Google

Google Panda là gì? Khám phá bì mật về thuật toàn Google Panda

Bài viết này tôi sẽ giúp cho bạn tìm hiểu rõ khái niệm Google Panda là gì và đưa ra những nguyên nhân khiến cho website của bạn bị phạt bởi thuật toán Panda này.

Bắt đầu thôi!

Google Panda Back là gì?

Google Panda Back là một thuật toán về SEO của Google, được ra mắt từ 2/2011. Google Panda giúp loại bỏ các nội dung rác, nội dung Copy và Website kém nổi bật. Google Panda Back còn thay đổi cách xếp hạng trên SERP (trang kết quả tìm kiếm) tốt và công bằng, và trả về các kết quả chính xác và phù hợp nhất.

thuat-toan-google-panda

Mục đích chính của bản cập nhật thuật toán Google Panda là:

  • Xem xét chất lượng nội dung của website. Qua đó nhằm loại bỏ những nội dung sai phạm, nội dung rác hoặc được copy từ những website khác.
  • Làm giảm sự hiện diện của các trang web có chất lượng thấp trong phần kết quả Organic Search của Google.
  • Thưởng cho các trang web chất lượng cao.

Nếu website của bạn đột nhiên bị rớt hạng trong quá trình thuật toán Panda đang cập nhật. Điều này lặp đi lặp lại trong một khoảng thời gian dài thì rất có thể đó là do nội dung trên website của bạn không đủ sức thuyết phục với Google.

Trên thực tế thì website đang tăng trưởng tốt vẫn có khả năng bị Panda phạt.

google-panda

9 nguyên nhân website bị dính án phạt Panda

7 nguyên nhân được xem là do Onpage

#1 – Nội dung mỏng, thông tin ít (Thin content)

Thin content (hay còn gọi là nội dung mỏng) ở đây bạn có thể hiểu theo cả nghĩa đen lẫn nghĩa bóng: content ngắn và chất lượng của content quá thấp!

Về chất lượng content thấp có thể kể đến các lỗi như:

  • Nội dung copy từ website khác
  • Nội dung không cung cấp quá nhiều giá trị hữu ích cho người đọc
  • Topic ở mỗi bài viết không liên quan nhiều đến lĩnh vực chính của website, không đồng nhất về chủ đề.

#2 – Trùng lặp nội dung (Duplicate content)

Nội dung copy thường xuất hiện ở nhiều website trên Internet.

Vì bạn không biết phải ghi gì, miêu tả như thế nào cho bài viết của bạn. Từ đó bạn bắt buộc phải sao chép nội dung từng những website khác từ khắp nơi trên Internet.

Duplicate content cũng xảy ra ngay trên chính website của bạn khi bạn có quá nhiều trang chứa cùng một nội dung. Hoặc có rất ít sự biến đổi trong nội dung giữa các trang.

Lưu ý: Google tính trùng lặp về nội dung theo:

  • Nội dung từng trang trên website
  • Thẻ meta description
  • Thẻ heading
  • Code HTML
  • Khung giao diện
  • Khung design mặc định của website (Ví dụ: bài viết chữ quá ít nhưng khung design lại lớn)
duplicate-heading
Website có nội dung thẻ titles hoặc H1, H2 giống nhau cũng bị Google panda tính là duplicate content.

Google định nghĩa content là toàn bộ code HTML của website.

Khi cào (crawl) dữ liệu từ website thì Google bot sẽ cào code html từ trên xuống dưới, từ trái qua phải.

Khung design mặc định của website giống nhau mỗi trang cũng sẽ được tính là trùng lặp. HTML của bạn phải unique 51% thì website của bạn mới ở trong vùng an toàn. Nếu như 1 bài của bạn chỉ cỡ 300 – 400 chữ mà khung design cố định của website lớn thì chắc chắn website bạn bị trùng lặp.

Do vậy hầu hết website Việt Nam bị duplicated content, nhất là các trang thương mại điện tử bán hàng.

Google định nghĩa Content của website như thế nào?

Duplicate content là một điều vô cùng tối kị và cực kì nguy hiểm cho website của bạn. Mọi công sức của bạn có thể bị “đổ sông đổ bể” chỉ vì bạn đạo nhái một vài câu văn.

#3 – Nội dung có chất lượng quá thấp

Các website cung cấp ít giá trị hoặc nội dung chất lượng thấp cho người đọc vì thiếu thông tin chuyên sâu.

Nội dung content thường:

  • Truyền tải vắn tắt, qua loa
  • Thiếu ý
  • Không phân tích chuyên sâu, ít có sự đào sâu nghiên cứu.
  • Ít tìm tòi, mở rộng chủ đề

#4 – Website thiếu Authority/ không có độ tin tưởng cao

Nội dung được tạo ra bởi các nguồn không được xác minh về Entity. Thiếu thẩm quyền (authority), thiếu độ tin cậy (trust) đối với người dùng. Điều đó sẽ làm cho webiste của bạn bị Google Panda loại bỏ ngay lập tức.

#5 – Content farming

Content farming là thuật ngữ được dùng để ám chỉ các website cố tình spam nội dung, thu thập và copy hàng loạt những content của các website khác, sau đó cố gắng nhồi nhét thêm thật nhiều từ khóa và tối ưu SEO tốt hơn so với website gốc.

Các website sử dụng content farming này đều hướng tới mục đích tăng thứ hạng từ khóa trên công cụ tìm kiếm nhiều hơn là tập trung cung cấp giá trị cho người đọc.

#6 – Website chứa quá nhiều nội dung quảng cáo

Website chủ yếu đặt nhiều banner quảng cáo với rất ít nội dung thực sự cung cấp giá trị đối với người đọc. Hầu hết những website này đều được tạo ra với mục đích kiếm tiền từ việc đặt banner quảng cáo, ít nội dung.

#7 – Lỗi Schema

Google đưa ra quy luật rõ ràng về vấn đề Schema như sau:

Nếu bạn khai gì trên schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Ví dụ: bạn làm schema review và khai rằng website hiện đang có khoảng 100 lượt review trên website, đồng thời website được đánh giá 5 sao,… thì lẽ dĩ nhiên, tất cả thông số ấy phải hiển thị chính xác trên trang web bạn đang quản lý.

loi-sai-schema

Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.

2 nguyên nhân còn lại do Offpage

#8 – Trộn nội dung (Spin content)

Spin content (trộn nội dung) lại với nhau để cho ra những bài viết mới.

Bài viết mới có thể có cùng ý nghĩa với bài viết gốc nhưng lại khác về mặt câu chữ hoặc cũng có thể mang ý nghĩa khác hoàn toàn so bài viết gốc.

Tuy nhiên, hình thức Spin Content tạo ra những nội dung này, đã được Google xem như là nội dung rác.

Google liên tục cập nhật nhiều thuật toán nhằm xóa bỏ những nội dung rác này. Đặc biệt nhất là dùng thuật toán Google Panda để xóa bỏ nó.

#9 – Keyword cannibalization

Keyword Cannibalization là từ khóa cạnh tranh lẫn nhau, hiện tượng này xảy ra khi bạn vô tình hay có chủ ý tạo lập thật nhiều bài viết cùng nói về một chủ đề nào đó hay cùng tối ưu một số từ khóa cụ thể.

Dẫn đến các URL này dù đều được hiển thị trên công cụ tìm kiếm, nhưng kết quả cuối cùng là không có trang nào lên vị trí top 10.

Google Panda khi vào xem xét website, nó sẽ ưu tiên quan sát những trang được tối ưu duy nhất.

Nếu nó vào scan một ngàn trang và thấy tất cả các trang đều tối ưu theo:

  • Các chủ đề bài viết khác nhau
  • Bộ từ khóa riêng biệt

Thì Google sẽ dễ dàng nhận diện và cho bạn lên đúng URL hơn.

Note: Cách kiểm tra Keyword Cannibalization:

Sử dụng công cụ Screaming Frog hoặc search google theo cú pháp site:domain + keyword seo.

2 dấu hiệu website đang bị Google Panda phạt

Từ những gì mà tôi đã nên ra bên trên, chắc hẳn bạn cũng nhận ra được dấu hiệu chính cho thấy website của mình đang “dính” Panda đó là:

Organic traffic giảm dần theo thời gian

Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất.

Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng quá nhiều đến website.

Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn trong vài tuần, bạn sẽ nhận ra ngay mức độ giảm sút traffic ngày càng mạnh mẽ và trầm trọng. Nó kéo theo hàng loạt những ảnh hưởng tiêu cực khác mà Google Panda có thể mang đến cho website của bạn.

google-panda-update

Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.

Lưu ý nhỏ:

Liên quan đến hiện tượng này, tôi xin có vài lưu ý về sự khác biệt giữa Panda và Penguin.

Nếu hình phạt từ Panda kéo traffic xuống dần dần thì Penguin hoàn toàn trái ngược. Penguin phạt thẳng tay và traffic giảm không phanh xuống tận đáy.

thuat-toan-google-panda-la-gi

Traffic giảm một nửa

Một dấu hiệu nhận biết Google Panda khác nữa là:

Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic.

Từ đó khiến website của bạn có thể từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.

Vậy website bạn chưa bị phạt thì sao?

Đừng nghĩ rằng bây giờ bạn chưa thấy hiện tượng sụt giảm traffic thì nghĩa là bạn đang ở trong vùng an toàn. Việc Google ghé thăm và thu thập dữ liệu có thể sẽ mất tới vài tháng.

Đến một ngày đẹp trời, bỗng dưng bạn thấy từ khóa lặn tăm thì lúc ấy mới biết thì quá muộn.

Phòng bệnh hơn chữa bệnh bạn nhé!

Hướng dẫn 3 cách khôi phục website bị Panda phạt

Hầu hết SEOer đều cho rằng: Sẽ rất khó để có thể phục hồi được một website đã bị Panda phạt.

Tuy nhiên, như đã đề cập ở phần đầu, bản cập nhật Panda chủ yếu dựa trên chất lượng của website đó/nội dung.

Vì thế các bước phục hồi thường tập trung vào cải thiện chất lượng trang web đó.

Kỹ thuật Noindex và thẻ Canonical

Để chặn việc lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc trùng lặp ít và các yếu tố có vấn đề khác

Đối với cách khắc phục, bạn có thể sử dụng các kĩ thuật noindex và thẻ canonical. Tìm hiểu thêm: “Canonical URL là gì? 7 Sai lầm phổ biến khi sử dụng thẻ Canonical

Cải thiện content kém chất lượng và content mỏng

Google Panda luôn liên tục hoạt động và tiến hành loại bỏ từng chút một những website bị thin content hoặc kém chất lượng.

Thông thường, Panda sẽ đánh giá chất lượng của toàn bộ trang web bằng cách xem xét một số lượng lớn các trang trong đó. Sau đó, nó mới bắt đầu điều chỉnh thứ hạng sao cho phù hợp nhất.

Ngoài ra, Panda còn chấm điểm thứ hạng website của bạn dựa trên chất lượng các phần nội dung bao gồm trong đó.

Do vậy cốt lõi của vấn đề chính là việc cải thiện nội dung chất lượng content của web.

Loại bỏ content kém chất lượng và content mỏng

Xóa bỏ content kém chất lượng khỏi website không chỉ nhằm mục đích SEO mà còn vì lợi ích của người dùng.

Nói cách khác, bạn hãy thử đặt mình vào vị trí của người dùng và thử truy cập vào website của mình. Sau khi bạn mở lên 1 bài blog lên và nó chẳng có nội dung gì cuốn hút hay không thể đáp ứng được nhu cầu của bạn? Hay tệ hơn là truy cập vào 1 chuyên mục toàn quảng cáo, chẳng có thông tin gì giá trị hết?

Vì thế, việc mang đến nội dung và trải nghiệm người dùng tốt nhất khi họ nhấp vào 1 kết quả tìm kiếm và truy cập vào website của bạn là cực kì quan trọng.

Cách loại bỏ content kém chất lượng

Việc đầu tiên, bạn cần phải làm là chắt lọc ra các phần nội dung kém chất lượng.

Và khi bạn đã tìm thấy phần nội dung kém chất lượng trên một URL đã bị Panda phạt, tôi gợi ý cách giải quyết bằng cách áp dụng:

Chiến lược “Giữ – Bỏ”.

Chiến lược này rất đơn giản:

Nếu có thể cải thiện phần content trong website của bạn thì nên làm ngay. Nếu content đó đã quá tốt, bạn không thể cải thiện hơn nữa và người dùng không phàn nàn gì khi họ truy cập vào thì hãy để noindex nó.

thuat-toan-panda

Tôi còn gọi đây là chiến lược “quản lí index”.

Đối với các content đã được Add URL vào Google, việc duy trì chất lượng nội dung ở mức cao nhất (thậm chí phải cao hơn cả đối thủ) là việc cực kỳ quan trọng. Việc này sẽ giúp website của bạn thoát khỏi các thuật toán kiểm tra chất lượng từ Google, trong đó có cả Panda.

Chiến lược giữ bỏ không chỉ loại đi phần nội dung kém chất lượng, mà nó còn giúp người dùng có thể dễ dàng tìm được những gì mà họ đang cần, đảm bảo content đạt hiệu quả cao. Hơn hết là phải đáp ứng đủ hoặc có khi hơn cả mong đợi từ phía người dùng. Đồng thời, đảm bảo Google sẽ chỉ index những phần nội dung giá trị nhất của bạn.

Tất cả chung quy lại vẫn chỉ để cải thiện chất lượng. Hay nói cách khác là mang đến cho người dùng những website tốt nhất.

Nâng cao chất lượng tổng thể website

Trong quá trình hỗ trợ khách hàng – những người đang chịu ảnh hưởng tiêu cực từ thuật toán Panda, tôi luôn khuyên họ rằng:

Họ không được dừng lại ở việc loại bỏ các content kém chất lượng.

Mà họ còn phải liên tục xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:

  • Nâng cao chất lượng nội dung
  • Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…

Vì vậy, tôi không cho rằng chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó.

Cách tốt nhất để tránh Google Panda là hãy tự mình phát triển thương hiệu của riêng bạn. Đó cũng là cách xây dựng một website của bạn trở thành một nguồn thông tin đáng tin cậy. Với nội dung tuyệt vời, mang lại giá trị cho người đọc.

2 công cụ hỗ trợ sửa phạt thuật toán Google Panda

Trong quá trình làm SEO, để tránh các hình phạt Google, đặc biệt là vấn đề copy bài viết, bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra.

Dưới đây, tôi gợi ý 2 công cụ phổ biến sau:

Copy scape

Copy scape là công cụ trả phí. Nó sẽ giúp bạn theo dõi được những nội dung bạn đã từng copy từ những website khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất.

Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.

Siteliner

Thêm 1 công cụ khác là siteliner với chức năng tìm nội dung copy dựa trên gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo cho bạn chỉ số phần trăm giống nhau giữa các bài. Đây cũng là 1 công cụ trả phí!

Kết luận

Panda vẫn chỉ được coi là một hình phạt của Google dành cho các website đang cố tình spam về nội dung trên công cụ tìm kiếm. Và công cụ tìm kiếm này vẫn chưa thể áp dụng Panda như là một thuật toán gốc lõi của Google.

Thuật toán Panda có thể xử phạt trên tất cả website dù nó đang phát triển trên cả mặt Onpage & Offpage. Hầu hết các website ở Việt Nam đều có khả năng bị Panda dòm ngó đến và gây ảnh hưởng tiêu cực đến toàn domain.

Chúc bạn thành công!

Cảm ơn bạn đã đọc hết bài viết trên của VIDCOGROUP mọi ý kiến và thắc mắc vui lòng để lại dưới phần Comment.

Đọc tiếp:

  1. Google Pagerank là gì? Cách tăng cường PageRank cho Websit của bạn
  2. SEO Onpage là gì? Hướng dẫn SEO Onpage từ cơ bản đến nâng cao.
  3. Google Sandbox là gì: Và sự thật lý do tại sao website của bạn bị kìm hãm & cách hóa giải

Author

nguyendaihai

Leave a comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

vi