SEO

Canonical URL là gì? 7 Sai lầm thường gặp khi sử dụng thẻ rel=“canonical”

Canonicalization là một chủ đề vô cùng phúc tạp và nó thường xuyên nằm trong TOP những lỗi kỹ thuật SEO thường gặp nhất trong những năm qua.

Thực tế, có rất nhiều hiểu lầm và quan niệm sai lệch về việc sử dụng Canonical URL đúng cách. Dưới đây là một số sai lầm phổ biến mọi người thường mắc phải khi sử dụng thẻ canonical:

Canonical URL là gì?

Canonical URL (hay còn gọi là Rel Canonical) là thành phần HTML nhằm khai báo URL gốc của trang web bị trùng lặp với nội dung của công cụ tìm kiếm. Sử dụng thẻ Canonical trong trường hợp nội dung bị Duplicate hoặc giống nhau trên nhiều URL.

canonical-url-la-gi

7 Sai lầm thường gặp khi sử dụng thẻ rel=“canonical”

su-dung-the-rel-canonical

Sai lầm 1: Chặn URL được chuẩn hóa qua Robots.txt 

Việc chặn một URL trong robots.txt sẽ ngăn không cho Google thu thập dữ liệu từ website. Có nghĩa là họ không thể thấy bất kỳ Canonical Tag nào trên đó. Kết quả là Google cũng không tài nào chuyển hóa “link equity” từ Non-Canonical sang Canonical.

Sai lầm 2: Đặt URL được chuẩn hóa thành ‘noindex’

Bạn nhớ nhé, tốt nhất là bạn không nên kết hợp noindex với thẻ canonical lại với nhau. Bởi vì chúng là 2 yếu tố hoàn toàn trái ngược nhau.

Google thường sẽ ưu tiên Canonical hơn là các thẻ “noindex”. Trong trường hợp bạn muốn thực hiện đồng thời noindex và gắn thẻ Tag, hãy dùng 301 redirects. Còn không thì chỉ dùng rel = canonical thôi. 

Sai lầm 3: Đặt mã trạng thái HTTP 4XX cho URL gốc

Việc bạn đặt mã HTTP 4XX cho các URL gốc có tác động tương tự như việc bạn dùng thẻ “noindex”. Google sẽ không thể nhìn thấy Canonical Tag để mà chuyển “link quity” sang bản gốc.

Sai lầm 4: Canonicalizing tất cả các Paginated Page đến Page gốc

Các paginated page không nên được triển khai Canonical URL đến các paginated page đầu tiên trong chuỗi. Thay vào đó, chúng ta sẽ sử dụng thẻ Tag tự tham chiếu trên những trang này.

John Mueller đã đưa ra lời giải thích cho nghi vấn này như sau: Nếu page A không tương tự như page B. Thì việc page B đang dùng rel=canonical muốn trỏ đến page A sẽ không được chấp thuận dùng rel = canonical không đúng cách.

Bạn cũng nên dùng thẻ rel="prev" và rel="next" để phân trang. Mặc dù cấu trúc này không còn thịnh hành với Google như một số web khác, chẳng hạn như Bing vẫn còn dùng nó.

Sai lầm 5: Không sử dụng Canonical Tags với Hreflang

Hreflang tags thường được dùng để chỉ định target đến những đối tượng dựa vào ngôn ngữ và vị trí địa lý của website.

Google khuyên rằng khi dùng hreflang: Bạn nên “chỉ định trang gốc có cùng một ngôn ngữ với website hoặc ngôn ngữ thay thế tốt nhất nếu không thể tìm ra ngôn ngữ chung cho cả 2”. 

Sai lầm 6: Có quá nhiều thẻ rel=canonical 

Có nhiều thẻ rel = canonical sẽ khiến Google dễ dàng bỏ qua tất cả.

Việc này xảy ra do các thẻ được thêm vào hệ thống ở các điểm khác nhau: Chẳng hạn như bởi CMS, theme và (các) plugin. Đây là lý do tại sao nhiều plugin có tùy chọn ghi đè đảm bảo chúng là nguồn duy nhất cho các Canonical URL. 

Cũng có rất nhiều trường hợp thẻ rel = canonical được thêm vào bởi JavaScript. Google chấp thuận trường hợp này chỉ khi URL gốc không xuất hiện trên HTML và sau đó bạn thêm thẻ rel = canonical với JavaScript.

Ngược lại, nếu HTML đã có thẻ rồi mà bạn lại tiếp tục hoán đổi page khác ưa thích bằng JavaScript. Thì có lẽ bạn đang làm khó Google bởi hàng loạt tín hiệu hỗn hợp đấy. Hãy cẩn thận nhé!

Sai lầm 7: Đặt rel=canonical trong phần Body

Rel = canonical chỉ nên xuất hiện trong <head> của tài liệu. Thẻ chuẩn trong phần <body> của web rất dễ bị bỏ qua.

Mặc dù mã nguồn của một trang có thể có thẻ rel = canonical ở đúng vị trí, nhưng khi nó thực sự được tạo trong trình duyệt hoặc được hiển thị bởi Google thì sẽ có nhiều vấn đề xảy ra như: thẻ không được đóng, JavaScript bị chèn hoặc <iframes> trong phần <head>,… khiến <head> phải kết thúc sớm trong khung trình duyệt.

Trong trường hợp này, thẻ Tag bị chuyển vào <body> của một trang đang hiển thị mà không được chấp thuận.

Cách Check Canonical và khắc phục sự cố Canonicalization 

canonical-url

Rõ ràng, trong quá trình bạn triển khai Canonicalization rất dễ xảy ra những sai sót. Vì vậy, bạn cần kiểm tra lại trang web của mình để tìm hiểu về các vấn đề liên quan đến Canonical Tag và khắc phục chúng càng sớm càng tốt.

Bật mí là bạn nên dùng công cụ Site Audit của Ahrefs. Nhằm giải quyết hơn 100 nỗi lo về Technical SEO nói chung và Canonical URL nói riêng. Dưới đây là 12 vấn đề liên quan mà Site Audit tìm ra và khắc phục hiệu quả:

Trang Canonical trỏ đến 4XX

Cảnh báo này được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 4XX. 

Vấn đề: Google không index các trang 4XX vì chúng không hoạt động. Do đó, họ sẽ bỏ qua tất cả các thẻ Canonical nào trỏ đến đây. Thay vào đó, chọn index ngẫu nhiên 1 trang không có Canonical. 

Cách khắc phục: Xem lại các trang xem nó có bị ảnh hưởng hay không, nếu có hãy thay thế các Canonical (4XX) đã chết bằng các liên kết đến các trang (200) đang hoạt động muốn được index. 

Trang Canonical trỏ đến 5XX

Cảnh báo này sẽ được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 5XX.

Vấn đề: Mã trạng thái HTTP 5XX cho biết sự cố nằm ở máy chủ. Điều này dẫn đến page gốc không thể truy cập được. Google không có khả năng index trang không thể truy cập, trang gốc cũng vì vậy mà sẽ bị bỏ qua. 

Cách khắc phục: Thay thế bất kỳ URL gốc nào đang bị sai sót bằng các URL hợp lệ. Trong trường hợp trang gốc của bạn vẫn hoạt động ổn định thì hãy kiểm tra các cấu hình sai của máy chủ.

Lưu ý rằng đây có thể là sẽ là sự cố tạm thời nếu quá trình thu thập thông tin xảy ra khi website của bạn ngừng hoạt động để bảo trì hoặc máy chủ website bị quá tải.

Trang Canonical trỏ đến URL Redirect

Cảnh báo này sẽ kích hoạt khi 1 hay là nhiều trang được chuẩn hóa đến URL redirect .

Vấn đề: Canonicals phải trỏ đến phiên bản có thẩm quyền nhất của một trang mà URL redirect không thuộc dạng bản này. Trong trường hợp này, công cụ tìm kiếm có thể hiểu sai ý nghĩa và bỏ qua các thẻ Canonical. 

Cách khắc phục: Thay thế các Canonical URL bằng các kết nối trực tiếp đến các phiên bản có thẩm quyền nhất của trang. Ví dụ như page trỏ về HTTP 200 và không chuyển hướng. 

Duplicate Pages không được gắn thẻ Canonical

Cảnh báo này nó sẽ được kích hoạt khi tồn tại một hoặc nhiều trang trùng lặp hoặc quá giống nhau nhưng lại không có trang nào trong số đó là trang gốc. 

Vấn đề: Vì không có trang nào được chỉ định là trang gốc. Nên Google sẽ tự mình quyết định trang nào phù hợp nhất để tự hiển thị trong kết quả tìm kiếm. Đây có thể sẽ không phải là loại mà bạn muốn được index. 

Cách khắc phục: Kiểm tra lại các trang duplicate. Sau đó, chỉ định 1 bản tốt nhất và chọn nó làm bản gốc để gắn thẻ Canonical tự tham chiếu. 

Liên kết thẻ Hreflang đến các trang Non-Canonical

Cảnh báo này nó sẽ được kích hoạt khi 1 hay nhiều trang chỉ định URL Non-Canonical trong Hreflang. 

Vấn đề: Các liên kết trong thẻ Hreflang phải luôn được trỏ đến các trang Canonical. Việc liên kết đến Non-Canonical của trang từ các chú thích Hreflang có thể gây ra sự nhầm lẫn và đánh lừa Google. 

Cách khắc phục: Thay thế các liên kết bên trong các chú thích Hreflang của các trang bị ảnh hưởng bằng các Canonical.

Canonical URL không có liên kết nội bộ 

Cảnh báo này sẽ được kích hoạt khi một hoặc là nhiều Canonical URL không có liên kết đến nội bộ. 

Vấn đề: Người dùng truy cập vào trang web không thể truy cập được các Canonical URL không có kết nối nội bộ. Khi ấy, họ có thể được chuyển hướng đến các trang non-Canonical.

Cách khắc phục: Thay thế bất kỳ link nội bộ nào đến các trang Canonical bằng các liên kết trực tiếp đến trang gốc. 

Trang Non-Canonical trong Sitemap

Cảnh báo này sẽ được kích hoạt khi một hoặc nhiều trang Non-Canonical được liệt kê trong sitemap.

Vấn đề: Google khuyên rằng bạn không nên đưa Non-Canonical URLs vào trong sitemap. Lý do đơn giản là các trang hiển thị trong sitemap chỉ nên là Canonical page. Hay nói cách khác là những trang mà bạn muốn được index.

Cách khắc phục: Loại bỏ Non-Canonical URLs ra khỏi Sitemap.

Non-Canonical page được chỉ định thành Canonical Page

Cảnh báo này sẽ được kích hoạt khi một hoặc nhiều trang chỉ định một URL chuẩn. URL này lại được Canonical cho một trang khác. Điều này tạo ra một “chuỗi canonical”. Trong đó trang A được Canonical đến trang B, sau đó được Canonical đến trang C. 

the-canonical

Vấn đề: Chuỗi Canonical có thể gây ra sự nhầm lẫn và đánh lừa công cụ tìm kiếm. Do đó, google có thể sẽ hiểu sai hoặc bỏ qua các trang được Canonical.

Cách khắc phục:Thay thế các liên kết Non-Canonical trong Canonical Tag của trang bị ảnh hưởng bằng liên kết trực tiếp đến trang Canonical. Ví dụ: nếu trang A được Canonical đến trang B. Sau đó được Canonical đến trang C. Hãy thay thế liên kết Canonical trên trang A bằng một liên kết trực tiếp đến trang C.

URL bên trong thẻ Open Graph không khớp với Canonical Page

Cảnh báo này sẽ được kích hoạt khi Canonical Tag và URL bên trong Open Graph URL không khớp nhau với nhau trên một hoặc nhiều trang. 

Vấn đề: Nếu  URL bên trong thẻ Open Graph URL bị sai lệch với Canonical URL. Khi ấy Non-Canonical URL sẽ thay thế, được chia sẻ trên các mạng xã hội. 

Cách khắc phục: Thay thế URL trong thẻ Open Graph URL trên các trang đang bị ảnh hưởng bằng Canonical URL. Hãy đảm bảo rằng lần này hai URL giống nhau nhé! Lưu ý: URL bên trong thẻ Open Graph phải là tuyệt đối và dùng giao thức http:// hoặc https://, như của Canonicals URL. 

Canonical từ HTTPS sang HTTP

Cảnh báo này sẽ được kích hoạt khi một hoặc nhiều secure (HTTPS) pages chỉ định non-secure (HTTP) page làm trang Canonical.

Vấn đề: HTTPS là một yếu tố xếp hạng. Vì vậy bạn nên chỉ định bản secure pages làm Canonical nếu có thể.

Cách khắc phục: Chuyển hướng trang HTTP sang HTTPS tương đương. Nếu không thể, hãy thêm liên kết rel = “canonical” từ phiên bản HTTP của trang vào phiên bản HTTPS.

Canonical từ HTTP sang HTTPS

Cảnh báo này sẽ được kích hoạt khi một hoặc nhiều non-secure (HTTP) page được chỉ định secure (HTTPS) pages làm trang Canonical.

Vấn đề: HTTPS luôn được ưu tiên hơn HTTP. Việc phiên bản HTTP của một trang chỉ định phiên bản HTTPS là trang Canonical là điều không hề hợp lý.

Cách khắc phục: Triển khai chuyển hướng 301 từ HTTP sang HTTPS. Bạn cũng nên thay thế mọi liên kết nội bộ tới phiên bản HTTP của trang bằng các liên kết trực tiếp đến HTTPS.

Non-Canonical Page nhận được lưu lượng truy cập Organic 

Cảnh báo này sẽ được kích hoạt khi một hoặc nhiều trang Non-Canonical được hiển thị trong kết quả tìm kiếm và nhận được lưu lượng truy cập organic (điều này sẽ không bao giờ xảy ra).

Vấn đề: Trường hợp này xảy ra có thể là do Canonical tag của bạn đã được thiết lập không chính xác hoặc Google đã bỏ qua thẻ do bạn tự chỉ định. 

Cách khắc phục: Kiểm tra xem các thẻ rel = canonical có đang được thiết lập một cách chính xác nhất trên tất cả các trang được báo cáo hay không. Nếu đó không phải là vấn đề, hãy dùng công cụ Kiểm tra URL trong Google Search Console để xem liệu họ có chấp thuận URL Canonical do bạn chỉ định không.

Kết luận

Với lần đầu tìm hiểu về Canonical URL là gì có thể không dễ dàng như bạn nghĩ. Tuy nhiên, một khi bạn đã nắm rõ được các quy tắc này và kết hợp chúng cùng với quá trình thực hành chăm chỉ thì tôi tin rằng bạn sẽ thuần thục cách triển khai này ngay.

Điều bạn cần phải nhớ là, không phải chỉ có một chỉ thị mà là một tín hiệu cho các công cụ tìm kiếm. Họ vẫn có thể chọn 1 Canonical Tag khác với với URL do bạn chỉ định ban đầu. 

Giờ thì đến lượt bạn! Hãy kiểm tra lại các page trên website của mình. Sau đó, hãy vận dụng các kiến thức mà tôi vừa chia sẻ trong bài này để triển khai thật hiệu quả. Góp phần tăng thứ tự xếp hạng cho website cũng như tiện lợi trong quá trình công cụ tìm kiếm thu thập dữ liệu.

Chúc bạn thành công!

Cảm ơn bạn đã đọc hết bài viết trên của VIDCOMEDIA mọi ý kiến và thắc mắc vui lòng để lại dưới phần Comment.

Bài viết cùng chủ đề:

  1. Thẻ Canonical url là gì? Hướng dẫn cách sử dụng thẻ Canonica
  2. SEO Onpage là gì? Hướng dẫn SEO Onpage từ cơ bản đến nâng cao.
  3. Cấu trúc Silo là gì? Silo ảnh hưởng đến SEO như thế nào?

Author

nguyendaihai