SEO

Thẻ Canonical url là gì? Hướng dẫn cách sử dụng thẻ Canonica

Canonical URL là gì không còn là khái niệm mới mẻ với SEOer. Năm 2009, Google, Microsoft và Yahoo đã hợp nhất để cùng tạo ra thẻ này. Với mong muốn hỗ trợ chủ các trang web giải pháp hiệu quả để khắc phục các vấn đề về Duplicate Content một cách nhanh chóng và dễ dàng nhất. 

  • Nhưng đâu đó bạn vẫn không thực sự hiểu thật sự Canonical là gì?
  • Cách sử dụng thẻ canonical ra sao? 
  • Chúng có thực sự giúp ích cho hoạt động của website hay không?

Tất cả sẽ được giải đáp trong bài viết này. Hãy cùng tôi tìm hiểu nhé!

Canonical URL là gì?

Canonical URL (hay còn gọi là Rel Canonical) là thành phần HTML nhằm khai báo URL gốc của trang web bị trùng lặp với nội dung của công cụ tìm kiếm. Sử dụng thẻ Canonical trong trường hợp nội dung bị Duplicate hoặc giống nhau trên nhiều URL.

canonical-url-la-gi

Nếu có nội dung giống hoặc tương tự trong các URL khác nhau. Bạn có thể dùng nó để chỉ định loại nào là phiên bản chính và sau đó index nó.

Cấu trúc chuẩn của Canonical Tag

Canonical có cấu trúc thế nào? Đó là cú pháp đơn giản, nhất quán và thường được đặt trong các phần của website, chẳng hạn như:

canonical-la-gi

Ý nghĩa của từng phần trong đoạn mã Canonical URL được hiểu như sau:

  • link rel=“canonical”:  Liên kết trong thẻ này là bản gốc của trang này.
  • href=“https://example.com/sample-page/”: truy cập bản gốc tại đây.

Tầm quan trọng của thẻ Canonical trong SEO

Như tôi đã đề cập ở đầu bài viết, thẻ Canonical được sinh ra với mục đích giải quyết các vấn đề liên quan đến Duplicate Content. Chính vì vậy, tôi sẽ phân tích về sự ảnh hưởng của trùng lặp nội dung đến SEO, để từ đó giúp bạn có thể hiểu rõ hơn về tầm quan trọng cũng như lý do mà thẻ Canonical tag được tạo ra. Tìm hiểu ngay thôi nào!

Bạn phải biết: Duplicate Content là điều Google cực kỳ “ghét”, do nó sẽ làm Google không xác định được:

  • Bản nào của trang web cần index.
  • Loại nào của trang web dùng để xếp hạng cho các truy vấn có liên quan.
  • Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều loại.

Trùng lặp nội dung cũng làm ảnh hưởng rất lớn đến “ngân sách thu thập dữ liệu”. Nghĩa là, Google sẽ phải mất thời gian để thu thập những thông tin từ nhiều bản cùng một page thay vì khám phá thêm những nội dung quan trọng khác trên website. Tuy nhiên, nếu bạn có sử dụng Canonical tag, nó sẽ giúp bạn giải quyết được tất cả những vấn đề kể trên bằng cách: Thông báo đến Google biết họ nên index và xếp hạng phiên bản nào của page, cũng như vị trí cần hợp nhất “link equity”.

Còn trong trường hợp bạn không có bất kỳ hành động để nào thông báo đến Google về link gốc. Thì Google sẽ thay bạn làm điều đó và quyết định loại hoặc chọn link tốt nhất. Tất nhiên, việc để Google lựa chọn như thế không phải là một ý tưởng hay. Vì họ có thể sẽ chọn ngẫu nhiên 1 URL mà bạn không thật sự muốn nó sẽ trở thành link gốc. 

canonical-la-gi

Lưu ý nhỏ về ngân sách thu thập dữ liệu:

Bạn phải luôn ghi nhớ: Để có thể tiết kiệm được tối đa thời gian Google thu thập những thông tin trên website đối với các nội dung Duplicate Content. Nhưng nếu bạn đang sỡ hữu một website mới, thì bạn có thể lướt qua nội dung này.

Sự thật về Duplicate Content

Có phải nhiều lúc bạn đã nghĩ rằng: chỉ cần đăng lại nội dung trên trang khác nhau thì sẽ không dính lỗi Duplicate Content. Tuy nhiên, thực tế idea này không thể triển khai. Vì các công cụ thu thập URL, không phải dữ liệu trên page.

Nghĩa là, chúng sẽ nhận định URL example.com/product và URL example.com/product?color=red ở 2 page khác nhau. Mặc dù chúng có cùng chung một website có nội dung giống hệt hoặc tương tự nhau.

Đây được gọi là các parameterized URLs và chúng là nguyên nhân chính dẫn đến Duplicate Content. Đặc biệt là trên những website thương mại điện tử có filtered navigation (bộ lọc tùy chỉnh tìm kiếm của người dùng dựa trên những gì họ đang tìm kiếm)

Ví dụ: Hãng Brown Bag Clothing chuyên bán áo sơ mi.

  • Đây là link cho trang danh mục chính của họ:
    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html
  • Nếu bạn chỉ lọc áo sơ mi XL, một thông số sẽ được thêm vào URL như sau:
    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL
  • Nếu sau đó bạn cũng chỉ lọc những chiếc áo sơ mi màu xanh lam thì một thông số khác sẽ thêm vào:
    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue.

Những trong mắt của Google, thì cả 3 link trên đều là từ những trang web riêng biệt mặc dù nội dung của chúng chỉ khác nhau đôi chút. Nhưng không chỉ các trang web thương mại điện tử trở thành nạn nhân của Duplicate Content. Dưới đây là một vài nguyên nhân khác của các nội dung trùng lặp áp dụng cho tất cả các website trên google: 

  1. Có parameterized URLs cho các tìm kiếm chọn lọc
    (VD: example.com?q=search-term)
  2. Có parameterized URLs cho các IDs phiên
    (VD: https://example.com?sessionid=3)
  3. Các loại trang có thể in riêng biệt
    (VD: example.com/page and example.com/print/page)
  4. URL riêng biệt cho mỗi bài đăng trong các danh mục khác nhau 
    (VD: example.com/services/SEO/ and example.com/specials/SEO/)
  5. Gồm pages cho các loại thiết bị khác nhau 
    (VD: example.com and m.example.com)
  6. Đồng thời cả AMP và non-AMP trong cùng 1 trang 
    (VD: example.com/page and amp.example/page)
  7. Cùng một nội dung ở các biến thể non-www và www variants 
    (VD: http://example.com and http://www.example.com)
  8. Và cung cấp cùng một nội dung ở các biến thể non-https và https variants 
    (VD: http://www.example.com and https://www.example.com)
  9. Cùng một nội dung có và không có dấu gạch chéo 
    (VD: https://example.com/page/ and http://www.example.com/page)
  10. Có cùng một nội dung ở các bản mặc định, chẳng hạn như trang index
    (VD: https://www.example.com/, https://www.example.com/index.htm,..)
  11. Cùng một nội dung có và không có chữ viết hoa
    (VD: https://example.com/page/ and http://www.example.com/Page/)

Trong những tình huống kể trên, việc bạn dùng đúng Canonical URL là rất quan trọng. Hơn nữa, để tránh trùng lặp nội dung giữa các tên miền với nhau bạn phải lưu ý những điều sau:

Đây là trường hợp khi nội dung trên cùng một website được chia sẻ trên 2 web khác nhau với mỗi trang web là một phần của nội dung gốc. Nếu như bạn là tác giả của bài viết thì bạn nên cài đặt nó trên bài nhằm thông báo đến công cụ để tìm kiếm rõ ràng bạn là chủ nhân của bài viết đó.

Tất nhiên, khả năng bài viết từ bên thứ 3 đăng lại vẫn có khả năng hiển thị trong danh sách tìm kiếm. Tuy nhiên, việc bạn gắn thêm Canonical tag giúp bạn giảm nguy cơ chúng được xếp hạng cao hơn nội dung gốc.

Lưu ý: Vẫn có tình trạng một số web sẽ từ chối thêm Canonical Tag . Trong những trường hợp này, bạn có muốn chấp nhận rủi ro hay không là tùy thuộc vào bạn.

Hướng dẫn cách sử dụng thẻ Canonical vô cùng đơn giảm

Nhiều người thắc mắc là Canonical URL có dễ thực hiện không? Trước khi đi vào vấn đề thảo luận về bốn cách khác nhau để triển khai URL Canonical. Tôi sẽ giới thiệu cho bạn 5 quy tắc vàng sau:

5 Quy tắc khi sử dụng Canonical Tag

Quy tắc 1: Sử dụng URL tuyệt đối

John Mueller của Google nói rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical”. Nghĩa là, bạn nên sử dùng cấu trúc sau:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Thay vì sử dụng cấu trúc:

<link rel=“canonical” href=”/sample-page/” />

Quy tắc 2: Sử dụng chữ viết thường trong URL

Google thường coi các URL viết hoa và viết thường là hai link hoàn toàn khác nhau. Tuy nhiên, bạn cũng nên dùng cả chữ viết thường trong URL trên máy chủ của mình, sau đó dùng link viết thường cho Canonical Tag.

Quy tắc 3: Sử dụng đúng phiên bản miền HTTPS hay HTTP

Nếu bạn đã chuyển sang SSL, hãy đảm bảo rằng bạn không khai báo bất kỳ URL không phải SSL (tức là HTTP) nào trong việc sử dụng thẻ Canonical Tag. Làm như vậy về mặt lý thuyết dẫn đến nhầm lẫn và kết quả không mong muốn.

Đối với secure domain, hãy đảm bảo rằng bạn dùng phiên bản URL sau:

<link rel=“canonical” href=“https://example.com/sample-page/” />.

Còn nếu bạn không dùng HTTPS thì hãy dùng dạng URL này:

<link rel=“canonical” href=“http://example.com/sample-page/” />

Quy tắc 4: Sử dụng Canonical Tag tự tham chiếu

John Mueller cho rằng mặc dù không bắt buộc nhưng Canonical tự tham chiếu vẫn là sự lựa chọn đáng để bạn cân nhắc. Vì nó sẽ giúp Google hiểu rõ những gì bạn muốn index trang nào hoặc link sẽ có cấu trúc như thế nào khi được index.

Về cơ bản, tự tham chiếu là Canonical trên một trang mà trỏ link đến chính nó.

Ví dụ, nếu URL là https://example.com/sample-page, thì Canonical tự tham chiếu trên trang đó sẽ là:

<link rel=“canonical” href=“https://example.com/sample-page” />

Hầu hết các CMS phổ biến hiện đại đều tự động thêm các URL tự tham chiếu. Còn với CMS tùy chỉnh, bạn nhờ đến các nhà phát triển web  hardcode nó.

Quy tắc 5: Sử dụng 1 Canonical Tag cho mỗi trang

Nếu 1 trang có nhiều hơn 1 Canonical Tag, Google sẽ tự động bỏ qua nó. Vì thế, mỗi trang bạn chỉ nên sử dụng 1 thẻ thôi nhé!

Cách triển khai: Có năm cách để chỉ định link gốc với các tín hiệu chuẩn hóa sau: 

  1. HTML tag
  2. HTTP header
  3. Sitemap
  4. 301 redirect
  5. Liên kết nội bộ (Internal links)

Cài đặt thẻ Canonical bằng cách sử dụng HTML rel = “canonical” 

Dùng thẻ rel = canonical là cách đơn giản nhất để bạn xác định link gốc. Cách thực hiện này vô cùng đơn giản: chỉ cần bạn thêm những mã sau vào phần <head> của bất kỳ trang trùng lặp nào:

<link rel=“canonical” href=“https://example.com/canonical-page/” />

Ví dụ: Giả sử bạn có một trang web thương mại điện tử chuyên bán áo thun. Bạn muốn chỉ định https://yourstore.com/tshirts/black-tshirts/ là URL gốc. Ngay cả khi nội dung của trang đó có truy cập được qua các URL khác, chẳng hạn như: https://yourstore.com/offers/black-tshirts/. Khi ấy, chỉ cần thêm thẻ tag sau vào bất kỳ trang trùng lặp nào:

<link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” />

Lưu ý rằng nếu bạn đang dùng CMS, bạn không cần phải lo lắng về mã code của trang. 

Cài đặt Canonical Tag trong WordPress

Trước hết, cài đặt Yoast SEO để Canonical tự tham chiếu sẽ được thêm tự động vào trang. Để thêm các mục tùy chỉnh cho thẻ, hãy nhấp chọn phần “Nâng cao” trên mỗi bài đăng hoặc trang.

canonical-url

Có thể bạn quan tâm: Yoast SEO là gì? Hướng dẫn cách sử dụng Yoast SEO từ A-Z

Cài đặt Canonical Tag trên Shopify

Shopify thêm URL gốc tự tham chiếu vào cho các sản phẩm và bài đăng viết của bạn trên blog theo mặc định. Để thêm mục tùy chỉnh cho URL gốc, bạn cần phải chỉnh sửa trực tiếp các tệp mẫu (.liquid).

Cài đặt Canonical Tag trên Squarespace

Squarespace cũng cần thêm các URL để tự mình tham chiếu theo mặc định và cũng tương tự như trường hợp của Shopify. Bạn cũng cần phải chỉnh sửa mã trực tiếp nếu như bạn muốn thêm tùy chỉnh vào URL gốc.

Cài đặt thẻ Canonical trên các dòng tiêu đề HTTP

Đối với các tài liệu như PDF, không có cách nào để sử dụng thẻ Canonical trong tiêu đề vì không có phần trang <head>.

Trong những trường hợp như vậy, bạn hãy dùng dòng tiêu đề HTTP để đặt tên cho thẻ. Bạn cũng có thể dùng nó trong tiêu đề HTTP cho những website chuẩn.

Cài đặt thẻ Canonical trong Sitemaps

Google cho rằng những trang không có Canonical Tag chuẩn sẽ không được đưa vào sitemaps. Chỉ các URL chuẩn mới có thể được liệt kê vào.

Đó là vì Google chỉ xem những trang được liệt kê trong sitemap là các URL gốc được đề xuất. Tuy nhiên, cũng có vài trường hợp, họ sẽ từ chối chọn URL trong sitemap làm URL gốc.

Cài đặt thẻ Canonical với 301 Redirects

Hãy 301 redirects khi bạn muốn chuyển hướng lưu lượng truy cập ra khỏi URL trùng lặp và tới URL gốc. Ví dụ: Giả sử web của bạn có thể truy cập được tại các URL sau:

  • example.com
  • example.com/index.php
  • example.com/home/

Chọn một URL làm gốc và chuyển hướng các URL khác đến URL gốc đó.

Cài đặt thẻ Canonical với các liên kết nội bộ

Cách bạn trỏ link từ các trang này sang những trang khác trên toàn bộ website của mình cũng được xem là một cách để bạn/ Canonical URL. John Mueller đã đề cập đến các tín hiệu được dùng để xác định URL gốc trong video #AskGoogleWebmasters video.

Tóm lại, bạn càng nhất quán với tất cả 5 tín hiệu kể trên, thì các công cụ của Google càng dễ dàng xác định URL gốc mong muốn được đưa vào.

Cảm ơn bạn đã đọc hết bài viết trên của VIDCOMEDIA mọi ý kiến và thắc mắc vui lòng để lại dưới phần Comment.

Bài viết liên quan:

  1. AMP là gì? Hướng dẫn cách tạo Google AMP từ A-Z
  2. Chi tiết Submit URL lên Google nhanh chóng
  3. 5 Thủ thuật loại bỏ tài nguyên và xóa Javascript hiệu quả nhất

Author

nguyendaihai