SEO

Entity Building là gì? Tại sao Entity lại quan trọng trong SEO?

  • Entity là gì và nó có liên quan như thế nào đến SEO?
  • Tại sao Entity lại quan trọng đối với SEO?
  • Làm thế nào có thể tối ưu theo Entity?

Nếu bạn cũng đang thắc mắc những câu hỏi như vây, thì trong bài viết này, tôi sẽ giải đáp chi tiết 3 câu hỏi trên, đồng thời hướng dẫn từ lý thuyết đến cung cấp giải pháp chi tiết để bạn có thể thực hành Xây dựng Entity ngay trên website của mình!

Giờ thì… Bắt đầu ngay thôi!

Tại sao Entity lại quan trọng trong SEO?

Nhìn chung SEO đang ngày càng khó khăn và phức tạp hơn, bởi 2 lý do chính sau:

  1. Google đang sử dụng quá nhiều machine learning (học máy) hơn.
    Nhiều thuật toán được google tung ra và thường xuyên gây nên rất nhiều khó, trong việc nắm bắt nguyên lý và thực sự hiểu được Google đang muốn gì.
  2. Paid search (quảng cáo có trả phí) ngày càng tốn kém.
    Chạy quảng cáo tốn nhiều ngân sách là lý do hàng đầu cho việc nhiều hiện nay rất nhiều công ty và cá nhân đang chuyển sang organic search để tìm kiếm thêm khách hàng, dẫn đến lý do thứ ba là bạn đang đối đầu trực diện với Google.
  3. Bạn đang cạnh tranh trực tiếp với Google!

Cạnh tranh với Google ư? 

Hãy để tôi giải thích cho bạn!

Trên đây là screenshot kết quả tìm kiếm cho truy vấn “buy sneaker” (mua giày sneaker) trên cả bản desktop lẫn mobile.

entity_seo

Bạn có thể thấy phía trên của trang kết quả là những gì người dùng thấy khi họ tìm kiếm từ khóa này trên Google.

Tất cả kết quả tìm kiếm đều cho thấy:

Google có thể ngay lập tức cung cấp câu trả lời cho câu hỏi hoặc làm thỏa mãn mục đích tìm kiếm của bạn.

  • Nếu mục đích chính của bạn là mua hàng => Google sẽ hiển thị cả kết quả các trang chạy ad mà bạn có thể vào đó và thực hiện việc mua sắm. Ngoài ra Google còn cho ra kết quả dưới dạng bản đồ, nơi bạn có thể tìm mua sản phẩm đó.
  • Nếu truy vấn của bạn thuần về tìm kiếm thông tin, Google sẽ cố gắng giải đáp trực tiếp thắc mắc của bạn.

Hơn 90% người làm SEO đều không biết:

Google đã thay đổi cuộc chơi trong việc phân phối traffic về cho website!

Giờ đây Google cố gắng trả lời toàn bộ câu hỏi của người dùng ngay trên trang kết quả tìm kiếm (SERP)

Điều đó có nghĩa là bạn sẽ nhận được ít lượt click hơn (vì người dùng đã tìm được cho mình câu trả lời ngay trên trang kết quả mà họ không cần phải click vào web bạn để xem thông tin).

Chính vì vậy, bạn càng phải xếp hạng cao hơn và đảm bảo tất cả chiến thuật SEO web đều phải tối ưu tốt hơn nữa.

Entity trong SEO Onpage: Tạo content

Câu hỏi đặt ra ở đây là:

Làm thế nào viết content hay hơn để có được traffic mà vẫn đến các trang khác?

Một tình trạng phổ biến đó chính là ngày càng có nhiều content được viết ra để cạnh tranh thứ hạng chứ không phải để được chia sẻ.

Dưới là nghiên cứu của BuzzSumo cho thấy sự tương quan giữa lượt chia sẻ trên Twitter so với lượng content đang được tạo ra. 

machine-learning-average-shares

Đó là lý do vì sao chúng ta cần phải tối ưu Content theo Entity, không chỉ để cung cấp thêm một trải nghiệm tốt nhất dành cho người dùng, mà còn để hiện diện và xếp hạng tốt hơn trên công cụ tìm kiếm!

Entity Building SEO là gì?

Entity (thực thể) là một khái niệm trừu tượng. Nó có thể là bất cứ thứ gì: địa điểm, con người, tổ chức, khái niệm hay ý tưởng.

Lấy ví dụ đoạn văn bản sau, bạn sẽ thấy Google nhận biết nhiều loại Entity khác nhau như con người, tổ chức như Google, mốc thời gian như 2007, quốc gia như Mỹ …

nhan-dien-Entity

Đây là cách mà Google dần hoàn thiện tính tự nhiên hay khả năng đọc hiểu ngôn ngữ cũng như nội dung văn bản của mình.

Nếu buộc phải định nghĩa Entity là gì, tôi sẽ nói đây là những thực thể có mối liên hệ với nhau về mặt ngữ nghĩa, từ đó giúp công cụ tìm kiếm của thể hiểu được cả nghĩa đen lẫn nghĩa bóng.

Lưu ý:

Entity không chỉ là vật thể rõ ràng ra, nó còn có thể là khái niệm, ý tưởng, xu hướng.

Vậy tại sao Google lại quan tâm đến việc rút trích Entity (Entity extraction) hay xét Entity trên tổng thể?

Chắc hẳn nhiều bạn đã nghe về biểu đồ liên kết (link graph), liên quan đến link building cũng như spam.

Thực ra Google luôn cố gắng ngăn chặn tối đa tình trạng này.

Từng có thời gian dài nhiều người cho rằng social signal (số lượt người dùng chia sẻ bài viết của bạn trên mạng xã hội) đóng một vai trò ngày càng quan trọng vì chỉ số này cho Google biết đây là content thích hợp với người dùng nhất – nhưng hiện nay dường như Entity đã thế chỗ cho điều đó.

Entity cũng giúp nhóm content đến từ cùng một thương hiệu hoặc một công ty.

Nếu bạn nghĩ về ứng dụng của một công ty và website của công ty đó thì hai Entity này sẽ cho Google biết cái nào đến từ cùng thương hiệu và cái nào đến từ 2 thương hiệu khác nhau.

Đây cũng là ngôn ngữ bất khả tri và hỗ trợ rất nhiều trong tìm kiếm bằng giọng nói.

Rút trích Entity SEO & Google rút trích Entity như thế nào?

Rút trích Entity là hành động lọc tất cả Entity ra khỏi văn bản để xử lý, phân tích, làm việc với chúng…

Nếu như bạn đang cố tự rút trích Entity thì bạn cần phải đảm bảo 4 yếu tố sau:

rut-trich-entity
  1. ID để nhận biết Entity như địa chỉ và các MREID (Machine Readable Entity ID). Nói đơn giản thì chúng giống như URL nhưng không phải vậy.
    *Chú thích: MREID là một chuỗi ký tự (thường là chữ cái và số) được viết để chỉ riêng một Entity đơn (người, nơi, cột mốc). Ví dụ: /m/0qs4dyq
  1. Dữ liệu khổng lồ (data) – Google đã có cho mình kho dữ liệu khổng lồ nhờ vào kho ngữ liệu (corpus) hay Google index.
  2. Kho kiến thức lớn như Freebase hoặc Wikipedia. Google đã mua Freebase nhiều năm về trước và chính xác là để phục vụ cho mục đích này.
  3. Thuộc tính (attribute), trên cơ bản những thuộc tính này là mối quan hệ giữa các Entity giúp Google hiểu về khái niệm đằng sau chúng.

Năm 2012, Google công bố một số dữ liệu họ có được – khoảng 500 thực thể, 3.5 tỷ thông tin trong kho kiến thức của Google và tất cả số liệu này đã được cập nhật khoảng 11 năm về trước.

Bạn có thể tưởng tượng đến thời điểm hiện tại thì con số này còn phát triển và trở nên kinh khủng đến mức nào.

Google đã dùng thuật toán gọi là Word2Vec để tăng độ nhận biết ngôn ngữ.

Thuật toán Word2Vec dựa trên hai thuật toán nhỏ khác là Skip Grams và Continuous Bag of Words (viết tắt CBOW).

Về cơ bản, thuật toán này là sự kết hợp của các từ lại với nhau, phân tích các từ đứng gần nhau, từ đó hiểu cách các từ liên kết như thế nào trong văn bản.

Với Word2Vec, Google có thể vẽ sơ đồ chữ hoặc chuyển đổi chữ thành số và rồi những con số này sẽ được biểu diễn dưới dạng vector hoặc biểu đồ.

**Note: Nếu như bạn vẫn còn nhớ kiến thức về vector, hãy đọc kĩ phần này. Nhưng nếu bạn đã quên nó và chưa từng có khái niệm về vector, hãy đi đến phần kế tiếp!

Google sẽ hiểu được các từ đặt trong mối quan hệ giống nhau giữa các ngôn ngữ khác nhau.

Ví dụ trong biểu đồ đầu tiên có các con số 1, 2, 3, 4, 5 bằng Tiếng Anh là one, two, three, four, five. Những con số này trong tiếng Tây Ban Nha cũng nằm ở vị trí tương tự.

thuat-toan-word2vec

Phía dưới, chúng ta có biểu đồ đầu tiên gồm các từ heo, bò, ngựa trong Tiếng Anh là pig, cow, horse và trong tiếng Tây Ban Nha thì những từ này cũng nằm ở vị trí giống vậy.

Một khi chuyển chữ thành các con số thì chữ sẽ biến thành khái niệm và con số đại diện sẽ hoàn toàn không liên quan đến ngôn ngữ mà bạn đang sử dụng.

Khi nối các vector lại, chúng ta sẽ thấy được mối quan hệ giữa ngôn ngữ và quốc gia.

Chẳng hạn Hà Nội là thủ đô của Việt Nam cũng như Moscow là thủ đô của Nga, hai mối quan hệ này như nhau.

Từ đó, bạn có thể ghép chữ để rút ra những nguyên tắc cơ bản.

Mọi thứ trở nên cực kỳ logic.

‘THINGS NOT STRINGS’ (Vật thể, không phải chuỗi)

Nguyên lý này không chỉ giúp bạn biết được hiện nay có bao nhiêu từ trên một trang mà còn là nghĩa của những từ này, từ đó biết được người dùng đang muốn tìm kiếm và muốn biết thêm những thông tin gì.

Nếu xem thuật toán này là biểu đồ, thì Entity ở đây là giao điểm (node) và mối quan hệ có được là các cạnh (edge) khi nối các điểm giao nhau lại.

kho_du_lieu

Nếu tìm kiếm trên Google từ khóa  “United States presidential candidates in 2012”, bạn sẽ có kết quả như Mitt Romney, Ron Paul, Gary Johnson – họ đều là những ứng viên tổng thống từ đảng Cộng hòa và vẫn còn sống.

Tuy nhiên trên thực tế, cũng có rất nhiều người họ Johnson như Andrew Johnson hay Lyndon B Johnson cũng là thành viên của đảng Cộng hòa.

Tiếp đến Mitt Romney và Johnson đều liên quan đến Medicare (chương trình bảo hiểm sức khỏe liên bang mỹ) Tất cả mối liên hệ trên giữa các Entity giúp Google hiểu được bản chất của các Entity này là gì.

Và nếu bạn xét trên cấp độ lớn hơn 1 tỷ lần thì khả năng nhận biết của Google đã được nâng lên tầm cao mới chứ không chỉ đơn thuần là mật độ từ khóa (keyword density) mà bạn đang có nhồi nhét để thông báo với Google bạn đang viết về chủ đề gì.

Nguyên lý này đã được ứng dụng trong thuật toán Knowledge Graph, tại cột bên tay phải Google đã cung cấp nhiều thông tin khác nhau về từ khóa “dưa hấu”.

knowlede_graph

Nguyên lý này cũng được thể hiện trong carousel (phần khoanh đỏ trong hình), rõ ràng Google có thể hiểu tất cả các dòng như iphone, apple watch, ipod, … đều thuộc quyền sử hữu và là sản phẩm của Apple

knowledge_graph

Và một lần nữa, nguyên lý này được áp dụng trong SERP, khi gõ từ khóa Airbus A380, Google sẽ tự động xuất ra kết quả tìm kiếm về các loại máy bay dân dụng.

airbus

Google cũng từng công bố họ đang thay đổi theo cách này trong thông báo từ Amit Singhal –  trưởng phòng Google Search năm 2012:

Giới chuyên môn gọi đây là biểu đồ (graph) – có khả năng hiểu được các Entity trong thế giới thực đặt trong mối quan hệ của chúng với thực thể khác: things not strings.” – Amit Singhal

Có lẽ bạn đã từng nghe “things not strings” ở đâu đó và đây thực sự là cuộc cách mạng, thay đổi từ mật độ từ khóa và văn bản hướng đến thực thể của văn bản là gì.

Chúng ta đã chứng kiến rất nhiều cập nhật mới trong năm nay và tôi cho rằng những cập nhật này có mối liên kết trực tiếp với nhau chứ không đơn thuần là những cập nhật riêng lẻ nhằm hướng đến Entity và rút trích Entity.

Những cập nhật này nhằm tăng khả năng hiểu ngôn ngữ tự nhiên, từ đó Google có thể hiểu được ngôn ngữ và content đó đang viết về chủ đề gì.

Cảm ơn bạn đã đọc hết bài viết trên của VIDCOGROUP mọi ý kiến và thắc mắc vui lòng để lại dưới phần Comment.

Tham khảo bài viết:

  1. Cấu trúc Website là gì: Cách xây dựng một trang Web chuẩn SEO (Phần 1)
  2. Thiết kế Web chuẩn SEO là gì? Hướng dẫn cách thiết kế web chuẩn Seo từ A-Z
  3. PBN SEO và tổng hợp các lưu ý bạn cần phải biết khi lựa chọn tên miền cũ

Author

nguyendaihai

Leave a comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

vi