Đầu tuần này, tôi lại tiếp tục đưa tin tức về RankBrain, một hệ thống máy học cùng với các yếu tố thuật toán khác để giúp xác định những kết quả tốt nhất cho một truy vấn cụ thể.
Cụ thể, RankBrain xuất hiện có liên quan đến xử lý và sàng lọc các truy vấn, sử dụng mô hình nhận dạng để tìm kiếm các truy vấn phức tạp hoặc không rõ ràng và kết nối chúng vào các chủ đề.



Điều này cho phép Google cung cấp kết quả tìm kiếm tốt hơn cho người dùng, đặc biệt là trong trường hợp có hàng trăm triệu các truy vấn tìm kiếm mỗi ngày mà công cụ tìm kiếm không bao giờ nhìn thấy trước được.

Google đã nói rằng RankBrain là một trong những tín hiệu xếp hạng quan trọng nhất.

RankBrain là một trong hàng trăm tín hiệu để nhận dạng những gì xuất hiện trên trang tìm kiếm và nơi chúng được xếp hạng. Trong vài tháng nó đã được triển khai, RankBrain đã trở thành một tín hiệu quan trọng nhất đứng thứ 3 góp phần vào việc hiển thị kết quả của một truy vấn tìm kiếm.

Lưu ý: RankBrain nhiều khả năng sẽ có một "bộ xử lý truy vấn" và nó được coi như là một tín hiệu xếp hạng.

Đây không phải là sự thay đổi lớn trong thời gian gần đây. Tuy nhiên, trong vài năm gần đây, Google đã thực hiện một vài thay đổi quan trọng trong hoạt động tìm kiếm, từ bản cập nhật thuật toán đến bố cục trang kết quả tìm kiếm. Google đã phát triển và thay đổi thành một động vật khác rất nhiều so với pre-Penguin và pre-Panda.

Những thay đổi này không dừng lại ở tìm kiếm. Công ty này cũng đã thay đổi về mặt cấu trúc. Với chiếc ô “Alphabet” mới và riêng biệt, Google không còn là một sinh vật.

Ngay cả vấn đề truyền thông đến với SEO và webmaster phần lớn cũng đã thay đổi. Matt Cutts không còn là nơi dễ dàng để lấy những thông tin đáng tin cậy nữa. Vì vậy, có rất nhiều thay đổi trong một thời gian ngắn. Có vẻ như Google đang đẩy mạnh về phía trước.

Tuy nhiên, RankBrain là một sự khác biệt từ những thay đổi trước đó. RankBrain là một nỗ lực để tinh chỉnh các kết quả truy vấn của Knowledge Graph dựa trên tìm kiếm thực thể. Trong khi tìm kiếm thực thể không phải là mới, việc bổ sung một thuật toán máy học chỉ trong khoảng 3 tháng.

Vậy tìm kiếm thực thể là gì? Làm thế nào để áp dụng nó với RankBrain? Google sẽ đi đâu?

Để hiểu rõ bối cảnh, chúng ta cần phải quay trở lại một vài năm.

Hummingbird

Sự ra đời của thuật toán Hummingbird là một sự thay đổi đáng kể. Đó là một cuộc đại tu lớn về việc Google xử lý các truy vấn tự nhiên.

Hummingbird đến từ đâu? Thuật toán Hummingbird mới được sinh ra khi Google kết hợp tìm kiếm ngữ nghĩa vào công cụ tìm kiếm của mình. Đây được coi là một bước đột phá của Google. Google sẽ chỉ hiểu những gì bạn nhập vào hộp tìm kiếm.

Tìm kiếm ngữ nghĩa đã tìm cách cải thiện độ chính xác của tìm kiếm bằng cách hiểu được ý định tìm kiếm theo ngữ cảnh và ý nghĩa của thuật ngữ khi chúng xuất hiện trong không gian tìm kiếm, cho dù là trên web hay trên một hệ thống khép kín để tạo ra các kết quả có liên quan hơn. Hệ thống tìm kiếm ngữ nghĩa xem xét các điểm khác nhau bao gồm cả bối cảnh tìm kiếm, vị trí, mục đích và biến thể của các từ, từ đồng nghĩa, các truy vấn tổng quát và chuyên ngành, khái niệm phù hợp và truy vấn ngôn ngữ tự nhiên để cung cấp kết quả tìm kiếm có liên quan. Công cụ tìm kiếm web như Google và Bing kết hợp một số yếu tố của tìm kiếm ngữ nghĩa.

Tuy nhiên, trong 2 năm đó mọi người sử dụng tìm kiếm ngữ nghĩa đều không nhận ra được điều đó. Không phải là Google không đáp ứng được các tiêu chí mà Google đang ở vị trí thấp hơn nhiều so với những định nghĩa đầy đủ.

Ví dụ, nó sử dụng cơ sở dữ liệu để nhận dạng và các thực thể liên kết. Tuy nhiên, một công cụ ngữ nghĩa sẽ hiểu bối cảnh ảnh hưởng như thế nào đến các từ và sau đó có thể đánh giá và giải thích ý nghĩa.

Google không hiểu điều này. Trên thực tế, Google chỉ đơn giản là tìm kiếm điều hướng và tìm kiếm điều hướng không được coi là theo định nghĩa tự nhiên.

Vì vậy khi Google hiểu biết về các thực thể và các mối quan hệ thông qua định nghĩa dữ liệu, khoảng cách và máy học, nó có thể chưa hiểu ngôn ngữ tự nhiên. Nó cũng có thể không dễ dàng giải thích liên kết thuộc tính, không giải thích gì thêm khi những mối quan hệ trong kho lưu trữ của Google đang có sự tương quan yếu hoặc không tồn tại.

Tất nhiên, Google có thể học được rất nhiều các định nghĩa và các mối quan hệ theo thời gian nếu mọi người tìm kiếm đủ một tập các thuật ngữa. Đây là nơi máy học (RankBrain) có thể đi vào. Thay vì tập các truy vấn của người dùng, máy học có thể tạo ra một phán đoán tốt nhất dựa trên cảm nhận của người dùng.

Tuy nhiên, ngay cả với RankBrain, Google không thể giải thích ý nghĩa như một con người và đó là phần ngôn ngữ tự nhiên của định nghĩa ngữ nghĩa.

Như vậy về bản chất Google không phải là một công cụ tìm kiếm ngữ nghĩa. Vậy nó là gì?

Chuyển từ "chuỗi ký tự" đến "mọi thứ"

Chúng ta đang làm việc trên một mô hình thông minh để hiểu được các thực thể trong thế giới thực và các mối quan hệ của chúng với nhau: mọi thứ chứ không phải là một chuỗi các ký tự.

Như đã đề cập, Google hiện đang làm việc rất tốt ở những dữ liệu cụ thể. Bạn cần một báo cáo về thời tiết? Tình trạng giao thông? Đánh giá nhà hàng? Google có thể cung cấp thông tin này, hiển thi trên đầu trang của kết quả tìm kiếm. Các vị trí như vậy thường được dựa vào Knowledge Graph và là kết quả của một loạt các hành động của Google.

Việc chuyển từ "string" đến "thing" là rất tuyệt vời cho việc tìm kiếm dựa trên dữ liệu, đặc biệt là khi nó đặt các bit dữ liệu trong Knowledge Graph. Các bit dữ liệu thường trả lời câu hỏi ai, cái gì, ở đâu, khi nào, tại sao và như thế nào. Google có thể cung cấp cho người dùng thông tin mà họ muốn có.

Ở đây, tôi sử dụng "truy vấn phức tạp" để chỉ một truy vấn mà không dễ dàng ánh xạ đến một thực thể, một phần dữ liệu được biết hoặc một thuộc tính dữ liệu - từ đó làm cho các truy vấn trở nên khó khăn hơn với Google.

Kết quả là khi bạn tìm kiếm một tập các thuật ngữ phức tạp, đó là một cơ hội tốt bạn nhận được một vài kết quả có liên quan.

Các truy vấn phức tạp và hiệu quả tìm kiếm

RankBrain sử dụng trí thông minh nhân tạo để nhúng một lượng lớn các ngôn ngữ viết thành các thực thể toán học - được gọi là vecto mà máy tính có thể hiểu được. Nếu RankBrain nhìn thấy một từ hoặc một cụm từ không quen thuộc, máy học có thể dự đoán những từ và cụm từ có một ý nghĩa tương tự và lọc kết quả phù hợp, làm cho nó hiệu quả hơn trong việc xử lý các truy vấn tìm kiếm mà trước đây không bao giờ nhìn thấy.

Bạn muốn xem các truy vấn phức tạp? Hãy nhập vào một tìm kiếm Google như bình thường. Bây giờ kiểm tra kết quả. Nếu bạn sử dụng một tập các thuật ngữ không phổ biến hoặc không liên quan, bạn sẽ thấy Google ném ra một kết quả không rõ nghĩa. Tại sao vậy?

Google đang tìm kiếm các thuật ngữ được Google biết đến và sử dụng máy học để tạo/hiểu các mối quan hệ. Về cơ bản, khi các thực thể hoặc mối quan hệ không được biết đến, Google không thể suy ra ngữ cảnh, vì vậy nó sẽ dựa vào những suy đoán.

Ngay cả khi các thực thể được biết đến, không có khả năng để xác định sự liên quan giữa các thuật ngữ tìm kiếm chưa được biết đến.

Chúng ta có thể thấy điều này nếu bạn nhập truy vấn của bạn một lần nữa - nhưng khi bạn nhập, bạn sẽ nhìn thấy trong hộp thả xuống và xem kết quả xuất hiện. Lần này, thay vì truy vấn ban đầu bạn tìm kiếm, chọn một trong các từ thả xuống gần giống nhất với ý định tìm kiếm của bạn.

Vậy các thực thể là những gì?

Nhìn chung, danh từ - hoặc người/địa điểm/ý tưởng/mọi thứ - là những gì chúng ta gọi là thực thể. Các thực thể được Google biết đến và điều đó có nghĩa là chúng được định nghĩa trong cơ sở dữ liệu tham chiếu của Google.

Như chúng ta đã biết, Google đã thực sự xuất sắc ở tất cả mọi lĩnh vực như thời tiết, phim, nhà hàng...Nó có thể cung cấp cho bạn các định nghĩa và các thuật ngữ có liên quan và thậm chí nó còn đóng vai trò như một quyển bách khoa toàn thư kỹ thuật số.

Những thứ mà Google trả về cũng được biết đến và đã được biết đến, được ánh xạ hoặc các mối quan hệ được phỏng đoán. Tuy nhiên, nếu có một thuật ngữ nào không dễ dàng được ánh xạ hoặc không được ánh xạ với nhau, Google sẽ gặp khó khăn trong việc tìm hiểu các truy vấn. Như đã đề cập trước đó, về cơ bản Google đoán được những gì bạn muốn.

Bây giờ Google muốn chuyển đổi các từ xuất hiện trên một trang thành các thực thể và có các thuộc tính liên quan. Với con người thì điều đó là hoàn toàn tự nhiên nhưng đối với máy tính thì nó được gọi là trí tuệ nhân tạo.

Đó là một nhiệm vụ đầy thử thách nhưng công việc đã bắt đầu. Google đang xây dựng một tập các thực thể và một kho lưu trữ về nó và những gì bạn nên biết về những thực thể đó.

Vậy nó làm việc như thế nào?

Tôi sẽ đưa ra một ví dụ. “Iced Tea,” “Lemons” và “Glass” tất cả là thực thể và các thực thể này có một mối quan hệ được biết đến. Điều này có nghĩa là khi bạn tìm kiếm thuật ngữ này [Iced Tea, Lemons, Glass] — Google có thể dễ dàng xâu chuỗi lại nhiều kết quả có liên quan. Google biết bạn muốn gì. Ý định người dùng là rất rõ ràng.

- Tuy nhiên, tôi thay đổi các truy vấn thành... Iced Tea, Rooibos, Glass

Google vẫn hiểu tìm kiếm này nhưng đó không phải là rõ ràng.

Tại sao? Rooibos thường không được sử dụng với Iced Tea, mặc dù nó là một loại trà.

- Bây giờ nếu chúng ta thay đổi truy vấn thành... Iced Tea, Goji, Glass

Chúng ta có thể thấy rằng Google đã bối rối.

- Bây giờ, nếu tôi thực hiện thay đổi cuối cùng thành...

Iced tea, Dissolved Sugar, Glass

Google gần như hoàn toàn bối rối về những truy vấn này. Mặc dù đây là thành phần trong công thức của sweet tea, bạn sẽ nhìn thấy một số trang liên quan đến hóa học.

Tại sao? Google không biết làm thế nào để ánh xạ chính xác các mối quan hệ.

- Nhưng nếu tôi nhìn vào trình đơn thả xuống với các thuật ngữ khác thì điều gì sẽ xảy ra?

Glass of Sugary Iced Tea

Các từ thay đổi là “sugar” thành "sugary" đã bị bỏ và từ “dissolved” đã bị bỏ. Tuy nhiên, điều này dẫn chúng ta đến một tập các kết quả Sweet Tea.

Nhưng tại sao?

Như những gì chúng ta có thể thấy là RankBrain đang cố gắng để giải thích các mối quan hệ. Khi nó hiểu biết về ý định của bạn, Google có thể sử dụng RankBrain để đưa vào danh sách một tập các kết quả có thể xảy ra với các truy vấn của bạn. Khi chúng không thể xác định được kết quả phù hợp, chúng sẽ sử dụng một cỗ máy để giúp tinh chỉnh các truy vấn.

Vậy Google sẽ đi đến đâu?

Tương lai của Google

Khi Google thử nghiệm với RankBrain, họ đã bị mất thị phần - không nhiều nhưng hiện nay con số này vẫn đang bị giảm ở Mỹ. Trên thực tế, Google đã mất khoảng 3% thị phần kể từ khi Hummingbird được tung ra, do đó kết quả này không được coi là phù hợp hơn hoặc cải thiện hơn (và trong một số trường hợp, bạn có thể nói là chúng tồi tệ hơn).

Có thể Google sẽ phải quyết định xem nó là một công cụ trả lời hay là một công cụ tìm kiếm hoặc có thể nó sẽ tách biệt 2 điều này hoặc sẽ làm cả hai.

Không thể tạo ra một động cơ về ngữ nghĩa, Google xây dựng một căn cứ dựa trên thực tế. RankBrain hiện đã được đưa vào để giúp tinh chỉnh kết quả tìm kiếm bởi tìm kiếm thực thể đòi hỏi không chỉ hiểu biết về các từ tìm kiếm mà nó còn phải biết chúng liên quan như thế nào.

Theo thời gian, RankBrain sẽ tốt hơn. Nó sẽ tìm hiểu các thực thể mới và tất cả các mối quan hệ có thể giữa chúng. Nó sẽ trình bày kết quả tốt hơn so với hiện nay. Tuy nhiên, họ đang chạy đua với từng tích tắc. Thời gian sẽ trả lời tất cả nhưng thời gian đó là có giới hạn.

Ghi nguồn


PHP Code:

www.thegioiseo.com

Chủ đề có liên quan: