AI tìm kiếm tổng hợp thông tin ngoài top link khác Google

Một nghiên cứu học thuật mới so sánh kết quả tìm kiếm web truyền thống với kết quả được tạo ra bởi các hệ thống dựa trên AI tìm kiếm đã phát hiện ra rằng các công cụ AI tạo sinh (generative AI) thường xuyên dựa vào các nguồn ít phổ biến hoặc không chính thống. Phát hiện này nhấn mạnh sự phân chia ngày càng rõ rệt giữa cách các công cụ tìm kiếm thông thường và các hệ thống dựa trên mô hình ngôn ngữ lớn (LLM) thu thập và trình bày thông tin trực tuyến.

Các nhà nghiên cứu từ Đại học Ruhr Bochum và Viện Max Planck về Hệ thống Phần mềm đã thực hiện phân tích này, được công bố dưới dạng một bài báo tiền in (preprint paper) có tiêu đề “Characterizing Web Search in the Age of Generative AI.” Nghiên cứu đã đo lường sự khác biệt giữa một loạt các công cụ tìm kiếm dựa trên AI, bao gồm AI Overviews của Google, Gemini-2.5 Flash và hai biến thể của GPT-4o của OpenAI: chế độ tìm kiếm web tích hợp và Công cụ Tìm kiếm GPT-4o (GPT-4o Search Tool), vốn chỉ truy cập web khi mô hình xác định rằng cần có dữ liệu bên ngoài. Những phát hiện này cung cấp một cái nhìn thực nghiệm sớm về cách AI tạo sinh đang thay đổi kiến trúc của tìm kiếm. Trong khi các công cụ truyền thống vẫn dựa vào sự phổ biến và xếp hạng, các hệ thống AI đang hình thành một mô hình dựa trên sự tổng hợp – một mô hình làm mờ ranh giới giữa việc truy xuất và diễn giải thông tin.

AI tìm kiếm thông tin ở những “vùng ngoại vi” của Internet

Trong nhiều thập kỷ, các công cụ tìm kiếm đã hoạt động bằng cách lập chỉ mục và xếp hạng các trang, trả về danh sách các liên kết được sắp xếp chủ yếu theo mức độ liên quan và độ uy tín. Ngược lại, các hệ thống AI tạo sinh tổng hợp thông tin từ nhiều nguồn thành các câu trả lời ngắn gọn, được tóm tắt. Các nhà nghiên cứu đã đặt mục tiêu định lượng xem sự thay đổi này ảnh hưởng như thế nào đến các loại trang web cung cấp thông tin cho những câu trả lời đó.

Để kiểm tra giả thuyết của mình, họ đã thu thập hàng nghìn truy vấn mẫu từ một số bộ dữ liệu công khai. Chúng bao gồm các câu hỏi được thu thập từ các tương tác ChatGPT trong bộ dữ liệu WildChat, các chủ đề xã hội và chính trị chung được lập danh mục bởi trang web giám sát độ thiên vị truyền thông AllSides, và 100 mục được tìm kiếm nhiều nhất trên danh sách xếp hạng sản phẩm của Amazon. Các chủ đề thịnh hành từ dữ liệu xu hướng tìm kiếm của Google cũng được đưa vào để thử nghiệm so sánh.

Ai Tìm Kiếm Tổng Hợp Thông Tin Ngoài Top Link Khác Google 01

Mỗi truy vấn được gửi đến cả Google Search truyền thống và các hệ thống dựa trên AI. Sau đó, các nhà nghiên cứu đã so sánh các tên miền được trích dẫn trong các câu trả lời do AI tạo ra với những tên miền xuất hiện trong 10 và 100 liên kết đầu tiên của một trang kết quả Google tiêu chuẩn.

Sự khác biệt là rất lớn. Sử dụng Tranco, một công cụ theo dõi độc lập xếp hạng các tên miền web theo mức độ phổ biến, nghiên cứu phát hiện ra rằng kết quả tìm kiếm do AI tạo ra liên tục lấy thông tin từ các trang web nằm ngoài các danh mục được truy cập nhiều nhất. Cụ thể, trong chính AI Overviews của Google, hơn một nửa số nguồn được trích dẫn không xuất hiện trong top 10 kết quả Google organic (organic) cho cùng một truy vấn, và 40% thậm chí còn không có mặt trong top 100 liên kết.

Gemini, GPT-4o và cách AI tổng hợp thông tin khác biệt

Kết quả tìm kiếm của Gemini cho thấy một mô hình tương tự, thường xuyên trích dẫn các tên miền nằm ngoài top 1.000 của Tranco. Các nhà nghiên cứu lưu ý rằng nguồn thông tin “trung bình” (median) được Gemini trích dẫn nằm dưới ngưỡng các trang web được truy cập rộng rãi. GPT-4o và đối tác có bật web của nó cũng lấy thông tin từ các nguồn ít nổi bật hơn, mặc dù chúng có xu hướng tham chiếu các tên miền thuộc tổ chức (institutional domains) như trang công ty và bách khoa toàn thư hơn là mạng xã hội hoặc diễn đàn thảo luận.

Nghiên cứu không kết luận rằng kết quả tìm kiếm của AI kém chất lượng hơn, mà là chúng phản ánh một cách tiếp cận khác đối với việc truy xuất thông tin. Sử dụng một công cụ đánh giá độc lập được phát triển tại Đại học Stanford, LLOOM, nhóm nghiên cứu phát hiện ra rằng các hệ thống tìm kiếm AI bao phủ một số lượng khái niệm riêng biệt tương đương với 10 liên kết hàng đầu trong tìm kiếm thông thường. Điều này cho thấy rằng trong khi các câu trả lời của AI tóm tắt độ rộng thông tin tương tự, chúng đôi khi nén dữ liệu đó lại, làm giảm bớt những sắc thái được bảo tồn trong các kết quả tìm kiếm truyền thống.

Ai Tìm Kiếm Tổng Hợp Thông Tin Ngoài Top Link Khác Google 02

Hiệu ứng này đặc biệt đáng chú ý đối với các thuật ngữ tìm kiếm mơ hồ, chẳng hạn như tên được chia sẻ bởi nhiều cá nhân. Tìm kiếm dựa trên liên kết tiêu chuẩn có xu hướng cung cấp phạm vi bao phủ ngữ cảnh rộng hơn, trong khi câu trả lời của AI thường hợp nhất các trường hợp này thành các diễn giải đơn lẻ, bỏ qua một số kết quả thay thế.

Các hệ thống tạo sinh được hưởng lợi từ kiến thức đã được đào tạo trước của các mô hình ngôn ngữ lớn, mang lại cho chúng lợi thế trong việc tổng hợp ngữ cảnh nền. Chẳng hạn, GPT-4o với Công cụ Tìm kiếm đôi khi đưa ra các bản tóm tắt toàn diện mà không trích dẫn bất kỳ dữ liệu bên ngoài nào, dựa hoàn toàn vào cơ sở kiến thức nội bộ của mô hình. Hành vi này tỏ ra hữu ích cho các chủ đề đã được thiết lập rõ ràng nhưng kém tin cậy hơn đối với các sự kiện gần đây hoặc tin tức nóng hổi.

Khi được thử nghiệm với các truy vấn Google thịnh hành từ giữa tháng 9, phiên bản có bật web của GPT-4o thường xuyên thất bại trong việc truy xuất thông tin hiện tại, tạo ra các câu trả lời giữ chỗ như yêu cầu làm rõ hoặc xác nhận đơn giản về sự không chắc chắn. Điều này phản ánh sự do dự của hệ thống trong việc truy cập các nguồn bên ngoài trừ khi thực sự cần thiết.

Các tác giả nhấn mạnh rằng việc đánh giá độ chính xác hoặc chất lượng của tìm kiếm AI tạo sinh đòi hỏi các tiêu chuẩn mới. Họ kêu gọi các nghiên cứu trong tương lai sử dụng các số liệu ngoài những tiêu chuẩn được thiết kế cho xếp hạng tìm kiếm truyền thống, đặc biệt là các khuôn khổ tính đến sự đa dạng của nguồn, phạm vi bao phủ khái niệm và hiệu quả của các hệ thống AI trong việc tổng hợp thông tin thành các bản tóm tắt gắn kết.

Viết một bình luận