一项由德国鲁尔大学波鸿分校与享誉全球的马克斯・普朗克软件系统研究所联合开展的研究,为我们揭示了传统搜索引擎与新兴生成式人工智能系统在信息获取与呈现方式上的显著差异。研究团队精心设计实验,将谷歌自然搜索结果与四种主流生成式AI搜索系统进行了全面对比,包括谷歌自家的AI概述功能、具备搜索能力的Gemini2.5Flash、强大的GPT-4o-Search以及整合搜索工具的GPT-4o。整个研究过程涵盖了超过4600个精心设计的查询,内容广泛涉及政治、产品评论、科学探索等六大核心主题,从而系统性地展现了这些系统在处理海量网络信息时的独特性。
研究发现了一个令人瞩目的现象:AI搜索系统展现出更广泛的网络信息获取能力,尤其擅长挖掘那些来自知名度较低或较少被主流搜索引擎关注的网站资源。以谷歌AI概述为例,其引用的53%网站信息并未出现在谷歌搜索结果的前十名之中,更有27%的网站甚至未能进入前百名排名。这一数据直观地表明,用户在使用AI搜索系统时,可能会接触到更多来自审查机制相对宽松或不甚熟悉的网站内容。在信息引用深度方面,GPT-Tool的表现则呈现出明显差异,其平均每个答案仅引用0.4个外部来源,主要依赖自身庞大的内部数据库。相比之下,AI概述和Gemini系统在每次查询中能够引用超过8个外部来源,充分体现了其信息获取的丰富性与全面性。而传统的谷歌搜索服务通常将每次查询结果严格限制在十个链接以内,这使得其信息来源呈现出更高的集中度。
研究还特别关注了传统搜索引擎在处理实时事件信息方面的优势。通过对100个热门话题的追踪测试,研究结果显示AI概述仅能准确覆盖3%的查询需求,而GPT-4o-Search的覆盖率也仅为72%。这一数据有力地证明了AI系统在最新信息更新速度与准确性上的不足,可能会让用户获取到过时甚至错误的信息。这一发现对于依赖实时信息进行决策的用户群体来说,无疑敲响了警钟。

划重点:🌐 AI搜索系统引用的53%网站未在谷歌前十名中出现,来源更加多样。 📊 GPT-Tool平均仅引用0.4个外部来源,主要依赖内部知识。 📰 传统搜索在当前事件的准确性上明显优于AI搜索系统。
