谷歌AI概览准确率90%却易受虚假信息影响引争议

微新创想:《纽约时报》近日报道,谷歌的 AI 概览(AI Overviews)准确率约为 90%。这一数据的背后是每年超过 5 万亿次的搜索量,意味着每小时可能会生成超过 5700 万条错误答案,平均每分钟接近 100 万条错误信息。

微新创想:初创公司 Oumi 对谷歌搜索进行评估,采用 SimpleQA 基准分析了 4326 次搜索结果。结果显示,谷歌的 Gemini 2 在去年 10 月的准确率为 85%,而到今年 2 月,Gemini 3 这一数字提升至 91%。

微新创想:然而,Oumi 的评估方法主要依赖于 AI 工具,这可能导致数据偏差。此外,谷歌对同一搜索查询可能生成不同的概览,增加了结果的不确定性。

微新创想:具体来看,AI 概览与原始信息来源不符的比例已从 Gemini 2 的 37% 上升至 Gemini 3 的 56%。这意味着用户在看到某些概览时,往往会发现与之不符的链接或者准确的概览中却引用了错误的信息。

微新创想:有记者甚至发布虚假博客后,谷歌在次日的概览中引用了相关内容,显示出 AI 概览容易被操纵。此外,用户斯蒂芬・潘瓦西在搜索摔跤手胡克・霍根(Hulk Hogan)的死讯时,AI 概览明确表示 “没有可信报告显示霍根已去世”,但页面下方却出现了 “霍根之死谜团加深” 的文章标题。

微新创想:这一自相矛盾的现象引发了用户对 AI 生成内容的可靠性质疑。面对这些问题,谷歌发言人对 Oumi 的测试方法提出了质疑,认为其评估并未能真实反映搜索行为。

最新快讯

2026年04月08日

14:36
微新创想:4月7日下午,张雪机车创始人张雪发布视频确认其踏板摩托车项目已启动。该车型定位为运动与越野风格的结合,展现出独特的设计语言和性能表现。据透露,这款新车由知名Vespa 946设计师参与设计,进一步提升了产品的外观与操控体验。 微新创想:该车型的售价将显著高于传统125/150cc踏板摩托车,显示出张雪机车在高端市场的布局与野心。这一价格策略也反映出...
14:36
微新创想:2026年4月8日,腾讯宣布WorkBuddy及CodeBuddy IDE、插件、CLI等全系产品已内置GLM-5.1大模型。这一重大升级标志着腾讯在人工智能与软件开发领域的深度融合迈出了关键一步。 此次更新主要面向开发者群体,涵盖了代码编写、长程智能任务执行与复杂系统设计等多个全场景开发需求。通过将GLM-5.1大模型集成到产品中,腾讯为开发者提...
14:36
微新创想:4月3日,广东横琴新石器无人车科技有限公司在珠海横琴正式成立。公司法定代表人为李子夷,注册资本为100万元。新石器慧研(深圳)科技有限公司作为其全资母公司,将为新公司提供强有力的技术支持与资源保障。 微新创想:广东横琴新石器无人车科技有限公司主要业务涵盖智能机器人研发、汽车零部件研发以及外卖递送服务。这一多元化布局体现了公司在智能交通与物流领域的全...
14:36
微新创想:淘宝平台于2026年4月3日发布公告,宣布自4月20日起逐步下线“其他物流公司”发货功能。此次调整是平台为进一步提升买家购物体验而采取的重要举措,旨在减少因第三方物流引发的投诉和负面舆情。 微新创想:公告指出,此次治理主要针对全行业实物类目,未来仅允许特定类目如大件商品等继续使用“其他物流公司”发货服务。具体是否开放,将依据发货页面上的提示为准,确...
14:36
微新创想:2026年3月,美国人工智能公司Perplexity AI宣布其年度经常性收入(ARR)从3.05亿美元提升至4.5亿美元。这一显著增长标志着公司在AI搜索和智能体业务方面取得了重要突破。Perplexity AI一直致力于提供先进的AI解决方案,帮助用户更高效地获取信息和完成任务。 在2月末,Perplexity AI推出了全新的Perplexi...
14:36
微新创想:2026年4月8日,特斯拉在美国向FSD监督版早期测试用户正式推送v14.3版本。此次更新被埃隆·马斯克称为自动驾驶‘最后一块重要拼图’,标志着特斯拉在自动驾驶技术上的又一重要突破。 该版本的核心在于基于MLIR技术完全重写的AI编译器与运行环境。这一技术革新不仅提升了系统的整体性能,还显著优化了车辆的响应速度,据官方数据显示,响应速度提升了20%...
14:36
微新创想:2026年4月,企业云端生成运营平台提供商NeuBird宣布完成1930万美元A轮融资。本轮融资由Xora Innovation领投,Mayfield、微软M12、StepStone Group及Prosperity7 Ventures跟投。 NeuBird专注于将生成式AI技术深度整合到IT运营中,以提升企业的运维效率和智能化水平。公司自主研发的...
14:36
微新创想:4月8日,埃隆·马斯克透露,SpaceX旗下人工智能项目Colossus 2当前正同步训练6个大模型。这一进展发生在多个位于美国得州与加州的数据中心。由SpaceX AI团队主导推进,该项目正致力于打造更强大的人工智能系统。 此次训练依托于SpaceX自建的定制化算力基础设施。这种基础设施不仅能够提供更高的计算效率,还特别强调低延迟与高可靠性,以满...
14:33
微新创想:近日,西安蓝田的一位烤馕小哥因为长相酷似韩国明星车银优,在网络上迅速走红。有网友随手拍了一张他的照片发到网上,没想到一下子就收获了超过百万的点赞,大家纷纷称他为“车馕优”。 这位小哥的颜值可真不是盖的,评论区里全是他的各种角度照片,每一张都帅气逼人,没有一张是“丑照”。他的外貌特征与车银优极为相似,尤其是那双明亮的眼睛和挺拔的身姿,让不少网友瞬间沦...
14:33
微新创想:您是否正在寻找一个既能提升品牌形象又能吸引潜在客户的高效方式?在当今竞争激烈的市场环境中,企业需要不断创新以保持活力。通过结合现代科技与传统营销手段,微新创想为您提供了一站式的解决方案,帮助您在数字化浪潮中脱颖而出。 微新创想:我们深知,客户体验是决定品牌成败的关键因素之一。因此,我们致力于打造个性化的服务流程,让每一位客户都能感受到专属的关怀与专...
14:33
微新创想:4月8日消息,广东梅州一名网约车司机通过社交平台发布视频,曝光了一起不文明乘车行为。据司机介绍,当天他搭载了一男一女两名乘客,行驶途中发现后排女乘客竟直接将光脚踩在前排扶手箱上,姿势十分随意。司机见状委婉提醒,对方却回应:你放心,我脚刚刚洗了”,之后才将脚收回。 该司机表示,自己在日常营运中经常遇到类似情况。在他看来,这类行为既是对司机的不尊重,也...