最新研究揭示生成式AI搜索引擎存在严重信息准确性问题

一项由Salesforce人工智能研究院主导的权威研究指出,当前主流生成式AI搜索引擎及深度研究智能体在提供答案时,普遍面临引用不实和信息缺乏支撑的严峻挑战。研究团队对包括GPT-4.5、GPT-5、You.com、Perplexity和必应聊天在内的五款代表性工具进行了全面测试,发现约三分之一的回答主张存在可靠来源缺失的问题。其中,GPT-4.5的准确率仅为53%,而Perplexity的深度研究功能表现尤为突出,其回答主张中高达97.5%缺乏事实依据。

研究团队采用创新的”DeepTrace”评估体系,对303个查询样本进行了深度分析,这些样本涵盖了从社会争议性话题到专业技术领域的广泛议题。通过严谨的测试流程,研究人员发现AI在处理复杂问题时,其信息整合能力与事实核查机制存在明显短板。尽管部分专家指出当前AI标注方式和统计方法尚存局限,但研究结论依然强烈警示:提升答案准确性与信息溯源能力已成为人工智能领域亟待解决的核心课题。

这一发现对依赖AI获取信息的用户群体构成了潜在风险。当用户基于AI生成的内容做出决策时,可能无意中接受了大量未经核实的虚假信息。研究呼吁技术开发者必须优先优化AI的验证机制,建立更完善的知识图谱与事实核查系统,确保智能体提供的内容既具有创新性又具备高度可靠性。随着生成式AI技术的快速普及,如何平衡创新效率与信息质量,将成为行业发展的关键命题。

最新快讯

2026年02月15日

07:45
微新创想:2月13日,杭州华电半山发电有限公司联合国家电网浙江省电力有限公司,在2号机组成功并网投运全国首套9F重型燃机柔性励磁系统。该系统采用先进的IGBT器件替代传统晶闸管,显著提升了系统的响应速度,达到毫秒级。同时,电压支撑能力也得到了大幅提升,达到原有水平的1.5倍。 这一技术突破标志着我国在柔性励磁领域迈出了重要一步,首次实现了从中、小型机组向大型...
07:45
微新创想:谷歌近日确认其AI聊天机器人Gemini正面临大规模的蒸馏攻击。这种攻击方式主要通过重复提问来探测模型的内部逻辑,攻击者的目标可能是克隆该模型或提升自身AI系统的性能。据谷歌披露,单场攻击中提示次数超过了10万次,攻击来源遍布全球,主要由具有商业动机的行为者发起,其中包括一些AI私企和研究机构。 谷歌表示,此类攻击属于知识产权的非法获取,严重威胁其...
07:15
微新创想:微软于2月12日向Windows Server预览体验成员推送了下一代LTSC预览版Build 29531。此次更新为用户提供了多种版本选择包括数据中心版、标准版以及Azure虚拟机评估版。该版本不仅支持桌面体验还兼容服务器核心安装模式满足不同场景下的使用需求。 微软将此版本设为新的预览基线要求用户进行全新安装不支持从Build 26525及更早版...
06:42
微新创想:2026年2月14日,苹果官方宣布Apple Music订阅价格保持不变。此举被广泛解读为对Spotify当日美区涨价的回应。 Spotify自2026年2月起将个人Premium订阅涨至12.99美元(约89.8元人民币),家庭套餐涨至21.99美元(约152.1元人民币)。相较于2023年的价格,此次调整使个人订阅价格上涨了3美元。 同期,Ap...
06:12
微新创想:2026年2月15日 三星向Galaxy Watch8 Classic推送L5050ZCU3AZB5等版本固件更新 本次升级优化设备性能并增强安全防护 更新后 用户可通过应用市场安装独立微信手表版App(v1.0.6) 支持消息接收 快捷回复 微信付款等功能 登录时需手机端确认授权 成功后手机微信顶部将提示“手表微信已登录” 该手表版微信自2022...
00:33
微新创想:2026年2月14日,《南京市网络预约出租汽车管理办法》正式施行。新规放宽车辆准入,将车龄要求由‘初次注册登记’调整为‘距初次注册登记不超过2年’,允许符合条件的二手车进入市场。这一调整为更多车辆提供了参与网约车运营的机会,有助于扩大行业覆盖面。 同时取消驾驶员须具本市户籍或居住证的限制。此举打破了以往对驾驶员身份的地域性约束,为更多有驾驶技能但户...

2026年02月14日

23:26
微新创想:2026年2月13日,日本确善能公司正式以福伦达品牌推出SEPTON 40mm f/2 Aspherical全画幅手动镜头。这款镜头不仅标志着确善能在镜头设计上的新突破,也展现了福伦达品牌在光学领域的深厚积累。 该镜头适配索尼E卡口与尼康Z卡口,为摄影师提供了更广泛的设备兼容性。其售价为93500日元,约合4226元人民币,定价合理,兼顾了品质与性...
23:26
微新创想:2026年2月14日 法国巴黎检察官办公室对雀巢、达能、拉克塔利斯等五家婴配奶粉企业启动刑事调查 此次调查主要针对企业涉嫌分销可能受污染的产品。相关企业被指控违反消费者权益保护法规,以危害人类健康的商品进行欺骗 案件由法国公共卫生部门主导展开。调查重点包括企业是否遵守了相关安全规范 是否在发现问题后及时召回产品 以及是否存在因失职而导致婴儿生命受到...
23:26
微新创想:2026年2月14日,云南咖啡豆进入采摘高峰期。这一时期不仅标志着咖啡种植业的繁忙阶段,也预示着新一季咖啡产品的集中供应。本产季出现价格倒挂现象,即国内收购价高于出口价格。这一现象在业内引起了广泛关注,反映出国内咖啡市场正在经历结构性变化。 价格倒挂促使多家企业将经营重心转向内需市场。随着国内消费者对咖啡产品的需求不断增长,企业开始更加重视国内市场...
23:26
微新创想:微软近日宣布,自2026年4月起,将全面关闭Xbox One与Xbox Series X|S平台上的玩家自建“社交俱乐部”功能。这一功能曾是玩家围绕共同兴趣建立社群的重要工具,支持聊天、组队、分享内容等多种互动方式。随着该功能的关闭,用户将需要依赖其他平台或内置功能来维持社交联系。 微新创想:此次调整意味着玩家将无法再通过Xbox平台自行创建和管理...
23:26
微新创想:2026年2月12日,摩尔线程成功在MTT S5000 GPU上完成MiniMax M2.5大模型的Day-0极速适配,实现高性能推理。这一突破标志着摩尔线程在AI计算领域迈出了坚实的一步。 该GPU基于自研MUSA架构,具备强大的计算能力和高效的能效比。其支持原生FP8加速技术,能够在保证精度的同时显著提升运算速度,为大模型的推理任务提供了坚实的...
23:26
微新创想:2026年2月13日,日本成人用品制造商Tenga确认发生数据泄露事件。黑客通过入侵员工工作邮箱,非法获取客户姓名、电子邮件地址及邮件往来记录(含订单与咨询内容),并以此向通讯录联系人发送垃圾邮件。 事件未涉及密码等敏感凭证泄露,但Tenga已重置涉事账户、全系统启用多重验证(MFA),并建议用户更改密码、警惕钓鱼邮件。公司未披露受影响客户数量,其...