欧洲广播联盟与英国广播公司(BBC)联合开展的一项权威研究揭示了生成式AI在新闻摘要领域的严峻挑战。该评估报告指出,尽管约42%的英国成年人对AI生成内容的准确性表示信任,但高达84%的受访者明确警告,任何事实性错误都可能导致公众信任的彻底崩塌。研究团队对ChatGPT、Gemini及Perplexity等主流AI系统进行了全面测试,结果令人震惊——Gemini不仅错误率位居榜首,其严重性错误比例更是显著高于其他同类产品。
这项深入分析揭示了Gemini存在的五大核心缺陷:首先,系统缺乏清晰可靠的信息来源标注;其次,无法准确识别讽刺性文本内容;第三,过度依赖维基百科作为单一信息源;第四,语境理解能力严重不足;第五,频繁出现原文引用错误。尽管所有测试系统在过去半年内都展现出不同程度的性能提升,但Gemini的表现始终明显落后于竞争对手。
更值得关注的是当前社会现象——约15%的25岁以下年轻群体已将AI作为主要新闻获取渠道。这一数据凸显了AI内容可靠性问题的紧迫性,任何信任危机都可能对年轻一代的信息认知产生深远影响。这项研究不仅为媒体行业敲响警钟,也为监管机构制定相关标准提供了重要参考依据。
