微新创想(idea2003.com)9月14日 消息:近年来,大规模语言模型在众多下游任务中展现出卓越性能,但同时也面临着严峻挑战。其中,大模型生成的与事实相悖的“幻觉”内容已成为学术界的研究焦点。近期,腾讯 AI Lab 联合国内外多家顶尖学术机构共同发布了关于大模型幻觉的全面综述,深入探讨了幻觉的评估方法、溯源机制以及缓解策略。论文链接:https://arxiv.org/abs/2309.01219Github 链接:https://github.com/HillZhang1999/llm-hallucination-survey

研究者根据大模型幻觉的表现形式,将其与用户输入、模型生成内容及事实知识之间的冲突分为三大类。目前,学术界的研究重点主要集中在与事实知识冲突的幻觉上,因为这类幻觉最容易对用户产生误导,影响信息传播的准确性。与传统语言生成任务中的幻觉问题相比,大模型幻觉呈现出数据规模巨大、模型通用性强以及幻觉现象不易被察觉等新特征,为研究带来了新的挑战。

在评估大模型幻觉方面,研究人员已提出多种生成式和判别式的基准测试,通过问答、对话等不同任务形式检验模型的幻觉倾向。这些基准测试设计了相应的判定指标,但可靠的自动评估方法仍需进一步探索。分析表明,海量低质训练数据以及模型对自身能力的高估是导致幻觉现象的重要原因。

为了有效减少幻觉,研究人员从预训练、微调、强化学习等多个阶段入手进行干预。在预训练阶段,可通过提升语料质量来降低幻觉发生的概率;在微调阶段,人工检查数据可以有效识别并修正潜在的错误;在强化学习阶段,通过惩罚过度自信的回复,引导模型生成更可靠的内容。此外,在推理阶段,还可以通过优化解码策略、引入知识检索机制以及测量不确定度等方式,进一步缓解幻觉现象。

尽管近年来取得了一定的研究进展,但在可靠评估、多语言场景应用以及模型安全性等方面仍面临诸多挑战。总体而言,大模型幻觉的评估与缓解仍需深入研究,以推动大模型在实际应用中的可靠性和有效性,促进人工智能技术的健康发展。

最新快讯

2025年08月13日

18:10
微新创想8月13日讯 腾讯控股近日正式发布了截至2024年6月30日的2025年第二季度财务报告,展现出强劲的增长势头。财报数据显示,本季度腾讯营收达到1845亿元人民币,同比增长15%,经营利润(Non-IFRS)更是高达692.5亿元,同比增幅达到18%。这一亮眼业绩的背后,是腾讯在人工智能领域的持续深耕与创新突破。 在研发投入方面,腾讯本季度支出达20...
18:10
近日,广州一名13岁少年小铭(化名)经历了一场令人揪心的健康危机。这位年轻的生命在一场意外中险些遭遇不幸,幸运的是,在医护人员的及时救治下,他最终转危为安。这一事件也为我们敲响了警钟,提醒人们在享受户外活动时,务必提高安全意识。 小铭的遭遇始于一次普通的骑单车活动。那天,他在骑行过程中不慎摔跤,导致腿部出现几处破损。虽然伤口看似不严重,但并未得到及时处理。第...
18:10
微新创想8月13日电 8月9日,印度恰蒂斯加尔邦发生惊险一幕,一名女子在乘坐摩天轮时意外坠落,悬挂在约9米高空,幸运的是她及时抓住栏杆。这一幕被目击者拍下并曝光于网络,引发广泛关注。据了解,事发时摩天轮运行至第二圈,女子安全带突然松脱导致意外发生。危急关头,一名勇敢的男子攀爬至摩天轮顶部,将女子安全转移至稳固座舱内。目前,当地当局已启动调查程序,将对涉事游乐...
18:10
8月13日最新消息显示,全球气候变暖加速导致冰川大规模消融,这一自然现象正将尘封的历史片段重新带回人类视野。今年1月,一支波兰科考团队在南极洲一处冰原上意外发现了一具保存完好的遗骸,其身旁散落着超过200件个人物品,包括衣物、工具和科研设备等。这一重大发现迅速引起国际关注,英国当局立即介入,将遗骸及物品运回伦敦进行科学鉴定。经过严谨的DNA比对分析,专家们最...
18:10
微新创想8月13日讯 央视新闻报道了一起令人震惊的交通事故,肇事者年仅13岁,却实施了偷车、无证驾驶、撞人逃逸等一系列恶劣行为,引发社会广泛关注。这起事件不仅暴露了青少年法制观念的缺失,更敲响了交通安全教育的警钟。 据悉,今年4月某日,广西防城港市发生一起骇人听闻的交通事故。当时,一名13岁男孩与朋友在街头闲逛时,发现路边停放的一辆货车竟然未拔钥匙。这个年...
18:10
在人工智能领域,Token数量限制始终是一个亟待突破的技术瓶颈。最近一项由华人团队完成的突破性研究,为这一难题带来了曙光。研究证实,扩散语言模型在Token数量受限的条件下,其数据学习潜力竟是传统自回归模型的整整三倍。这一发现不仅可能颠覆现有语言模型训练范式,更预示着AI领域即将迎来新的技术革命。 这项研究的核心是一个参数规模达10亿的扩散模型。研究团队采用...
18:10
腾讯控股近日发布了截至2025年6月30日的第二季度财报,数据显示公司在本季度实现了1845亿元营收,同比增长15%,经营利润(Non-IFRS)更是达到了692.5亿元,同比增幅高达18%。这一亮眼业绩背后,是腾讯对技术创新的坚定投入。公司研发投入达到202.5亿元,同比增长17%,这一数据充分彰显了腾讯在技术创新领域的决心与力度。特别是在人工智能(AI)...
18:10
华峰化学与全球化工巨头美国伊士曼化工公司于8月13日正式宣布达成战略合作协议,双方将携手成立合资企业,专注于研发与生产伊士曼Naia™醋酯纤维素长丝纤维这一高端材料。此次合作标志着该创新纤维将首次在中国本土实现规模化生产,不仅将极大完善亚太地区的供应链体系,还将有效提升对区域内高端材料需求的响应速度与质量保障能力。作为醋酯纤维素纤维领域的领先技术,Naia™...
18:10
8月13日,江特电机正式发布最新经营状况公告,确认近期公司内部运营及外部市场环境均保持稳定,未出现任何需要披露而尚未公开的重大事项。公告中特别强调,江特电机在江西宜春地区已成功获取并持有多个采矿权和探矿权,其控制的锂矿资源总量已突破1亿吨大关,为公司的持续发展奠定了坚实的资源基础。 在产业布局方面,江特电机正积极把握人形机器人这一新兴产业的巨大发展机遇。公司...
18:10
2025年8月13日收盘后,龙虎榜数据揭示出机构资金流向的显著变化,共有29只个股吸引了机构的关注并参与交易。从机构净买入角度来看,创新医疗以1.01亿元的净买入额位居榜首,展现出机构对该股的强烈信心;紧随其后的是江特电机,净买入金额达到8933万元,同样显示出机构的积极布局;沪电股份则以7292万元的净买入额位列第三,反映出机构对该股未来发展的看好。 而在...
18:10
2025年8月13日,哈投股份正式发布其2025年半年财务报告,数据显示公司上半年经营表现亮眼。报告期内,哈投股份实现营业总收入14.75亿元,相较于去年同期增长1.12%,虽然增速相对温和,但归母净利润却大幅攀升至3.8亿元,同比增长率高达233.08%,展现出强劲的盈利能力。 在子公司方面,江海证券的业绩表现尤为突出。报告期内,江海证券实现营业总收入7....
18:10
2025年8月13日,备受瞩目的半导体设备制造商屹唐股份正式对外发布重要公告,揭露了一起严重的知识产权侵权事件。公告指出,全球领先的半导体设备供应商应用材料公司,在未获授权的情况下,通过不正当手段非法获取了屹唐股份的核心技术秘密,具体涉及等离子体源及晶圆表面处理等关键领域。更为严重的是,应用材料公司不仅窃取了技术,还在中国境内进行了专利申请,公然侵犯屹唐股份...