富士通于2023年9月26日重磅宣布推出两项创新的人工智能信任技术,旨在全面提升对话型人工智能模型的可靠性,有效应对幻觉检测与对抗性攻击等关键挑战。这两项突破性技术将深度集成至富士通旗舰人工智能平台”Kozuchi”中,为企业及个人用户提供强大的工具,以精准评估对话型人工智能回复的可靠性,显著增强人工智能应用的安全性。
在当今数字化时代,虚假信息泛滥与钓鱼攻击频发,已成为制约人工智能健康发展的重大隐患。富士通此次推出的两项新技术,正是为解决这些难题而来。第一项技术专注于高度精准检测对话型人工智能回复中的幻觉现象。在商业场景中,企业广泛运用对话型人工智能提取关键信息,并将其作为参考数据输入外部系统,虽然这种方式能有效提升回复准确性,但完全消除幻觉仍面临技术瓶颈。由于对话型人工智能在特定情况下可能无法正确提取相关信息,导致生成不相关或错误的回复。为突破这一难题,富士通研发的新技术采用创新的三阶段分析机制:首先将人工智能回复分解为主语、谓语、宾语等语法单元,然后自动识别其中的命名实体,最后通过留空这些实体并反复向外部人工智能提问,实现更精准的表达定义。根据WikiBio GPT-3幻觉数据集等权威基准测试结果,该技术相比SelfCheckGPT等同类检测方法,检测准确率(AUC-ROC)提升了约22%,展现出卓越的技术优势。
第二项技术则聚焦于检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能的回复基于训练数据生成,恶意行为者可能通过污染训练数据,诱导人工智能生成包含欺诈性网址的回复。为应对这一威胁,富士通开发出智能网址检测技术,一旦识别出钓鱼网址,系统将立即向用户发出警示。值得注意的是,这项技术不仅具备钓鱼网址检测功能,还能显著增强人工智能模型对各类攻击的防御能力,确保持续提供高度可靠的回复。该技术由富士通与以色列本古里安大学联合研发,巧妙利用了恶意攻击者通常针对单一类型人工智能模型发动攻击的规律,通过多模型交叉验证机制,评估不同人工智能处理同一信息的判断差异,从而精准识别恶意数据。这一创新技术不仅适用于钓鱼网址检测,还能有效预防针对表格数据等其他类型人工智能模型的欺骗性攻击,为各类人工智能服务提供全方位安全保障。
这两项革命性技术将全面融入富士通的对话型人工智能核心引擎,通过”富士通Kozuchi(代号)-富士通AI平台”向用户开放。该平台汇集了丰富的人工智能与机器学习技术资源,为用户创造无限可能。具体部署计划如下:检测对话型人工智能幻觉的技术将于2023年9月28日起向日本用户开放,而检测网络钓鱼网址的技术则从2023年10月起正式启用。企业用户将通过Kozuchi平台获得专属演示环境,个人用户则可通过专用门户网站体验这些前沿技术。富士通已规划将这两项技术逐步推广至全球市场,为全球用户带来更安全、更可靠的人工智能服务体验。随着人工智能技术的不断演进,富士通始终坚守创新与安全并重的理念,致力于推动人工智能在更广阔领域实现健康可持续发展。