富士通于2023年9月26日重磅宣布推出两项创新的人工智能信任技术,旨在全面提升对话型人工智能模型的可靠性,有效应对幻觉检测与对抗性攻击等关键挑战。这两项突破性技术将深度集成至富士通旗舰人工智能平台”Kozuchi”中,为企业及个人用户提供强大的工具,以精准评估对话型人工智能回复的可靠性,显著增强人工智能应用的安全性。

在当今数字化时代,虚假信息泛滥与钓鱼攻击频发,已成为制约人工智能健康发展的重大隐患。富士通此次推出的两项新技术,正是为解决这些难题而来。第一项技术专注于高度精准检测对话型人工智能回复中的幻觉现象。在商业场景中,企业广泛运用对话型人工智能提取关键信息,并将其作为参考数据输入外部系统,虽然这种方式能有效提升回复准确性,但完全消除幻觉仍面临技术瓶颈。由于对话型人工智能在特定情况下可能无法正确提取相关信息,导致生成不相关或错误的回复。为突破这一难题,富士通研发的新技术采用创新的三阶段分析机制:首先将人工智能回复分解为主语、谓语、宾语等语法单元,然后自动识别其中的命名实体,最后通过留空这些实体并反复向外部人工智能提问,实现更精准的表达定义。根据WikiBio GPT-3幻觉数据集等权威基准测试结果,该技术相比SelfCheckGPT等同类检测方法,检测准确率(AUC-ROC)提升了约22%,展现出卓越的技术优势。

第二项技术则聚焦于检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能的回复基于训练数据生成,恶意行为者可能通过污染训练数据,诱导人工智能生成包含欺诈性网址的回复。为应对这一威胁,富士通开发出智能网址检测技术,一旦识别出钓鱼网址,系统将立即向用户发出警示。值得注意的是,这项技术不仅具备钓鱼网址检测功能,还能显著增强人工智能模型对各类攻击的防御能力,确保持续提供高度可靠的回复。该技术由富士通与以色列本古里安大学联合研发,巧妙利用了恶意攻击者通常针对单一类型人工智能模型发动攻击的规律,通过多模型交叉验证机制,评估不同人工智能处理同一信息的判断差异,从而精准识别恶意数据。这一创新技术不仅适用于钓鱼网址检测,还能有效预防针对表格数据等其他类型人工智能模型的欺骗性攻击,为各类人工智能服务提供全方位安全保障。

这两项革命性技术将全面融入富士通的对话型人工智能核心引擎,通过”富士通Kozuchi(代号)-富士通AI平台”向用户开放。该平台汇集了丰富的人工智能与机器学习技术资源,为用户创造无限可能。具体部署计划如下:检测对话型人工智能幻觉的技术将于2023年9月28日起向日本用户开放,而检测网络钓鱼网址的技术则从2023年10月起正式启用。企业用户将通过Kozuchi平台获得专属演示环境,个人用户则可通过专用门户网站体验这些前沿技术。富士通已规划将这两项技术逐步推广至全球市场,为全球用户带来更安全、更可靠的人工智能服务体验。随着人工智能技术的不断演进,富士通始终坚守创新与安全并重的理念,致力于推动人工智能在更广阔领域实现健康可持续发展。

最新快讯

2025年08月14日

13:38
淡马锡于8月13日成功发行两批总额达15亿美元的美元债券,涵盖固定利率与浮动利率两种产品类型,进一步丰富了其多元化融资渠道。在固定利率债券方面,7.5亿美元两年期产品以3.75%的票息率成功定价,其发行利率较同期两年期美国国债收益率高出15个基点,显示出投资者对该机构的高度认可。该债券采用半年付息模式,为投资者提供了稳定的现金流预期。而在浮动利率债券领域,淡...
13:38
2025年8月14日,恒生科技指数遭遇显著回调,整体下跌1%至5,574.19点,展现出市场情绪的波动与不确定性。多只核心成分股表现疲软,其中比亚迪电子股价重挫超过5%,网易也遭遇超过3%的跌幅,成为市场关注的焦点。这一现象反映出科技板块整体承压,市场参与者普遍担忧外围市场动荡可能引发的连锁反应。与此同时,行业监管政策的不确定性也成为压在科技股心头的一块巨石...
13:38
今日A股市场整体承压,三大指数表现分化。创业板指重挫逾1.00%,沪指微跌0.32%,深成指则下跌0.87%。市场板块轮动加剧,军工、光伏、算力硬件等板块领跌,多只权重股大幅回调。沪深京三市合计近4600只个股收跌,市场整体情绪偏弱,投资者风险偏好显著下降。分析人士指出,近期政策面变化与海外市场波动叠加影响,导致A股市场短期承压,但长期来看,科技创新与新能源...
13:38
财联社8月14日讯 汤加群岛今日午间突发地震,震级达5.6级,震源深度深达100千米。这一地质活动由中国地震台网正式测定并对外发布。据监测数据显示,震中位于南纬17.90度,西经172.05度,地处太平洋西南部偏远海域。此次地震虽未引发海啸预警,但依然引起了地质学界的广泛关注。专家分析指出,该区域属于环太平洋火山地震带,地壳活动频繁,此次地震是板块运动过程中...
13:38
法国公共卫生署最新通报显示,该国近期爆发李斯特菌病疫情,累计确诊21例病例,其中18例集中在今年6月以来,已造成2名患者不幸离世。经调查确认,此次疫情源头为沙弗格朗公司生产的某款花皮软质奶酪。该产品采用巴氏杀菌牛奶或山羊奶为原料,以多种品牌形式在法国本土及海外市场销售,销售周期一直持续至2025年8月9日。 此次疫情引发广泛关注,涉事奶酪产品线覆盖范围广泛,...
12:33
中国铁路建设领域正迎来一场由人工智能驱动的知识传承革命。拥有70年光辉历史的中铁第一勘察设计院近日携手商汤科技,联合推出"国铁价值工程多模态大模型应用平台",这一创新举措标志着传统铁路工程设计首次全面拥抱前沿AI技术。作为国内铁路建设的重要力量,中铁第一勘察设计院自1953年成立以来,在国内外铁路工程领域创造了无数令人瞩目的标杆项目。然而随着行业快速发展与人...
12:33
当以色列初创公司NeoLogic决心为AI服务器打造更节能的CPU时,业内权威纷纷断言此举无异于天方夜谭。创始人Avi Messica回忆道:"几乎所有业内人士都告诉我们这不可能实现。"他们直言不讳地表示,逻辑综合和电路设计领域已臻完美,不存在创新空间。面对质疑,NeoLogic这位无晶圆厂半导体新锐却矢志不渝,要证明行业固有认知的错误。 这家创新企业正在研...
12:33
苹果公司正积极进军智能家居市场,计划推出一系列创新智能设备,以扩大在家居领域的市场份额。彭博社记者马克・古尔曼透露,苹果将推出桌面机器人、家庭安全摄像头以及带屏幕的智能音箱等新型产品,这些设备将充分利用人工智能技术,为用户带来更智能便捷的家居体验。 据悉,苹果的桌面机器人计划于2027年正式推出。这款移动式家庭助手将具备与用户互动的能力,采用生动的 Siri...
12:33
8月14日,上海未来产业基金正式公布一项重大投资计划,拟参与投资6只具有潜力的子基金,涵盖多个前沿领域。这些子基金包括上海浦清本草创业投资合伙企业、上海比邻星四期创业投资合伙企业(暂定名)、苏州千骥康睿投资中心、上海凯风开兴创业投资合伙企业(暂定名)、上海鼎峰未来能源创业投资合伙企业(暂定名)以及无限启航海河(天津)创业投资合伙企业。此次投资行动不仅彰显了上...
12:33
8月14日,联想集团董事长兼CEO杨元庆在第一季度业绩沟通会上宣布了一项重要计划,备受业界关注。据杨元庆透露,联想将于2026年1月6日,在国际消费电子展(CES)期间,在拉斯维加斯标志性的Sphere场馆举办一场名为"联想Tech World"的创新科技大会。此次大会将成为联想展示其前沿科技实力的舞台,涵盖人工智能、终端设备、基础设施和服务等多个关键领域,...
12:33
8月14日午间收盘,港股市场整体表现平稳,恒生指数微跌0.06%,恒生科技指数则承压下行,跌幅达到0.45%。板块方面,保险、地产及软件服务行业逆势上涨,成为市场亮点。其中,中国太保股价强势飙升5.12%,新华保险也录得4.82%的显著涨幅,展现出行业复苏的积极信号。然而,部分科技股遭遇重挫,天立国际控股暴跌5.46%,耐世特更是重挫6.94%,反映出科技板...
12:33
13日傍晚时分,云南怒江傈僳族自治州泸水市称杆乡遭遇罕见强降雨袭击,持续不断的暴雨引发了严重的泥石流灾害。据初步统计,堵堵洛村等多处区域受灾严重,大量房屋被冲毁或掩埋,部分农田和基础设施也遭到破坏。这场突如其来的灾难已造成1人不幸遇难,另有数名村民失联,具体情况仍在进一步核实中。 灾情发生后,当地政府立即启动应急预案,组织消防、武警、医疗等多部门力量展开紧急...