蚂蚁数科多语种视觉大模型突破语言壁垒引领技术创新

在香港金融科技节上,蚂蚁数科震撼发布了革命性技术——“多语种多模态大模型训练框架”,旨在彻底突破当前大模型在多语言环境应用中的瓶颈。该框架特别针对资源稀缺的小语种,如埃及阿拉伯语、印尼爪哇语、巴哈萨语和巽他语,展现出惊人的应用潜力。这一创新技术的核心在于其独特的语言感知优化框架,通过“以目标语言进行思考”的机制,结合细粒度、多维度的奖励策略和自动化数据解决方案,极大地增强了对小语种的理解与处理能力。

根据权威测试结果,蚂蚁数科的新框架在主流多语言视觉问答(Multilingual Visual Question Answering,VQA)基准测试中,准确率较同规模开源模型提升了约9.5%。更令人瞩目的是,在某些任务中,该框架的表现甚至超越了GPT-4o和Gemini-2.5-flash等国际主流闭源模型,以总分第一的优异表现荣获评测第一。

除了语言模型的突破,蚂蚁数科还推出了图像安全框架,这一技术融合了视觉分析与常识推理,能够高效识别图像中的伪造与不一致性。新框架不仅能精确定位篡改区域,还提供可解释的分析报告,显著提升了数字内容的风险控制能力。这一技术的成功实施将为各种场景下的数字内容保护提供更有力的支持。

作为蚂蚁数科全球业务的核心技术,这两项能力已经在ZOLOZ的文档识别鉴真产品(RealDoc)中得到了广泛应用,支持119种语言,能够高效处理多种商务文档、合同和证件,覆盖保险理赔、信贷审核及跨境贸易等多个领域。这不仅展示了蚂蚁数科在多语言处理领域的领先地位,也为全球用户提供了更优质的服务体验。

最新快讯

2025年11月04日

22:28
2025年10月下旬,小鹏汽车正式宣布重启Robotaxi项目,并同步启动内部人才转岗计划。为加速L4级别自动驾驶车型明年量产进程,公司不惜高薪引进多家知名L4企业核心技术负责人,以此彰显对该战略项目的决心与重视。据行业消息透露,小鹏在Robotaxi商业化路径上倾向于采取"轻量化运营"模式,将投入产出比作为核心考量指标,着力避免陷入重资产运营的困境。这一系...
22:28
近日,国际游戏界传来重大消息,据多家权威媒体报道,美国专利商标局局长约翰·斯夸尔斯正式下令对任天堂2019年成功注册的“召唤与战斗”游戏专利进行全面重新审查。这一举措迅速引发行业震动,因为该专利核心涉及允许玩家在游戏中自由选择手动操控或自动进行战斗的机制。然而,局长在审查指令中明确指出,早在2002年,科乐美公司就已成功注册了包含相同创新机制的专利。这一历史...
22:28
近期网络上关于“iQOO Neo11与Neo10 Pro+未配备距离感应器”的传闻引发广泛关注,iQOO Neo产品经理罗佳慧迅速响应,通过官方渠道进行了权威澄清。她在微博上发布了一组官网截图,清晰展示了两款机型均支持接近感应器功能的相关说明,有力驳斥了不实信息的传播。为增强用户信任,罗佳慧还贴心分享了实用检测方法:只需用高清摄像头对准Neo11已录入指纹的...
22:28
大疆正式官宣,将于11月13日20:00举行新品发布会,引发行业高度关注。预热视频中首次曝光的可变光圈镜头设计,已暗指这款备受期待的新品——Osmo Action 6运动相机即将登场。根据多方爆料,这款新一代旗舰将突破技术壁垒,搭载与索尼联合研发的1/1.1英寸堆栈式CMOS传感器,感光面积较前代大幅提升近40%,显著增强暗光环境下的拍摄表现。同时,该传感器...
22:28
2025年第三季度,天际股份六氟磷酸锂生产成本稳定在5至6万元每吨的区间。这一关键数据通过公司官方互动平台正式披露,不仅彰显了其在核心原材料生产控制方面的卓越能力,更揭示了当前工艺技术与原料采购策略下的综合制造支出。作为锂电池关键电解质材料,六氟磷酸锂的成本直接影响行业利润格局,天际股份的透明披露无疑为市场提供了重要参考。该成本区间基于当前技术成熟度与供应链...
22:28
2025年11月4日,Spotify在其备受瞩目的电话会议中释放出重要信号,高管团队透露,尽管公司在全球超过150个市场范围内同步上调了订阅服务价格,但用户留存率并未出现任何负面影响。这一轮调价策略广泛覆盖了包括基础版、高级版在内的多数订阅服务,其核心目标在于有效应对日益攀升的内容采购成本,并进一步强化公司的盈利能力。值得注意的是,尽管用户面临更高的价格门槛...
22:28
2025年11月4日,英国石油公司(BP)首席执行官在公开场合明确表示,公司计划于2026年2月正式发布一份全新的产量展望报告。这份备受市场关注的报告将全面反映BP在石油领域的增长潜力与战略布局。根据公司内部评估,凭借现有丰富的资源储备以及灵活的战略调整能力,BP坚信未来产量存在显著的进一步上升空间。此次主动更新产量展望,不仅体现了BP对未来能源市场的信心,...
22:28
谷歌地图即将为极星4电动汽车带来一项革命性的实时车道引导功能,通过车载AI系统精准识别高速公路上的车道标线,在临近出口时向驾驶员提供精准的变道提示。这项创新功能依托极星先进的车载信息娱乐系统与谷歌软件平台的深度整合实现,不仅大幅提升了驾驶安全性,更标志着谷歌正加速将人工智能技术拓展至汽车领域这一前沿市场。 据悉,该功能将在未来几个月内率先登陆美国和瑞典市场的...
21:42
乌普萨拉大学与哥德堡大学联合研发的"视网膜电子纸"技术取得重大突破,为显示行业带来革命性变革。该技术通过电化学还原三氧化钨纳米圆盘,成功将像素尺寸缩小至惊人的560纳米,像素密度高达每英寸25,000像素,这一成就远超当前主流显示设备的性能指标。这一创新不仅突破了传统电子墨水屏的分辨率瓶颈,更在保持低功耗优势的同时实现了显示效果的飞跃。研究人员表示,该屏幕在...
21:42
近日,一则关于B站拉黑特定账号可屏蔽广告的说法在网络上迅速传播,引发广泛关注。部分用户出于好奇纷纷尝试,并声称该方法确实有效,相关体验分享也一度成为热议焦点。然而,随着讨论的深入,有细心的网友发现,被提及的所谓"广告屏蔽目标用户"已从搜索结果中消失,疑似被平台处理。 针对这一现象,B站官方客服及时作出澄清。经过平台技术团队的多轮核查验证,明确指出"通过拉黑特...
21:42
育碧旗下经典大作《刺客信条》系列目前正在Steam平台展开限时特惠活动,优惠将持续到11月10日,为玩家带来不容错过的游戏盛宴。此次促销涵盖了系列多款备受好评的作品,无论是新玩家还是资深粉丝都能找到心仪的选择。 《刺客信条:影》以震撼人心的史低价登场,原价348元的游戏现直降40%,仅需208.8元即可入手。这款以古日本为背景的作品,让玩家能够亲身体验双主角...
21:05
2025年11月4日,星源卓镁正式宣布收到国内领先新能源汽车制造商的供应商定点通知,将独家负责开发与供应镁合金动力总成壳体零部件。这一重要合作标志着星源卓镁在新能源汽车产业链中的战略地位得到显著提升,为其未来业绩增长注入强劲动力。据悉,该项目计划于2026年第三季度正式进入量产阶段,预计未来四年内实现销售总额约20.21亿元,将成为公司重要的营收增长点。 此...