7月28日,在世界人工智能大会论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。这款大模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型,显示其更强的金融专业性、推理能力以及安全合规能力。

随着金融业数智化转型不断提速,大模型在金融领域的应用正持续深化。然而,在实际业务场景中,金融机构往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,现有的大模型在解决实际金融任务时仍然存在诸多挑战。通用大模型距离产业实际应用存在“知识鸿沟”。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。蚂蚁数科CEO赵闻飙在演讲中表示。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图

据悉,蚂蚁数科通过构建全面的金融任务数据体系以及模型训练算法创新,实现模型更强的金融推理能力及可信性。评测结果显示:相较于通用开源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ两大主流金融基准测试中均取得最高评分。并且模型在金融能力显著增强的同时,通用能力也表现出较高水准。

在数据层面,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力,让大模型“天生懂金融,出厂即专家”。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图1

在训练层面,创新的加权训练算法,提高大模型对复杂金融任务学习效率与性能。在后续业务应用中,可显著减少二次微调的数据需求与算力消耗,有效降低大模型在企业落地的门槛与成本。此外,Agentar-Fin-R1还能不断更新迭代,吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,让模型能力在真实业务场景中不断进化。

Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图2

为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。在Finova评测中,Agentar-Fin-R1也取得最高评分,甚至超越更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。

蚂蚁数科是蚂蚁集团旗下独立科技子公司,致力于以AI及Web3技术助力产业数智化升级。今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。在金融领域,蚂蚁数科此前推出金融智能体平台Agentar,成为首批通过信通院评测的智能体平台产品,并获最高评级5级。蚂蚁数科还联合行业合作伙伴,推出超百个金融智能体解决方案,加速大模型在金融业规模化应用。

以上海某银行为例,蚂蚁数科助力上海某银行打造的AI手机银行,创新“对话即服务”模式,用户通过自然对话即可获取各类金融服务,推动银行老年客户满意度提升显著,月活用户同比增长25%。目前,蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。

最新快讯

2025年08月13日

10:32
近日,一段以“测试路人诚信”为噱头的中介视频在网络上掀起轩然大波,迅速成为舆论焦点。视频画面中,一名女子在繁华街头故意放置一个名牌手包,并公开承诺若有人拾金不昧,将给予千元现金奖励。很快,一名男子“幸运”地“捡”到了这个手包,然而当女子上前认领时,男子却突然狮子大开口,索要五万元天价酬金。经过一番令人啼笑皆非的讨价还价,女子最终转账一千元才从男子手中取回了手...
10:32
微新创想8月13日讯 近日,中国知名科技企业影石Insta360推出的"百万减重"挑战赛再度引发社会热议。这项旨在鼓励员工健康生活的年度活动,以其独特的激励机制吸引了广泛关注。活动规则设计简洁明了:所有影石员工均可报名参赛,每成功减重一斤即可获得500元现金奖励。今年更有一位00后女员工在短短90天内惊人地减重40斤,最终赢得2万元现金大奖,成为当之无愧的...
10:32
微新创想8月13日重磅报道,在2025世界机器人大会的现场,一场别开生面的科技与力量碰撞吸引了全场目光。360集团创始人周鸿祎与宇树科技研发的拳击机器人上演了一场精彩绝伦的趣味对决,将科技与娱乐完美融合,引发了网友们的热烈讨论。 视频画面显示,周鸿祎以惊人的速度零帧起手,直接将机器人紧紧抱住,随即以一个巧妙的后向绊腿动作,干净利落地将机器人放倒在地。短暂的几...
10:32
微新创想8月13日电 华为在2025金融AI推理应用落地与发展论坛上发布了革命性AI推理创新技术UCM(推理记忆数据管理器),这一举措被业界视为将彻底重塑国内AI推理格局的关键性突破。UCM技术的核心优势在于其先进的KV Cache系统,该系统通过融合多种缓存加速算法工具与精细的分级管理策略,能够高效处理推理过程中产生的大量记忆数据。这一创新技术带来了多重...
10:32
微新创想8月12日重磅消息,知名分析师郭明錤在其最新研究中透露,预计明年问世的iPhone 18系列将搭载全新的A20处理器,这颗处理器将迎来重大突破——放弃传统InFO封装方案,转而采用业界领先的WMCM(晶圆级多芯片模块)封装技术。WMCM全称为Wafer-Level Multi-Chip Module,是一种创新的半导体封装解决方案,它通过在晶圆制造阶...
10:32
微新创想8月12日最新消息,知名博主定焦数码独家爆料称,备受期待的iPhone 17 Air将搭载A19 Pro芯片,但与预期不同的是,这款芯片仅配备了5核GPU,而Pro系列机型通常拥有6核GPU配置,这意味着iPhone 17 Air缺少了一个GPU核心。这一差异揭示了苹果在超轻薄机身设计上的妥协——为了实现极致的便携性,散热系统不得不做出牺牲,因此不得...
10:03
谷歌资深工程师大卫·佩特鲁在2023年初做出了一个令人瞩目的职业抉择。这位在谷歌服务超过17年的技术专家,同时也是谷歌护目镜和谷歌眼镜项目的核心创始成员,决定离开科技巨头,创办自己的创业公司。佩特鲁解释道:"面对日新月异的技术变革,我认为某些创新理念更适合在初创企业的灵活环境中孕育成长。"这一深思熟虑的决定最终催生了Continua——一家专注于通过AI智能...
10:03
根据《华尔街日报》最新披露的消息,人工智能初创企业 Perplexity 于本周二向科技巨头谷歌正式提交了收购其旗下 Chrome 浏览器的无条件报价,出价高达345亿美元。这一大胆举动被视为 Perplexity 试图借助当前反垄断裁决悬而未决的司法环境,对谷歌在网络搜索领域不可动摇的统治地位发起挑战的标志性一步。值得注意的是,该收购报价远超 Perple...
10:03
AI陪伴应用正迅速崛起为移动应用市场的新宠,成为资本和用户关注的焦点。应用情报公司Appfigures最新发布的行业报告显示,除了ChatGPT和Grok等头部产品外,专注于AI"陪伴"功能的应用正经历爆发式增长。在全球337款活跃且盈利的AI陪伴应用中,2025年新增应用数量高达128款,展现出强劲的市场活力。根据Appfigures的深度分析,这一细分领...
10:03
腾讯混元团队近日重磅推出全新多模态理解模型——混元Large-Vision,这款模型凭借腾讯混元团队独创的MoE(专家混合)架构,实现了52B规模的激活参数,在性能与效率之间取得了令人瞩目的平衡。混元Large-Vision的核心突破在于其卓越的多模态输入支持能力,不仅能够处理任意分辨率的图像,还能无缝应对视频和3D空间输入,为用户带来全方位的视觉理解新体验...
10:03
科技界近日再起风云,埃隆・马斯克通过社交平台 X 发文直指苹果公司涉嫌垄断行为,矛头直指苹果在 App Store 中对 OpenAI 的偏袒。马斯克在声明中怒斥苹果此举明显违反反垄断法,并威胁将采取法律手段维护自身权益,其立场不容置疑。这一事件迅速引发广泛关注,将两大科技巨头推向舆论焦点。 面对马斯克的强硬指控,苹果公司迅速作出回应。据知名科技记者马克・古...
10:03
昆仑万维集团在备受瞩目的SkyWork AI技术发布周第三天,正式向全球开发者与研究者开源其最新研发的「Skywork UniPic2.0」统一多模态模型。这一具有里程碑意义的发布,不仅标志着多模态人工智能领域迈入新纪元,更代表着该技术生态的又一次重大突破。Skywork UniPic2.0作为一个面向统一多模态建模的高效训练与推理框架,通过创新性地整合生成...