7月28日,在世界人工智能大会论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。这款大模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型,显示其更强的金融专业性、推理能力以及安全合规能力。

随着金融业数智化转型不断提速,大模型在金融领域的应用正持续深化。然而,在实际业务场景中,金融机构往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,现有的大模型在解决实际金融任务时仍然存在诸多挑战。通用大模型距离产业实际应用存在“知识鸿沟”。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。蚂蚁数科CEO赵闻飙在演讲中表示。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图

据悉,蚂蚁数科通过构建全面的金融任务数据体系以及模型训练算法创新,实现模型更强的金融推理能力及可信性。评测结果显示:相较于通用开源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ两大主流金融基准测试中均取得最高评分。并且模型在金融能力显著增强的同时,通用能力也表现出较高水准。

在数据层面,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力,让大模型“天生懂金融,出厂即专家”。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图1

在训练层面,创新的加权训练算法,提高大模型对复杂金融任务学习效率与性能。在后续业务应用中,可显著减少二次微调的数据需求与算力消耗,有效降低大模型在企业落地的门槛与成本。此外,Agentar-Fin-R1还能不断更新迭代,吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,让模型能力在真实业务场景中不断进化。

Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。

蚂蚁数科发布Agentar-Fin-R1金融大模型评测基准引领行业创新插图2

为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。在Finova评测中,Agentar-Fin-R1也取得最高评分,甚至超越更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。

蚂蚁数科是蚂蚁集团旗下独立科技子公司,致力于以AI及Web3技术助力产业数智化升级。今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。在金融领域,蚂蚁数科此前推出金融智能体平台Agentar,成为首批通过信通院评测的智能体平台产品,并获最高评级5级。蚂蚁数科还联合行业合作伙伴,推出超百个金融智能体解决方案,加速大模型在金融业规模化应用。

以上海某银行为例,蚂蚁数科助力上海某银行打造的AI手机银行,创新“对话即服务”模式,用户通过自然对话即可获取各类金融服务,推动银行老年客户满意度提升显著,月活用户同比增长25%。目前,蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。

最新快讯

2025年08月10日

23:57
8月10日,宁德时代旗下新能源后市场品牌宁家服务迎来重要里程碑,在上海与泰国曼谷同步举行两家直营体验中心的开业仪式。这一举措不仅彰显了宁家服务在新能源后市场领域的雄心壮志,更标志着其布局这一万亿级市场的战略步伐显著提速。 随着新能源汽车保有量的持续攀升,后市场服务的重要性日益凸显。据权威数据显示,预计到2035年,我国新能源汽车保有量将突破1.7亿辆。其中,...
23:57
2025年8月10日,A股市场再掀股东减持风波,多家上市公司密集披露减持计划,引发市场广泛关注。其中,利扬芯片部分股东宣布拟合计减持不超过3.94%的股份,引发市场对该公司未来股价走势的担忧。与此同时,路维光电实际控制人却作出郑重承诺,保证在未来6个月内不会进行任何减持行为,为市场注入了一剂"稳定剂"。 在此次减持潮中,多家公司股东也纷纷披露了各自的减持计划...
22:43
2025年8月10日晚,天津港迎来了一场备受瞩目的航空物流盛事空客A320系列飞机大部件的运输任务。这批关键部件由‘中远海运人马座’轮精心承运,经过精准操作,顺利抵达太平洋国际集装箱码头。这一重要时刻不仅彰显了天津港在航空物流领域的卓越能力,更标志着该港累计接卸空客大部件数量正式突破800架次,这一里程碑式的成就进一步巩固了天津港在全球航空大部件物流领域的领...
22:43
8月9日晚间,长安汽车董事长朱华荣在个人微博上分享了一则重要动态,透露自己已于本周五专程前往深圳拜访了华为创始人兼CEO任正非。据朱华荣介绍,此次会晤聚焦于当前汽车产业的竞争态势以及未来发展趋势的深度探讨,双方就行业变革与机遇展开了富有建设性的交流。 朱华荣特别提到,任正非对长安汽车和阿维塔品牌的战略发展提供了宝贵的指导意见,并对其展现出的行业视野、战略格局...
22:43
8月9日,行业消息人士透露,宁德时代旗下枧下窝矿区采矿作业将于当晚24时正式终止。根据最新安排,该矿区自8月10日起将全面暂停所有采矿活动,且短期内暂无恢复生产的计划。此前,关于该矿区是否停产的传闻持续发酵,一度成为影响近期碳酸锂价格波动的重要因素。此次停产事件不仅对市场供应格局产生直接冲击,更引发了业内对后续市场走势的高度关注。随着全球新能源产业链对锂资源...
21:42
8月10日,中际旭创(股票代码:300308)在官方互动平台上正式宣布,公司当前正积极推进产能扩建计划。这一战略举措不仅体现了企业对市场需求的敏锐洞察,更彰显了其持续提升生产效率与强化市场竞争力的坚定决心。通过不断优化生产布局与升级技术设备,中际旭创致力于打造行业领先的智能制造体系,从而在激烈的市场竞争中占据更有利的位置。此次产能扩建不仅将有效提升公司的产能...
21:42
国内首个专注于隧道与地下空间领域的垂直大模型近日正式问世,这一里程碑事件标志着人工智能技术在该专业领域的应用实现了重大突破。该大模型由亦庄地区多家科技企业联合研发,通过深度融合"大模型+算法"的双重备案技术架构,为隧道与地下空间的智能化升级提供了强大的技术支撑。此次创新成果不仅代表了国内在该领域的领先水平,更将推动相关产业向数字化、智能化方向加速转型。 北京...
21:42
2025年8月10日,知名A股上市公司华丽家族(股票代码:600503.SH)正式发布一则备受市场关注的投资公告,宣布将斥资不超过3亿元人民币,参与认购上海海和药物研究开发股份有限公司的新增股份。根据公告内容,华丽家族将以每股4.75元的价格进行认购,计划增持不超过6315.7895万股。此次投资完成后,华丽家族在目标公司的持股比例预计将稳定在5%至8.09...
21:42
8月10日,万通发展正式发布重大投资公告,宣布将通过增资及股权转让双轨模式,斥资8.54亿元人民币战略入股数渡科技,并成功获取其62.98%的股权。此举标志着数渡科技将成为万通发展旗下控股子公司,为其在高科技领域拓展注入强劲动力。 数渡科技作为高速互连芯片领域的创新先锋,专注于PCIe高速交换芯片的研发与设计,同时提供定制化的ASIC芯片设计服务。其核心产品...
21:42
2025年5月最新就业市场报告显示,美国求职者平均每月投递的工作申请数量已攀升至45份,较2024年同期的22份呈现显著增长,这一变化直观反映了就业市场竞争的白热化程度。值得注意的是,学历越高者面临的求职压力越大,硕士研究生群体平均每月需投递32至60份简历,远超普通求职者。就业平台Simplify发布的权威数据显示,学历在就业市场中的价值正经历前所未有的下...
21:42
8月9日,备受瞩目的广药白云山星群二天油防蚊虫研究成果发布会暨非遗保护学术研讨会在广州隆重举行。此次盛会不仅揭开了星群二天油在防蚊虫领域最新科研成果的神秘面纱,更将传统中医药非遗文化的保护与发展推向了新的高度。 发布会上,星群二天油防蚊虫研究成果引起了与会专家学者的广泛关注。该研究团队通过多年潜心钻研,成功提取出天然植物中的有效成分,研发出具有高效驱蚊、安全...
21:42
2025年8月10日,新洋丰在一场备受瞩目的分析师会议上释放出重要信号,公司高层透露已对磷酸铁产线实施了全面的工艺升级改造。这一系列技术革新旨在显著提升生产效率与成本控制能力,从而为今年磷酸铁业务实现减亏目标奠定坚实基础。 新洋丰管理层明确表示,经过持续的技术攻关与流程优化,磷酸铁板块对整体业绩的拖累效应已基本消退。随着产能利用率稳步提升以及生产成本的有...