声明:本文源自微信公众号光锥智能,作者白鸽,经站长之家授权转载发布。百川智能专注医疗领域后,交出了一份令人瞩目的答卷!8月11日,百川智能正式推出第二款开源医疗增强推理大模型Baichuan-M2,这款拥有32B参数量的大模型,在OpenAI的Healthbench评测集上表现卓越,超越了仅发布5天的开源模型gpt-oss-120b,更在所有开源模型中拔得头筹。除gpt-oss-120b外,Baichuan-M2还全面领先GPT-5及其他所有开源与闭源前沿模型,以更小的模型尺寸实现了医疗能力的反超,成为全球开源医疗大模型领域的佼佼者。与此同时,大模型的应用不再局限于效果,更注重低成本落地。尤其在医疗健康领域,模型涉及大量敏感隐私信息,医疗机构对私有化部署的需求日益强烈,但传统部署往往伴随着高昂成本。Baichuan-M2则以极低的落地门槛打破了这一局面,支持RTX4090单卡部署,显著提升了模型在真实医疗场景中的应用可能性和可扩展性。这短短5天的“攻防战”,不仅改写了全球医疗大模型的实力排名,更在中美通用大模型差距持续扩大的背景下,展现了中国团队在AI垂直行业大模型赛道中的弯道超车能力。当前,医疗领域已成为大模型最重要、最具潜力的应用场景之一,逐渐成为全球共识。然而,作为应用底座的医疗大模型,行业尚未出现特别突出的产品。即使是OpenAI最新发布的GPT-5,在数学、代码、写作、知识能力等方面表现优异,但在医疗领域的得分依然较低,这表明医疗大模型的发展仍任重道远。而中美垂直行业大模型的能力差距并不显著,作为中国头部大模型企业代表,百川智能此次在医疗大模型领域已实现与OpenAI的并驾齐驱。那么,作为国内最早全力押注医疗AI赛道的大模型创企,百川智能是如何实现弯道超车的?让我们深入解析Baichuan-M2的硬实力。

长期以来,模型在医学考试(如USMLE)上的表现被视为衡量其医疗能力的重要指标。然而,随着相关题库的饱和,这类选择题或短回复的评测已难以全面反映模型的真实临床实用性。毕竟,医疗AI的核心在于解决实际问题,而非“刷题机器”。因此,医疗能力的评测需要系统化方法,验证模型在推理决策、临床沟通等关键能力上的综合表现。今年5月,OpenAI发布的HealthBench医疗健康评测集,正是全球公认的医疗大模型“能力试金石”。该测评集包含5000个广泛场景的医患多轮对话,由262位人类医生编写的48562个医疗评价规则进行评估,涵盖标准版本和更具挑战性的Hard版本。在标准版HealthBench中,Baichuan-M2以60.1的高分超越gpt-oss120b(57.6分),并力压Qwen3-235B、Deepseek R1、Kimi K2等全球开源大模型。同时,Baichuan M2在医疗对话任务中展现出显著优势,包括紧急医疗响应、医疗上下文理解、医患沟通能力、全球健康知识覆盖及医学思维完备性等核心医疗场景性能全面领先。在Hard版本HealthBench中,Baichuan-M2以34.7分打破纪录,成为全球仅有的两款超过32分的模型之一,力压所有顶尖闭源大模型,与GPT-5并驾齐驱。尽管HealthBench已收集大量真实医疗场景数据,但现实情况往往更加复杂多样。不过,基于该评测,GPT-5和Baichuan-M2在多数医疗场景上的问答质量已超越资深医生,尤其在知识更新速度和全面性上,能为人类医生提供强大支持。那么,百川智能的Baichuan-M2是如何以32B参数实现以小博大的?其核心思路在于让大模型像医生一样思考、应对真实医患场景。从技术角度,这背后是百川智能在大型验证系统、端到端强化学习、AI患者模拟器、多类型医疗数据深度推理等四个方面的创新探索。

百川M2医疗大模型参数小胜GPT-5登顶世界第一插图

近一年来,大语言模型后训练范式的升级,特别是基于RLVR(Reinforcement Learning with Verifiable Rewards)方法的大规模强化学习训练,显著提升了模型效果。然而,强化学习在数学、代码、科学等领域之所以效果显著,是因为这些领域的数据是静态的,由简洁的问题和答案构成。而医疗问题复杂多变,没有标准答案,同一症状可能对应多种病因,治疗方案也因患者个体差异而异。因此,医疗领域的强化学习不仅要验证诊断结果的准确性,还要验证问诊对话过程是否符合医生思维,这是一个动态验证过程,导致传统强化学习规则在医疗领域表现不佳。针对这一挑战,百川智能以构建Large Verifier System为核心,结合医疗场景特点设计了一套全面的医疗Verifier系统。通俗来说,如果将大模型比作医学实习生,这个系统就像一位要求极高、异常挑剔的医疗专家,从医疗正确性、完备性、安全性及患者友好性等多维度评估模型输出,引导其改正不足,使其思维方式更贴近专业医生。但要让这个系统成为严谨的医疗专家,关键在于模拟人类医生在听诊时分辨患者描述中的逻辑漏洞、从含混表达中辨别真实病因的能力。现实中患者几乎无法全面准确表达症状,仅基于静态病例和指南训练,模型难以掌握这一能力。为突破这一瓶颈,百川技术团队升级迭代了今年初首创的“AI患者模拟器”。该模拟器用真实数据构造上万个不同年龄、性别、症状的AI患者,最大程度还原真实医疗场景,特别是包含错误噪声的表达。7个月后,百川升级患者模拟器并引入模型端到端强化学习,使Baichuan-M2在HealthBench等评测上取得更大突破。这个模拟器的核心作用是让AI在训练时与虚拟病人不断对话,而“考官”会根据聊天情况实时调整打分标准,帮助AI练出“随机应变”的能力,即使病人信息混乱不全,也能重新判断病情,并决定是继续问诊还是直接给出结论。此外,为提升AI的医学知识学习效率,百川智能还采用了多阶段强化学习策略,将复杂任务分解为医学常识、医患沟通技巧、复杂病例诊断等分层训练阶段,逐步提升AI能力,避免“一口吃成胖子”。综合来看,百川智能用“智能考官”判断AI表现,用“真实病例+虚拟病人”模拟实战,分阶段训练让AI既懂医学知识,又能灵活应对真实场景,最终使大模型具备靠谱医生的能力。

但在AI大模型落地应用浪潮中,模型不仅要有能力,更要能低成本落地。尤其在垂直行业,许多大模型效果虽好,却因部署运营成本过高而沦为“demo”。医疗大模型落地既要效果好,又要成本低。早在2016年深度学习浪潮中,AI就已开始在医疗场景落地,但当时更多聚焦于语音语义、图像等单点功能应用。而这一代医疗大模型开启了全新范式,其能力与上一代医疗AI相比已产生质的飞跃,不仅能提升效率,还能通过Agent方式全流程融入诊中、诊前、诊后环节,为AI落地医疗场景打开更广阔空间。百川智能医疗大模型的迭代和落地正是这一颠覆性变化的缩影。在实践应用中,今年2月,以Baichuan-M1为底座的AI儿科医生在国家儿科医学中心多学科会诊中大放异彩,获得专家一致认可。M2则在医疗沟通、诊断合理、检查合理、医疗治疗、医疗安全六个维度相较于M1均显著提升。这背后最关键的一点在于,Baichuan-M2为适配中国医疗场景,从医学指南对齐、医疗政策适配和患者需求洞察等多个维度进行了深度优化。在中国临床诊疗场景的问题评测中,对比gpt-oss系列模型,Baichuan-M2展现出更明显的可用性优势,部分优势源于对中国医疗场景的适配性。例如,在真实肝癌治疗案例中,针对CNLC IIa期(BCLC B期)患者,M2首选推荐解剖性肝右叶切除,而gpt-oss-120b建议首选经动脉化疗栓塞术(TACE)。临床医学专家认为,类似情况在中国医疗场景中还有很多。手术切除或TACE都是可选方案,差异在于中西方指南不同,并非医学上的高下之分,而是基于本地患者特点、医疗资源与医学发展水平权衡的最优解。医疗大模型能否将全球医学知识转化为符合本地优势特长的临床决策,是为其提供切实服务的关键。Baichuan-M2为此所做的专门优化,让中国临床场景有了专属的顶尖模型。

百川M2医疗大模型参数小胜GPT-5登顶世界第一插图1

更为重要的一点在于,Baichuan-M2能让中国万千医疗机构以更低成本部署使用。医疗大模型落地面临“两难”:追求高精度往往意味着高成本,而低成本方案又难以满足复杂场景的推理需求。Baichuan-M2通过技术优化和开源模式打破了这一困境。百川智能通过多种PTQ量化策略,对Baichuan-M2进行权重4bit量化,量化后模型精度接近无损,可在RTX4090上单卡部署,相比DeepSeek-R1H20双节点部署方式,成本降低了57倍。同时,其基于Eagle-3训练的Baichuan-M2-Spec版本,单用户场景下token吞吐提升74.9%。开源大模型特性支持二次开发,可根据具体场景轻量化训练,避免冗余成本,模型权重、训练代码全开放,企业/机构无需支付授权费。百川M2开源医疗大模型为中国医疗AI提供了“低成本突破”的路径,推动技术普惠应用。它通过“高精度推理+开源低成本”的组合,证明医疗大模型落地无需在效果与成本间妥协。

直面全球差距,中国医疗AI的突围之道在于深耕垂直领域。今年是AI大模型浪潮兴起的第三年,但中国通用大模型在全球市场中仍处于跟随者地位。近期在首届全球AI象棋争霸赛中,中国大模型首轮即被淘汰,凸显中美在通用大模型能力和技术创新层面的差距。然而,中国更擅长推动大模型落地应用,而这正是我们在AI垂直行业赛道弯道超车的关键。百川智能作为中国大模型创企之一,选择医疗这一“中国有需求、有数据优势”的领域深耕,用反超OpenAI的成绩证明“中国可以在垂直赛道做全球第一”。通过开源模式,百川智能降低了医疗AI技术门槛,让全球研究者、医疗机构可直接复用模型,在细分领域构建专属模型,加速医疗AI的落地与创新。此次发布会后,M2模型将进入全面落地期,百川将与国家儿童医学中心、北京大学第三医院、海淀卫健委等探索AI医疗深度应用,推动AI医疗从“实验室”走向“临床一线”。未来,随着模型的落地,将为基层医疗、疾病诊断等场景带来革新,推动“AI医疗惠及全民”。

百川M2医疗大模型参数小胜GPT-5登顶世界第一插图2

最新快讯

2025年11月18日

15:14
声明:本文源自微信公众号新熵,作者山竹,经站长之家授权转载发布。2023年盛大的报复性狂欢尚未落幕,2025年音乐节市场却已陷入“消失潮”的困境。据不完全统计,今年1至7月全国共有40场音乐节遭遇延期或取消,这一数字甚至超过了延期频发的2024年。更令人唏嘘的是,在这40场音乐节中,仅有2场最终复办,其余所谓的“延期”不过是无限期搁置的委婉说法。在如此严峻的...
15:14
微新创想11月18日重磅报道,华为Mate X7今日正式揭开神秘面纱,确认将在11月25日的旗舰发布会上与备受期待的Mate 80系列同步登场。华为官方社交媒体平台率先发布了Mate X7的四款配色真机图,其独具匠心的全新设计令人眼前一亮,尤其是后摄区域的Deco设计元素辨识度极高,彰显出华为在工艺层面的全新突破。 根据最新爆料信息,Mate X7的内置...
15:13
2025年11月18日,国内领先的测试与自动化设备研发企业博测达正式宣布成功完成总额超2亿元人民币的C轮融资。此次融资吸引了知名投资机构洪山资本领投,联合投资方阵容强大,涵盖了达晨财智、毅达资本、广东质量提升基金等业内知名机构,以及中山远道、靖锦投资、立湾创投、传新博宇、讯芯电子和华盈投资等多家优质资本。 本轮融资不仅为博测达注入了强劲的发展动力,更彰显...
15:13
Noctua近期在海外社交平台悄然释放了全新散热器的预热信息,引发广泛关注。根据该品牌公布的2025年9月产品规划路线图,此次曝光的黑色版本极有可能就是备受期待的NH-D15 G2旗舰风冷散热器的chromax.black黑化升级版。与此同时,备受瞩目的NF-A14x25(r) G2风扇的黑色定制款也有望在本季度内与市场见面。从Noctua一贯的产品策略来看...
15:13
吉利第三代豪越L将于2025年11月27日震撼登场,正式开启市场征程。新车全面贯彻"天地美学"设计理念,以大气磅礴的线条勾勒出优雅身姿,车身长度达到4865mm,彰显旗舰气场。官方精心准备了四款专属车身颜色供消费者选择,并创新推出5/6/7座三种灵活布局方案,满足不同家庭的多样化需求。 内饰设计堪称科技与舒适的完美融合,14.6英寸高清中控屏搭载Flyme ...
15:13
2025年11月18日,铭凡正式在海外市场推出备受期待的NAB3R迷你主机,这款产品凭借其强大的性能配置和丰富的接口选择,迅速吸引了全球用户的目光。作为一款面向创意工作者和普通用户的全能设备,NAB3R搭载了2022年发布的酷睿i3-1220P处理器,这款处理器在提供高效处理能力的同时,保持了出色的能效比,确保了长时间稳定运行。 在内存和存储方面,NAB3R...
15:13
2025年11月18日,全球知名汽车制造商宝马集团正式宣布其自主研发的企业级AI智能体平台“盖亚”(GAIA)正式投入运行,标志着国内汽车制造行业在智能化转型方面迈出了重要一步。作为首批实现全员化AI赋能的汽车制造企业之一,宝马通过“盖亚”平台整合了内部创新资源与外部先进技术成果,实现了在研发、生产、供应链管理及客户服务等多个核心领域的全面覆盖。 在宝马的沈...
15:13
2025年11月18日,银联商务正式宣布与河南新密市溱洧水城商业街达成战略合作,为其全面部署“银商收银宝”智能支付终端。这款终端凭借其革命性的“即插即用、快速适配”技术特性,能够迅速与街区各类商户现有的收银系统实现无缝对接,大幅简化了安装流程,显著提升了支付效率。 此次合作不仅为商户提供了更加灵活便捷的收银解决方案,有效满足了多样化的收银与对账需求,更为商业...
15:13
2025年11月18日,美国领先的新型抗体疗法开发商Solve Therapeutics成功斩获1.2亿美元战略融资,标志着其在全球生物制药领域的创新实力获得资本市场的高度认可。此次融资由Yosemite、Surveyor Capital、General Atlantic等顶级投资机构联合领投,同时吸引了默沙东(MSD)、汇桥资本等产业资本的鼎力支持,形成了...
15:13
2025年11月,滴滴巴士重磅推出全年最值得期待的出行优惠活动,为旅客带来前所未有的跨城出行体验。本次优惠活动覆盖范围广泛,涉及杭州、南昌、厦门、昆明、郑州、哈尔滨等百余座热门城市,完美契合了用户在旅游、探亲以及长途通勤等场景下的出行需求。 活动时间安排精心设计,分为两个阶段,旨在为乘客提供更具吸引力的优惠选择。具体来说,11月1日至21日期间,乘客只需完成...
15:13
2025年11月18日,金山云旗下AIoT物联网平台服务商金云智联正式宣布成功完成A轮融资,投资方包括锡创投与梁溪创投。作为智慧地产、酒店、住宅及园区等场景智能化解决方案的领先提供商,金云智联凭借其60余项发明专利技术,依托强大的AIoT智居平台,实现了生态设备的无缝互联。公司以“设计+科技+生态”的创新模式为核心,致力于为企业客户提供线上线下深度融合的智能...
15:13
2025年11月18日,英国生物医药领域的领军企业Artios Pharma成功斩获1.15亿美元D轮融资,标志着其在全球癌症治疗领域的研发实力再获资本市场的高度认可。此次投资由Janus Henderson Investors、Andera Partners等顶尖投资机构组成的联合投资团共同完成,彰显了业界对Artios创新疗法的强烈信心。 Artios ...