百川M3大模型超越GPT-5.2 AI医疗新趋势解读

AI医疗或成下一个AI规模化应用领域?2026年开年以来,AI医疗领域动作频频,且均聚焦C端试水。1月8日,OpenAI推出ChatGPT Health,允许用户共享Apple Health等应用中的电子病历和体征数据,由AI解答健康问题。1月11日,Anthropic发布Claude for Healthcare,通过与初创公司合作接入用户医疗数据,为用户提供健康咨询服务。这一系列动向释放出明确信号:2026年AI医疗新趋势——AI公司将医疗服务拓展至医院场景之外。

作为大模型五小龙中唯一All in AI医疗的选手,百川智能也传来新消息。1月13日,百川智能在北京举办M3大模型发布会,正式亮相自家的AI医疗新模型。官方数据显示,该模型在多项测试中超越OpenAI的GPT-5.2。拆解技术优势之余,百川CEO王小川还提出诸多非主流观点:技术才是真正的护城河,数据虽关键但非最核心要素;多模态并非主战场,语言大模型才是智能最高体现。

百川M3大模型超越GPT-5.2 AI医疗新趋势解读插图1

回顾2025年,对王小川和百川而言最重要的事,就是确立”用AI造医生”的发展路线。王小川表示,科研第一步是打造优质模型,这也是M1、M2到M3的迭代逻辑。2026年,百川迎来关键节点,王小川透露将推出AI硬件和C端产品,让商业化叙事从大模型走向具体产品。但这条路并不轻松,王小川透露百川账面仍有30亿现金,过去1年半烧掉20亿融资。

透过百川,我们得以审视AI医疗的过去与未来,这个赛道又将涌现哪些新可能?实测M3大模型在严肃医疗与泛健康领域的差异究竟如何?时隔4个多月,百川BaiChuan-M3正式亮相。官方评测显示,相比M2追赶海外模型,M3实现成功超越,在幻觉、HealthBench等测试中全面超越OpenAI的GPT-5.2。

除了数据印证,光锥智能的实测对比也颇具参考价值。与国内蚂蚁阿福对比发现,两者在诊断准确度上表现相似,都能给出症状猜测和检查建议。但M3在模拟真实就医场景时更胜一筹,而阿福更擅长追问补充信息。最直观的差异在于,M3能深入浅出解释病情来龙去脉,而非简单停留在术语判断上。

百川M3大模型超越GPT-5.2 AI医疗新趋势解读插图2

以”指标显示重度贫血但体感仅轻度疲劳”为例,两者都能准确判断为慢性贫血并建议检查。但M3在症状说明上更胜一筹,会解释贫血是心脏、血液、组织代偿的调整过程,并提醒用户”透支健康”的风险。这种差异源于百川自创的SCAN-bench评测体系——该体系联合150位一线医生,将就医过程拆解为病史采集、辅助检查和精准诊疗三个阶段,通过动态多轮交互完整展示模型思路。

更值得关注的是百川的医疗论文+自创算法组合。M3在解释病症原因和判断对症标准时,会引用1-3条论文文献佐证。以生理期延迟测试为例,M3结合论文指出”若无特殊变化可观察”,结论与医生建议完全一致。这种分段强化学习方法值得称道——将诊断拆分为问诊、鉴别诊断、实验室检测和最终诊断四个阶段,各阶段结论可传递至下一阶段,显著提升长时间问询任务的准确度。

M3在追问方面略逊于蚂蚁阿福,后者几乎每次都会连续追问补充信息。但M3通过风险项提示和针对不同用户的建档区分,在C端交互体验上表现成熟。上市、出海?比起这些,2026年AI医疗落地更值得关注。

百川M3大模型超越GPT-5.2 AI医疗新趋势解读插图3

关于AI医疗大模型发展,王小川提出诸多”非共识”观点。他认为医疗AI主战场从来不是多模态,而是语言大模型——评判模型能力至今仍以符号、语言为基础,医学本质是推理而非图像处理。数据同样非最关键要素,他举例说明Gemini和Claude虽C端用户少于OpenAI,仍能做出领先模型。当前阶段优势更多在于技术,而非用户规模。

在AI医疗领域,王小川预判了重要趋势——未来增量将主要出现在院外场景。”院内更多是手术执行和挂水服务,写病历、做质控绝非主流方向。”他分析国内医疗痛点:好医生供给不足、医患关系不平等、国内外就医环境差异、医学发展局限。OpenAI押注C端、蚂蚁阿福突破3500万月活,都印证了这个市场潜力。

百川目前的护城河在于技术、场景和产品形态:M3代表技术实力,场景定位更贴近家庭医生,但始终坚守不触碰医疗红线,专注于辅助决策。今年百川计划推出两款C端产品,并尝试布局睡眠相关AI硬件。

百川M3大模型超越GPT-5.2 AI医疗新趋势解读插图4

百川战略日益清晰,但商业化能否成功仍存疑问。国内C端变现风险重重,蚂蚁阿福至今未收费,医疗领域C端付费更面临舆论和准确性考验。上市、出海计划能否通过C端产品证明AI医疗商业化潜力?答案或许就在未来几个月。

最新快讯

2026年01月19日

11:07
OpenAI近期宣布了一项重大举措,将极具性价比的ChatGPT Go订阅计划推向全球市场,覆盖所有支持ChatGPT的国家和地区,包括美国。这一战略部署标志着该计划自2025年8月率先在印度推出以来,其服务范围已迅速扩展至171个国家和地区,成为OpenAI增长速度最快的付费产品线。ChatGPT Go的推出,旨在以更亲民的价格让更多用户享受到高级AI功能...
11:07
小米运动健康 App 近期迎来重大升级,正式携手蚂蚁集团旗下 AI 健康助手“蚂蚁阿福”,为用户开启全新的智能健康管理体验。这一合作旨在通过尖端人工智能技术,为用户提供更为精准的健康数据分析与个性化建议。在最新版本的小米运动健康 App 中,用户只需在睡眠监测或心率监测界面轻轻一点,即可直接调用“蚂蚁阿福”对实时数据进行深度分析。 “蚂蚁阿福”依托蚂蚁集团自...
11:07
据权威科技媒体 AIbase 最新报道,巨人网络旗下现象级游戏《超自然行动组》近日重磅推出全新“AI大模型挑战”玩法,正式开启游戏与人工智能深度融合的新纪元。这一创新玩法标志着国内首次在日活跃用户超千万级的大型游戏中,成功将AI大模型技术规模化落地,打造出真正意义上的AI原生游戏体验。 在全新玩法中,游戏内传统NPC“假人”经过彻底革新,进化为由尖端AI大模...
11:07
据权威科技媒体AIbase最新报道,阿里健康于1月19日正式揭幕其自主研发的医学大模型产品化里程碑——AI医疗助手“氢离子”。这款创新产品现已成功完成内测阶段,正式面向临床一线医生及科研工作者开放下载,标志着国内医疗AI领域迈入新纪元。 "氢离子"的核心竞争力聚焦于"低幻觉、高循证"的卓越能力。在医疗领域对信息准确性的严苛要求下,该AI助手的所有输出均基于权...
11:07
在人工智能技术狂飙突进的当下,就业市场的安全性正面临前所未有的考验。AIbase 获悉,伦敦市长萨迪克·汗近日在年度演讲中发出严厉警告。他指出,如果缺乏有效的约束与监管,人工智能极有可能演变成对就业环境造成系统性破坏的“大规模摧毁岗位武器”。目前,伦敦作为全球金融与创意产业的枢纽,已处于这场变革的最前沿。AIbase 了解到,根据伦敦市政厅的最新调查,高达 ...
11:07
2025 年 7 月 9 日,香港交易所的钟声为一位中国制造业传奇人物而鸣——蓝思科技创始人周群飞正式带领公司登陆港交所,成功跻身“A+H”双资本平台。这场上市不仅是一次融资行动,更标志着这家从湖南小作坊起步的全球精密制造龙头,正以惊人速度向智能汽车、AI眼镜与人形机器人等前沿赛道全面跃迁。 市场用真金白银投下信任票:蓝思科技港股公开发售获**462.76 ...
11:07
人工智能领域的军备竞赛再掀波澜,埃隆·马斯克近日投下重磅消息:xAI公司专为驱动AI聊天机器人Grok打造的超级计算机Colossus2已正式投入运行。这不仅是xAI技术实力的最新展现,更是全球首个实现吉瓦级规模的AI训练集群,标志着AI基础设施迈入全新纪元。 坐落于孟菲斯的Colossus2堪称"算力巨兽"。据AIbase独家了解,该设施占地面积广阔,相当...
10:57
微新创想1月19日重磅消息,备受瞩目的电影《镖人:风起大漠》正式官宣定档2026年春节档,并同步发布了极具视觉冲击力的"亮招!"版定档预告。预告片中,吴京、李连杰、谢霆锋、梁家辉等一众实力派演员集体亮相,瞬间点燃观众期待值。定档海报以雄浑壮阔的沙漠为背景,黄沙遮天蔽日,一位头戴斗笠的镖人身影在漫天狂沙中若隐若现,长刀出鞘的瞬间,猩红的血痕随刀锋迸溅,画面极具...
10:57
声明:本文源自微信公众号「游戏葡萄」,作者九莲宝灯,经站长之家授权转载发布。近期,一款全新的AI模型横空出世,虽然AI技术已广泛应用于各行各业,包括游戏领域,但这款名为PixVerse R1的AI模型却展现出前所未有的独特性。它由爱诗科技研发,自海外发布以来备受瞩目,引发众多报道与热议。不少体验者认为,这款AI模型或将深刻影响游戏、互动视频、社交、广告等多个...
10:57
微新创想1月19日重磅消息,苹果公司正式宣布将颠覆其长达十年的秋季新品发布惯例,从iPhone 18系列起,将年度旗舰更新策略升级为双季更迭模式。根据最新披露的官方时间表,2026年秋季苹果将同步推出三款划时代机型,包括iPhone 18 Pro、iPhone 18 Pro Max以及备受全球科技爱好者热切的折叠屏iPhone Fold,而入门级iPhone...
10:55
2026年1月,财通资本成功完成对新能源材料领域的领军企业至华能源的战略性投资。作为全球领先的硅基材料解决方案提供商,至华能源专注于为新能源产业输送高性能材料,其产品在锂电池领域展现出卓越的应用价值。此次投资不仅将为企业注入强劲的资金支持,更将助力其加速技术研发进程,推动锂电池材料技术的突破性创新与规模化产业化应用。通过此次合作,财通资本将与至华能源携手,共...
10:55
2026年1月19日,技嘉与英伟达正式宣布深化在显卡、笔记本及显示器领域的战略合作,共同开启高性能计算新时代。作为此次合作的核心成果,AORUS品牌隆重推出搭载NVIDIA最新Blackwell架构的GeForce RTX 5090 INFINITY旗舰显卡,这款产品将RTX 50系列在游戏渲染与AI计算方面的性能潜力发挥到极致,为玩家和创作者带来前所未有的...