百度文心ERNIE-4.5-21B-A3B-Thinking开源登顶Hugging Face榜首

百度文心大模型家族迎来重大突破——ERNIE-4.5-21B-A3B-Thinking正式开源,迅速在Hugging Face平台登顶文本生成模型榜首,并跻身整体模型榜前三甲。这款轻量级Mixture-of-Experts(MoE)模型凭借卓越的推理性能与参数效率,引发行业强烈关注,成为中国AI开源生态的重要里程碑。

模型核心规格与创新设计ERNIE-4.5-21B-A3B-Thinking采用先进的MoE架构,总参数规模达21B,但通过稀疏激活机制,每个token仅激活3B参数。这种设计显著降低计算成本,同时保持高性能输出。模型支持128K长上下文窗口,特别擅长处理复杂长文本任务,如逻辑推理、数学求解和学术分析。与主流模型依赖PyTorch不同,ERNIE-4.5系列基于百度自研的飞桨(PaddlePaddle)框架训练优化,不仅提升多模态兼容性,更确保高效硬件适配。全球仅百度和谷歌采用自研框架训练大模型,这一技术自主性凸显其创新深度。

性能表现:高效推理挑战行业巨头最新基准测试显示,该模型在逻辑推理、数学、科学、编码和文本生成等任务上表现优异,部分指标甚至接近或超越Gemini2.5Pro和GPT-5级别模型。尽管总参数仅21B(约相当于Qwen3-30B的70%),其在BBH、CMATH等数学推理基准上的得分已超越同类竞品,展现出惊人的参数效率。模型内置高效工具调用功能,支持结构化函数调用和外部API集成,适用于程序合成、符号推理和多代理工作流场景。在长上下文理解方面,经过专属训练,它能稳定处理海量信息生成学术级合成内容,显著减少幻觉问题。此外,模型支持双语(中英)优化,全球开发者和企业均可轻松应用。开源社区反馈显示,该模型在Hugging Face上的下载量和趋势指数飙升,成为文本生成领域的热门选择。开发者可通过vLLM、Transformers4.54+和FastDeploy等工具快速集成,实现本地部署或云端推理。

百度文心ERNIE-4.5-21B-A3B-Thinking开源登顶Hugging Face榜首插图1

开源意义:推动AI民主化与生态建设ERNIE-4.5-21B-A3B-Thinking以Apache2.0许可发布,支持商业使用,进一步降低AI技术门槛。继6月底百度开源ERNIE4.5家族其他10款模型后,此次发布进一步巩固了其在开源AI领域的领导地位。目前,Hugging Face平台前排模型多为中国开源成果,反映中国AI在MoE架构和推理优化上的全球竞争力。作为文心大模型的最新迭代,该模型不仅提升指令跟随和知识密集任务表现,还通过多轮强化学习强化“思考”模式。在视觉-语言任务中,其VL变体也表现出色,缩小了与OpenAI-o1在MathVista和MMMU等基准上的差距。

行业影响与未来展望这款模型的发布证明,无需万亿级密集参数即可实现深度推理。它为资源受限的开发者提供高性能选项,推动AI从实验室向实际应用转型。未来,随着飞桨框架的进一步生态扩展,ERNIE系列有望在Agent产品和多模态应用中发挥更大作用,避免单一厂商垄断风险。

最新快讯

2025年11月28日

20:02
2025年11月28日,长安汽车正式宣布了一项具有里程碑意义的战略布局——拟以自有资金2.25亿元参与设立全新机器人公司。这一举措标志着长安汽车在智能化转型道路上迈出了坚实一步,也彰显了其向多元化科技巨头迈进的决心。据悉,新成立的长安机器人公司将由中国长安、辰致科技和长安科技共同出资组建,注册资本高达4.5亿元,其中长安汽车以50%的持股比例成为控股股东,凸...
20:02
2025年11月28日,社交巨头Meta旗下的Instagram平台重磅推出两项创新功能——本地化语音翻译与字体适配,旨在为全球创作者提供更强大的跨语言传播工具。这一系列优化举措将显著提升内容在多语言环境下的可理解性与视觉吸引力,帮助创作者突破地域限制,更精准地触达不同语言背景的用户群体。 通过先进的语音识别与机器翻译技术,Instagram能够实时将语...
20:02
2025年11月28日,安世中国正式发布了一份措辞强硬的声明,直指安世荷兰在控制权问题上的不当行为,并要求其立即与相关方展开真诚磋商。声明明确指出,当前全球半导体供应链的混乱局面,主要源于荷兰方面的一系列违规操作,其海外扩产计划不仅扰乱了正常的市场秩序,更试图通过替代中国产能来谋求不正当优势。安世中国强烈谴责荷方这种破坏全球产业分工的行为,要求其立即停止在马...
20:02
2025年11月28日,中国巨石发布重要公告,宣布其控股股东振石集团正式启动股份增持计划。据悉,振石集团目前持有公司总股本的16.88%,此次计划将通过自有资金及专项贷款,筹集5.5亿元至11亿元的资金,分阶段逐步增持公司股份。这一举措不仅彰显了振石集团对巨石未来发展的坚定信心,更体现了其对公司长期价值的深度认可。根据公告内容,增持的具体实施将灵活调整,择机...
20:02
2025年11月28日,备受瞩目的2025数据要素发展大会在北京隆重召开。在此次盛会期间,中国信息通信研究院正式发布了《数据要素发展报告(2025年)》,为我国数据要素市场的发展提供了权威解读。报告深入分析了当前数据要素领域面临的挑战与机遇,指出数据基础制度与现有体系的衔接仍存在明显短板,技术产业规模化突破尚未实现。为有效激发数据要素的内在活力,报告提出了一...
19:01
2025年11月28日,胜科纳米正式宣布一项重大战略布局,其全资子公司青岛胜科计划投入约5亿元人民币,全力推进“青岛检测分析能力提升建设项目”。这一举措标志着胜科纳米在半导体检测与分析领域的深度拓展,旨在通过技术升级和产能扩张,进一步巩固其在第三方检测服务市场的领先地位。 该项目投资主体为青岛胜科或其关联企业,建设地点选址于青岛这一重要的科技创新中心。据...
19:01
2025年11月28日,中国创新药企贝达药业传来振奋人心的消息,其自主研发的盐酸恩沙替尼胶囊上市许可申请已成功获得欧洲药品管理局(EMA)的正式受理。这款备受瞩目的靶向药物,专为治疗间变性淋巴瘤激酶(ALK)阳性的非小细胞肺癌患者设计,此次获得EMA受理标志着其进军欧洲市场的关键一步,有望为欧洲患者带来全新的治疗希望。 该药物的申请材料基于一项全球多中心II...
19:01
2026年初,备受期待的M&M'S全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家标志性门店坐落于迪士尼小镇入口附近黄金位置,将为游客提供集购物、餐饮与娱乐体验于一体的全方位休闲空间。玛氏中国官方宣布,此次新店开业将是品牌在中国市场战略布局的重要里程碑。据悉,新门店将精心打造沉浸式品牌体验空间,通过创新设计、互动装置和特色活动,让消费者深度感受...
19:01
2025年第三季度,美团核心本地商业分部遭遇了前所未有的经营困境,实现经营亏损高达141亿元人民币,较去年同期由盈转亏的局面形成鲜明对比。回顾去年同期,该分部曾实现经营溢利146亿元,经营利润率维持在令人羡慕的21.0%水平。然而,本季度这一数据急转直下,不仅扭亏为盈,反而跌至-20.9%的亏损区间,利润率大幅下滑41个百分点。 造成这一结果的主要原因是多方...
19:01
2025年11月28日,中国生物科技企业海特生物迎来重大突破,其参股公司研发的创新眼用注射液ZM-02正式获得美国食品药品监督管理局(FDA)的临床试验批准。这一里程碑事件不仅彰显了ZM-02的卓越研发潜力,更标志着该产品迈向国际化的关键一步。据悉,ZM-02将在美国境内开展严谨的临床试验,全面评估其在治疗各类眼部疾病方面的安全性与有效性。作为该项目的参股方...
19:01
2025年11月28日,医药企业泰恩康迎来重大突破,其全资子公司正式获得国家药品监督管理局颁发的巴瑞替尼片药品注册证书。这一里程碑事件不仅意味着该创新药物即将进入临床应用阶段,更标志着泰恩康在自身免疫疾病治疗领域迈出了关键一步。据悉,巴瑞替尼片作为一款口服JAK抑制剂,凭借其强大的抗炎特性,被批准用于治疗中重度斑秃及类风湿关节炎两大高发性自身免疫疾病。此次成...
19:01
首旅如家近日宣布与云迹科技达成战略合作,在上海等一线城市的多家门店成功引入煮面机器人,正式开启餐饮智能化升级新篇章。此次合作的核心目标在于全面升级旗下特色服务「如家这碗面」,通过引入自动化煮面机器人,显著提升早餐服务的餐饮效率与标准化水平,为消费者带来更稳定、更高效的用餐体验。 据悉,这款煮面机器人能够全流程自动化完成从取面、煮面到加汤等关键步骤,其卓越性能...