百度文心ERNIE-4.5-21B-A3B-Thinking开源登顶Hugging Face榜首

百度文心大模型家族迎来重大突破——ERNIE-4.5-21B-A3B-Thinking正式开源,迅速在Hugging Face平台登顶文本生成模型榜首,并跻身整体模型榜前三甲。这款轻量级Mixture-of-Experts(MoE)模型凭借卓越的推理性能与参数效率,引发行业强烈关注,成为中国AI开源生态的重要里程碑。

模型核心规格与创新设计ERNIE-4.5-21B-A3B-Thinking采用先进的MoE架构,总参数规模达21B,但通过稀疏激活机制,每个token仅激活3B参数。这种设计显著降低计算成本,同时保持高性能输出。模型支持128K长上下文窗口,特别擅长处理复杂长文本任务,如逻辑推理、数学求解和学术分析。与主流模型依赖PyTorch不同,ERNIE-4.5系列基于百度自研的飞桨(PaddlePaddle)框架训练优化,不仅提升多模态兼容性,更确保高效硬件适配。全球仅百度和谷歌采用自研框架训练大模型,这一技术自主性凸显其创新深度。

性能表现:高效推理挑战行业巨头最新基准测试显示,该模型在逻辑推理、数学、科学、编码和文本生成等任务上表现优异,部分指标甚至接近或超越Gemini2.5Pro和GPT-5级别模型。尽管总参数仅21B(约相当于Qwen3-30B的70%),其在BBH、CMATH等数学推理基准上的得分已超越同类竞品,展现出惊人的参数效率。模型内置高效工具调用功能,支持结构化函数调用和外部API集成,适用于程序合成、符号推理和多代理工作流场景。在长上下文理解方面,经过专属训练,它能稳定处理海量信息生成学术级合成内容,显著减少幻觉问题。此外,模型支持双语(中英)优化,全球开发者和企业均可轻松应用。开源社区反馈显示,该模型在Hugging Face上的下载量和趋势指数飙升,成为文本生成领域的热门选择。开发者可通过vLLM、Transformers4.54+和FastDeploy等工具快速集成,实现本地部署或云端推理。

百度文心ERNIE-4.5-21B-A3B-Thinking开源登顶Hugging Face榜首插图1

开源意义:推动AI民主化与生态建设ERNIE-4.5-21B-A3B-Thinking以Apache2.0许可发布,支持商业使用,进一步降低AI技术门槛。继6月底百度开源ERNIE4.5家族其他10款模型后,此次发布进一步巩固了其在开源AI领域的领导地位。目前,Hugging Face平台前排模型多为中国开源成果,反映中国AI在MoE架构和推理优化上的全球竞争力。作为文心大模型的最新迭代,该模型不仅提升指令跟随和知识密集任务表现,还通过多轮强化学习强化“思考”模式。在视觉-语言任务中,其VL变体也表现出色,缩小了与OpenAI-o1在MathVista和MMMU等基准上的差距。

行业影响与未来展望这款模型的发布证明,无需万亿级密集参数即可实现深度推理。它为资源受限的开发者提供高性能选项,推动AI从实验室向实际应用转型。未来,随着飞桨框架的进一步生态扩展,ERNIE系列有望在Agent产品和多模态应用中发挥更大作用,避免单一厂商垄断风险。

最新快讯

2025年09月15日

17:15
微新创想9月15日讯 魅族22于今日下午正式揭开神秘面纱,其起售价高达2999元,并于9月15日16:30全面开售。这款手机最引人注目的莫过于其行业罕见的白面板设计,星纪魅族中国区CMO万志强更是大胆预测,魅族22或将成绝版白面板手机。 魅族22采用6.3英寸黄金尺寸屏幕,分辨率为1.5K,并创新性地运用了全新自研的LIPO屏幕封装技术。这一技术不仅将面...
17:12
近日,xAI 宣布正式推出 Grok4Fast,一款专为追求极致速度而优化的全新AI模型。用户可通过 Grok 网页版的模型选择器轻松体验这一创新功能,但需在订阅设置中先行开启早期访问模式切换按钮。据 testingcatalog 报道,Grok4Fast 最引人注目的特性在于其惊人的响应速度,用户实测反馈显示其处理效率比标准 Grok4 快达10倍之多。 ...
17:12
Genspark AI 浏览器震撼问世,正式宣告其作为全球首款支持本地运行开源模型的 AI 浏览器身份。这款创新产品的独特魅力在于,它赋予用户在完全离线状态下,直接通过本地设备流畅运行多达169款开源模型的能力,其中包括备受瞩目的 GPT-OSS 和 Gemma3 等。无需依赖网络连接,即可享受闪电般的响应速度,并且这一切完全免费。Genspark AI 浏...
16:57
2025年第十六届东莞台湾名品博览会于14日圆满落下帷幕,这场备受瞩目的行业盛会将台湾优质商品与内地市场紧密连接,取得了令人瞩目的成果。展会期间,共有671家参展企业盛装亮相,精心布置了1881个展位,全面展示了台湾地区的特色产品与创新技术。据统计,线上线下参会人数累计达到54.1万人次,其中超7000名专业采购商亲临现场,深入考察洽谈。经过激烈而高效的交流...
16:57
Demand AI作为一家以人工智能技术为核心驱动力的B2B营销与潜在客户生成服务提供商,致力于通过智能化解决方案优化企业营销流程,显著提升客户转化效率。公司核心业务聚焦于三大领域:智能线索挖掘、精准客户画像构建以及自动化营销策略制定,通过创新技术帮助企业突破传统营销瓶颈,实现高效获客目标。凭借卓越的技术实力和服务能力,Demand AI在行业内已建立起良好...
16:57
2025年,全球领先的检验检测认证机构DEKRA德凯即将迎来其百年华诞。9月12日,德凯亚太区在上海隆重举行百年庆典,以此纪念这一重要的里程碑时刻。集团首席执行官Stan Zurkiewicz在庆典上发表致辞,强调面对当前全球环境的复杂多变,德凯将始终坚守百年传承的初心,持续深耕未来交通与出行、数字信任和可持续发展三大战略领域,为全球客户提供更加优质、可靠的...
16:57
近日任天堂官方举办的最新一场直面会为玩家带来了众多备受期待的大作消息,而其中最受关注的莫过于Switch 2平台的三款重点游戏容量数据,这些信息由知名游戏爆料者Stealth率先公开。据其透露,《塞尔达无双:封印战纪》的数字版容量达到了惊人的45GB,相较于前作《塞尔达无双:海王之泪》有了显著的增长,这也意味着玩家需要更充足的存储空间来体验这款次世代动作巨作...
16:57
石头科技近日正式官宣旗下扫拖机器人新品——P20活水版,迅速引爆市场关注。这款创新产品凭借其独特的滚筒活水清洁系统,彻底颠覆传统清洁方式,通过实时清洁拖布表面,有效杜绝二次污染问题,让清洁效果更彻底、更健康。据悉,目前石头科技在售的P20标准版和水箱版价格分别为2799元和3199元,而备受期待的活水版则尚未公布具体定价。 据官方透露,P20活水版在继承现款...
16:57
龙磁科技旗下全资子公司越南龙磁正式宣布一项重大投资计划,拟斥资约2.1亿元人民币用于建设二期工程。该项目将显著提升永磁铁氧体湿压磁瓦的产能,新增10,000吨/年规模,同时配套建设25,000吨预烧料产能,以满足日益增长的市场需求。 该项目核心目标在于实现永磁铁氧体原料的本土化供应,通过在越南布局生产基地,有效降低物流成本,提升供应链稳定性,并进一步巩固...
16:57
2025年9月15日,随着湖南首个低空经济互联网平台的正式上线,无人机服务迈入全民化时代。这一创新平台由湖南新翼智能科技发展有限公司倾力打造,不仅标志着湖南低空经济发展迈出关键一步,更将无人机应用带入前所未有的便捷境界。用户只需通过手机轻点,即可像预约网约车一样轻松下单无人机服务,真正实现“指尖上的天空”。 该平台覆盖航拍、植保、巡检、物流配送等十余种实用场...
16:57
2025年9月15日,备受关注的重庆北碚悦榕庄酒店及其在建工程在拍卖场上再次遭遇流拍,引发市场广泛关注。此次拍卖的起拍价仅为8180.9万元,与评估价相比低至3折,显示出市场对该标的的接受度依然较低。值得注意的是,该物业此前已多次因无人报名而流拍,显示出市场观望情绪浓厚。最新一次拍卖将于9月23日举行,尽管此次降价吸引了1人报名,但最终仍因无人出价而宣告流拍...
16:57
丰田汽车正式宣布推出创新纯电动车型e-Palette,这款车型凭借其独特的设计理念和多功能性,将彻底改变城市出行与服务模式。e-Palette采用开放式车厢设计,内部空间宽敞明亮,大面积车窗提供极佳视野,不仅可作为高效交通工具,更可通过灵活配置轻松转换为移动商店、服务站点或临时活动空间。 该车将首先部署在东京体育馆周边交通枢纽以及未来智慧城市Woven Ci...