微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型

近日,中国领先的社交媒体平台微博旗下人工智能部门重磅推出了一款开源的大型语言模型——VibeThinker-1.5B。这款拥有15亿参数的先进模型,是在阿里巴巴尖端研究成果Qwen2.5-Math-1.5B的基础上进行深度优化和精细调整的结晶。VibeThinker-1.5B现已全面登陆Hugging Face、GitHub以及ModelScope等主流开源平台,向全球的研究人员和企业开发者免费开放,并允许在MIT许可证框架下进行商业应用,极大地促进了技术创新与知识共享。

尽管VibeThinker-1.5B的参数规模相对较小,但在数学推理和代码生成等关键任务上却展现出惊人的能力,其推理性能达到了行业顶尖水平,甚至成功超越了参数量高达6710亿的DeepSeek R1模型这一重量级对手。更令人瞩目的是,VibeThinker-1.5B能够在与Mistral AI的Magistral Medium、Anthropic的Claude Opus4以及OpenAI的gpt-oss-20B Medium等多款大型模型同台竞技中脱颖而出,而其所需的基础设施投入和运营成本却要低得多。

微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型插图1

VibeThinker-1.5B的后期训练成本仅为7800美元,这一数字与同类或更大规模模型动辄数十万甚至数百万美元的成本形成了鲜明对比,充分彰显了其高性价比和经济效益。大型语言模型的训练过程通常分为两个关键阶段:预训练和后期训练。预训练阶段,模型通过海量文本数据学习语言结构和积累通用知识;而后期训练则聚焦于使用更精炼的高质量数据集,进一步提升模型在提供帮助、执行推理以及与人类期望保持一致等方面的能力。

VibeThinker-1.5B创新性地采用了“谱-信号原则”(Spectrum-to-Signal Principle,SSP)的训练框架,将监督微调和强化学习巧妙地分为两个阶段。第一阶段强调训练数据的多样性,为模型探索广阔的推理空间奠定基础;第二阶段则通过强化学习技术对最优路径进行精准优化,使得即使是参数量较小的小模型也能高效地挖掘推理潜力,最终实现信号的有效放大。在多个领域的严格性能测试中,VibeThinker-1.5B的表现均超越了众多大型开源模型和商业模型,充分证明了小型模型在特定任务中也能创造卓越成就的可能性。

VibeThinker-1.5B开放源代码的发布,不仅打破了传统观念中对模型参数规模和计算强度的固有认知,更向业界展示了小型模型在特定领域实现突破性进展的无限潜力,为人工智能技术的普及和发展注入了新的活力。huggingface:https://huggingface.co/WeiboAI/VibeThinker-1.5B

微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型插图2

划重点:📊 VibeThinker-1.5B是微博推出的15亿参数开源AI模型,在多项任务中表现出色,甚至超越部分大型模型。  💰 该模型后期训练成本仅为7800美元,远低于行业平均水平,展现出极高的经济性。  🔍 采用创新的“谱-信号原则”训练框架,有效提升了小模型的推理能力,打破了规模限制的壁垒。

最新快讯

2025年11月13日

10:47
Epic Games近日正式发布了备受期待的虚幻引擎5.7版本,这一重大更新将重点聚焦于大规模世界构建技术的飞跃性突破以及高保真渲染效果的革命性提升。作为本次更新的核心亮点,程序化内容生成框架(PCG)已经成功进入稳定状态,为开发者提供了一套全新的内容创作解决方案。通过这套基于规则驱动的智能系统,开发者能够快速构建出规模宏大的虚拟环境,极大地提高了开发效率。...
10:47
瑞视生物近日成功斩获数千万元天使轮融资,彰显其在细胞治疗领域的强劲发展势头。此次融资由华方资本独家领投,杭州市科创集团旗下颠覆性技术成果转化基金强势跟投,为这家专注于眼部疾病治疗的新兴企业注入强劲动力。作为一家致力于攻克眼科领域未解决临床难题的创新企业,瑞视生物凭借其前瞻性的研发战略和领先的技术实力,正逐步成为行业内的佼佼者。 公司自主研发的iPSC分化技术...
10:47
2025年11月13日,亚马逊正式发布革命性企业采购智能助手——Amazon Business Assistant,为企业采购流程注入AI驱动的智慧。这款创新工具基于海量历史采购数据与精细化账户设置,能够实时生成精准的采购建议,涵盖成本优化方案、合规性检查以及账户配置优化等多维度内容。其独特的会话式交互设计,让用户可以自然流畅地获取所需信息,而持续学习的算法...
10:47
11月12日,备受瞩目的东南亚-海南-香港(SEA-H2X)国际海缆项目迎来关键进展,由中国移动主导发起并深度参与投资建设的关键路段在香港将军澳成功登陆。作为项目中国香港段的核心登陆点,此次登陆作业的成功完成,标志着香港段的建设工程正式拉开帷幕,为区域通信网络的升级换代注入强劲动力。 SEA-H2X国际海缆工程是一项具有里程碑意义的跨国通信基础设施项目,其总...
10:47
索尼正式官宣11月PlayStation Plus游戏更新名单,备受全球玩家期待的大作《侠盗猎车手5》(GTA 5)强势回归,这已是该作自2023年12月和2024年11月后第三次登陆会员免费游戏库。本月还将同步上线两部获奖佳作:凭借精湛表演斩获英国电影学院奖的荒诞喜剧《谢天谢地你来了!》,以及融合心理惊悚元素的恐怖冒险游戏《觉醒深渊》。此外,游戏库还精心收...
10:47
2025年11月13日,小米集团正式宣布完成对已回购股份的注销工作。根据官方披露,此次注销行动于11月12日顺利实施,共计注销2729.54万股股票。这一重要举措标志着小米在优化资本结构、提升股东权益价值方面迈出了关键一步。通过减少总股本,小米不仅增强了每股收益的潜在空间,更向市场传递出对自身未来发展的坚定信心。此次股份注销的相关细节已在官方公告中全面披露,...
10:47
2025年1月5日起,爱彼迎将在美国三大城市启动一项创新试点服务——杂货配送服务,为房客提供更加便捷的日常生活支持。这项服务将与知名电商平台Instacart深度合作,率先在凤凰城、奥兰多以及洛杉矶部分房源区域落地。根据计划,入住爱彼迎房源的旅客可以通过爱彼迎App轻松下单,在入住前后随时订购各类日用品,从生鲜食品到个人护理用品,全面满足基本生活需求。 此次...
10:47
深圳传音控股股份有限公司近日正式宣布一项重大战略举措——计划发行H股并在香港联合交易所主板挂牌上市。这一决策标志着传音控股在全球化发展道路上迈出关键一步,不仅旨在显著提升企业的综合竞争力,更致力于增强其国际品牌影响力。通过拓展多元化融资渠道,传音控股有望进一步优化资本结构,为未来的可持续发展奠定坚实基础。 根据公司披露的详细信息,本次H股发行规模将控制在发行...
10:47
保时捷中国总裁潘励驰近日公开表示,中国消费者对汽车智能化技术的需求已显著超越欧洲及其他国际市场,高度智能化配置几乎已成为行业新标准。面对这一市场趋势,保时捷正从技术创新、产品迭代和文化融合等多个维度展开全面布局。 目前,保时捷上海研发中心正同步推进多个前沿项目,重点涵盖信息娱乐系统升级、高级驾驶辅助技术(ADAS)优化以及新能源电池管理系统研发等关键领域...
10:47
近期六氟磷酸锂价格呈现爆发式增长,部分市场报价已飙升至15万元/吨,较10月中旬价格翻了一番不止。这一轮价格飙升发生在2025年11月,主要受供应端紧张与下游需求回暖的双重驱动,厂商普遍采取惜售策略。多家核心生产企业已暂停发布官方报价,并针对中小客户实施现款现货或预付款交易模式,同时大幅缩短账期。作为锂电池电解液的核心原料,六氟磷酸锂价格的上涨正通过产业链传...
10:47
2025年11月13日,A股市场钙钛矿电池板块迎来爆发式增长,中利集团强势涨停并创下三连板,奥来德、中来股份、天合光能等龙头企业也纷纷跟风上涨。这一轮资本市场的热情与南京工业大学的重大科研突破密不可分。据该校官网最新消息,其研究团队成功开发出全钙钛矿叠层LED器件,通过创新性地利用层间光子循环效应,显著提升了光提取效率,最终将外量子效率推向了45%的历史新高...
10:47
美国人工智能领域的领军企业 Anthropic 正以惊人的魄力,向全球市场投下重磅炸弹——公司宣布将斥资高达500亿美元,全力打造覆盖全球的AI基础设施网络。这一雄心勃勃的计划,不仅标志着Anthropic在技术领域的野心,更预示着人工智能产业即将迎来新一轮的变革浪潮。 作为这一宏大蓝图的起点,Anthropic已确定在得克萨斯州和纽约州选址建设尖端数据中心...