微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型

近日,中国领先的社交媒体平台微博旗下人工智能部门重磅推出了一款开源的大型语言模型——VibeThinker-1.5B。这款拥有15亿参数的先进模型,是在阿里巴巴尖端研究成果Qwen2.5-Math-1.5B的基础上进行深度优化和精细调整的结晶。VibeThinker-1.5B现已全面登陆Hugging Face、GitHub以及ModelScope等主流开源平台,向全球的研究人员和企业开发者免费开放,并允许在MIT许可证框架下进行商业应用,极大地促进了技术创新与知识共享。

尽管VibeThinker-1.5B的参数规模相对较小,但在数学推理和代码生成等关键任务上却展现出惊人的能力,其推理性能达到了行业顶尖水平,甚至成功超越了参数量高达6710亿的DeepSeek R1模型这一重量级对手。更令人瞩目的是,VibeThinker-1.5B能够在与Mistral AI的Magistral Medium、Anthropic的Claude Opus4以及OpenAI的gpt-oss-20B Medium等多款大型模型同台竞技中脱颖而出,而其所需的基础设施投入和运营成本却要低得多。

微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型插图1

VibeThinker-1.5B的后期训练成本仅为7800美元,这一数字与同类或更大规模模型动辄数十万甚至数百万美元的成本形成了鲜明对比,充分彰显了其高性价比和经济效益。大型语言模型的训练过程通常分为两个关键阶段:预训练和后期训练。预训练阶段,模型通过海量文本数据学习语言结构和积累通用知识;而后期训练则聚焦于使用更精炼的高质量数据集,进一步提升模型在提供帮助、执行推理以及与人类期望保持一致等方面的能力。

VibeThinker-1.5B创新性地采用了“谱-信号原则”(Spectrum-to-Signal Principle,SSP)的训练框架,将监督微调和强化学习巧妙地分为两个阶段。第一阶段强调训练数据的多样性,为模型探索广阔的推理空间奠定基础;第二阶段则通过强化学习技术对最优路径进行精准优化,使得即使是参数量较小的小模型也能高效地挖掘推理潜力,最终实现信号的有效放大。在多个领域的严格性能测试中,VibeThinker-1.5B的表现均超越了众多大型开源模型和商业模型,充分证明了小型模型在特定任务中也能创造卓越成就的可能性。

VibeThinker-1.5B开放源代码的发布,不仅打破了传统观念中对模型参数规模和计算强度的固有认知,更向业界展示了小型模型在特定领域实现突破性进展的无限潜力,为人工智能技术的普及和发展注入了新的活力。huggingface:https://huggingface.co/WeiboAI/VibeThinker-1.5B

微博开源VibeThinker-1.5B低成本AI模型挑战大型语言模型插图2

划重点:📊 VibeThinker-1.5B是微博推出的15亿参数开源AI模型,在多项任务中表现出色,甚至超越部分大型模型。  💰 该模型后期训练成本仅为7800美元,远低于行业平均水平,展现出极高的经济性。  🔍 采用创新的“谱-信号原则”训练框架,有效提升了小模型的推理能力,打破了规模限制的壁垒。

最新快讯

2025年11月13日

12:01
2025年11月13日,银联商务携手中国银联与广东华兴银行深圳分行,在深圳正式推出创新性的离境退税“即买即退”POS服务。这项便捷服务覆盖了深圳市内多个重点商圈的指定退税商店,为港澳台同胞及境外游客提供了全新的购物体验。在合作商户完成购物后,游客可直接通过POS机完成退税款支付,无需再前往机场或港口排队办理繁琐的退税手续。这一举措不仅极大提升了境外旅客的购物...
12:01
2025年11月13日,备受瞩目的时刻即将到来——小米之家巴黎首家直营门店正式揭幕。这家位于法国巴黎市中心的门店,不仅代表着小米重返欧洲市场的坚定决心,更象征着品牌全球化战略的重要里程碑。作为小米在欧洲市场的首个直营据点,该门店的落成将全面展现小米的创新科技与独特品牌魅力,为当地消费者带来全新的智能生活体验。 此次小米选择直营模式进军巴黎市场,充分体现了品牌...
12:01
上海发布最新消息,东方枢纽上海东站传来重大进展。11月11日,这座位于浦东新区祝桥镇的综合交通枢纽项目正式宣告混凝土主体结构封顶,标志着工程建设取得了关键性突破。作为上海打造国际航运中心的重要配套工程,上海东站主站房已完成最后一块分块梁板的浇筑任务,这一里程碑事件不仅展现了建设团队的卓越实力,更彰显了上海在国家战略布局中的前瞻视野 这座现代化综合交通枢纽总建...
12:01
瑞鼎精密作为孔加工切削技术领域的专业解决方案提供商,近日成功完成B轮融资,投资方阵容强大,涵盖久德投资、经开基金及中财融商等知名机构。这家高新技术企业始终坚守创新驱动发展战略,通过持续研发投入与零缺陷生产流程的严格把控,在精密制造领域树立了卓越标杆。其产品线广泛应用于汽车工业、工程机械、轨道交通、船舶动力、工业母机及能源装备等关键产业,为精密制造供应链体系提...
12:01
在11月8日至9日圆满落幕的第八届进博会上,上海外服在FSG展台隆重发布了六份聚焦人力资源领域的系列研究报告。这些报告内容丰富且具有前瞻性,分别从中国企业出海人力资源管理趋势、技能培训行业洞察、社会化用工分析、AI技术赋能人力资源管理、高科技行业员工健康福利以及生物医药人才战略等六个维度展开深入探讨,为行业人士呈现了一幅人力资源领域的前沿动态与发展路径全景图...
12:01
2025年11月13日,菜鸟物流科技凭借其创新性的“AI赋能汽车售后零部件供应链智能升级方案”成功入选《2024-2025罗戈物流行业年报》。这一案例不仅彰显了菜鸟在物流科技领域的领先地位,更凸显了AI技术在推动行业变革中的关键作用。方案聚焦于中国汽车售后零部件市场,针对该领域长期存在的库存积压、周转率低以及需求预测不准确等核心痛点,提出了系统性的解决方案。...
12:01
11月10日,第八届中国国际进口博览会期间,上海外服FSG展台成功举办了主题为“阳光进博·创益未来”的助残公益主题活动。这一活动充分利用了进博会开放包容的平台优势,旨在积极探索残疾人就业服务的新模式,并推动社会融合实践向更深层次发展。 活动现场特别设立了“阳光201”手工艺品展区,集中展示了由残障人士匠心独运的珍珠花、绣球、刺绣等非遗作品。这些精美的手工...
12:01
创业环球光明集团(EUBG)近期正式发布了截至2025年9月30日的首季度未经审计财务报告。数据显示,报告期内公司实现营业收入121.8万美元,较去年同期大幅下降27%,反映出当前市场环境对公司业务造成一定压力。与此同时,净利润降至39.5万美元,同比下滑幅度达到44%,显示出公司在盈利能力方面面临挑战。 尽管短期业绩表现不及预期,但光明集团在财务健康方面仍...
12:01
AI语音交互技术迎来历史性突破,正式迈入“拟人化2.0”时代。谷歌今日宣布全面推送Gemini Live语音功能重大升级,凭借五大核心能力——实时语速调节、情绪化语气响应、个性口音切换、无障碍优化与多模态深度整合,将AI对话体验提升至“懂你所想、如你所愿”的新境界。这一创新被视为对OpenAI ChatGPT语音模式的精准反击,当ChatGPT还在追求对话连...
12:01
在备受瞩目的2025世界大会上,百度公司执行副总裁沈抖正式揭幕了两款划时代的新产品——昆仑芯片M100与M300,同时发布了百度天池256和512两款高性能超节点。这些尖端产品即将震撼登陆市场,为全球用户带来前所未有的计算体验。 核心产品发布与未来战略规划沈抖在发布会上详细阐述了昆仑芯片未来五年的发展蓝图。百度将保持每年推出一款或数款新品的创新步伐,持续巩固...
12:01
近日,字节跳动大模型团队(Seed)的核心研究员任某某正式确认离职,据公司内部多位知情人士透露,此次离职实因其多次泄露公司核心机密信息,最终触犯公司红线被正式辞退。这一事件在科技圈引发广泛关注,尤其引人注目的是,任某某在知乎平台拥有超过8万名粉丝,长期以"业内人士"身份分享字节跳动在机器人研发领域的最新进展、技术策略及内部项目细节,其高调的分享行为最终导致公...
12:01
中国人工智能翻译技术迎来重大突破,东北大学“小牛翻译”团队宣布正式开源其最新研发的大模型——NiuTrans.LMT(Large-scale Multilingual Translation),这一里程碑式的成果实现了60种语言、234个翻译方向的无缝覆盖,不仅以中文和英文作为双核心构建起全球语言沟通的桥梁,更在藏语、阿姆哈拉语等29种低资源语言上取得了令人...