微博开源Vibe Thinker 15亿参数模型击败DeepSeek R1 后训练成本仅7800美元

2025-11-18 17:25:38 AI动态 2 次阅读

微博正式宣布推出自主研发的开源大模型Vibe Thinker，这一突破性成果在国际顶级数学竞赛基准测试中展现出惊人实力。凭借仅15亿参数的规模，Vibe Thinker竟在击败了拥有6710亿参数的DeepSeek R1等强劲对手的同时，实现了更高的准确率。更令人瞩目的是，其单次“后训练”成本仅为7800美元，相较于DeepSeek-R1和MiniMax-M1等同类模型降低了数十倍，展现出卓越的经济效益。

Vibe Thinker的核心优势在于其轻量化的MoE（Mixture of Experts）架构与多轮知识蒸馏技术。官方明确表示，该模型能够在5GB以下的数学语料库上高效完成微调，极大降低了资源门槛。此外，Vibe Thinker全面支持Hugging Face平台的一键下载，并提供了灵活的商用许可，为开发者提供了极大的便利。

微博技术团队进一步透露，Vibe Thinker在AIME 2025、HMMT等知名数学竞赛题库中的平均得分较R1提升了3.4%，同时推理延迟降低了42%。这些优异性能使其在教育、金融等实时应用场景中具有极高的实用价值。开源版本不仅支持PyTorch与GGUF格式，确保兼容性，更能在单张RTX4090显卡上流畅运行，展现了其强大的硬件适应性。

为了进一步推动AI技术的普及，微博同步开放了训练脚本与数据配比方案，为开发者提供了完整的参考资源。计划于12月推出的Vibe Thinker-Math专用数学增强版，将进一步提升模型在数学领域的专业性能。此外，微博还联合高校举办“轻量级数学挑战赛”，旨在激发更多创新应用，推动低成本高精度AI技术的广泛应用，为AI领域的发展注入新的活力。

2025年11月18日

19:54

微博开源Vibe Thinker 15亿参数模型击败DeepSeek R1 后训练成本仅7800美元

最新快讯

2025年11月18日

微软Win11AI功能默认关闭防安全风险

力箭一号遥十一火箭通过出厂评审将执行一箭9星发射任务

亚玛芬体育Q3营收超预期股价大涨业绩亮眼

重庆加速打造高性能算力中心助力智能算力网络发展

重庆加速具身智能机器人落地工业制造升级

谷歌CEO：AI泡沫破裂无人幸免警惕非理性投资风险

拼多多Q3营收超预期1082.8亿净利润增14%超预期

川酒集团董事长定调2030营收450亿目标深耕核心领域提升竞争力

近视用户优选AI眼镜一体化贴合镜片更舒适可靠

央地共推成渝科创中心建设助力区域高质量发展

2025年11月建筑钢材价格窄幅震荡分析

小米汽车本周提前达成35万台交付目标市场需求强劲供应链升级