微博开源Vibe Thinker 15亿参数模型击败DeepSeek R1 后训练成本仅7800美元

微博正式宣布推出自主研发的开源大模型Vibe Thinker,这一突破性成果在国际顶级数学竞赛基准测试中展现出惊人实力。凭借仅15亿参数的规模,Vibe Thinker竟在击败了拥有6710亿参数的DeepSeek R1等强劲对手的同时,实现了更高的准确率。更令人瞩目的是,其单次“后训练”成本仅为7800美元,相较于DeepSeek-R1和MiniMax-M1等同类模型降低了数十倍,展现出卓越的经济效益。

Vibe Thinker的核心优势在于其轻量化的MoE(Mixture of Experts)架构与多轮知识蒸馏技术。官方明确表示,该模型能够在5GB以下的数学语料库上高效完成微调,极大降低了资源门槛。此外,Vibe Thinker全面支持Hugging Face平台的一键下载,并提供了灵活的商用许可,为开发者提供了极大的便利。

微博技术团队进一步透露,Vibe Thinker在AIME 2025、HMMT等知名数学竞赛题库中的平均得分较R1提升了3.4%,同时推理延迟降低了42%。这些优异性能使其在教育、金融等实时应用场景中具有极高的实用价值。开源版本不仅支持PyTorch与GGUF格式,确保兼容性,更能在单张RTX4090显卡上流畅运行,展现了其强大的硬件适应性。

为了进一步推动AI技术的普及,微博同步开放了训练脚本与数据配比方案,为开发者提供了完整的参考资源。计划于12月推出的Vibe Thinker-Math专用数学增强版,将进一步提升模型在数学领域的专业性能。此外,微博还联合高校举办“轻量级数学挑战赛”,旨在激发更多创新应用,推动低成本高精度AI技术的广泛应用,为AI领域的发展注入新的活力。

最新快讯

2025年11月18日

19:54
2025年11月17日,微软正式发布重要安全警示,宣布即将推出的Windows 11“智能体式AI”功能将默认关闭。这一创新功能赋予AI智能体访问用户文档、桌面等核心个人文件夹的权限,但需管理员手动启用方可使用。微软在声明中强调,该智能体将在隔离环境中运行,能够代表用户自动执行各类任务,然而也面临着“跨提示词注入攻击”等新型网络威胁的潜在风险。 针对这些安全...
19:54
2025年11月18日,中科宇航传来振奋人心的消息,力箭一号遥十一运载火箭已成功完成总装测试,并顺利通过出厂评审。这款备受瞩目的火箭即将在近期奔赴酒泉东风商业航天创新试验区,执行"一箭9星"的密集发射任务。此次火箭总装工作在中科宇航产业化基地完成,基地采用先进的脉动式生产模式,不仅效率显著提升,更具备年产30发的固体运载火箭生产能力,这标志着力箭一号正式迈入...
19:54
2025年11月18日,亚玛芬体育正式公布其第三季度财务报告,交出了一份亮眼的成绩单。公司营收高达17.6亿美元,不仅成功超越市场此前预测的17.2亿美元,更展现出强劲的增长势头。在盈利方面,亚玛芬体育同样表现卓越,调整后每股收益达到0.33美元,大幅超出分析师预期的0.25美元,彰显出公司稳健的盈利能力。 得益于这份出色的业绩表现,亚玛芬体育管理层信心倍增...
19:54
2025年11月18日,重庆市经济和信息化委员会正式发布《重庆市加快推进人工智能终端产业创新蝶变行动计划(2026—2030年)》,为未来五年重庆人工智能产业发展擘画宏伟蓝图。该计划明确提出,重庆将着力构建高性能、高效能算力体系,通过实施"东数西算"工程,优化全国算力资源配置。同时,计划推动与成都、西安等西部城市深度合作,共同打造区域性算力网络联盟,实现跨区...
19:54
2025年11月18日,重庆市经济和信息化委员会正式发布《重庆市加快推进人工智能终端产业创新蝶变行动计划(2026—2030年)》,标志着该市在人工智能产业发展领域迈出关键一步。该计划以工业机器人领域为核心突破口,重点布局焊接、装配、喷涂、搬运、质检等关键制造场景的智能机器人研发,旨在通过技术创新推动制造业智能化升级。方案特别强调,将优先推动具身智能机器人在...
19:54
美东时间周二,谷歌CEO Sundar Pichai在一场重要采访中发出警示,直言若人工智能泡沫最终破裂,没有任何一家公司能够完全幸免。他坦承当前AI领域的投资热潮中存在明显的非理性因素,这种过度狂热可能重演互联网泡沫时期的过度反应。尽管谷歌凭借从芯片设计到模型训练的全栈技术优势,在AI领域占据领先地位,但仍难以完全规避这场潜在的风暴。 今年以来,Alpha...
19:54
2025年第三季度,拼多多交出亮眼业绩单,营收达到1082.8亿元,同比增长9%,不仅超越市场预期值1075.9亿元,更展现出强劲的增长势头。在盈利能力方面,调整后净利润高达313.8亿元,同比增长14%,大幅超出市场预估的251.2亿元。每股ADS收益表现同样亮眼,达到21.08元,显著高于行业预期。 此次业绩增长主要得益于拼多多在成本控制上的持续优化...
19:54
2025年11月18日,川酒集团董事长曹勇在备受瞩目的“十五五”战略发布会上,向外界描绘了公司未来五年乃至更长远的发展蓝图。他掷地有声地宣布,川酒集团将以坚定的步伐,力争到2030年实现营业收入突破450亿元大关,同时利税总额将达到30亿元,为地方经济发展注入强劲动力。 为实现这一宏伟目标,川酒集团将战略重心聚焦于原酒酿造与口粮酒等核心业务领域。公司表示,将...
19:35
11月,国内AI眼镜市场迎来新品发布热潮,众多消费者在选购时更加关注镜片结构的安全性与佩戴体验。多位行业专家和医学专家指出,“一体化贴合镜片”在光学性能和可靠性方面表现尤为突出,成为当前市场的主流选择。 目前主流AI眼镜已集成问答、拍照、导航、支付、音乐播放等多种实用功能,价格区间覆盖2000元至6000元,深受AI爱好者和年轻用户的青睐。对于需要视力矫正的...
19:22
2025年11月17日,备受瞩目的央地共建成渝地区区域科技创新中心工作推进会在山城重庆隆重举行。科技部、重庆市、四川省等相关部门负责人齐聚一堂,就协同推进区域科技创新发展展开深入研讨,共绘成渝地区科技创新新蓝图。会议指出,将着力强化中央与地方协同机制,深化部门间联动合作,全方位支持成渝地区加快建成具有全国影响力的科技创新中心。作为国家级战略布局的重要一环,此...
19:22
2025年11月18日,国内建筑钢材市场迎来小幅上涨,其中唐山迁安普方坯出厂价格保持稳定,维持在2970元/吨的水平。尽管黑色系期货价格出现回调,但市场整体情绪仍显偏弱,导致现货成交量有所回落。季节性淡季的效应逐渐显现,终端需求呈现疲软态势,多数商家选择持观望态度,市场活跃度不高。预计11月19日,建筑钢材价格将继续维持窄幅震荡的运行格局,短期内缺乏明显方向...
19:22
2025年11月18日,小米集团在季度财报电话会议中传来振奋人心的消息,官方宣布小米汽车有望在本周内提前完成全年设定的35万台交付目标。这一里程碑式的成就背后,是小米汽车团队与合作伙伴的共同努力,更是市场对小米汽车品牌实力和产品力的高度认可。 卢伟冰在电话会上详细介绍,第三季度小米汽车新车交付量已突破10万台大关,而前三季度的累计交付量更是高达26万台以上。...