AI大模型无疑是2023年的科技焦点,成为各大厂商竞相争夺的制高点。然而,这些象征着未来的AI技术却异常昂贵,连微软这样的科技巨头也开始寻求”Plan B”。近日有内部消息透露,在Peter Lee领导的1500人研究团队中,部分成员正转向研发全新的小型AI模型,其体积显著缩小,运营成本大幅降低。

关于微软的小尺寸AI模型,其实早在3个月前就已初露锋芒。今年6月,微软发布了一篇题为《Textbooks Are All You Need》的论文,通过仅70亿token的”教科书级别”数据训练出13亿参数的phi-1模型,证明高质量的小规模数据同样能打造高性能AI。基于phi-1,微软研究院还推出了phi-1.5预训练语言模型,适用于QA问答、聊天和代码等场景。微软表示,phi-1.5在常识、语言理解和逻辑推理等基准测试中表现优异,甚至超越了包括Meta llama-2在内的许多大模型,在GPT4AL跑分套件中可与70亿参数的开源大模型媲美,AGIEval得分更胜一筹。

微软开发小尺寸AI模型背后有多重考量。首先,与OpenAI的复杂关系可能是主要动因。作为OpenAI的重要资助方,微软虽拥有旗下产品使用OpenAI知识产权的独家权利,但无法完全掌控OpenAI的发展方向。因此,开发自主可控的高质量LLM成为微软保障战略安全的必然选择。其次,AI大模型的超高能耗也成为关键因素。AMD首席技术官Mark Papermaster曾展示数据显示,机器学习系统能耗已占全球电力消耗的1.5%-2%,相当于整个英国的用电量,预计2030年将升至4%。Digital Information World的报告显示,AI数据中心功耗到2028年将接近4250兆瓦,是2023年的212倍。OpenAI训练GPT-3的耗电量达1.287吉瓦时,相当于120个美国家庭一年的用电量,而训练过程仅占模型实际运行能耗的40%。

更令人担忧的是AI大模型的惊人水耗。谷歌2023年环境报告显示,其2022年消耗了56亿加仑水,其中52亿加仑用于数据中心,比2021年增加20%。ARM高级技术总监Ian Bratt指出:”AI计算需求无法满足,网络规模越大、电力消耗也越大。”AI从业者透露,疫情前训练Transformer模型能耗为27千瓦时,而现在参数从5000万增至2亿,能耗飙升至50万千瓦时,耗电量增加超过18000倍。AI创新功能背后,是惊人的能源和水资源消耗。微软甚至被曝计划使用小型核反应堆为数据中心供电。

从成本角度考量,小尺寸模型同样具有重大价值。英伟达凭借CUDA生态占据了AI芯片市场70%的份额,H100、A100等计算卡一卡难求,算力采购已成为AI厂商的主要成本支出。小尺寸模型对算力需求更低,能显著降低运营成本。虽然大模型功能强大,但商业化仍处于初级阶段,英伟达作为”卖铲人”独享红利。微软此举正是希望改变这一现状,通过技术创新实现更高效的AI应用。

最新快讯

2025年12月20日

20:43
2025年12月20日,备受瞩目的KDE Plasma桌面环境正式发布重大更新,为用户带来前所未有的视觉与功能体验。此次升级不仅新增了对现代笔记本电脑环境光传感器的全面支持,更在显示效果和网络连接方面实现了多项关键突破。值得注意的是,该更新率先在搭载最新AMD锐龙处理器的旗舰设备上完成适配,包括备受关注的Framework 13系列笔记本,从而成功解决了困扰...
20:12
2025年,谷歌在AI软件工程师招聘中迎来重大变化,其中约五分之一的新面孔竟是曾离职后重返的老员工,这一比例创下近年新高。这一现象的背后,既有Alphabet此前裁员策略形成的回聘空间,也得益于公司对顶尖AI人才的强大吸引力。值得注意的是,谷歌不仅成功召回内部人才,还从主要竞争对手手中抢夺了大量AI精英。 这一人才回流潮的背后,是谷歌在AI领域的持续投入与战...
20:12
2025年9月,北京市市场监督管理局成功查处了一起性质恶劣的虚假AI培训案件,揭露了部分培训机构利用中老年人信息不对称进行价格欺诈的乱象。这起案件不仅损害了消费者的合法权益,也对AI培训行业的健康发展造成了不良影响。 涉事公司通过大规模投放"免费AI培训、月入过万"的虚假广告,精准吸引对AI技术抱有学习热情的中老年群体。广告画面光鲜亮丽,承诺高薪就业前景...
19:42
12月20日,备受瞩目的「Alpha峰会」在中欧国际工商学院隆重举行。在此次峰会上,蚂蚁数科AI原生事业部总经理王磊发表了题为《AI在严肃产业的落地挑战与应对》的演讲,深入探讨了人工智能在金融等高要求行业中的应用现状与未来方向。王磊指出,AI技术要真正赋能严肃产业,必须高度重视严谨性、专业性和合规性三大核心要素,这是确保AI应用安全可靠的基础。 王磊特别强调...
19:42
12月20日,备受瞩目的「Alpha峰会」在中欧国际工商学院与华尔街见闻联合举办,知名经济学家付鹏在会上发表了深度观点。他指出当前AI领域面临的关键挑战——算力基础设施建设已初见成效,但实际应用场景的落地仍存在诸多不确定性。这一现状使得整个行业迫切需要寻找新的增长点,而付鹏特别强调,明年市场将聚焦于一个核心问题:人工智能技术能否真正从提升生产力的层面,进一步...
18:41
2025年12月20日,农业农村部正式发布最新一批特色农作物新品种,总数达到1048个,标志着我国农业科技创新能力再上新台阶。值得注意的是,这些新品种中高达98.5%均由国内自主选育,充分彰显了我国农业科技自立自强的显著成果。此次登记推出的品种覆盖范围广泛,横跨特色粮食、油料、糖料、蔬菜、果树、茶树及橡胶树等七大类29种作物,为我国农业产业多元化发展提供了有...
18:41
2025年12月20日,《黄仁勋传》作者斯蒂芬·威特发布深度分析报告,指出谷歌正迅速崛起为英伟达在人工智能领域的头号竞争对手。威特在报告中强调,英伟达通过其独特的软硬件一体化生态体系,成功实现了数万亿美元的市值飞跃。然而,谷歌在Gemini大型语言模型和TPU(张量处理单元)芯片技术上的突破性进展,正对英伟达构成前所未有的实质性挑战。 尽管英伟达在半导体供应...
18:11
12月19日,美国《财富》杂志独家报道了一项重要观点:Meta首席AI官汪滔向Alpha世代青少年发出强烈呼吁,鼓励他们投身AI编程领域。现年28岁的汪滔在接受采访时明确指出,当前正处于一个技术断层的关键时刻,传统代码编写方式将逐渐被AI生成代码所取代。这一趋势预示着未来编程模式的深刻变革。 汪滔特别强调,对于青少年而言,掌握AI工具的实验与引导能力远比单纯...
18:11
2025年12月20日,北京电力交易中心圆满落幕2026年度电力外送交易,黑龙江绿电外送成交电量高达34.31亿千瓦时,一举刷新历史记录。这一亮眼成绩的背后,是黑龙江电力资源优化配置的生动实践。此次交易不仅彰显了黑龙江清洁能源的巨大潜力,更凸显了区域电力协同发展的显著成效。 黑龙江总外送电量达到146.68亿千瓦时,同比增长19.3%,这一数据充分印证了黑龙...
18:11
2025年12月20日,中国量子科技领域迎来重大合作里程碑,图灵量子与摩尔线程正式签署战略合作协议,宣布将携手开启GPU与量子处理器(QPU)协同的混合计算架构研发新时代。此次合作聚焦于量子-经典混合计算这一前沿领域,计划从多个维度深度探索技术融合的无限可能,具体涵盖硬件互联技术突破、量子计算模拟加速方案优化、量子纠错实时计算支撑体系构建以及量子智算中心的全...
18:11
2025年12月18日,国际科技媒体纷纷聚焦OpenAI最新发布的ChatGPT-5.2模型,其基础测试结果却令人大跌眼镜。据多家权威媒体联合报道,该模型在核心功能测试中暴露出一系列严重缺陷,尤其是在处理特定视觉任务时表现令人担忧。测试显示,ChatGPT-5.2在生成按英文字母顺序排列的动物挂图时,系统性地遗漏了"U"和"Z"两个关键字母,这种明显的逻辑错...
17:11
12月19日,NASA传来振奋人心的消息,宣布其火星车“毅力号”在2025年6月19日创下了单日行驶距离的新纪录,自主行驶了约412米。这一壮举不仅展现了人类科技的进步,更彰显了深空探测的无限可能。此次行驶任务历时4小时24分钟,其中超过九成的路程由“毅力号”的增强型自主导航系统ENav独立完成。该系统能够精准识别前方约15米范围内的潜在危险,并自动进行避障...