AI大模型无疑是2023年的科技焦点,成为各大厂商竞相争夺的制高点。然而,这些象征着未来的AI技术却异常昂贵,连微软这样的科技巨头也开始寻求”Plan B”。近日有内部消息透露,在Peter Lee领导的1500人研究团队中,部分成员正转向研发全新的小型AI模型,其体积显著缩小,运营成本大幅降低。

关于微软的小尺寸AI模型,其实早在3个月前就已初露锋芒。今年6月,微软发布了一篇题为《Textbooks Are All You Need》的论文,通过仅70亿token的”教科书级别”数据训练出13亿参数的phi-1模型,证明高质量的小规模数据同样能打造高性能AI。基于phi-1,微软研究院还推出了phi-1.5预训练语言模型,适用于QA问答、聊天和代码等场景。微软表示,phi-1.5在常识、语言理解和逻辑推理等基准测试中表现优异,甚至超越了包括Meta llama-2在内的许多大模型,在GPT4AL跑分套件中可与70亿参数的开源大模型媲美,AGIEval得分更胜一筹。

微软开发小尺寸AI模型背后有多重考量。首先,与OpenAI的复杂关系可能是主要动因。作为OpenAI的重要资助方,微软虽拥有旗下产品使用OpenAI知识产权的独家权利,但无法完全掌控OpenAI的发展方向。因此,开发自主可控的高质量LLM成为微软保障战略安全的必然选择。其次,AI大模型的超高能耗也成为关键因素。AMD首席技术官Mark Papermaster曾展示数据显示,机器学习系统能耗已占全球电力消耗的1.5%-2%,相当于整个英国的用电量,预计2030年将升至4%。Digital Information World的报告显示,AI数据中心功耗到2028年将接近4250兆瓦,是2023年的212倍。OpenAI训练GPT-3的耗电量达1.287吉瓦时,相当于120个美国家庭一年的用电量,而训练过程仅占模型实际运行能耗的40%。

更令人担忧的是AI大模型的惊人水耗。谷歌2023年环境报告显示,其2022年消耗了56亿加仑水,其中52亿加仑用于数据中心,比2021年增加20%。ARM高级技术总监Ian Bratt指出:”AI计算需求无法满足,网络规模越大、电力消耗也越大。”AI从业者透露,疫情前训练Transformer模型能耗为27千瓦时,而现在参数从5000万增至2亿,能耗飙升至50万千瓦时,耗电量增加超过18000倍。AI创新功能背后,是惊人的能源和水资源消耗。微软甚至被曝计划使用小型核反应堆为数据中心供电。

从成本角度考量,小尺寸模型同样具有重大价值。英伟达凭借CUDA生态占据了AI芯片市场70%的份额,H100、A100等计算卡一卡难求,算力采购已成为AI厂商的主要成本支出。小尺寸模型对算力需求更低,能显著降低运营成本。虽然大模型功能强大,但商业化仍处于初级阶段,英伟达作为”卖铲人”独享红利。微软此举正是希望改变这一现状,通过技术创新实现更高效的AI应用。

最新快讯

2026年02月11日

17:33
2月9日,斯柯达在欧洲预览全新纯电动城市跨界SUV Epiq,该车将于2026年上半年上市,是品牌最经济实惠的纯电车型。Epiq基于大众MEB+平台打造,采用前轮驱动,车身尺寸为4171×1798×1581mm,轴距2601mm,风阻系数0.275。全系标配LED大灯、5.3英寸数字仪表与13英寸中控屏,搭载LFP或NMC电池(38.5–55kWh),CL...
17:33
2026年2月11日,区块链与现实世界资产(RWA)融合项目RubberVerseX(RVX)宣布完成200万美元战略融资。本轮融资由M2M Capital、HVS Ventures及BD Ventures联合投资。RVX致力于构建数字橡胶经济,通过区块链技术将天然橡胶种植、加工、贸易等实体产业链关键环节上链,提升透明度与流动性。此次融资将用于智能合约审计...
17:33
2026年2月11日,日本开发商Kairosoft宣布经典模拟经营游戏《游戏发展国》在苹果App Store和谷歌Play商店开启限时免费领取活动。该游戏原价4.49美元(约合31.1元人民币),曾于2010年10月9日首发登陆移动平台,此前最早可追溯至1997年Windows版本。玩家将扮演游戏公司创始人,统筹开发、招聘与市场策略,推动企业成长。本次免费...
17:33
2026年1月,中国电解铝行业平均含税完全成本环比降0.6%、同比降19.5%,主因氧化铝与预焙阳极成本下降;同期SMM A00铝现货月均价为23641元/吨,环比上涨1840元/吨。成本回落叠加价格上行,行业平均利润升至7500元/吨。按月均价测算,当月全国在产电解铝产能全部盈利。
17:33
2月11日16时40分,新疆巴音郭楞州尉犁县发生3.9级地震,震中位于北纬40.86度、东经84.07度。此次地震震源深度26千米,属浅源地震。据中国地震台网正式测定,目前暂无人员伤亡和财产损失报告。当地相关部门已启动应急响应,正开展震情核查与风险排查。
17:32
2026年2月11日,蔚蓝锂芯(002245.SZ)董事会审议通过终止参与格林美印尼项目增资扩股事项。公司原计划于2025年10月出资2000万美元,认购目标公司5.95%股权。因格林美调整战略规划,经协商一致,各方签署终止契约书。本次终止系基于战略优化需要,不涉及违约,对公司经营、财务状况及股东权益无重大影响。
17:32
2026年2月11日,沃森生物公告拟联合国投创益、玉溪国有资本及央企乡村产业基金,共同设立云南创沃生物产业投资基金。基金总规模10亿元,沃森生物以自有资金认缴4.5亿元,作为有限合伙人。基金聚焦合成生物制造领域,重点布局合成生物学、生命大健康、生物农业、生物能源、生物材料及技术平台型企业。此举旨在强化公司在前沿生物技术领域的产业协同与战略卡位。
17:32
2026年2月11日,欧洲汽车电池公司(ACC)宣布搁置在意大利和德国建设电池超级工厂的计划。ACC由Stellantis、梅赛德斯-奔驰与道达尔能源合资成立,旨在增强欧洲电动汽车电池供应链自主性。此举源于Stellantis近期因电动车市场需求疲软,计提220亿欧元资产减值,并全面缩减电动化投资。ACC CEO安东尼奥·菲洛萨表示,实际电池产能需求远低于...
17:32
2026年2月11日,Meta向Quest 3用户推送v85公共测试频道(PTC)更新,新增“Surface Keyboard”桌面虚拟键盘功能。该功能利用头显摄像头在任意平整表面投射可交互虚拟键盘与触控板,支持光标移动、点击、拖拽及双指滚动。适用于轻度生产力、网页浏览及消息沟通等场景,但Meta建议大量输入仍使用实体键盘。已加入PTC的用户可在设置→实验...
17:32
声明:本文来自于微信公众号 新莓,作者:翟文婷,授权站长之家转载发布。全民AI运动还在进行时。腾讯元宝的10亿红包雨进程过半,阿里千问免费请客计划也在继续,大家还在用支付宝扫福集福。今年五福变六福,蚂蚁AI健康应用阿福为大家新增健康福以及红包。除此之外,字节、百度等互联网公司也在花式参与其中。种种迹象表明,今年春节的AI含量绝对...
17:32
声明:本文来自于微信公众号 Tech星球,作者:陈桥辉,授权站长之家转载发布。2026年2月10日,QQ迎来27岁生日。这个几乎和中国互联网同龄的产品,从那只“嘀嘀嘀”叫的企鹅开始,一路见证了国内网民从拨号上网到5G时代的全部变迁。在很多人眼里,QQ是“青春纪念册”般的存在。70后在这里学会打字,80后在这里玩“偷菜”游戏、养宠...
17:32
 据QuestMobile最新数据显示,2月7日,大模型应用千问的日活跃用户数(DAU)已正式突破7352万。在市场排名方面,千问App近期展现出极高的用户增长势头。根据苹果App Store实时数据,该应用已连续6天蝉联App Store免费榜第一名,持续领跑国内AI应用赛道。