ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2026年01月12日

03:48
2026年1月12日,U23亚洲杯D组第二轮比赛落下帷幕,中国U23队凭借一场1-0的胜利,以4分优势暂时领跑小组积分榜。这场关键战役不仅展现了国青队的竞技实力,更将小组出线悬念推向高潮。末轮对阵泰国队,中国U23队肩负着锁定小组头名的重任。若能全取三分,球队将直接以小组第一的身份晋级下一阶段;若战平,则需依赖伊拉克队与澳大利亚队的比赛结果——只要伊拉克未能...
02:47
2026年,IDEAYA Biosciences将全面启动四项关键性的注册性临床试验,标志着公司研发战略迈入全新阶段。这些临床试验将在全球范围内多个中心同步开展,重点聚焦于公司核心在研药物IDE849和darovasertib的疗效与安全性评估。作为全球生物科技领域的创新力量,IDEAYA Biosciences此次多中心临床试验的推进,旨在显著加速两款药物...
01:46
2026年1月1日至9日,黑龙江省口岸出入境旅客数量突破9.1万人次,同比增长率高达43.8%,这一亮眼数据充分展现了边境旅游与跨境往来的蓬勃态势。黑龙江出入境边防检查总站最新发布的数据显示,随着通关便利化措施的持续优化以及冬季冰雪旅游热潮的兴起,边境地区的客流量呈现显著增长。其中,绥芬河、黑河、抚远等主要陆路口岸的客流增长尤为突出,反映出冬季冰雪旅游的强大...
00:44
2026年1月11日21时45分,北京时间,美国航天局成功发射三颗专项研究系外行星的先进卫星,搭乘“猎鹰9”号火箭,从加利福尼亚州范登堡太空军基地腾空而起。火箭点火过程精准无误,卫星顺利分离,助推器更以卓越性能成功回收,标志着此次任务圆满开局。 “潘多拉”卫星作为此次发射的核心,将搭载可见光与近红外光谱仪,通过精准分析行星大气信号,有效区分恒星与行星的化学成...
00:44
2026年1月11日,全球零售巨头沃尔玛与科技巨头谷歌母公司Alphabet正式宣布达成战略合作,将在谷歌的Gemini人工智能平台上推出创新性购物功能。这一合作标志着零售行业与前沿AI技术的深度融合,将彻底改变用户的在线购物体验。 该AI驱动的购物功能将基于Gemini平台的强大智能算法,通过深度学习用户购物习惯和偏好,为每一位消费者提供高度个性化的商品推...
00:44
2026年1月11日,博杰股份正式宣布与N客户达成合作,为其提供机柜内PCBA主板测试服务。据悉,相关测试设备预计将在2026年上半年完成批量交付,标志着公司在该领域的产能与技术实力获得市场高度认可。根据公司财报显示,该业务已于2025年成功切入量产产线,预计今年设备需求量将突破小四位数,展现出强劲的市场增长潜力。此类产品主要应用于客户在线生产环节,若客户产...

2026年01月11日

23:42
2026年1月11日,特斯拉CEO埃隆·马斯克在播客访谈中释放出惊人言论:Optimus人形机器人将在短短三年内实现重大突破,不仅将超越全球最顶尖的外科医生,更将开启规模化应用的新时代。马斯克指出,传统医生培养周期漫长且知识更新速度难以跟上医疗技术革新的步伐,而机器人则能完美克服这些局限,以稳定性和持续学习能力成为医疗领域的革命性力量。值得注意的是,特斯拉已...
23:42
2026年1月8日,数字人民币App在上海地区迎来重大创新,率先上线“碳普惠”小程序,为绿色出行行为赋予全新的价值。这一举措标志着我国在推动绿色消费和碳减排方面迈出了坚实一步。用户只需开通该小程序,日常低碳出行行为如乘坐地铁、骑行共享单车等,均可被精准量化为碳积分,并自动归集至个人数字人民币账户中。每1250克碳积分可兑换0.01元数字人民币,兑换过程需通过...
23:12
2026年1月11日,超微公司(SMCI)正式宣布携手多家行业领军企业,共同推出具有革命性意义的智能店内零售解决方案。这一创新方案深度融合了尖端AI计算技术与先进的边缘设备,致力于全面优化零售门店的运营效率,同时显著提升顾客的购物体验。此次战略合作覆盖了硬件设备、软件系统及数据分析三大核心领域,通过引入实时库存管理系统、智能监控摄像头以及自动化结账系统,为零...
23:12
1月11日21时12分,电影《匿杀》的票房成绩再创新高,成功突破3亿元大关,累计观影人次也达到了令人瞩目的817万。这部近期上映的影片凭借其扣人心弦的剧情和精良的制作水准,迅速赢得了观众的广泛青睐。这一亮眼的数据成果源自票务平台的实时统计,清晰地反映出《匿杀》在市场上的热度正持续攀升,势头强劲。尽管影片目前仍处于热映阶段,但其在观众中的口碑和票房表现已展现出...
23:12
1月11日下午,广东汕头市濠江区礐石街道突发山火。火情发生后,当地立即组织森林防火力量赶赴现场扑救。截至目前,暂无人员伤亡报告。扑救工作正在全力进行中,相关部门已对周边区域加强监测和疏散准备。
22:41
1月9日,华住集团主办的“艺术MaxX·城市记忆摄影大赛”因一幅引发热议的AI生成作品而备受瞩目。据悉,该作品在比赛中一度斩获头名,但经主办方严格核查后,发现其与赛事原创性规则存在明显冲突。为确保比赛的公平公正,主办方已主动与该作品的投稿人进行深入沟通,最终决定取消其参赛成绩。 在确认违规作品被取消后,原定第二名作品《陆家嘴》顺延递补,正式荣膺本次大赛的冠军...