ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2025年09月18日

10:20
微新创想9月18日讯 从微新创想获悉,特斯拉与SpaceX的掌舵人埃隆马斯克近日在社交平台X上发布惊人言论,透露其人工智能公司xAI正在研发的Grok 5模型有望在通用人工智能(AGI)领域实现历史性突破。这一表态与马斯克过往的谨慎态度形成鲜明对比,引发了科技界的广泛关注。 马斯克坦诚表示,此前他从未将Grok系列模型与AGI直接挂钩。他进一步透露,Grok...
10:20
微新创想9月18日重磅消息,即便iPhone 17系列尚未正式发售,却已曝出重大技术隐患,苹果公司对此也罕见地公开承认。据多家国际媒体联合报道,苹果官方确认iPhone 17系列及iPhone Air两款机型存在相机系统缺陷。当用户在极端强光环境下,特别是遭遇极亮LED灯光直接照射时,手机在拍摄照片过程中可能出现明显的黑色方块和白色曲线干扰现象。 资深科技记...
10:20
微新创想9月18日重磅消息,小米17系列发布时间意外提前,备受期待的子品牌REDMI K90系列也将紧随其后,预计于10月正式亮相。据知名博主more深度体验透露,REDMI K90系列已顺利通过国内3C认证,并支持高达100W的超级快充技术,这一规格已全面超越小米今年主流旗舰水平。 据悉,REDMI K90系列将推出两款核心机型——K90标准版与K90 P...
10:18
微软公司近日宣布了一项重大战略投资,计划斥资62亿美元租赁挪威的人工智能计算能力。这一雄心勃勃的项目由微软与英国数据中心公司Nscale Global Holdings Ltd.以及挪威投资巨头Aker ASA共同推进,标志着微软在人工智能领域的全球布局再添重要里程碑。根据三方联合声明,该项目将全面依托挪威独特的"保障电网容量与完全可再生的电力资源"运行,充...
10:18
近日,前推特产品负责人凯冯・贝基普尔(Kayvon Beykpour)正式宣布推出一款名为“Macroscope”的创新AI工具,这款产品专为开发者和产品负责人设计,旨在帮助他们更高效地理解代码库、精准总结更新内容并快速发现潜在bug。Macroscope的创始团队由贝基普尔与其童年挚友乔・伯恩斯坦(Joe Bernstein)共同组建,伯恩斯坦曾参与创办直...
10:18
9月18日,大语言模型(LLM)领域迎来历史性突破。DeepSeek团队凭借其关于DeepSeek R1的研究论文,成功登上顶级学术期刊《Nature》封面,成为首个通过权威同行评审的大语言模型。这一里程碑事件不仅彰显了DeepSeek R1的技术创新性,更为整个AI行业树立了新的学术标杆。 《Nature》编辑部特别指出,在AI技术迅猛发展但炒作泛滥的当下...
10:18
随着人工智能技术的飞速发展,其潜在的安全风险也日益凸显。周三,专注于AI安全评估的创新企业Irregular成功完成新一轮8000万美元的融资,由红杉资本和红点创投联合领投,网络安全巨头Wiz的首席执行官阿萨夫·拉帕波特也加入了投资行列。据知情人士透露,此次融资将Irregular的估值推升至4.5亿美元,彰显了市场对其技术价值的认可。 前瞻性安全防护理念 ...
10:18
位于美国旧金山的创新科技企业Invisible Technologies近日成功斩获1亿美元融资,这一里程碑式融资由新兴投资机构Vanara Capital领投,联合了Princeville Capital、HOF Capital、Acrew Capital、Greycroft以及Deepwater Asset Management等多家知名投资方参与。随着...
10:18
近日,AI安全领域的创新先锋Irregular成功斩获8000万美元巨额融资,由顶级投资机构Sequoia Capital和Redpoint Ventures联合领投,Wiz公司CEO Assaf Rappaport也积极参与其中。据交易相关消息透露,此次融资后Irregular的估值已攀升至4.5亿美元,彰显了市场对其技术实力的高度认可。 Irregula...
10:18
随着人工智能技术的飞速发展,如何赋予大模型“并行思维”能力已成为学术界的研究热点。近日,腾讯AI Lab联合多所高校的研究团队推出了一款名为Parallel-R1的创新强化学习框架,旨在教会大模型如何同时探索多条推理路径。这一突破性框架为解决复杂的数学推理任务提供了全新思路。 传统方法主要依赖监督微调(SFT),但这种方式存在两大局限:一是对数据质量要求极高...
10:18
Meta 在周三举办的 Connect2025 年度开发者大会上,隆重发布了旗下最新智能眼镜产品——Meta Ray-Ban Display。这款备受瞩目的眼镜由公司首席执行官马克·扎克伯格亲自揭晓,其最核心的创新之处在于右侧镜片内置的微型显示屏,能够将应用程序界面、重要提醒和实时导航信息直观地投射在用户视野中。这款智能眼镜将于今年9月30日正式开售,售价定...
09:54
近日,全球领先的云安全服务商Netskope成功在美国完成首次公开募股,以每股19美元的价格出售约4780万股,最终筹集资金高达9.08亿美元。此次发行价格精准定位于上调后区间顶端,充分展现了市场对Netskope的高度认可与信心。作为专注于企业云服务安全监管的技术提供商,Netskope凭借其创新的安全解决方案,为大型企业有效保障员工在使用谷歌Drive、...