ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2025年11月14日

10:12
11月13日,哈尔滨市推出一款独具特色的红肠主题公交卡,迅速引发市民和游客的热烈关注。这款公交卡以哈尔滨红肠为原型,造型逼真,仿佛将美味浓缩于方寸之间,让乘客在出行时都能感受到浓郁的东北风情。据悉,该红肠主题公交卡可在全国300余个城市通用,为乘客提供便捷的公共交通服务。 红肠主题公交卡采用写实风格设计,细节之处彰显匠心。红棕色的肠衣纹理深浅交错,生动复刻了...
10:12
11月13日,一则来自贵州的趣味视频在网络上迅速走红,画面中一只猴子竟在办公桌前大快朵颐,手中的妙脆角和士力架更是吃得不亦乐乎。这一幕引发网友热议,有人调侃道"贵州的猴子都开始上班带薪摸鱼了"。随着镜头的传播,以黔灵山为代表的贵州猕猴群体也意外成为社交平台上的"顶流",它们与人类互动的日常频频引发关注。 据了解,猕猴在贵州广泛分布,种群数量近年来呈现明显增长...
10:12
微新创想11月13日讯,大疆创新今日正式发布旗下全能旗舰级运动相机——Osmo Action 6,首发售价2998元起,为户外运动与影像创作爱好者带来全新体验。作为大疆首款可变光圈运动相机,Osmo Action 6突破传统设计,配备f/2.0至f/4.0连续可变光圈系统,在自动模式下可根据环境光线智能调节光圈大小,并支持星芒模式创作,让夜景拍摄与创意视频更...
10:12
谷歌正全力推进其AI工具NotebookLM的扩展能力,最新更新彻底打破了用户创作视频摘要的限制。现在用户只需输入任意文本提示,即可生成相应视频内容,不再受限于预设风格列表。这一突破意味着NotebookLM能够跨越几乎所有视觉语言界限,创作出各类风格的内容——无论这些风格是否涉及版权问题。 在真实测试中,NotebookLM展现了惊人的创作能力。只需简单指...
10:12
苹果公司近日宣布了对应用审核指南的重大更新,旨在进一步加强用户数据保护。新规明确指出,任何应用在将用户个人数据分享给第三方人工智能(AI)系统之前,都必须进行透明化的信息披露,并确保获得用户的明确授权同意。这一举措是在苹果计划于2026年推出全新升级版Siri的背景下提出的,升级后的Siri将具备跨应用操作能力,并部分采用谷歌的Gemini技术作为支持。通过...
10:12
11月13日,百度世界大会的舞台上,小度科技重磅发布了全新升级的多模态AI助手——超能小度,这一里程碑式的事件标志着公司在人机交互技术领域实现了重大突破。值得关注的是,数千万台已售小度设备将免费享受此次升级,让用户即刻体验更智能化的生活方式。 超能小度通过深度融合语音、视觉及空间环境信息,赋予了设备前所未有的感知能力。它不再局限于传统的听与说,而是能够通...
10:11
近日,Character AI 与耶鲁大学的研究团队强强联手,共同推出了一款名为 Ovi 的新型音画同步视频生成技术。这一开源项目不仅标志着音频和视频生成技术的一次重大突破,更彻底颠覆了以往音画生成的传统模式。Ovi 采用了一种创新的双骨干交叉模态融合架构,将音频和视频视为一个不可分割的整体,通过并行的处理流程和深度的信息交互,实现了音画的完美同步。这一设计...
10:11
大模型领域的价格战再度升级。阿里云旗下大模型服务平台百炼今日重磅宣布,自2025年11月13日起,针对中国站(北京区域)的通义千问3-Max模型将实施全面降价策略,核心调用费用直接减半,并同步优化缓存计费机制,显著降低企业与开发者的长期运营成本。这一举措旨在有效破除大模型应用的高门槛,加速人工智能技术在中小企业数字化转型中的普及应用。 三大核心降价举措精准打...
10:11
在全球范围内,成千上万的器官移植患者正焦急地等待着生命的希望,然而供体器官的短缺已成为制约医疗进步的巨大瓶颈。近期,美国斯坦福大学的研究团队突破性地开发出一款人工智能(AI)预测工具,旨在显著提升肝脏移植手术的成功率,有效减少器官移植过程中的资源浪费。这一创新成果有望彻底改变器官捐献领域的现状,为无数生命创造新的生机。 据统计数据显示,每年约有半数心脏骤停后...
10:11
AI 编程领域的革命性工具 Cursor 母公司 Anysphere 宣布成功完成高达 23 亿美元(约 163.2 亿元人民币)的 D 轮融资,这一里程碑事件使其投后估值飙升至惊人的 293 亿美元(约 2079.1 亿元人民币),进一步巩固了其在全球 AI 编程工具市场的绝对领先地位。Cursor 通过其官方博客正式宣布了这一振奋人心的消息,强调此次融资...
10:11
腾讯近日公布的2023年第三季度财报显示,公司整体营收与利润均实现大幅增长,然而资本开支却未达市场预期,这一数据引发了外界对腾讯AI项目的广泛关注。在财报发布后的电话会议上,腾讯总裁刘炽平就相关问题进行了详细解读。 刘炽平明确指出,尽管资本开支低于市场预期,但公司在GPU储备方面完全无忧。他强调,目前腾讯拥有的GPU资源充足,能够充分满足内部需求,特别是为"...
10:11
近日,上海孛璞半导体技术有限公司传来振奋人心的消息,成功完成了一笔高达数亿元人民币的A轮融资。此次融资由上海国和投资强势领投,多家产业资本及知名上市公司积极参与跟投,而公司原有的股东也纷纷追加投资,展现了市场对孛璞半导体未来发展的坚定信心。 孛璞半导体成立于2022年,是一家专注于硅光子技术研发的高科技企业。公司在硅基CMOS工艺、Chiplet异构集成以及...