ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2026年01月20日

10:34
根据身份窃取资源中心(ITRC)最新发布的权威调查报告,小微企业正面临一场前所未有的网络安全风暴。报告揭示,2025年全球范围内高达80%的小微企业遭遇了网络诈骗或数据泄露事件,这一数字较2024年实现了惊人的飞跃。值得注意的是,其中近半数(41%)的攻击直接由人工智能驱动,而这一数据在2024年甚至未被列入主要攻击诱因榜单。黑客正利用先进的生成式AI技术,...
10:27
声明:本文源自微信公众号 硅星人Pro,作者郭海惟,经站长之家授权转载发布。在GPT3.5发布以来,如何让现有应用与AI深度融合,已成为AGI叙事中的核心议题之一。尽管我试用过众多融入垂直场景的AI工具,却鲜有能长期坚持使用的。这并非产品打磨不够、模型能力不足或应用场景需求不明确,而是因为传统GUI(图形用户界面)的交互效率已相当成熟:若我有明确意图,通常三...
10:20
2026年1月20日 北京——国家统计局今日正式发布2025年度国内生产总值(GDP)初步核算数据,向社会公布全年及第四季度经济运行情况。根据最新基础资料和现行GDP核算方法,经过严谨测算,2025年全年我国GDP实现同比增长5.2%,增速较预期目标有所提升。其中,第四季度GDP同比增长5.4%,展现出经济持续向好的积极态势,整体运行呈现稳中有进的发展格局。...
10:20
近日,全球软件投资机构Hg宣布以约64亿美元收购财务绩效管理平台OneStream并将其私有化。OneStream成立于2012年,总部位于美国密歇根州,专注于整合财务与运营数据,并通过AI提升决策效率。此次交易后,Lucanet蓝科、OneStream与Prophix将依托各自技术积累和客户资源,形成区域互补与技术协同,共同构建全球财务数字化服务网络,进...
10:20
2026年1月16日,英伟达通知AIC厂商上调GDDR6/GDDR7显存价格,涨幅约10-15%,AMD近期亦跟进调涨。两大厂未调整GPU核心及显卡建议零售价(MSRP/SEP),由AIC厂商自行消化成本压力。部分台系厂商已对AMD显卡出货价进行上调,微星更率先针对RTX 50系列提高供货价格。市场预计入门级型号供应或将缩减,终端实际售价可能上涨。
10:20
2026年1月14日,一场科技史上的奇迹在临时计算机博物馆(ICM)上演——工作人员成功唤醒了一台沉睡了52年的传奇计算机Altair 8800。这台诞生于1974年的机器,曾因原主人组装失败而被迫封存,如今终于重获新生。经过技术人员SDF的精心修复,包括修正复杂布线和更换适配电源,这台历史悠久的设备终于再次"开口说话"。通过前面板开关输入二进制代码,运行1...
10:20
2026年1月19日晚,AYANEO与攻氪联合举办产品分享会,推出攻氪品牌首款Windows掌机KONKR FIT。该设备搭载AMD锐龙AI 9 HX 470处理器,配备7英寸OLED屏幕,分辨率为1920×1080,内置80Wh电池,提供银、黄两种配色。此次发布标志着攻氪正式进军Windows掌机市场,产品定位高性能便携 gaming 设备。
10:20
2026年1月19日,科技界传来重要消息,据行业爆料人士透露,苹果计划于近期推出的iPhone Air 2在机身设计上面临重大挑战。由于对轻薄形态的极致追求,这款新机可能无法搭载备受期待的屏下Face ID技术。这一消息引发了广泛关注,毕竟屏下Face ID一直是苹果在移动支付和生物识别领域的重要技术突破。 据悉,为了保证iPhone Air 2的轻薄设计,...
10:20
2026年1月20日,顺丰与雷士照明在武汉举行开仓仪式,宣布武汉专仓正式投入运营。该仓库是双方战略合作的重要成果,旨在提升供应链效率,助力2026年业务发展。此次合作深化了双方伙伴关系,为全国物流网络优化提供支撑。
10:20
1月19日,知名慈善家陈光标通过一段视频公开表达了对李亚鹏慈善事业的鼎力支持,展现出其一贯的慷慨情怀。他提出一项极具诚意的计划:由李亚鹏邀请天后王菲举办一场慈善演唱会,并表示将全额承担所有费用,所得善款将悉数捐赠给正面临关停危机的嫣然天使儿童医院。这一举动迅速引发社会广泛关注,彰显了陈光标对慈善事业的坚定执着。 嫣然天使儿童医院目前正遭遇严峻困境,由于拖欠2...
10:20
2026年1月20日,蜂巢能源董事长杨红新在一场重要采访中,对芬兰公司Donut Lab宣称的全固态电池技术提出了严厉质疑,直指其宣称的技术参数存在明显矛盾,称其所谓的突破性成果实为"骗局"。杨红新指出,Donut Lab所公布的高能量密度、超快充性能以及极端温度适应性等关键指标之间存在难以调和的技术矛盾,从现有材料科学和电化学原理来看,这些参数同时实现的技...
10:20
2026年1月20日,备受瞩目的深度操作系统正式推出全新升级版本——Deepin 25.0.10镜像。本次更新以用户体验为核心,全面优化系统安装流程、文件管理功能、交互设计细节及整体稳定性,同时惊喜加入AI截图、98版五笔输入法与Origin商务主题等创新特性,并显著提升NVIDIA显卡驱动性能。 在文件管理方面,新版深度系统迎来重大突破:支持拖拽自动滚...