ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2025年11月14日

11:19
11月13日,#男子因朋友圈无人点赞患上抑郁症#这一话题迅速引爆热搜榜,引发了全网热议。据媒体深度报道,小张正是这个话题的当事人。他每天下班后,总会陷入一种难以自愈的回忆漩涡,对周围人的眼神和反应异常敏感。比如,当他给别人发送消息却迟迟得不到回应时,内心便会涌起强烈的焦虑感;而当他发布的朋友圈动态点赞数寥寥无几时,更是会陷入深深的自我怀疑,反复猜测别人是否对...
11:19
2025年,音乐行业正经历一场深刻变革。技术浪潮以AI为代表,降低了创作与传播门槛,推动内容生产与分发进入超速时代;与此同时,流量红利逐渐消退,用户增长放缓,传统商业模式面临重构。平台竞争焦点正从用户规模的“量”转向用户价值的“质”。在这场混沌的变革中,腾讯音乐娱乐集团(TME)却交出了一份稳健的Q3财报:总收入与调整后净利润同比增速均超20%,在线音乐订阅...
11:19
摩尔线程的 AI 研究团队近日在国际顶级学术会议 AAAI2026 上重磅发布了其最新研究成果——URPO(统一奖励与策略优化)框架。这一创新技术致力于革新大语言模型的训练范式,突破现有性能瓶颈,为人工智能领域开辟全新的技术路径。在题为《URPO:A Unified Reward & Policy Optimization Framework for...
11:18
沙特阿拉伯旅游部携手世界经济论坛正式发起"超越旅游业"全球倡议,旨在通过三大核心支柱——可持续性发展、包容性增长与韧性建设,全面推动全球旅游产业的深度转型。这一开创性合作汇聚了房地产巨头、基础设施专家、科技创新先锋及城市规划大师等跨领域顶尖领袖,共同构建未来旅行发展的全新生态范式。 未来三年,双方将重点推进三大战略举措:首先,系统构建多元化社区发展体系,促进...
11:18
Dealism,这家以销售智能技术为核心的新兴企业,近日成功斩获1500万美元天使轮融资,标志着其在人工智能销售领域的快速发展。此次融资由知名投资机构高瓴创投领投,红杉中国、线性资本等业内顶尖机构紧随其后,共同助力Dealism的创新发展。 Dealism专注于全球市场,其核心使命是为销售人员打造高度个性化的智能分身,通过先进技术赋能销售团队,提升客户互动效...
11:18
在国新办最新举行的经济形势新闻发布会上,国家统计局新闻发言人付凌晖释放出重要信号:我国机电产品与高技术产品正异军突起,成为驱动出口增长的强劲引擎。这一积极变化背后,是产业升级战略的深入实施,推动着出口产品技术含量实现质的飞跃,出口结构也随之持续优化升级。 根据最新数据,今年前10个月,我国机电产品出口额同比增长8.7%,其占出口总额的比重已达到惊人的60...
11:18
LanzaJet在佐治亚州索珀顿的Freedom Pines Fuels工厂已正式实现全面商业化运营,这一里程碑事件使其成为全球首家以乙醇为原料大规模生产可持续航空燃料(SAF)的企业。该项目成功验证了酒精转喷气(ATJ)技术的商业可行性,为航空业提供了一种与现有飞机发动机完全兼容的非石油基可再生燃料方案。这一创新突破不仅为航空业实现碳中和目标注入强劲动力,...
11:18
索尼旗下知名游戏工作室Guerrilla Games与韩国顶尖游戏开发商NCSOFT正式宣布达成战略合作,共同打造备受期待的《地平线》系列MMORPG衍生作品——《地平线:钢铁边境》。这款创新游戏将构建在广受赞誉的机械猎人世界Deadlands之上,为玩家带来前所未有的沉浸式冒险体验。 游戏将完美继承《地平线》系列标志性的狩猎动作玩法,同时深度融合先进的MM...
11:18
哔哩哔哩近日正式发布2025年第三季度财务报告,数据显示公司总净营收达到76.9亿元人民币,同比增长5%,展现出稳健的增长态势。令人欣喜的是,本季度净利润成功扭亏为盈,达到4.694亿元人民币,较去年同期实现显著改善。在非美国通用会计准则下,调整后净利润更是大幅增长233%,达到7.863亿元,这一成绩充分彰显了B站业务模式的创新活力与市场竞争力。 财报发布...
11:18
2025年新加坡金融科技节(SFF)上,MVGX科技集团凭借其自主研发的“碳足迹及碳资产数字化与金融化交易框架”强势入围“可持续创新企业”奖项四强,成为全球绿色金融领域的焦点之一。该框架创新性地融合区块链与人工智能技术,实现了碳排放数据的精准追踪与数字碳资产的可信流转,为碳资产与资本市场的高效对接提供了强大技术支撑。这一突破性成果不仅构建了透明、智能且可验证...
11:18
国家统计局最新发布的经济数据显示,10月份全国规模以上工业增加值同比增长4.9%,展现出稳健的增长态势。其中,制造业和装备制造业分别实现4.9%和8.0%的显著增长,高技术制造业增速更是高达7.2%,成为工业领域的一大亮点。特别是在高端产品领域,新能源汽车和工业机器人等关键产业的产量增幅尤为突出,其中3D打印设备的产量同比增长30.8%,反映出我国制造业向智...
10:46
声明:本文来自于微信公众号 卡思数据,作者:卡思数据,授权站长之家转载发布。近年来,网络直播行业迎来了一股强劲的浪潮——团播。这种多人同台、集体表演的直播形式,正以惊人的速度俘获着用户的目光,成为线上娱乐的重要支柱。如果你经常浏览直播平台,一定不会对这样的场景感到陌生:灯火璀璨的直播间里,一群妆容精致、气质出众的男孩们正专注地舞动身姿,他们的动作整齐划一,配...