ChatGPT 火爆全球的 AI 热潮下,企业采用 AI 的比例正以惊人的速度增长。斯坦福大学发布的「2023年 AI 指数报告」显示,2022年采用 AI 的公司比例较2017年翻了一番以上。这些企业通过 AI 实现了显著的成本降低和收入增加,而 AIGC 领域的爆发更预示着新一轮产业革命的到来。然而,企业在构建 AI 基础设施时也面临严峻挑战:算力供需矛盾加剧,模型选择缺乏成熟商业模式,数据安全风险突出,大规模部署成本高昂。那么,企业究竟该如何在性能与成本间找到平衡点?那些已经成功应用 AI 的企业提供了宝贵的经验。

### 已用上 AI 的公司:性能与成本的艰难抉择

互联网行业作为 AI 应用的先行者,其推荐系统、视觉处理、自然语言处理等典型工作负载的优化都离不开 AI。但业务量激增也带来了新的挑战:如何满足 AI 推理在吞吐量、时延和精确性方面的要求,同时控制成本?

#### 推荐系统:应对双十一峰值负载压力
阿里巴巴等电商巨头在 618、双十一等购物高峰期面临数亿实时请求,对 AI 推理的吞吐量、时延和精确性提出了极高要求。为平衡性能与成本,阿里巴巴选择用 CPU 处理 AI 推理工作负载,并采用英特尔®第四代至强®可扩展处理器。这款处理器新增的英特尔高级矩阵扩展(AMX)内置 AI 加速器,支持 BF16 和 INT8 数据类型,性能大幅提升。测试显示,48 核第四代英特尔®至强®可扩展处理器可将代理模型吞吐量提升 2.89 倍,同时将时延控制在 15 毫秒以下,推理精度依然满足需求。优化后的方案已成功应对双十一峰值负载,投资回报率显著。

#### 视觉处理:美团用 CPU 降低 70% 服务成本
美团在智能图片处理、证照识别等场景广泛应用视觉 AI,但 GPU 部署成本高昂。通过英特尔®AMX 技术,美团将部分低流量长尾模型数据类型从 FP32 转换为 BF16,在精度损失可控的前提下实现 3.38-4.13 倍的推理性能提升。这一优化使美团能够充分利用现有基础设施,降低 GPU 部署成本,服务成本直降 70%。

#### 自然语言处理:百度 ERNIE-Tiny 轻量化模型
百度采用模型蒸馏技术压缩 ERNIE3.0 大模型,推出轻量版 ERNIE-Tiny,使其更易于部署。通过与英特尔合作,百度在第四代英特尔®至强®可扩展处理器上部署 ERNIE-Tiny,并利用英特尔®oneAPI 深度神经网络库调用 AMX 指令。测试显示,ERNIE-Tiny 性能提升 2.66 倍,已成功部署在 EasyDL、BML 等平台,为用户提供建议、问答等能力。

### 高性价比解决方案:CPU 承载 AI 任务

传统认知认为 CPU 不适合承载 AI 任务,但英特尔®第四代至强®可扩展处理器打破了这一刻板印象。Hugging Face 的 Q8-Chat 应用仅用 32 核英特尔®至强®处理器就实现了类似 ChatGPT 的体验,而阿里巴巴、美团、百度等企业也通过 CPU 解决了算力瓶颈。

#### 阿里巴巴:CPU 助力下一代电商推荐系统
英特尔®AMX 技术使第四代英特尔®至强®可扩展处理器在 AI 推理性能上超越第三代产品,同时保持高精度。结合英特尔®oneAPI 深度神经网络库的优化,主流 48 核处理器可将代理模型吞吐量提升 2.89 倍,时延严格控制在 15 毫秒以下,成功应对双十一峰值负载。

#### 美团:低流量长尾模型用 CPU 优化成本
部分视觉 AI 模型对时延要求不高,美团通过 AMX 将模型数据类型转为 BF16,推理性能提升 3.38-4.13 倍,Top1 和 Top5 精度仅损失 0.01%-0.03%。这一方案使美团服务成本降低 70%,充分释放现有基础设施潜能。

#### 百度:ERNIE-Tiny 轻量化模型加速部署
百度将 ERNIE3.0 蒸馏压缩为 ERNIE-Tiny,并通过第四代英特尔®至强®可扩展处理器和 AMX 实现性能翻倍。ERNIE-Tiny 已部署在多个平台,为用户提供建议、问答等能力,进一步降低 AI 应用门槛。

### AIGC 时代:企业如何应对?

波士顿咨询公司(BCG)选择用英特尔 AI 超级计算机训练行业专用模型,该计算机搭载英特尔®第四代至强®可扩展处理器和 Habana®Gaudi2®加速器,在 PyTorch 训练性能上提升 10 倍,计算机视觉和自然语言处理表现优于英伟达 A100。BCG 员工通过语义搜索功能,用户满意度提高 41%,结果准确性增长 25%,工作完成率提升 39%。

### 结语

无论是传统中小规模 AI 还是 AIGC 大模型,GPU 都不是唯一选择。英特尔®至强®CPU 及配套软硬件加速方案为企业在性能与成本间提供了平衡点。企业应根据业务特点选择合适的技术方案,而非盲目追求超大模型或算力集群。AIGC 时代已来,但真正的关键在于如何高效、经济、安全地应用 AI。

最新快讯

2026年02月27日

13:08
微新创想:2026年底前,我国将完成1亿吨水泥熟料、5000万吨焦化产能的超低排放改造。此举由生态环境部于2月27日新闻发布会上宣布,旨在推进重点行业污染治理升级。 此次改造行动覆盖京津冀及周边、长三角、汾渭平原等重点区域。这些地区长期以来是工业污染的高发区,通过实施超低排放标准,有助于显著降低大气污染物排放,改善区域空气质量。 同步开展低效污染治理设施排查...
13:08
微新创想:2026年2月27日,沃尔核材在互动平台披露,公司已引进16台进口发泡芯线挤出机,部分设备正安装调试,高速线整体产能显著提升。为应对2026年以来数据中心对高速线规格需求激增,公司大量采购绕包设备,目前正陆续到货。现有产能规划可有效支撑高速通信线业务增长,并与下游核心客户项目进度同步。鉴于订单交付紧张,部分车间于春节期间有序加班,保障重点客户按期收...
13:08
微新创想:2月27日,浙江杭州钱塘区一家机器人企业披露,节后机器人租赁业务持续升温,当前订单已排至3月31日。随着春节假期的结束,各行各业开始陆续复工复产,机器人租赁服务需求显著增加。该企业不仅承接传统制造业的机器人租赁,还积极拓展至演艺、会展等新兴领域,展现出商用机器人应用的广阔前景。 微新创想:该公司为本地企业定制舞蹈动作,用于3月的各类活动,服务范围已...
13:08
微新创想:2026年2月27日,天融信在互动平台回应投资者提问时表示,公司目前尚未向字节跳动旗下Seedance 2.0产品提供网络安全防护服务 该声明发生于北京,由天融信官方发布,旨在澄清市场相关传闻 公司强调其与字节跳动在部分领域存在合作基础,但Seedance 2.0项目不在当前已落地的安全服务范围内 此举系企业对业务边界和合作进展的例行说明,不涉及技...
13:08
微新创想:2026年2月27日,DHL集团与京东在京签署谅解备忘录。双方将在创新物流与跨境电商领域开展深度合作,重点服务德国品牌进入中国市场及拓展欧洲业务。 此次合作将为德国优质品牌提供新的市场机遇,使其能够通过京东国际平台直接面向中国消费者销售,而无需在中国设立实体公司。这不仅降低了品牌进入中国市场的门槛,也提升了其在本地市场的运营效率。 DHL将发挥其在...
13:08
微新创想:2026年2月26日,利民股份与拜耳(BAYER S.A.)在江苏正式签署了一份农用化学品长期供货合同。此次合作标志着双方在农业化学品领域的深度绑定,为未来业务发展奠定了坚实基础。 合同初始期限为三年,双方同意在期满后可根据实际情况自动续期三年。这意味着合作最长可执行六年,为双方提供了充足的时间窗口来优化供应链、拓展市场。 根据合同内容,前三年的预...
13:08
微新创想:2026年2月28日,长安汽车将在全国范围内正式上市2026款UNI-Z插电混动车型。新车在内饰配置方面进行了多项升级,包括三辐式方向盘、怀挡式换挡机构以及副驾座椅腿托,进一步提升了驾乘舒适性与操作便捷性。同时,新车保留了10.25英寸液晶仪表与14.6英寸悬浮中控屏,延续了品牌在智能科技方面的优势。 外观设计方面,2026款UNI-Z插电混动车型...
12:32
微新创想:2026年2月27日,豆包手机助手官方发布声明,谴责网络上未报备、未验证即恶意传播所谓“安全漏洞”的黑公关行为。声明指出,相关漏洞演示需用户主动指令AI查看恶意内容,无自动触发风险;目前产品已升级防护。 微新创想:字节跳动设有公开漏洞响应平台,但尚未收到该漏洞的合规报告,亦无监管通报。声明强调预览版处于测试阶段,技术属行业前沿,呼吁负责任披露。 微...
12:32
微新创想:2026年2月,哈佛大学研究团队在《自然》杂志发表研究,阐明篮球鞋摩擦发声的物理机制。研究发现,鞋底花纹的几何形状决定了摩擦声的频率。团队通过定制橡胶块在玻璃表面滑动,成功复现了《帝国进行曲》的声效。 实验采用达芬奇式滑轮重物系统,以市售Nike篮球鞋为样本,在干燥玻璃板上进行滑动测试,并同步采集声学与视觉数据。研究人员发现,当鞋底花纹产生“张开脉...
12:31
微新创想:2026年2月26日 国家市场监督管理总局发布《网络餐饮服务经营者落实食品安全主体责任监督管理规定》 该规定将于6月1日正式实施 新规要求外卖网店名称须与实体门店招牌一致 这将有助于消费者更直观地识别商家 提高透明度和信任感 ‘无堂食’商家须在主页面及平台列表页显著标识 以明确告知消费者该店铺不提供堂食服务 从而避免误解和不必要的消费纠纷 全面推行...
12:31
微新创想:2026年2月27日,人工智能公司Anthropic宣布收购西雅图初创企业Vercept。此次交易标志着Anthropic在拓展其人工智能技术版图方面迈出重要一步。 Vercept成立于2024年,专注于研发“视觉优先”AI智能体。该智能体的核心目标是通过屏幕理解与交互技术,实现无需依赖API的端到端电脑自动化。这一突破性的技术理念,为用户提供了更...
12:31
微新创想:2026年2月,苏州浩纳光电科技有限公司完成超亿元B轮融资。本轮融资由安徽国控资本、川流资本与苏州相城金控联合投资,大璞资本担任财务顾问。此次融资标志着公司在超精密光学领域获得资本市场高度认可。 资金将用于建设新生产基地,以提升产能和生产效率。同时,公司将加大在高精度模造玻璃非球面镜片等核心技术研发上的投入,进一步巩固其在光学制造领域的领先地位。通...