微新创想(idea2003.com) 8月14日讯 在德克萨斯州奥斯汀一座不起眼的办公大楼内,亚马逊的工程师们正致力于研发两款革命性的微芯片——Inferentia与Trainium,旨在为生成式人工智能的训练与加速提供强大支持。这两款定制芯片将为AWS客户提供训练大型语言模型的全新方案,尤其是在GPU采购日益困难和昂贵的情况下,这一创新显得尤为关键。

亚马逊网络服务(AWS)首席执行官Adam Selipsky在六月的一次采访中强调,全球对生成式人工智能芯片的需求激增,无论是GPU还是亚马逊自研芯片,都备受瞩目。他认为,AWS在满足客户需求方面具有显著优势。然而,其他公司如OpenAI和微软等在生成式人工智能领域的发展更为迅速,投入资金巨大。微软因托管ChatGPT并据报道投资达130亿美元而备受瞩目,迅速将生成式人工智能模型融入自身产品,并在二月份将其纳入必应搜索引擎。谷歌也紧随其后,推出了大型语言模型Bard,并投资了OpenAI的竞争对手Anthropic 3亿美元。相比之下,亚马逊直到四月才宣布推出自己的大型语言模型家族Titan,以及名为Bedrock的服务,旨在帮助开发人员利用生成式人工智能增强软件。

咨询公司Gartner的副总裁分析师Chirag Dekate指出,亚马逊不习惯追逐市场,而是习惯于创造市场。他认为,亚马逊首次发现自己处于被动地位,并努力追赶进度。Meta也发布了自己的LLM——Llama 2,这款开源的ChatGPT竞争对手现在可以在微软的Azure公共云上进行测试。

Dekate认为,从长远来看,亚马逊的定制芯片可能在生成式人工智能领域为其带来显著优势。他表示,亚马逊的技术能力是其真正的差异化所在,而微软并不具备Trainium或Inferentia这样的芯片。自2013年起,AWS便开始秘密研发定制芯片,首先推出了一款名为Nitro的专用硬件,如今已成为AWS规模最大的芯片。亚马逊表示,每台AWS服务器至少有一颗Nitro芯片,总共使用超过2000万颗。

2015年,亚马逊收购了以色列芯片初创公司Annapurna Labs。2018年,亚马逊推出了基于Arm架构的服务器芯片Graviton,与AMD和英特尔等巨头的x86 CPU展开竞争。Bernstein Research的高级分析师Stacy Rasgon指出,目前ARM芯片可能仅占服务器市场总销售额的个位数甚至10%,但其中大部分将出售给亚马逊,因此他们在CPU方面表现相当出色。

2018年,亚马逊推出了面向人工智能的芯片,这是谷歌宣布推出第一款Tensor处理器单元(TPU)的两年后。据报道,微软目前正在与AMD合作开发名为Athena的人工智能芯片,但尚未正式宣布。CNBC参观了亚马逊在德克萨斯州奥斯汀的芯片实验室,这里是Trainium和Inferentia的开发与测试地点。产品副总裁Matt Wood解释了这两款芯片的应用。他说,机器学习可以分为两个阶段:训练和推理。相对于AWS上训练机器学习模型的任何其他方式,Trainium的性价比提高了约50%。2019年发布的Inferentia已进入第二代,使客户能够以极低成本、高吞吐量、低延迟运行机器学习推理。

然而,就目前而言,英伟达的GPU在训练模型方面仍占主导地位。今年7月,AWS推出了由英伟达H100s驱动的新型人工智能加速硬件。Rasgon指出,英伟达芯片拥有庞大的软件生态系统,已建立超过15年,其他公司都无法比拟。对于目前的人工智能来说,最大的赢家是英伟达。

尽管如此,AWS在云计算领域的主导地位是亚马逊的重要优势。Dekate表示,亚马逊不需要赢得头条新闻,他们已经拥有非常强大的云计算用户群体。他们只需要找出如何让现有客户利用生成式人工智能扩展价值创造活动。在选择用于生成式人工智能的亚马逊、谷歌和微软之间,数百万的AWS客户可能会被亚马逊吸引,因为他们对亚马逊已经很熟悉,正在运行其他应用程序并将数据存储在那里。

AWS是全球最大的云计算提供商,在2022年拥有40%的市场份额。尽管近三个季度的运营收入同比下降,但AWS在第二季度的运营利润中仍占据了亚马逊整体77亿美元运营利润的70%。AWS的运营利润率历史上一直远远高于谷歌云。AWS还拥有日益增长的面向生成式人工智能的开发者工具组合。

回想起ChatGPT之前的时代,AWS数据库、分析和机器学习副总裁Swami Sivasubramanian表示,这并不是说在那件事发生后,他们突然匆忙地想出了一个计划,因为不可能在那么短的时间内设计出一个芯片,更不可能在2到3个月内构建出Bedrock服务。Bedrock让AWS客户可以访问由Anthropic、Stability AI、AI21 Labs和亚马逊自己的Titan开发的大型语言模型。Sivasubramanian强调,他们不相信一个模型就能统治世界,希望客户能从多个供应商那里获得最先进的模型,为他们选择正确的工具。

亚马逊最新的人工智能产品之一是AWS HeAlthScribe,于七月推出,利用生成式人工智能帮助医生起草患者就诊总结。另一个重要工具是机器学习中心SageMaker,提供算法、模型等。编码辅助工具CodeWhisperer也备受关注,亚马逊表示该工具使开发人员的任务平均完成时间提高了57%。去年,微软也报道了其编码辅助工具GitHub Copilot带来的生产力提升。六月,AWS宣布成立了一个价值1亿美元的生成式人工智能创新中心,旨在帮助客户将生成式人工智能应用于自身业务。

尽管迄今为止AWS主要专注于工具而不是构建与ChatGPT竞争的产品,但最近泄露的内部电子邮件显示,亚马逊首席执行官安迪·贾西(Andy Jassy)直接监督着一个新的中央团队,正在构建更广泛的大规模语言模型。在第二季度的盈利电话会议上,贾西表示,AWS业务的很大一部分现在由人工智能推动,提供了20多个机器学习服务。一些客户案例包括飞利浦、3M、Old Mutual和汇丰银行。

人工智能的爆炸性增长伴随着许多公司担心员工将专有信息放入用于公共大型语言模型的训练数据中的一系列安全问题。Selipsky表示,他无法统计有多少财富500强企业禁止使用ChatGPT。因此,AWS通过其对生成式人工智能的方法和Bedrock服务来保障客户的需求。通过Bedrock使用的任何模型都将位于客户独立的虚拟私有云环境中,并进行加密,同时具备相同的AWS访问控制。

目前,亚马逊正在加速推进生成式人工智能,告诉CNBC称,超过100,000个客户如今正在使用亚马逊的机器学习。尽管这只是AWS数百万客户中的一小部分,但分析师表示这种情况可能会发生改变。Dekate指出,我们没有看到企业说,『哦,等等,微软在生成式人工智能领域领先,我们就切换基础设施策略,将一切迁移到微软上。』如果您已经是亚马逊的客户,很有可能会广泛探索亚马逊的生态系统。

最新快讯

2026年02月10日

20:03
微新创想:2026年2月10日,英特尔正式发布Wi-Fi驱动更新包24.20.0 该版本驱动适配Windows 10 64位及Windows 11操作系统 对应驱动版本为24.20.0.4 此次更新标志着英特尔在无线网络技术领域迈出了重要一步 该版本首次支持BE211、BE213等新一代Wi-Fi 7网卡 同时确认Wi-Fi 7完整功能需Windows 11...
20:03
微新创想:2026年2月9日,美国加州北区法院文件显示,OpenAI因商标纠纷决定不在任何AI硬件产品中使用“io”或“IYO”名称。此举源于音频初创公司iyO发起的侵权诉讼。 公司副总裁Peter Welinder确认,首款无屏桌面AI硬件将不早于2027年2月28日面向消费者发货。目前该设备仍处原型阶段,尚未启动包装与营销材料制作。 原计划中,这款AI硬...
20:03
微新创想:2026年1月30日,摩尔线程宣布开源TileLang-MUSA项目,今日再次发布。该项目实现了对高层张量分块编程语言TileLang的完整支持,并已在MTT S5000、S4000等国产GPU平台上完成验证。TileLang采用类似Python的声明式语法,使得开发者能够以更简洁的方式表达复杂的张量操作。 微新创想:TileLang支持自动循环优...
20:03
微新创想:2026年2月3日,韩国媒体报道称Nexon已与暴雪达成合作,正式启动基于《星际争霸》IP的新游戏项目。这一消息引起了业界广泛关注,标志着Nexon在游戏开发领域迈出了重要一步。 该项目由Nexon射击事业本部主导,计划采用第一人称射击(FPS)或第三人称射击(TPS)玩法,而非传统的即时战略(RTS)模式。这一选择表明Nexon希望将《星际争霸》...
20:03
微新创想:2026年2月6日,户外品牌KOLON SPORT可隆在北京华贸购物中心正式启用品牌体验旗舰店“KOLON ATLAS可隆自然典集”。这一全新门店由品牌自主打造,致力于通过沉浸式空间展现自然探索的核心理念。店内不仅展示了可隆最新的产品系列,还融入了丰富的文化互动元素和生活方式体验,为顾客带来全方位的感官享受。 旗舰店选址于北京核心商业区,精准定位都...
20:03
微新创想:2026年2月10日,阿里云宣布通过ICANN全面技术评估,成为中国首家具备顶级域名全链路服务能力的云服务商 阿里云此次通过评估,标志着其在顶级域名服务领域达到了国际领先水平。该认证覆盖了新顶级域名申请、域名资产管理、DNS解析、安全防护以及云部署等多个关键环节,为用户提供了一站式的解决方案 此前,企业在申请地域性顶级域名时往往需要与多个机构进行协...
19:02
微新创想:2026年2月10日,国际DRAM现货市场整体持稳,DDR5部分颗粒结束连续数日小幅下跌,出现温和反弹。市场情绪有所回暖,显示出一定的复苏迹象。 DDR5 16Gb(2Gx8)4800/5600规格颗粒价格上涨0.41%,均价达到38美元。这一涨幅虽然不大,但标志着市场开始对近期的供需变化做出反应。 同容量的eTT版本颗粒也出现了上涨,涨幅为0.5...
19:02
微新创想:2026年2月10日,制造商Musnap在海外正式推出Ocean C彩色墨水屏电纸书。这款设备采用了7英寸的Kaleido 3面板,具备300PPI的黑白显示和150PPI的彩色显示,为用户带来更清晰细腻的阅读体验。其硬件配置也相当扎实,搭载了8核处理器、4GB RAM以及64GB存储空间,能够流畅运行安卓14系统。 微新创想:Ocean C不仅在...
19:02
微新创想:2026年2月10日,四川资阳乐至县太平2号特大桥现场传来喜讯,中铁十九局成功完成最后一孔箱梁的架设工作,标志着成渝中线高铁四川段桥梁工程全面竣工。这一重要节点的达成,不仅为后续的铺轨作业和联调联试提供了坚实基础,也意味着整个项目正式迈入全面冲刺阶段。 此次桥梁工程由长江沿岸铁路集团四川有限公司负责建设管理,覆盖四川境内的全线桥梁结构。作为成渝中线...
19:02
微新创想:2026年2月10日,上海召开年度市重大工程建设工作会议。全市共安排重大工程正式项目184项、预备项目14项,计划新开工16项、基本建成22项,年度投资2550亿元,创历史新高。此次会议标志着上海在推动城市高质量发展方面迈出了坚实一步。 微新创想:项目聚焦“五个中心”建设,涵盖科技创新、产业升级、基础设施完善、文化教育提升、医疗卫生优化、生态环境改...
19:02
微新创想:2026年2月10日 大位科技发布异动公告回应市场误读 大位科技(600589.SH)在2026年2月10日发布公告 明确回应市场对其算力租赁概念的误解 公司股票在2026年2月6日、9日、10日连续三日涨幅偏离值超过20% 引起投资者广泛关注 面对市场对算力租赁业务的猜测 公司在公告中强调其相关业务收入占比并不高 2024年前三季度 大位科技的算...
19:02
微新创想:2026年2月10日,由世茂集团商业地产商娱公司与章丘控股集团联合打造的章丘世茂广场在济南市章丘区东部核心板块正式开业。项目总建筑面积约14万平方米,定位为区域旗舰级城市综合体,涵盖商业零售、休闲娱乐、餐饮及服务等多种业态。选址依托高阶居住人群集聚区,旨在提升东部片区商业能级与消费体验。该项目是目前章丘规模最大的城市综合体,标志着区域商业升级迈出关...