微新创想(idea2003.com) 8月14日讯 在德克萨斯州奥斯汀一座不起眼的办公大楼内,亚马逊的工程师们正致力于研发两款革命性的微芯片——Inferentia与Trainium,旨在为生成式人工智能的训练与加速提供强大支持。这两款定制芯片将为AWS客户提供训练大型语言模型的全新方案,尤其是在GPU采购日益困难和昂贵的情况下,这一创新显得尤为关键。
亚马逊网络服务(AWS)首席执行官Adam Selipsky在六月的一次采访中强调,全球对生成式人工智能芯片的需求激增,无论是GPU还是亚马逊自研芯片,都备受瞩目。他认为,AWS在满足客户需求方面具有显著优势。然而,其他公司如OpenAI和微软等在生成式人工智能领域的发展更为迅速,投入资金巨大。微软因托管ChatGPT并据报道投资达130亿美元而备受瞩目,迅速将生成式人工智能模型融入自身产品,并在二月份将其纳入必应搜索引擎。谷歌也紧随其后,推出了大型语言模型Bard,并投资了OpenAI的竞争对手Anthropic 3亿美元。相比之下,亚马逊直到四月才宣布推出自己的大型语言模型家族Titan,以及名为Bedrock的服务,旨在帮助开发人员利用生成式人工智能增强软件。
咨询公司Gartner的副总裁分析师Chirag Dekate指出,亚马逊不习惯追逐市场,而是习惯于创造市场。他认为,亚马逊首次发现自己处于被动地位,并努力追赶进度。Meta也发布了自己的LLM——Llama 2,这款开源的ChatGPT竞争对手现在可以在微软的Azure公共云上进行测试。
Dekate认为,从长远来看,亚马逊的定制芯片可能在生成式人工智能领域为其带来显著优势。他表示,亚马逊的技术能力是其真正的差异化所在,而微软并不具备Trainium或Inferentia这样的芯片。自2013年起,AWS便开始秘密研发定制芯片,首先推出了一款名为Nitro的专用硬件,如今已成为AWS规模最大的芯片。亚马逊表示,每台AWS服务器至少有一颗Nitro芯片,总共使用超过2000万颗。
2015年,亚马逊收购了以色列芯片初创公司Annapurna Labs。2018年,亚马逊推出了基于Arm架构的服务器芯片Graviton,与AMD和英特尔等巨头的x86 CPU展开竞争。Bernstein Research的高级分析师Stacy Rasgon指出,目前ARM芯片可能仅占服务器市场总销售额的个位数甚至10%,但其中大部分将出售给亚马逊,因此他们在CPU方面表现相当出色。
2018年,亚马逊推出了面向人工智能的芯片,这是谷歌宣布推出第一款Tensor处理器单元(TPU)的两年后。据报道,微软目前正在与AMD合作开发名为Athena的人工智能芯片,但尚未正式宣布。CNBC参观了亚马逊在德克萨斯州奥斯汀的芯片实验室,这里是Trainium和Inferentia的开发与测试地点。产品副总裁Matt Wood解释了这两款芯片的应用。他说,机器学习可以分为两个阶段:训练和推理。相对于AWS上训练机器学习模型的任何其他方式,Trainium的性价比提高了约50%。2019年发布的Inferentia已进入第二代,使客户能够以极低成本、高吞吐量、低延迟运行机器学习推理。
然而,就目前而言,英伟达的GPU在训练模型方面仍占主导地位。今年7月,AWS推出了由英伟达H100s驱动的新型人工智能加速硬件。Rasgon指出,英伟达芯片拥有庞大的软件生态系统,已建立超过15年,其他公司都无法比拟。对于目前的人工智能来说,最大的赢家是英伟达。
尽管如此,AWS在云计算领域的主导地位是亚马逊的重要优势。Dekate表示,亚马逊不需要赢得头条新闻,他们已经拥有非常强大的云计算用户群体。他们只需要找出如何让现有客户利用生成式人工智能扩展价值创造活动。在选择用于生成式人工智能的亚马逊、谷歌和微软之间,数百万的AWS客户可能会被亚马逊吸引,因为他们对亚马逊已经很熟悉,正在运行其他应用程序并将数据存储在那里。
AWS是全球最大的云计算提供商,在2022年拥有40%的市场份额。尽管近三个季度的运营收入同比下降,但AWS在第二季度的运营利润中仍占据了亚马逊整体77亿美元运营利润的70%。AWS的运营利润率历史上一直远远高于谷歌云。AWS还拥有日益增长的面向生成式人工智能的开发者工具组合。
回想起ChatGPT之前的时代,AWS数据库、分析和机器学习副总裁Swami Sivasubramanian表示,这并不是说在那件事发生后,他们突然匆忙地想出了一个计划,因为不可能在那么短的时间内设计出一个芯片,更不可能在2到3个月内构建出Bedrock服务。Bedrock让AWS客户可以访问由Anthropic、Stability AI、AI21 Labs和亚马逊自己的Titan开发的大型语言模型。Sivasubramanian强调,他们不相信一个模型就能统治世界,希望客户能从多个供应商那里获得最先进的模型,为他们选择正确的工具。
亚马逊最新的人工智能产品之一是AWS HeAlthScribe,于七月推出,利用生成式人工智能帮助医生起草患者就诊总结。另一个重要工具是机器学习中心SageMaker,提供算法、模型等。编码辅助工具CodeWhisperer也备受关注,亚马逊表示该工具使开发人员的任务平均完成时间提高了57%。去年,微软也报道了其编码辅助工具GitHub Copilot带来的生产力提升。六月,AWS宣布成立了一个价值1亿美元的生成式人工智能创新中心,旨在帮助客户将生成式人工智能应用于自身业务。
尽管迄今为止AWS主要专注于工具而不是构建与ChatGPT竞争的产品,但最近泄露的内部电子邮件显示,亚马逊首席执行官安迪·贾西(Andy Jassy)直接监督着一个新的中央团队,正在构建更广泛的大规模语言模型。在第二季度的盈利电话会议上,贾西表示,AWS业务的很大一部分现在由人工智能推动,提供了20多个机器学习服务。一些客户案例包括飞利浦、3M、Old Mutual和汇丰银行。
人工智能的爆炸性增长伴随着许多公司担心员工将专有信息放入用于公共大型语言模型的训练数据中的一系列安全问题。Selipsky表示,他无法统计有多少财富500强企业禁止使用ChatGPT。因此,AWS通过其对生成式人工智能的方法和Bedrock服务来保障客户的需求。通过Bedrock使用的任何模型都将位于客户独立的虚拟私有云环境中,并进行加密,同时具备相同的AWS访问控制。
目前,亚马逊正在加速推进生成式人工智能,告诉CNBC称,超过100,000个客户如今正在使用亚马逊的机器学习。尽管这只是AWS数百万客户中的一小部分,但分析师表示这种情况可能会发生改变。Dekate指出,我们没有看到企业说,『哦,等等,微软在生成式人工智能领域领先,我们就切换基础设施策略,将一切迁移到微软上。』如果您已经是亚马逊的客户,很有可能会广泛探索亚马逊的生态系统。