微新创想(idea2003.com)7月28日 消息:随着人工智能技术的飞速发展,新一代人工智能超级计算机正逐渐崭露头角,为生成式人工智能模型的创新提供强大动力。大型语言模型和其他生成式AI应用的需求呈现爆炸式增长,ChatGPT、Bard、Copilot等聊天机器人已成为数字生态系统中不可或缺的一部分,而GPT-4等前沿模型依然保持着领先地位。然而,技术的脚步永不停歇,更先进的生成式AI模型正蓄势待发。
为了应对这些复杂AI系统的训练需求,各大科技公司纷纷投入巨资,研发新一代人工智能超级计算机。其中,Cerebras公司推出的Condor Galaxy1系统堪称行业标杆,其强大的2Exaflops计算能力令人瞩目。该系统由32台Cerebras CS-2计算机组成,仅用10天便完成组装并投入运行,展现了惊人的效率。据Cerebras透露,Condor Galaxy的规模将在未来12周内实现翻倍,其所有者G42作为阿布扎比控股公司,旗下拥有9家人工智能企业,包括中东最大的云计算提供商G42Cloud。未来18个月内,Cerebras计划部署更多系统,最终在9个安装点达到36Exaflops的算力,这将使其成为全球最大的人工智能超级计算机之一。
云服务提供商纷纷推出支持Nvidia H100 GPU的新实例,为AI开发提供强大支持。AWS近期推出的P5实例可容纳高达20,000个H100GPU,而Microsoft Azure、Google和Core Weave也提供了类似的硬件解决方案。这些云平台通过提供便捷的扩展资源,使开发者能够快速构建生成式AI应用程序原型。得益于Transformer引擎的H100 GPU,训练时间大幅缩短,显著提升了AI模型的开发效率。在MLPerf基准测试中,Core Weave与Nvidia合作,在约3,500个GPU上不到11分钟的时间内成功训练了一个拥有1750亿参数的GPT-3模型,这一成就充分证明了新一代AI超级计算机的强大性能。