蚂蚁万卡AI集群训练效率领先蚂蚁基础大模型助力产业应用

2023-09-10 09:50:05 互联网 67 次阅读

微新创想(idea2003.com) 9月8日消息: 9月8日，备受瞩目的外滩大会在上海盛大举行，蚂蚁集团在此正式发布了具有里程碑意义的金融大模型，并同步开源了生成式AI编程平台CodeFuse。这一重要举措标志着蚂蚁集团在人工智能领域的又一重大突破，为金融科技发展注入了强劲动力。

蚂蚁集团首席技术官、平台技术事业群总裁何征宇在大会期间接受采访时表示，蚂蚁大模型坚持纯自研的技术路线，以全栈布局和长线发展为战略原则，致力于创造产业价值。为了实现这一目标，蚂蚁集团已坚决投入大模型底层基础设施的建设，目前已建成规模庞大的万卡AI集群，训练效率显著领先行业，为大模型产业化应用提供了坚实保障。

何征宇进一步介绍，蚂蚁集团始终秉持核心技术自主创新的理念。2022年底，蚂蚁正式立项大模型研发，经过持续努力，目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。此次发布的蚂蚁金融大模型，正是基于蚂蚁基础大模型，针对金融产业进行了深度定制，以满足金融领域的特殊需求。

在技术细节方面，何征宇透露，蚂蚁基础大模型平台具备万卡异构集群，其中千卡规模训练MFU可达到40%，集群有效训练时长占比超过90%。在RLHF训练方面，同等模型效果下，蚂蚁方案的训练吞吐性能相较于业界方案提升3.59倍，推理性能提升约2倍，技术水平已达到业界先进水平。

展望未来，何征宇表示蚂蚁将持续探索和精进大模型的五大能力方向。首先，将建设高质量的数据标注团队，沉淀高质量数据体系；其次，攻坚基础大模型算法，以及高效绿色工程能力，提升模型逻辑推理等能力；第三，从通用语言大模型到通用多模态大模型，从一般通识走向全面专业；第四，建设高效的大模型评测标准和评测体系，加快大模型迭代速度；第五，建设大模型安全能力，保障大模型健康可持续发展。

在产业端，蚂蚁集团将结合自身能力优势和大模型技术特征，重点探索金融、民生、科技服务等领域的落地应用。通过这些举措，蚂蚁集团有望推动大模型技术在更多领域的创新应用，为经济社会发展带来更多价值。