微新创想(idea2003.com) 9月8日 消息: 9月8日,备受瞩目的外滩大会在上海盛大举行,蚂蚁集团在此正式发布了具有里程碑意义的金融大模型,并同步开源了生成式AI编程平台CodeFuse。这一重要举措标志着蚂蚁集团在人工智能领域的又一重大突破,为金融科技发展注入了强劲动力。
蚂蚁集团首席技术官、平台技术事业群总裁何征宇在大会期间接受采访时表示,蚂蚁大模型坚持纯自研的技术路线,以全栈布局和长线发展为战略原则,致力于创造产业价值。为了实现这一目标,蚂蚁集团已坚决投入大模型底层基础设施的建设,目前已建成规模庞大的万卡AI集群,训练效率显著领先行业,为大模型产业化应用提供了坚实保障。
何征宇进一步介绍,蚂蚁集团始终秉持核心技术自主创新的理念。2022年底,蚂蚁正式立项大模型研发,经过持续努力,目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。此次发布的蚂蚁金融大模型,正是基于蚂蚁基础大模型,针对金融产业进行了深度定制,以满足金融领域的特殊需求。
在技术细节方面,何征宇透露,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比超过90%。在RLHF训练方面,同等模型效果下,蚂蚁方案的训练吞吐性能相较于业界方案提升3.59倍,推理性能提升约2倍,技术水平已达到业界先进水平。
展望未来,何征宇表示蚂蚁将持续探索和精进大模型的五大能力方向。首先,将建设高质量的数据标注团队,沉淀高质量数据体系;其次,攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;第三,从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;第四,建设高效的大模型评测标准和评测体系,加快大模型迭代速度;第五,建设大模型安全能力,保障大模型健康可持续发展。
在产业端,蚂蚁集团将结合自身能力优势和大模型技术特征,重点探索金融、民生、科技服务等领域的落地应用。通过这些举措,蚂蚁集团有望推动大模型技术在更多领域的创新应用,为经济社会发展带来更多价值。