
阿布扎比的人工智能领军企业 G42 于本周二正式推出了备受瞩目的 NANDA87B 开源印英大型语言模型,这一具有里程碑意义的发布标志着其早期版本 NANDA 的重大升级。NANDA87B 拥有高达 87 亿的参数规模,现已在 MBZUAI 的 Hugging Face 页面上以开放权重形式向全球开发者、创作者和企业开放,充分体现了其开放共享的理念,为技术创新提供了无限可能。这款尖端模型的研发成果归功于穆罕默德・本・扎耶德人工智能大学(MBZUAI)与 G42 旗下 Inception 公司以及领先芯片制造商 Cerebras 的深度合作。
NANDA87B 是在 Llama-3.170B 模型的基础上精心构建的,其训练过程涵盖了超过 650 亿个印地语标记,并特别采用了印地语专用的分词器技术,这一创新显著提升了模型在训练和推理环节的效率。G42 印度首席执行官马努・贾因对此表示:”印度理应拥有能够用本土语言表达的世界级技术,NANDA87B 正是朝着这一愿景迈出的关键一步。” 他进一步强调,该模型将全面支持印度 AI 生态系统在教育、娱乐、企业等多个领域的创新实践。
据 G42 公开信息显示,NANDA87B 经过专门设计,能够精准处理正式印地语、日常口语以及混合印地语(Hinglish)等多种语言变体,并具备执行翻译、摘要生成、指令遵循和音译转换等多项复杂任务的强大能力。特别值得一提的是,该公司在模型设计过程中高度重视安全性与文化一致性,确保所有输出结果都符合责任性原则。穆罕默德・本・扎耶德人工智能大学基础模型研究所执行董事理查德・莫顿评价道:”此次 NANDA87B 的发布是扩展高级语言技术可及性的重大突破,它将为全球最大语言社区之一提供前所未有的高质量开放语言技术资源。”
NANDA87B 的训练工作是在 G42 与 Cerebras 联合研发的 Condor Galaxy 超级计算系统上完成的,这一先进的计算平台为模型训练提供了强大的算力支持。此次发布不仅彰显了 G42 在人工智能领域的领先地位,更向世界展示了其在推动全球最大语言社区技术进步方面的坚定决心。
划重点:NANDA87B 是 G42 推出的87亿参数开源印英语言模型,致力于促进印度的技术发展。💻 模型支持正式印地语、日常口语和混合印地语,可执行翻译、摘要、指令跟随和音译等多种语言处理任务。🔍 此次发布标志着高级语言技术可及性的重大扩展,为全球最大语言社区的技术进步注入新动力。
