微新创想(idea2003.com) 8月30日 消息:近日,阿联酋科技巨头G42与硅谷创新企业Cerebras Systems强强联手,共同推出了一款具有里程碑意义的开源阿拉伯语人工智能语言模型——Jais。这款模型拥有高达130亿个参数,其训练数据不仅涵盖了海量的阿拉伯语语料,还融合了丰富的英语计算机代码,确保了模型的全面性和先进性。
Jais的命名灵感源自阿联酋巍峨的哈利法山,象征着科技与自然的完美融合。这一创新项目由一群杰出的工程师、研究人员以及Cerebras Systems的专业团队共同打造。Cerebras Systems作为人工智能计算硬件领域的先驱,其自主研发的芯片性能与英伟达芯片不相上下,能够为高强度的人工智能计算提供强大支持。在该项目中,Cerebras Systems不仅提供了关键的计算资源,更以技术优势为Jais的诞生奠定了坚实基础。
开发团队特别强调,计算机代码数据在提升Jais推理能力方面发挥了至关重要的作用。由于纯阿拉伯语数据难以支撑如此大规模语言模型的训练需求,英语计算机代码的加入有效弥补了这一短板,显著增强了模型的智能化水平。Jais以完全开源的方式向全球开发者开放,旨在推动阿拉伯语人工智能技术的蓬勃发展。
业界专家指出,尽管类似Google的英语语言模型BERT已取得令人瞩目的成就,但针对阿拉伯语的优质语言模型仍十分稀缺。Jais的问世不仅填补了这一市场空白,更标志着阿拉伯语人工智能发展迈出了重要一步。这一突破性成果不仅将为阿联酋地区带来深远影响,还将促进全球阿拉伯语人工智能技术的繁荣与进步。
Jais将基于开放源代码许可证向公众发布,未来可广泛应用于语音识别、机器翻译、文档生成等多个领域。作为阿拉伯语地区首个规模如此庞大的语言模型,Jais的推出预计将极大推动阿拉伯语人工智能的深入研究与应用落地。业内普遍认为,Jais的问世将为阿拉伯语智能技术开启新篇章,引领人工智能在阿拉伯语世界的创新浪潮。