微新创想(idea2003.com) 7月19日讯 Meta公司近日宣布正式推出开源大型语言模型LLaMA 2,标志着其在这一领域迈出了重要一步。作为Meta首款面向公众免费开放的大型语言模型,LLaMA 2的发布不仅彰显了该公司在人工智能领域的雄心,也为整个AI社区带来了新的发展机遇。
自OpenAI去年11月推出备受瞩目的ChatGPT以来,各大科技公司纷纷布局AI领域,试图在人工智能浪潮中占据有利地位。然而,Meta在这一领域的进展相对缓慢。今年2月,尽管微软和谷歌相继宣布推出AI聊天机器人,Meta仅发布了首个小型版本的LLaMA,且仅限于研究人员使用。此次LLaMA 2的发布,标志着Meta决心迎头赶上,通过开放源代码的方式,鼓励更多开发者和企业在其基础上构建商业产品。
Meta此次发布的LLaMA 2包含多个不同规模的版本,同时还提供了一种可构建成聊天机器人的AI模型,功能类似于ChatGPT。值得注意的是,用户需要通过Meta的合作伙伴微软Azure、亚马逊AWS和Hugging Face等平台下载该模型,而非直接通过OpenAI网站访问。Meta负责生成AI工作的副总裁Ahmad Al-Dahle表示:”这一举措将使整个AI社区受益,为用户提供了封闭源与开源两种选择,以适应不同的应用需求。对我们而言,这是一个具有里程碑意义的时刻。”
尽管LLaMA 2的发布备受瞩目,但仍然存在一些限制条件。根据Meta与《麻省理工科技评论》独家共享的研究论文,该公司并未公开训练LLaMA 2所使用的数据集信息,也无法保证其中不包含受版权保护的作品或个人数据。此外,LLaMA 2也面临着所有大型语言模型共有的问题,如易产生虚假信息和冒犯性语言。
Al-Dahle强调,通过将模型公开发布,并允许开发者和企业进行调试,Meta将从中获得宝贵经验,以提升模型的安全性、公正性和效率。斯坦福大学基础模型研究中心主任Percy Liang认为,强大的开源模型如LLaMA 2对OpenAI构成了显著威胁。作为开源竞争对手Alpaca研究团队的一员,Liang表示:”LLaMA 2并非GPT-4。”研究论文中也承认,LLaMA 2与GPT-4之间的性能差距仍然较大,而GPT-4目前是OpenAI最先进的AI语言模型。但Liang补充道:”对于许多用例来说,GPT-4并非必需。”
加州大学伯克利分校教授Steve Weber指出:”如果LLaMA 2能成为领先的开源替代品,这将是对Meta的巨大胜利。”为了推出LLaMA 2,Meta进行了大量改进,使其比前身更安全,更不易产生有害虚假信息。Al-Dahle表示,Meta从过去的失误中汲取了深刻教训。例如,科学语言模型Galactica上线仅三天就被下线,而早期的LLaMA模型因在网上泄露引发了一系列批评,质疑Meta是否充分评估了AI语言模型的风险。
为避免重蹈覆辙,Meta应用了多种机器学习技术,旨在提升LLaMA 2的实用性和安全性。Meta研究人员Sasha Luccioni指出,相比于一般生成式AI模型,训练LLaMA 2需要更多步骤。Al-Dahle透露,该模型使用了比前身多40%的训练数据,其中包含在线抓取的数据,以及根据人类标注员反馈进行微调和调整的数据。公司强调,LLaMA 2未使用Meta用户数据,并排除了已知含有大量个人信息的网站的数据。
尽管如此,LLaMA 2仍可能产生冒犯、有害等语言问题,与其他竞争对手的模型类似。Meta表示未从数据集中删除有害数据,因为保留这些数据可能有助于模型更好地检测仇恨言论,而删除它们可能会意外地排除某些群体。Luccioni认为,Meta的开放承诺令人振奋,因为它为研究人员提供了研究AI模型偏见、道德和效率的宝贵机会。作为开源模型,LLaMA 2也将允许外部研究人员和开发人员探索其安全漏洞,从而使其比专有模型更安全。Liang对此表示赞同:”我非常期待尝试一些新事物,相信这将有益于整个社区。”