近日,瑞士顶尖科研机构瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)共同宣布了一个名为“Apertus”的大规模开源语言模型的诞生。该模型的名字在拉丁语中意为“开放”,其命名恰如其分地反映了其开放共享的开发理念。与当前市场上备受瞩目的美国大型模型,如OpenAI的GPT系列、Meta的Llama和Anthropic的Claude相比,Apertus在技术实力之外,更以其无与伦比的透明度赢得了全球范围内的广泛关注。这款模型的所有核心要素,包括模型权重、架构设计、训练代码以及数据来源等,均实现了全面公开,甚至包括训练过程的完整文档记录。这种彻底的“开放”策略,让Apertus成为了一个极具吸引力的新选择。
在这个人工智能技术日新月异的时代,“数据黑箱”现象依然普遍存在。许多大型科技公司在发布其模型时,往往对外界隐瞒大量关键细节,这导致了行业内部的不信任感。而Apertus的出现打破了这一行业常规,通过开源的方式积极促进技术的共享与合作。研究人员和开发者们可以在Apertus的基础上进行创新与改进,从而推动整个行业的进步。参与这项研究的团队表示,Apertus的推出不仅旨在为学术研究提供便利,更希望激励全球的AI研究者和开发者共同参与到开源生态中来。通过这种方式,Apertus希望能够降低AI技术的门槛,让更多的人能够参与到AI的开发和应用中,从而加速科技进步。
Apertus的问世标志着瑞士在全球人工智能领域的一次重要尝试,预示着未来可能会有更多类似的开源项目涌现,共同推动整个行业向前发展。随着这一项目的持续推进,我们期待看到更多的创新和突破。