微新创想(idea2003.com) 7月19日讯 Meta公司近日宣布正式推出开源大型语言模型LLaMA 2,标志着其在这一领域迈出了重要一步。作为Meta首款面向公众免费开放的大型语言模型,LLaMA 2的发布不仅彰显了该公司在人工智能领域的雄心,也为整个AI社区带来了新的发展机遇。

自OpenAI去年11月推出备受瞩目的ChatGPT以来,各大科技公司纷纷布局AI领域,试图在人工智能浪潮中占据有利地位。然而,Meta在这一领域的进展相对缓慢。今年2月,尽管微软和谷歌相继宣布推出AI聊天机器人,Meta仅发布了首个小型版本的LLaMA,且仅限于研究人员使用。此次LLaMA 2的发布,标志着Meta决心迎头赶上,通过开放源代码的方式,鼓励更多开发者和企业在其基础上构建商业产品。

Meta此次发布的LLaMA 2包含多个不同规模的版本,同时还提供了一种可构建成聊天机器人的AI模型,功能类似于ChatGPT。值得注意的是,用户需要通过Meta的合作伙伴微软Azure、亚马逊AWS和Hugging Face等平台下载该模型,而非直接通过OpenAI网站访问。Meta负责生成AI工作的副总裁Ahmad Al-Dahle表示:”这一举措将使整个AI社区受益,为用户提供了封闭源与开源两种选择,以适应不同的应用需求。对我们而言,这是一个具有里程碑意义的时刻。”

尽管LLaMA 2的发布备受瞩目,但仍然存在一些限制条件。根据Meta与《麻省理工科技评论》独家共享的研究论文,该公司并未公开训练LLaMA 2所使用的数据集信息,也无法保证其中不包含受版权保护的作品或个人数据。此外,LLaMA 2也面临着所有大型语言模型共有的问题,如易产生虚假信息和冒犯性语言。

Al-Dahle强调,通过将模型公开发布,并允许开发者和企业进行调试,Meta将从中获得宝贵经验,以提升模型的安全性、公正性和效率。斯坦福大学基础模型研究中心主任Percy Liang认为,强大的开源模型如LLaMA 2对OpenAI构成了显著威胁。作为开源竞争对手Alpaca研究团队的一员,Liang表示:”LLaMA 2并非GPT-4。”研究论文中也承认,LLaMA 2与GPT-4之间的性能差距仍然较大,而GPT-4目前是OpenAI最先进的AI语言模型。但Liang补充道:”对于许多用例来说,GPT-4并非必需。”

加州大学伯克利分校教授Steve Weber指出:”如果LLaMA 2能成为领先的开源替代品,这将是对Meta的巨大胜利。”为了推出LLaMA 2,Meta进行了大量改进,使其比前身更安全,更不易产生有害虚假信息。Al-Dahle表示,Meta从过去的失误中汲取了深刻教训。例如,科学语言模型Galactica上线仅三天就被下线,而早期的LLaMA模型因在网上泄露引发了一系列批评,质疑Meta是否充分评估了AI语言模型的风险。

为避免重蹈覆辙,Meta应用了多种机器学习技术,旨在提升LLaMA 2的实用性和安全性。Meta研究人员Sasha Luccioni指出,相比于一般生成式AI模型,训练LLaMA 2需要更多步骤。Al-Dahle透露,该模型使用了比前身多40%的训练数据,其中包含在线抓取的数据,以及根据人类标注员反馈进行微调和调整的数据。公司强调,LLaMA 2未使用Meta用户数据,并排除了已知含有大量个人信息的网站的数据。

尽管如此,LLaMA 2仍可能产生冒犯、有害等语言问题,与其他竞争对手的模型类似。Meta表示未从数据集中删除有害数据,因为保留这些数据可能有助于模型更好地检测仇恨言论,而删除它们可能会意外地排除某些群体。Luccioni认为,Meta的开放承诺令人振奋,因为它为研究人员提供了研究AI模型偏见、道德和效率的宝贵机会。作为开源模型,LLaMA 2也将允许外部研究人员和开发人员探索其安全漏洞,从而使其比专有模型更安全。Liang对此表示赞同:”我非常期待尝试一些新事物,相信这将有益于整个社区。”

最新快讯

2025年08月04日

15:41
一夜爆红的农村诗人吕玉霞,能否借助网络热度实现快速变现、改善生活?2025年3月,达人@沂蒙二姐(吕玉霞)因在田野中即兴作诗而迅速走红网络,其作品被央视新闻转载,相关视频在各大社交媒体平台累计获得百万级点赞。然而,这位网络红人的变现之路并非一帆风顺。初期尝试3场水果直播,总GMV仅10万元,与高涨的网络热度形成鲜明对比。5月底,@沂蒙二姐 转战快手平台开启直...
15:41
Figma近期宣布对其开发者模式进行重大升级,推出了创新的彩色交互式批注系统和Model Context Protocol(MCP)协议的全面改进。这一更新被视为设计与开发协作领域的重要里程碑,有望彻底重塑传统的设计交接流程。 彩色批注系统:终结沟通混乱 新版开发者模式的最大亮点是引入了彩色交互式批注功能。设计师现在可以直接在设计文件中使用不同颜色的批注来标...
15:41
东京大学松尾研究室孵化的创新企业 IGSA 近期推出了一项专为50至70岁中老年群体设计的脑健康管理服务——"聊聊吧"。这项服务通过人工智能驱动的语音对话技术,帮助用户及早发现轻度认知障碍等认知功能变化,为大脑健康提供早期预警。用户无需下载任何应用程序,只需在社交平台 LINE 上添加"聊聊吧"官方账号即可轻松开启使用体验。 服务采用极简交互设计,用户在系统...
15:41
腾讯混元团队正式宣布推出四款全新开源小尺寸模型,分别为0.5B、1.8B、4B和7B参数版本。这些专为消费级显卡打造的轻量化模型,完美适配笔记本电脑、智能手机、智能座舱及智能家居等低功耗场景,同时支持垂直领域的低成本微调应用。这一创新举措不仅极大丰富了混元开源模型体系,更为开发者和企业提供了更多元化的模型选择维度。 作为腾讯混元大模型持续开源战略的重要组成部...
15:41
2025年7月30日,长江电力董事会正式审议通过《关于出资建设葛洲坝航运扩能工程的议案》,宣布将以自有资金约266亿元启动这一重大民生工程,最终投资金额将根据国家核定结果进行调整。值得注意的是,该项目可行性研究报告已获得国家发改委的权威批复,为项目顺利推进奠定了坚实基础,计划于2025年8月全面启动前期准备工作。 该项目作为长江黄金水道建设的关键一环,旨在全...
15:41
8月4日,强力新材在官方互动平台上发布重要信息,就其核心产品光敏性聚酰亚胺(PSPI)的当前进展作出说明。公司明确表示,该产品目前仍处于严格的客户验证阶段,尚未进入大规模商业化应用阶段。这一阶段是确保产品质量和性能符合市场高标准的关键环节,需要通过实际应用场景的反复测试与评估。 在强调产品进展的同时,强力新材也特别指出,截至目前该光敏性聚酰亚胺产品尚未通过任...
15:41
2025年8月4日,山东省正式发布《美丽山东建设金融项目库管理办法》,标志着该省在绿色金融领域迈出重要步伐,旨在通过强化金融支持,全面提升生态环境保护水平。新办法对原有的金融项目库进行了全面升级,将项目类目从原先的9大类107个扩展至8大类274个,覆盖范围更广、内容更丰富。此次调整不仅增加了项目数量,更在结构上进行了优化,新增的类目重点聚焦于气候变化应对、...
15:41
沙特阿拉伯东部省近日重磅推出"达曼全球城市计划",这一创新项目将精心打造16座各国特色展馆,以高度融合文化展示、旅游观光、休闲娱乐及商业运营的复合模式,为当地乃至全球游客带来前所未有的体验。项目选址于达曼市核心区域,规划总占地面积超过60万平方米,采用分阶段开发策略,首期工程已正式启动,投资总额高达2亿沙特里亚尔。 该项目是沙特阿拉伯在推动经济多元化战略中的...
15:41
深圳小米通讯技术有限公司近日完成重要工商变更,公司核心管理层迎来调整。原法定代表人、执行董事及总经理王川已卸任所有职务,由张剑慧全面接任,新任法定代表人同时兼任经理及董事一职。此次变动还涉及多位主要人员的人事调整,标志着公司在组织架构上进行了优化升级。 该公司成立于2020年3月,注册资本规模达5000万元人民币,作为深圳小米信息技术有限公司的全资子公司,依...
15:41
2025年上半年,中国医药行业的风向骤变。受医保控费政策持续收紧的影响,央企华润集团旗下的医疗旗舰华润医疗遭遇了前所未有的业绩挑战。公司最新财报显示,其拥有人应占利润同比大幅下滑55%至60%,这一数字预示着一场深刻的行业变革正在悄然发生。8月4日,华润医疗股价更是遭遇断崖式下跌,单日暴跌15.8%,市值急剧缩水至约48.4亿港元,市值蒸发近三成。这一系列动...
15:01
近日,重庆上演了一场因网络直播打赏引发的复杂情感与经济纠纷,引发社会广泛关注。故事的主角是来自湖北的42岁离异女子安女士,她在网络平台上结识了年仅27岁的男主播阿超,两人迅速发展出一段看似甜蜜的恋爱关系。在这段关系中,安女士对阿超倾注了大量情感与金钱,累计打赏金额高达20万元,其中大部分通过直播间完成,另有2万多元以私下转账形式给予。然而,这段看似光鲜的“主...
15:00
微新创想8月4日重磅报道,复旦MBA项目官方公众号最新发布,备受瞩目的"复旦MBA聚劲2025"班级见面会在复旦管院政立院区圆满举行。现场照片中,一位备受瞩目的特殊新生格外引人注目——拥有超过751万粉丝的知名网红博主"迅猛龙特蕾莎"许锴蓥正式加入复旦管理学院2025级MBA大家庭,成为非全日制MBA项目中的一员。 据了解,许锴蓥凭借优异的考试成绩成功叩开复...