Meta近期推出了一项令人瞩目的音频AI技术大礼包——AudioCraft,涵盖文本生成音乐、音效、音频压缩及编辑等全方位功能。这一系列开源模型不仅功能全面,而且全部免费使用,为音频创作领域带来了革命性变革。无论是生成一段流行舞曲(提示词:流行舞曲,旋律朗朗上口,热带打击乐和欢快的节奏,量子位,30秒),还是创作一段风吹口哨的音效(提示词:吹着风吹口哨,量子位,5秒),只需简单一句文本提示,即可轻松实现。

Meta特别强调,所有AI模型的训练数据均来自授权渠道或公开资源,确保了技术的合规性和安全性。这一举措不仅赢得了用户的好评,也引发了行业对AI数据伦理的深入思考。有网友惊叹道:“这太疯狂了,刚刚试了一下,生成的声音效果真不错!”而另一些网友则幽默地调侃,Meta此举意在与OpenAI划清界限,彰显其对数据合规的坚定立场。

AudioCraft究竟包含哪些强大功能?实际生成效果如何?让我们深入了解一下这一音频AI三件套。AudioCraft是一个开源音频AI库,目前包含MusicGen、AudioGen和EnCodec三个核心工具。Meta为了发布AudioCraft,还特意更新了EnCodec模型,提升了输出质量,使其更加出色。

MusicGen:基于文本输入生成音乐。该模型使用Meta拥有和授权的音乐数据进行训练,包括20000小时的音乐素材,涵盖10000条内部搜集的高质量音轨,以及ShutterStock和Pond5素材库中的大量数据。这些音乐数据在32kHz下重新采样,并配有流派、BPM等详细信息,确保生成音乐的多样性和高质量。

AudioGen:基于文本输入生成音效。该模型基于10个公开音效数据集进行训练,包括狗吠、汽车鸣喇叭、木地板脚步声等各种音效,为用户提供了丰富的音效选择。

EnCodec:音频压缩工具。该模型能够以极低的音损保持音频的高质量,压缩效果比MP3格式还要小10倍,为音频存储和传输提供了极大的便利。

这三个模型均基于PyTorch框架开发,用户可以直接上手试玩。MusicGen还提供了Demo试玩功能,让用户能够直观体验其强大功能。GitHub项目中也包含了MusicGen、AudioGen和EnCodec的论文细节,方便用户深入了解其技术原理。

然而,AudioCraft的发布也引发了一些争议。有网友认为,音频生成就变得更加大众化,所有人都可以轻松上手尝试;但也有网友担心,这可能导致人类连音频的真假都难以区分,10年后或许连过去的声音、图片、视频都无法分辨。尽管存在争议,AudioCraft无疑为音频创作领域带来了新的可能性。

One More Thing:最近,音频生成AI技术发展迅速,就连效果都卷起来了。一个名为AudioLDM2的模型,虽然论文和代码还在准备中,但刚放出demo就已经在网上传开了。作者Haohe Liu表示,该模型在生成音效、音乐和可理解语音三个领域中均达到了SOTA水平。从实际生成效果来看,确实不错,感兴趣的小伙伴们,可以蹲一波后续了~

MusicGEN试玩地址:https://huggingface.co/spaces/facebook/MusicGen

参考链接:
[1]https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/
[2]https://github.com/facebookresearch/audiocraft
[3]https://twitter.com/LiuHaohe/status/1686782804518973440
[4]https://news.ycombinator.com/item?id=36972347

最新快讯

2025年11月15日

06:00
美国邮政服务局(USPS)近期正式公布了2026年的价格调整方案,引发广泛关注。根据最新披露的信息,该机构计划将优先邮件服务的价格上调约6.6%,而优先特快邮件服务的费用也将随之上涨5.1%。这一系列价格调整措施主要出于对运营成本持续上升的应对,旨在确保邮政系统能够长期稳定运行,并维持其服务质量。 此次价格调整方案的具体实施细节仍需经过相关部门的审批流程。一...
02:04
2025年11月15日,领先的金融科技企业Mu Holdings Ltd.正式宣布其革命性举措——成功将人工智能技术深度整合至现有信用评估模型中。这一创新解决方案已率先在巴西市场部分客户群体中落地应用,通过精准分析用户的消费行为模式与信用数据,实现了信用卡限额的动态智能调整。该技术部署的核心目标在于显著提升用户金融服务体验,同时通过数据驱动的决策机制有效扩大...
01:21
2025年11月15日,水利部权威发布,备受瞩目的三峡后续工作规划目标任务已进入收尾阶段,预计将于今年年底前全面完成。这一规划自2011年正式启动实施,历时十余年,累计投入资金高达1238亿元人民币,成功推进了7561个各类项目。该规划的核心聚焦于四大关键领域:一是保障库区移民的安稳致富,二是强化地质灾害的防治力度,三是全面提升生态环境的保护水平,四是有效处...
00:15
2025年11月14日,备受瞩目的北京6G产业发展分论坛隆重举行,现场首次集中发布了由北京6G实验室取得的十大技术进展成果。这一系列突破性进展不仅彰显了北京在6G领域的领先地位,更在全球范围内树立了新的技术标杆。发布内容聚焦于高频通信、智能超表面、星地融合、通感一体等四大核心方向,通过一系列创新技术的深度融合与应用,实现了U6G频段单用户下行峰值速率高达20...

2025年11月14日

23:41
科技媒体Tom's Hardware最新报道了一则关于AMD驱动程序异常行为的发现。用户Takia_Gecko在测试过程中注意到,当移动或调整应用程序窗口时,系统日志文件会出现持续追加写入的现象。经过实际验证,C:\Windows\System32\AMD\EEUDumps目录下的日志文件在窗口操作期间频繁更新,导致数据记录异常频繁。 这一异常行为可能对固态...
23:41
禾赛科技近日传来振奋人心的消息,正式宣布其新一代激光雷达产品已全面获得理想汽车旗下理想L系列、i系列以及MEGA等全系车型的定点认可。这一重要合作进展不仅彰显了双方在智能驾驶技术领域的深厚积累,更预示着未来智能汽车辅助驾驶能力的显著提升。 自2021年起,禾赛科技与理想汽车便建立了紧密的战略合作关系。在过去的三年里,禾赛已成功为理想汽车多款旗舰车型供应高性能...
23:41
2025年11月14日,全球科技巨头谷歌公司正式宣布对欧洲市场的广告技术服务进行重大调整。这一战略举措旨在积极响应欧盟委员会此前作出的反垄断处罚决定,通过主动优化广告交易平台运作模式,避免在欧洲市场面临强制拆分的极端风险。据悉,谷歌将全面革新其欧洲广告交易系统的架构与功能,确保所有业务流程完全符合欧盟最新的监管要求。公司高层强调,相关技术调整将在未来几个月内...
23:41
游戏媒体Euro Gamer近期发布了关于《密特罗德究极4:穿越未知》在Switch 2平台上的实机体验视频,为玩家带来了最前沿的游戏动态。游戏以极具电影化的开场引入,萨姆斯·艾仁在联邦基地迎战突袭的太空海盗,剧情完美延续了系列经典的设定,让老玩家倍感亲切。在游戏过程中,玩家可以通过扫描环境获取关键信息,这一设计不仅增强了互动性,还配合新增的心灵感应机制,让...
23:07
2025年11月14日,《科创板日报》独家报道了一则重磅消息。黑芝麻智能CEO单记章在深度专访中透露,机器人市场规模预计将远超智能汽车领域,其体量有望达到后者的10倍以上。这一惊人预测背后,是机器人技术正迎来前所未有的发展机遇。 单记章指出,随着技术进步,机器人将逐渐渗透到人类生活的方方面面。从情感陪护到家务服务,从工业制造到医疗健康,机器人的应用场景正在不...
23:07
苹果公司近期对App Store审核准则进行了全面升级,通过新增多项关键规定进一步优化平台生态体系。根据4.1(c)条款的最新要求,开发者将严格禁止在应用图标、名称等核心元素中擅自使用其他开发者的知识产权,这一举措旨在从源头上有效遏制"李鬼"应用泛滥现象,维护公平竞争的市场环境。 新规在金融应用监管方面也展现出更强力度,明确要求所有贷款类应用年化利率不得...
23:07
世嘉正式宣布,《人中之龙 极》与《人人之龙 极 2》已成功登陆 Nintendo Switch 2 平台,为全球玩家带来全新的游戏体验。此次登陆备受期待的两款作品,分别在港澳地区和日本市场推出了差异化定价策略。港服方面,《人中之龙 极》独立版售价为187港币,而捆绑包版本则提供338港币的优惠价格;日服市场则根据版本不同,价格区间设定在1980至3990日元...
22:31
近日 Valve 公司正式发布了备受期待的 Steam Machine 游戏主机,这款采用紧凑立方体设计的设备完美融合了迷你主机与客厅 PC 的优势,为玩家带来全新的游戏体验。该主机搭载专为游戏优化的 Steam OS 系统,并配备了定制的 AMD 处理器,确保流畅运行各类游戏大作。 据 PC Gamer 最新探访视频披露,这款 Steam Machine ...