Meta近期推出了一项令人瞩目的音频AI技术大礼包——AudioCraft,涵盖文本生成音乐、音效、音频压缩及编辑等全方位功能。这一系列开源模型不仅功能全面,而且全部免费使用,为音频创作领域带来了革命性变革。无论是生成一段流行舞曲(提示词:流行舞曲,旋律朗朗上口,热带打击乐和欢快的节奏,量子位,30秒),还是创作一段风吹口哨的音效(提示词:吹着风吹口哨,量子位,5秒),只需简单一句文本提示,即可轻松实现。

Meta特别强调,所有AI模型的训练数据均来自授权渠道或公开资源,确保了技术的合规性和安全性。这一举措不仅赢得了用户的好评,也引发了行业对AI数据伦理的深入思考。有网友惊叹道:“这太疯狂了,刚刚试了一下,生成的声音效果真不错!”而另一些网友则幽默地调侃,Meta此举意在与OpenAI划清界限,彰显其对数据合规的坚定立场。

AudioCraft究竟包含哪些强大功能?实际生成效果如何?让我们深入了解一下这一音频AI三件套。AudioCraft是一个开源音频AI库,目前包含MusicGen、AudioGen和EnCodec三个核心工具。Meta为了发布AudioCraft,还特意更新了EnCodec模型,提升了输出质量,使其更加出色。

MusicGen:基于文本输入生成音乐。该模型使用Meta拥有和授权的音乐数据进行训练,包括20000小时的音乐素材,涵盖10000条内部搜集的高质量音轨,以及ShutterStock和Pond5素材库中的大量数据。这些音乐数据在32kHz下重新采样,并配有流派、BPM等详细信息,确保生成音乐的多样性和高质量。

AudioGen:基于文本输入生成音效。该模型基于10个公开音效数据集进行训练,包括狗吠、汽车鸣喇叭、木地板脚步声等各种音效,为用户提供了丰富的音效选择。

EnCodec:音频压缩工具。该模型能够以极低的音损保持音频的高质量,压缩效果比MP3格式还要小10倍,为音频存储和传输提供了极大的便利。

这三个模型均基于PyTorch框架开发,用户可以直接上手试玩。MusicGen还提供了Demo试玩功能,让用户能够直观体验其强大功能。GitHub项目中也包含了MusicGen、AudioGen和EnCodec的论文细节,方便用户深入了解其技术原理。

然而,AudioCraft的发布也引发了一些争议。有网友认为,音频生成就变得更加大众化,所有人都可以轻松上手尝试;但也有网友担心,这可能导致人类连音频的真假都难以区分,10年后或许连过去的声音、图片、视频都无法分辨。尽管存在争议,AudioCraft无疑为音频创作领域带来了新的可能性。

One More Thing:最近,音频生成AI技术发展迅速,就连效果都卷起来了。一个名为AudioLDM2的模型,虽然论文和代码还在准备中,但刚放出demo就已经在网上传开了。作者Haohe Liu表示,该模型在生成音效、音乐和可理解语音三个领域中均达到了SOTA水平。从实际生成效果来看,确实不错,感兴趣的小伙伴们,可以蹲一波后续了~

MusicGEN试玩地址:https://huggingface.co/spaces/facebook/MusicGen

参考链接:
[1]https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/
[2]https://github.com/facebookresearch/audiocraft
[3]https://twitter.com/LiuHaohe/status/1686782804518973440
[4]https://news.ycombinator.com/item?id=36972347

最新快讯

2025年08月17日

12:43
8月17日,南海热带低压强势北上,海南岛迎来强降雨天气。受其影响,全岛多地遭遇大到暴雨袭击,局部地区更是出现短时强降水,导致部分河流水位急剧上涨,防汛压力骤增。为有效应对可能发生的中小河流超警洪水,水利部于当日11时果断启动洪水防御Ⅳ级应急响应,全面部署各项防汛措施,确保人民群众生命财产安全。此次应急响应的启动,标志着海南防汛工作已进入关键阶段,相关部门正密...
12:43
8月16日,随着西藏定日县蔚来换电站的正式投运,蔚来在G318川藏线上的换电站布局迎来了第15个重要节点,实现了全线贯通。这条被誉为"天空之路"的G318川藏线,横贯成都至拉萨,全长约2410公里,是连接中国东西部的重要交通动脉。如今,随着蔚来换电站的陆续建成,这条充满挑战的线路为新能源车长途出行提供了前所未有的便利。蔚来换电站的投运不仅完善了公司在西藏地区...
12:43
2025年8月17日,备受瞩目的济南黄岗路黄河隧道传来重大突破——盾构段实现全面贯通这一历史性时刻标志着我国隧道工程技术再攀高峰。该隧道项目采用直径17.5米的"山河号"盾构机进行施工,这种世界级超大直径盾构机在黄河水域的复杂地质条件下展现了卓越性能。作为济南城市建设集团重点投资建设的民生工程,该项目由中铁十四局集团凭借精湛工艺承建。中国工程院院士钱七虎对此...
12:43
2025年8月17日,常州队在‘苏超’赛场取得进球,淹城春秋乐园为庆祝这一体育盛事,特别推出一系列惠民活动回馈市民。即日起至8月22日,镇江市民及全国体育老师可凭有效证件免费入园,共享欢乐时光。为鼓励教育界交流,体育老师还可免费携带一名音乐或美术老师同行,让不同领域的教育工作者共赴文化盛宴。此外,8月17日至8月24日,苏锡常三市市民凭身份证购票可享四折优惠...
12:43
2025年8月16日深夜22时许,内蒙古自治区巴彦淖尔市乌拉特后旗乌盖苏木东乌盖沟上游地区突发严重山洪灾害,一场突如其来的自然浩劫瞬间吞噬了正在野外露营的13名人员,导致他们全部失联。经过紧急救援,截至17日10时,搜救队伍已成功救出1名幸存者,但令人痛心的是,已有8人不幸遇难,仍有4人下落不明。目前,相关部门已启动最高级别应急响应,搜救工作正在全速展开,每...
12:43
8月14日10时10分,伴随着一声轻微的引擎轰鸣,一架载有紧急医疗药品的无人机从西安灞桥区疾控中心平稳升空,翱翔于城市上空。仅仅11分钟后,无人机便以惊人的精准度抵达灞桥区狄寨社区卫生服务中心,将急需的药品安全送达。地面工作人员迅速完成药品接收与核对程序,随后将其妥善存放在专用药仓中。完成使命的无人机随即返航,整个过程高效而流畅。 此次无人机成功飞行,标志着...
12:43
8月15日,中国能源建设集团与交通运输部中国交通建设集团在北京正式签署战略合作协议,标志着两大行业领军企业开启深度合作新篇章。中国能源建设集团总经理倪真、中国交通建设集团董事长宋海良共同出席会谈并见证签约仪式,双方高层就未来合作蓝图进行了深入交流。 此次战略携手将聚焦七大核心合作领域:在交通能源融合创新方面,双方将探索路衍光伏、交通枢纽储能等前沿技术;绿色能...
11:38
2025年8月17日,北京时间,权威AI模型聚合平台OpenRouter最新发布的数据报告揭示了编程领域一场深刻的变革。数据显示,Anthropic和Google两大商业编程模型的市场份额在过去几周内持续下滑,而以Qwen 3 Coder为代表的开源模型则实现了爆发式增长,迅速抢占市场空白。 本周,Qwen 3 Coder的市场份额已突破20.5%,较7月第...
11:38
2025年8月17日,广西海事局果断启动防御台风Ⅳ级应急响应,全力应对即将来袭的强热带风暴。据最新气象监测数据显示,南海热带低压正以每小时15公里的速度向西北方向移动,其中心目前位于海南岛南部约500公里的海域,中心附近最大风力已达到6级。预计在8月18日上午,该热带低压将进入北部湾海域,对广西沿海地区造成严重影响。为切实保障船舶航行安全及渔船作业人员生命财...
11:04
微新创想8月17日重磅报道,华为常务董事、终端BG董事长余承东做客央视财经《对话》栏目,就备受关注的话题"遥遥领先"展开深度解读。余承东坦言:"其实我很少主动提及'遥遥领先'这个词,因为过去十几年里,华为终端产品在多个领域确实取得了令人瞩目的成就,偶尔才会脱口而出。" 回顾华为经历制裁的六年多历程,余承东感慨道:"这六年我们经历了前所未有的艰难时刻。制裁前,...
11:03
微新创想8月16日重磅报道,在央视财经《对话》栏目的精彩对话中,华为常务董事、终端BG董事长余承东与主持人陈伟鸿就鸿蒙操作系统的发展历程与未来前景展开了深度对话。针对用户普遍关注的鸿蒙应用适配问题,余承东给出了令人信服的解答。他表示,任何新系统在初期都会面临应用适配的挑战,但华为团队通过快速迭代已经成功解决了这些问题。目前,鸿蒙生态已持续丰富功能矩阵,例如备...
11:03
微新创想8月16日重磅消息,OPPO Find系列产品负责人周意保在社交媒体互动中释放出关键信号,暗示备受瞩目的OPPO Find X9系列将在9月正式启动预热活动。据科技博主数码闲聊站最新爆料,该系列预计于10月正式揭晓,而按照OPPO一贯的发布策略,此次将同步推出Find X9标准版与Find X9 Pro旗舰两款机型。 据悉,OPPO Find X9系...