Meta近期推出了一项令人瞩目的音频AI技术大礼包——AudioCraft,涵盖文本生成音乐、音效、音频压缩及编辑等全方位功能。这一系列开源模型不仅功能全面,而且全部免费使用,为音频创作领域带来了革命性变革。无论是生成一段流行舞曲(提示词:流行舞曲,旋律朗朗上口,热带打击乐和欢快的节奏,量子位,30秒),还是创作一段风吹口哨的音效(提示词:吹着风吹口哨,量子位,5秒),只需简单一句文本提示,即可轻松实现。

Meta特别强调,所有AI模型的训练数据均来自授权渠道或公开资源,确保了技术的合规性和安全性。这一举措不仅赢得了用户的好评,也引发了行业对AI数据伦理的深入思考。有网友惊叹道:“这太疯狂了,刚刚试了一下,生成的声音效果真不错!”而另一些网友则幽默地调侃,Meta此举意在与OpenAI划清界限,彰显其对数据合规的坚定立场。

AudioCraft究竟包含哪些强大功能?实际生成效果如何?让我们深入了解一下这一音频AI三件套。AudioCraft是一个开源音频AI库,目前包含MusicGen、AudioGen和EnCodec三个核心工具。Meta为了发布AudioCraft,还特意更新了EnCodec模型,提升了输出质量,使其更加出色。

MusicGen:基于文本输入生成音乐。该模型使用Meta拥有和授权的音乐数据进行训练,包括20000小时的音乐素材,涵盖10000条内部搜集的高质量音轨,以及ShutterStock和Pond5素材库中的大量数据。这些音乐数据在32kHz下重新采样,并配有流派、BPM等详细信息,确保生成音乐的多样性和高质量。

AudioGen:基于文本输入生成音效。该模型基于10个公开音效数据集进行训练,包括狗吠、汽车鸣喇叭、木地板脚步声等各种音效,为用户提供了丰富的音效选择。

EnCodec:音频压缩工具。该模型能够以极低的音损保持音频的高质量,压缩效果比MP3格式还要小10倍,为音频存储和传输提供了极大的便利。

这三个模型均基于PyTorch框架开发,用户可以直接上手试玩。MusicGen还提供了Demo试玩功能,让用户能够直观体验其强大功能。GitHub项目中也包含了MusicGen、AudioGen和EnCodec的论文细节,方便用户深入了解其技术原理。

然而,AudioCraft的发布也引发了一些争议。有网友认为,音频生成就变得更加大众化,所有人都可以轻松上手尝试;但也有网友担心,这可能导致人类连音频的真假都难以区分,10年后或许连过去的声音、图片、视频都无法分辨。尽管存在争议,AudioCraft无疑为音频创作领域带来了新的可能性。

One More Thing:最近,音频生成AI技术发展迅速,就连效果都卷起来了。一个名为AudioLDM2的模型,虽然论文和代码还在准备中,但刚放出demo就已经在网上传开了。作者Haohe Liu表示,该模型在生成音效、音乐和可理解语音三个领域中均达到了SOTA水平。从实际生成效果来看,确实不错,感兴趣的小伙伴们,可以蹲一波后续了~

MusicGEN试玩地址:https://huggingface.co/spaces/facebook/MusicGen

参考链接:
[1]https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/
[2]https://github.com/facebookresearch/audiocraft
[3]https://twitter.com/LiuHaohe/status/1686782804518973440
[4]https://news.ycombinator.com/item?id=36972347

最新快讯

2025年08月17日

19:56
智元机器人于8月17日发布重磅消息,正式推出全新一代OmniHand 2025系列灵巧手,这一创新举措标志着该公司在机器人核心部件研发领域取得突破性进展。该系列产品精心划分为两大类别——灵动款与专业款,分别针对日常交互服务场景和精密专业作业需求进行定制化设计。 据悉,灵动款OmniHand 2025灵巧手将于8月18日同步登陆智元商城及京东平台开启预售,其市...
19:56
8月17日,备受瞩目的首届世界人形机器人运动会圆满落下帷幕,这场科技与智能的盛宴汇聚全球顶尖人形机器人技术,共同探索未来机器人的无限可能。在这场高手云集的竞技中,宇树科技凭借其卓越的技术实力和精心研发的机器人,一举斩获四枚金牌,分别是在1500米、400米、100米障碍赛以及4×100米接力项目中的惊人表现。这些成绩不仅彰显了宇树科技在人形机器人领域的领先地...
19:55
2025年8月16日深夜22时许,内蒙古巴彦淖尔市乌拉特后旗乌盖苏木东乌盖沟上游地区遭遇突发山洪灾害,这场突如其来的自然灾害瞬间吞噬了宁静的夜空。据官方通报,共有10名野外露营人员不幸遇难,另有2人失联,1人奇迹获救。这场突如其来的灾难迅速引起了社会各界的广泛关注。 面对严峻的灾情,当地政府第一时间启动应急响应机制。截至8月17日17时20分,已紧急调集70...
19:55
8月16日,广东省佛山市新增52例基孔肯雅热确诊病例,引发社会广泛关注。具体病例分布情况如下:禅城区报告19例,南海区11例,顺德区18例,高明区2例,三水区2例。面对此次疫情,佛山市相关部门已迅速启动应急响应机制,全面开展疫情防控工作。目前,专业医疗团队正对确诊病例进行隔离治疗,同时加强了对密切接触者的追踪管理。此外,卫生防疫部门也在全市范围内开展了基孔肯...
19:55
8月16日,深港陆路口岸迎来历史性突破,单日出入境旅客总数高达102.71万人次,刷新了有记录以来的最高纪录。这一惊人数字背后,是两地人员往来的蓬勃活力。具体来看,当日出境旅客达46.81万人次,而入境旅客则达到55.9万人次,双向流动均呈现强劲态势。这一现象不仅彰显了深港合作关系的紧密程度,也反映出两地经济文化交流的日益频繁。随着粤港澳大湾区建设的深入推进...
18:48
2025年8月17日,智元机器人重磅发布OmniHand 2025系列灵巧手,为机器人行业带来革命性突破。该系列涵盖两大版本——面向日常交互服务的“灵动款”与专注专业作业的“专业款”,全面升级机器人的操作与交互能力。其中,灵动款2025灵巧手指指导价定为1.48万元,灵动触觉款首发线上价同样为1.48万元,原价1.98万元。这一系列产品的推出,标志着智元机器...
18:48
2025年8月18日,新横琴口岸迎来了其辉煌的五年庆典。这一重要跨境口岸自开通以来,不仅见证了区域经济的蓬勃发展,更成为连接粤港澳大湾区的关键纽带。据最新统计数据显示,截至8月17日17时,新横琴口岸累计验放人员已突破7560万人次,车辆通行量更是高达895万辆次,这一数字背后是年均增长率分别达55.6%和43.3%的惊人成绩。 作为粤港澳大湾区最繁忙的跨境...
18:48
2025年8月17日16时55分,北京时间精准定格在这一历史性时刻,我国在西昌卫星发射中心再次展现航天力量的巅峰技艺。长征四号丙运载火箭以雷霆万钧之势升空,将试验二十八号B星02星稳稳送入预定轨道,标志着我国航天事业迈入新纪元。此次发射任务不仅圆满成功,更彰显了我国在航天领域的卓越实力与持续创新精神。 试验二十八号B星02星肩负着空间环境探测的重要使命,其搭...
18:48
8月17日,西班牙国家气象局紧急发布最高级别警报,预警当日多个地区气温将飙升至惊人的45摄氏度。这场极端热浪引发全国关注,部分省份已进入红色预警状态,这意味着高温可能对民众健康和日常生活造成严重威胁。面对严峻的天气形势,相关部门紧急呼吁全体民众务必加强防暑降温措施,避免在高温时段长时间户外活动,并密切关注自身健康状况。此次高温预警不仅是对民众的提醒,更是对整...
18:03
2025年8月17日15时36分,湖北省气象台紧急发布高温橙色预警,提醒公众警惕即将到来的酷热天气。据最新气象数据预测,18日白天,除西部高海拔地区外,湖北省绝大部分地区气温将飙升到35℃至38℃之间。其中,十堰、襄阳、恩施北部、宜昌、武汉、鄂州、黄冈、黄石、咸宁等地的局部区域气温更可能突破39℃大关,甚至达到40℃以上。面对如此严峻的高温形势,气象部门强烈...
18:03
8月17日,中信证券最新研报揭示,当前市场赚钱效应显著增强,增量流动性持续注入市场。尽管宏观环境复杂多变,但投资机会依然存在。报告建议投资者重点关注五大强势行业:创新药、资源、通信、军工和游戏,这些行业展现出强劲的增长潜力。为方便投资者操作,上述行业均对应有相应的ETF产品,包括有色ETF、恒生创新药ETF、5G通信ETF、游戏ETF以及军工龙头ETF,为投...
18:03
2025年8月17日,海南省气象局紧急发布台风与暴雨四级预警,提醒公众高度关注南海热带低压的动态。该热带低压正加速向海南岛南部沿海逼近,预计在17日至18日期间,西沙群岛、海南岛周边及北部湾海面将普遍出现6至7级风力,局部地区伴有8级以上阵风。海南岛西南部地区更是面临严峻考验,预计将迎来暴雨到大暴雨级别降水,其中三亚、保亭、乐东和东方等核心区域强降水强度尤为...