位于伦敦的初创公司Stability AI近日重磅推出了一款名为Stable Audio的人工智能音乐生成工具,该产品能够从简单的文本输入中创造出高度定制化的音乐曲目和音效。Stable Audio的核心优势在于其强大的AI模型,能够以多种音乐流派进行创作,并通过用户友好的浏览器界面为创意专业人士提供便捷的音乐生成服务。这一创新工具特别适合需要快速获取高质量背景音乐的影视制作、游戏开发等领域从业者使用。

Stable Audio采用先进的扩散式AI技术,仅需几秒钟即可根据用户输入的文本描述生成定制音频文件。用户可以通过指定音乐风格、乐器类型、音调特征等参数,系统将自动创作出与之匹配的音乐作品。例如,当输入”后摇滚、吉他、鼓套、低音、弦乐、欢快、振奋、情绪化、流畅、原始、史诗、多愁善感、125BPM”等关键词时,系统会生成一首具有强烈氛围感的摇滚乐曲,节奏为125BPM。Stability AI表示,该工具能够胜任多种音乐风格的创作,包括氛围音乐、电子舞曲等。

与市面上其他AI音乐生成器不同,Stable Audio最突出的特点在于其能够生成长达90秒的音乐作品,且音频质量达到44.1kHz的专业水准。生成的音乐听起来极为真实,几乎难以分辨是否由人类创作。据Stability AI透露,借助Nvidia A100 GPU,95秒的音频内容可在不到一秒内完成生成,这一技术潜力巨大,有望在影视制作、游戏开发等领域发挥重要作用。

该工具通过网络浏览器即可访问,即使对人工智能技术不太了解的用户也能轻松上手。为了实现如此高质量的音乐生成效果,Stability AI与AudioSparx合作,利用其提供的音乐库进行模型训练。这个音乐库包含了约80万首歌曲、音效和乐器片段,AudioSparx承诺将音乐库产生的收入按比例分享给Stability AI,而参与训练的歌曲创作者也能通过AudioSparx分享Stable Audio的利润。据称,在训练前,所有创作者都已被询问是否同意其作品用于AI训练。

这一合作模式或是对Stability AI在Stable Diffusion项目培训素材版权问题上遭遇的争议做出的回应。Stability AI强调,用户可以免费将使用Stable Audio创作的音轨用于个人用途,而商业用途则需要付费订阅。该公司主要面向电影制片人、游戏开发者等创意专业人士,为他们提供快速获取定制背景音乐的解决方案。

Stability AI还计划发布一个基于不同数据集训练的开源音乐模型。虽然Stable Audio本身并非开源项目,但公司表示很快会推出基于其他数据集训练的开源音乐模型。Stable Audio的技术基础是2022年由Harmonai发布并得到Stability AI支持的Dance Diffusion模型,但Stable Audio是由Stability AI音频部门从零开始开发的全新模型。虽然使用扩散模型生成音乐并非全新概念,但Stable Audio的独特之处在于其能够生成不同长度的音乐作品,这是其训练过程中特别考虑到的设计要点。

Stable Audio的底层技术由潜在扩散模型构成,包含变分自动编码器(VAE)、文本编码器和基于U-net的扩散模型。VAE将立体声音频压缩为有损、抗噪声且可逆的潜在编码,从而实现更快的生成和训练速度。新训练的CLAP模型用于处理文本提示,而定时嵌入则在训练期间计算,用于控制输出音频的长度。Stable Audio的扩散模型基于Moûsai模型的9.07亿参数U-net架构。

用户可以通过专门为Stable Audio设计的网络界面使用该工具。个人用户每月可免费使用20首时长不超过45秒的歌曲,而商业用户只需支付11.99美元/月,即可获得500首时长可达90秒的歌曲,并获得商业使用许可。然而,由于缺乏内容过滤器,该工具存在被用于伪造知名艺术家歌曲的风险。尽管唱片公司已成功应对类似的人工智能创作挑战,但相关法律问题仍存在争议。

在接受Techcrunch采访时,Stability AI强调其致力于负责任地使用这项技术。虽然AudioSparx的数据库不包含流行歌曲,但其中许多歌曲仍以知名艺术家的风格进行标记。与谷歌的MusicLM不同,目前尚未屏蔽著名艺术家的名称。Stable Audio能否为Stability AI的商业模式带来盈利还有待观察,毕竟该公司至今仍处于亏损状态。但无论如何,人工智能创作出令人惊叹的音乐质量,已经让整个行业刮目相看。

最新快讯

2025年10月29日

06:27
10月29日清晨至上午时段,我国多个地区将遭遇大雾天气的困扰。北京、天津、河北、陕西、河南、山东、湖北、湖南、贵州等省份的部分区域将受到大雾影响,其中北京南部、天津北部、河北中南部以及河南北部等地雾气尤为严重,能见度将降至500米以下,局部地区甚至不足200米,对出行造成极大不便。 中央气象台已于当日凌晨6时正式发布大雾黄色预警,提醒广大公众尽量避免晨间户外...
05:57
2025年10月29日,科技巨头苹果公司正式揭晓了其产品线的重大升级计划,宣布将MacBook Air和iPad系列产品的显示屏技术进行全面革新。据行业消息透露,苹果将借鉴iPhone的成功经验,引入先进的OLED显示屏技术,旨在为用户带来前所未有的视觉盛宴。此次升级不仅限于iPad Pro,更涵盖了包括iPad mini在内的多款热门型号,预示着苹果正逐步...
05:24
2025年10月28日,美国股市上演了一场鲜明的板块分化行情。在整体市场波动中,科技板块异军突起,成为当日表现最亮眼的板块。全球科技股指数ETF逆势上涨1.38%,展现出强劲的增长动力。细分领域同样表现不俗,科技行业ETF上涨0.99%,半导体ETF更是录得0.88%的涨幅,显示出市场对科技股的持续看好。特别是在标普500指数中,信息技术板块涨幅高达1.64...
05:24
诺基亚首席执行官Patrik Hotard近日公开强调,公司与全球知名科技巨头英伟达的战略合作将共同开启无线通信技术的创新纪元。双方将强强联手,聚焦于人工智能驱动的无线网络解决方案研发,致力于加速6G技术的商业化进程。根据规划,这项具有里程碑意义的合作产品预计在2027年实现全球范围内的全面商业化部署,而首批客户的试点测试计划将于2026年初正式启动。 此次...
05:24
2025年10月29日,全球知名食品饮料公司亿滋国际正式发布最新业绩指引,宣布将全年有机净营收增长预期从原先的5%下调至约4%。这一调整主要受到两大因素影响:部分核心市场的消费需求出现放缓迹象,以及全球汇率波动带来的不利冲击。尽管面临外部环境挑战,亿滋国际强调其核心品牌在亚太、欧洲等多个关键区域依然展现出强劲的市场韧性,持续保持稳健增长态势。为应对当前复杂的...
04:52
苹果公司于今日正式向全球iPhone和iPad用户推送了iOS/iPadOS 18.7.2 RC(Release Candidate)版本更新,其内部版本号为22H123。此次更新距离上一个测试版本发布已过去了整整49天,充分展现了苹果在软件迭代方面的严谨与高效。对于广大果粉而言,这是一个不容错过的系统优化机会。 想要升级至最新测试版系统的用户,主要有两种途...
04:52
苹果公司于今日正式向iPhone和iPad用户推送了备受期待的iOS/iPadOS 26.1 RC测试版更新,内部版本号为23B82。此次更新距离上一轮测试版发布仅相隔8天,充分展现了苹果公司快速迭代和精益求精的开发节奏。用户可以通过两种途径参与本次系统升级体验:对于公开测试版,用户需要提前注册Apple Beta版软件计划,并在系统设置中手动开启Beta版...
04:52
苹果公司今日正式向Mac用户发布了macOS 26.1 RC更新,其内部版本号为25B77。值得注意的是,距离上一轮Beta/RC版本发布仅过去了短短8天,这一密集的更新节奏充分展现了系统优化已进入关键冲刺阶段。从历史发布记录来看,macOS 26系列自今年6月启动测试以来,已经经历了多轮次的迭代与调试,而近期的工作重点则明显转向了系统稳定性的全面提升。 本...
04:52
苹果公司近日向Vision Pro用户正式发布visionOS 26.1 RC版本更新,内部版本号为23N48。此次更新仅距离上一个测试版本发布8天,彰显了苹果在空间计算系统开发上的惊人速度。根据官方更新日志,由于全球服务器节点配置存在差异,部分地区用户可能会遇到更新时间延迟,但通常不会超过半小时。从版本发布历史来看,visionOS 26自今年6月启动测试...
04:52
苹果公司今日正式向全球Apple Watch用户推送了备受期待的watchOS 26.1 RC版本(内部版本号为23S36),这一重要更新标志着该操作系统距离最终正式发布仅一步之遥。值得注意的是,此次RC版本的发布距离上一轮Beta/RC版本仅相隔8天,这一紧凑的更新周期清晰地反映出苹果在系统开发方面的节奏已趋于稳定,预示着后续版本迭代将更加高效有序。 回顾...
04:21
2025年10月29日,在华盛顿GTC全球科技大会上,英伟达CEO黄仁勋发表了掷地有声的演讲,有力驳斥了当时甚嚣尘上的AI泡沫论。他不仅描绘了英伟达未来的宏伟蓝图,更透露了公司最新研发的Blackwell芯片及Rubin模型将在未来五个季度内创造高达5000亿美元收入的惊人目标。 大会上,英伟达展示了与优步、Palantir和CrowdStrike等知名...
03:44
2025年10月29日,微软正式宣布将在Azure云平台率先推出搭载NVIDIA RTX Pro 6000 Blackwell服务器版GPU的尖端计算服务。这一创新举措专为提升人工智能与高性能计算能力而设计,将全面面向企业客户开放使用。该服务的推出不仅彰显了微软与NVIDIA在AI基础设施领域的深度战略合作,更预示着Azure将在全球云计算市场迎来新的竞争优...