位于伦敦的初创公司Stability AI近日重磅推出了一款名为Stable Audio的人工智能音乐生成工具,该产品能够从简单的文本输入中创造出高度定制化的音乐曲目和音效。Stable Audio的核心优势在于其强大的AI模型,能够以多种音乐流派进行创作,并通过用户友好的浏览器界面为创意专业人士提供便捷的音乐生成服务。这一创新工具特别适合需要快速获取高质量背景音乐的影视制作、游戏开发等领域从业者使用。

Stable Audio采用先进的扩散式AI技术,仅需几秒钟即可根据用户输入的文本描述生成定制音频文件。用户可以通过指定音乐风格、乐器类型、音调特征等参数,系统将自动创作出与之匹配的音乐作品。例如,当输入”后摇滚、吉他、鼓套、低音、弦乐、欢快、振奋、情绪化、流畅、原始、史诗、多愁善感、125BPM”等关键词时,系统会生成一首具有强烈氛围感的摇滚乐曲,节奏为125BPM。Stability AI表示,该工具能够胜任多种音乐风格的创作,包括氛围音乐、电子舞曲等。

与市面上其他AI音乐生成器不同,Stable Audio最突出的特点在于其能够生成长达90秒的音乐作品,且音频质量达到44.1kHz的专业水准。生成的音乐听起来极为真实,几乎难以分辨是否由人类创作。据Stability AI透露,借助Nvidia A100 GPU,95秒的音频内容可在不到一秒内完成生成,这一技术潜力巨大,有望在影视制作、游戏开发等领域发挥重要作用。

该工具通过网络浏览器即可访问,即使对人工智能技术不太了解的用户也能轻松上手。为了实现如此高质量的音乐生成效果,Stability AI与AudioSparx合作,利用其提供的音乐库进行模型训练。这个音乐库包含了约80万首歌曲、音效和乐器片段,AudioSparx承诺将音乐库产生的收入按比例分享给Stability AI,而参与训练的歌曲创作者也能通过AudioSparx分享Stable Audio的利润。据称,在训练前,所有创作者都已被询问是否同意其作品用于AI训练。

这一合作模式或是对Stability AI在Stable Diffusion项目培训素材版权问题上遭遇的争议做出的回应。Stability AI强调,用户可以免费将使用Stable Audio创作的音轨用于个人用途,而商业用途则需要付费订阅。该公司主要面向电影制片人、游戏开发者等创意专业人士,为他们提供快速获取定制背景音乐的解决方案。

Stability AI还计划发布一个基于不同数据集训练的开源音乐模型。虽然Stable Audio本身并非开源项目,但公司表示很快会推出基于其他数据集训练的开源音乐模型。Stable Audio的技术基础是2022年由Harmonai发布并得到Stability AI支持的Dance Diffusion模型,但Stable Audio是由Stability AI音频部门从零开始开发的全新模型。虽然使用扩散模型生成音乐并非全新概念,但Stable Audio的独特之处在于其能够生成不同长度的音乐作品,这是其训练过程中特别考虑到的设计要点。

Stable Audio的底层技术由潜在扩散模型构成,包含变分自动编码器(VAE)、文本编码器和基于U-net的扩散模型。VAE将立体声音频压缩为有损、抗噪声且可逆的潜在编码,从而实现更快的生成和训练速度。新训练的CLAP模型用于处理文本提示,而定时嵌入则在训练期间计算,用于控制输出音频的长度。Stable Audio的扩散模型基于Moûsai模型的9.07亿参数U-net架构。

用户可以通过专门为Stable Audio设计的网络界面使用该工具。个人用户每月可免费使用20首时长不超过45秒的歌曲,而商业用户只需支付11.99美元/月,即可获得500首时长可达90秒的歌曲,并获得商业使用许可。然而,由于缺乏内容过滤器,该工具存在被用于伪造知名艺术家歌曲的风险。尽管唱片公司已成功应对类似的人工智能创作挑战,但相关法律问题仍存在争议。

在接受Techcrunch采访时,Stability AI强调其致力于负责任地使用这项技术。虽然AudioSparx的数据库不包含流行歌曲,但其中许多歌曲仍以知名艺术家的风格进行标记。与谷歌的MusicLM不同,目前尚未屏蔽著名艺术家的名称。Stable Audio能否为Stability AI的商业模式带来盈利还有待观察,毕竟该公司至今仍处于亏损状态。但无论如何,人工智能创作出令人惊叹的音乐质量,已经让整个行业刮目相看。

最新快讯

2026年02月11日

15:52
微新创想:2026年2月10日至23日,抖音生活服务在全国范围内推出“新春吃喝玩乐节”春节大促活动。此次活动不仅为用户带来丰富的优惠,还融入了多种互动玩法,提升节日氛围与参与感。 用户在活动期间的每日12点、17点、20点,可以登录抖音“团购”首页或直接搜索“春节团购”参与抢红包活动。通过抢红包,用户有机会领取餐饮、娱乐等领域的满减券,以及各类实物奖品,享受...
15:52
微新创想:2026年2月10日,德国知名硬件厂商Sharkoon旋刚正式发布了SKILLER SGK55W机械键盘。这款新品以其独特的设计和出色的性能,迅速吸引了众多键盘爱好者的关注。 SKILLER SGK55W采用75%紧凑配列,结合旋钮式设计,兼顾了便携性与功能性。用户可以根据自己的使用习惯,灵活调整键盘的布局,提升打字效率与操作体验。 在连接方式上,...
15:52
微新创想:2026年2月11日,T3出行面向全国符合条件的网约车司机推出新春保险福利。该福利免费提供为期一年的门急诊医疗、住院医疗及意外伤害保障,单人最高保额达15万元。 此举系继春节工会关怀与补贴后的新春专项举措,公司累计投入数千万元。保障覆盖全国注册并符合运营时长、服务评分等条件的T3平台司机,旨在提升司机职业安全感与权益保障水平。 此次保险福利的推出,...
15:52
微新创想:2026年2月10日,台积电董事会在日本熊本厂召开,正式审议通过了2025年度员工分红方案。该方案的总金额高达2061.46亿元新台币,约合455.38亿元人民币,创下了历史新高。此次分红覆盖了公司约7.8万名员工,人均可获得约264万元新台币,约合58.3万元人民币,相比上一年度增长了31.58%。这一显著提升反映了台积电在2025年整体经营状况...
15:52
微新创想:2026年2月10日,瑞典开发商Hazelight工作室宣布其下一款游戏已进入开发阶段。创始人Josef Fares当晚通过社交媒体确认该消息,并配发动捕现场合影。这一举动不仅展示了团队的辛勤付出,也引发了玩家对新作的广泛关注。 工作室官方推特以幽默方式暗示项目进展,借用《黑神话:钟馗》梗称“正在烹制美味食物”。这种轻松的表达方式让粉丝们对即将发布...
15:52
微新创想:2026年2月,北京瑞孚医药科技有限公司完成Pre-A轮融资,协同创新产业投资基金领投。此次融资标志着公司在小核酸药物研发领域获得重要认可,为其后续发展注入强劲动力。 该公司专注于小核酸药物的研发,是一家具有创新能力和技术实力的科技型中小企业。其核心技术基于碳环核苷修饰(cLNA)平台,这一平台在提升药物稳定性与递送效率方面展现出显著优势,为小核酸...
15:52
微新创想: 马年将至,一头牛的表情包反而先火出了圈。最近,不管是和朋友私聊,还是在群聊里,葡萄君总能见到这只皱着眉头的草地牛。它确实很魔性,该怎么形容呢……草地牛的眼神有种深邃、严肃、成熟的认真感,但身体却是治愈童风的奶牛造型。再加上和眼神毫不搭边的大鼻孔、情绪波动不明显的嘴角,整体结合出一种「态度很严肃,但其实也没在干什么很严肃的事」「严肃是表象,幽默是内...
15:52
微新创想:近日,杭州滨江区一家名为“假装上班无限公司”的机构引发了广泛关注。该机构提供一种独特的付费服务——每天支付30元,便可租用工位“上班”。这种服务模式看似矛盾,却在短短两个月内吸引了40余人参与。 令人意外的是,这种付费方式并非简单的摆拍或虚假行为,而是通过严格的规则来模拟真实职场环境。在这里,付费用户不仅要自掏腰包,还需严格遵守一系列纪律要求,包括...
15:52
微新创想:2月10日,一段萌娃与父亲的趣味约定视频在网络引发热议。视频中,孩子与父亲约定“网友点赞数等于跳绳数量”,不料“好心”网友集体发力,点赞数迅速突破180万大关。面对这一意外结果,父亲哭笑不得地表示:“有点懵,但会督促孩子每天跳300个,循序渐进完成目标。” 这一事件也引发关于“网络约定边界”的讨论。部分网友认为,家长的及时引导避免了“流量绑架”孩子...
15:52
微新创想:国产大模型再次迎来“硬核”升级 2026年2月11日科大讯飞官方宣布正式发布星火X2大模型 这款模型的发布不仅标志着通用能力的全面跃升更重要的是它是基于全国产算力底座训练而成实现了从底层算力到顶层应用的自主可控 聚焦高专业性拒绝“空谈”AI与单纯追求通用性的模型不同星火X2在实现基础能力升级的同时将重心放在了对专业性要求极高的四大核心领域 教育场景...
15:52
微新创想:一张照片不仅胜过千言万语还可能预示着你职业生涯的“身价” 一项最新的学术研究表明利用 AI 对照片进行性格分析可以预测个人在劳动力市场中的表现包括薪资水平和晋升路径 研究团队在一篇名为《AI 从面部提取性格:劳动力市场影响》的论文中指出他们分析了超过 9.6 万名 MBA 毕业生的 LinkedIn 头像 通过算法提取出“大五人格”特征(开放性...
15:52
微新创想:阿维塔车主们期待已久的大版本更新终于落地。2026年2月11日,阿维塔官方宣布正式向全系车型推送 AVATR.OS5.0.0 版本系统。本次升级的核心在于深度融合了 AI 大模型能力,并同步升级至华为最前沿的智驾系统。 微新创想:MoLA 大模型:车载助手的“进化时刻” 本次更新最引人注目的亮点是 MoLA 大模型助手 的正式上线。语义理解更精准:...