位于伦敦的初创公司Stability AI近日重磅推出了一款名为Stable Audio的人工智能音乐生成工具,该产品能够从简单的文本输入中创造出高度定制化的音乐曲目和音效。Stable Audio的核心优势在于其强大的AI模型,能够以多种音乐流派进行创作,并通过用户友好的浏览器界面为创意专业人士提供便捷的音乐生成服务。这一创新工具特别适合需要快速获取高质量背景音乐的影视制作、游戏开发等领域从业者使用。

Stable Audio采用先进的扩散式AI技术,仅需几秒钟即可根据用户输入的文本描述生成定制音频文件。用户可以通过指定音乐风格、乐器类型、音调特征等参数,系统将自动创作出与之匹配的音乐作品。例如,当输入”后摇滚、吉他、鼓套、低音、弦乐、欢快、振奋、情绪化、流畅、原始、史诗、多愁善感、125BPM”等关键词时,系统会生成一首具有强烈氛围感的摇滚乐曲,节奏为125BPM。Stability AI表示,该工具能够胜任多种音乐风格的创作,包括氛围音乐、电子舞曲等。

与市面上其他AI音乐生成器不同,Stable Audio最突出的特点在于其能够生成长达90秒的音乐作品,且音频质量达到44.1kHz的专业水准。生成的音乐听起来极为真实,几乎难以分辨是否由人类创作。据Stability AI透露,借助Nvidia A100 GPU,95秒的音频内容可在不到一秒内完成生成,这一技术潜力巨大,有望在影视制作、游戏开发等领域发挥重要作用。

该工具通过网络浏览器即可访问,即使对人工智能技术不太了解的用户也能轻松上手。为了实现如此高质量的音乐生成效果,Stability AI与AudioSparx合作,利用其提供的音乐库进行模型训练。这个音乐库包含了约80万首歌曲、音效和乐器片段,AudioSparx承诺将音乐库产生的收入按比例分享给Stability AI,而参与训练的歌曲创作者也能通过AudioSparx分享Stable Audio的利润。据称,在训练前,所有创作者都已被询问是否同意其作品用于AI训练。

这一合作模式或是对Stability AI在Stable Diffusion项目培训素材版权问题上遭遇的争议做出的回应。Stability AI强调,用户可以免费将使用Stable Audio创作的音轨用于个人用途,而商业用途则需要付费订阅。该公司主要面向电影制片人、游戏开发者等创意专业人士,为他们提供快速获取定制背景音乐的解决方案。

Stability AI还计划发布一个基于不同数据集训练的开源音乐模型。虽然Stable Audio本身并非开源项目,但公司表示很快会推出基于其他数据集训练的开源音乐模型。Stable Audio的技术基础是2022年由Harmonai发布并得到Stability AI支持的Dance Diffusion模型,但Stable Audio是由Stability AI音频部门从零开始开发的全新模型。虽然使用扩散模型生成音乐并非全新概念,但Stable Audio的独特之处在于其能够生成不同长度的音乐作品,这是其训练过程中特别考虑到的设计要点。

Stable Audio的底层技术由潜在扩散模型构成,包含变分自动编码器(VAE)、文本编码器和基于U-net的扩散模型。VAE将立体声音频压缩为有损、抗噪声且可逆的潜在编码,从而实现更快的生成和训练速度。新训练的CLAP模型用于处理文本提示,而定时嵌入则在训练期间计算,用于控制输出音频的长度。Stable Audio的扩散模型基于Moûsai模型的9.07亿参数U-net架构。

用户可以通过专门为Stable Audio设计的网络界面使用该工具。个人用户每月可免费使用20首时长不超过45秒的歌曲,而商业用户只需支付11.99美元/月,即可获得500首时长可达90秒的歌曲,并获得商业使用许可。然而,由于缺乏内容过滤器,该工具存在被用于伪造知名艺术家歌曲的风险。尽管唱片公司已成功应对类似的人工智能创作挑战,但相关法律问题仍存在争议。

在接受Techcrunch采访时,Stability AI强调其致力于负责任地使用这项技术。虽然AudioSparx的数据库不包含流行歌曲,但其中许多歌曲仍以知名艺术家的风格进行标记。与谷歌的MusicLM不同,目前尚未屏蔽著名艺术家的名称。Stable Audio能否为Stability AI的商业模式带来盈利还有待观察,毕竟该公司至今仍处于亏损状态。但无论如何,人工智能创作出令人惊叹的音乐质量,已经让整个行业刮目相看。

最新快讯

2025年12月20日

08:35
2025年12月19日,OpenAI为ChatGPT带来了令人期待的全新功能升级,旨在让用户能够更精细地掌控AI的沟通风格与情感表达。这一重要更新不仅覆盖了网页版与移动应用,更在设置界面中引入了直观的调节选项,让用户可以根据具体需求,灵活调整GPT的"温和体贴"与"热情洋溢"程度。此外,新增的性格类型选择,包括"专业可靠"、"亲和友善"等多元选项,进一步丰富...
08:35
三星于2025年12月18日重磅发布专为AI数据中心量身打造的SOCAMM2 LPDDR5X内存模块,这一创新产品基于先进的LPDDR5X DRAM技术,采用模块化可拆卸设计,完美兼容现有主板架构,为用户带来前所未有的便捷升级体验。与传统的RDIMM相比,该模块实现了带宽的惊人提升超过两倍,同时功耗降低幅度高达55%以上,从源头上显著增强了AI服务器的综合性...
08:35
2025年12月19日,微软正式向Windows Insider计划成员发布了备受期待的Windows 11 Copilot应用重大更新,版本号达到1.25121.60.0及以上。此次更新以"实时文本编辑"为核心亮点,通过深度整合Copilot Actions与Copilot Vision技术,为用户带来革命性的桌面交互体验。新功能允许用户在共享窗口状态下,...
08:35
2025年12月20日08时至21日08时,我国多个地区将迎来大风天气,需特别注意防范。内蒙古中东部、华北北部、山东半岛以及西藏北部和青海南部等地部分地区预计将有5至6级风力,阵风强度可达7至8级,对当地交通和户外活动造成一定影响。 与此同时,黄海、东海和台湾海峡等海域风力也将显著增强,普遍出现7至8级大风,阵风更可达9级,对海上航行和作业构成潜在威胁。 ...
08:04
2025年12月20日,备受瞩目的CES 2026展会即将拉开帷幕,联想将在此次科技盛宴中重磅发布一款颠覆性的概念笔记本——ThinkPad Rollable XD Concept。这款笔记本以其独特的垂直卷轴设计,彻底颠覆了传统笔记本的形态,为用户带来前所未有的视觉与交互体验。 该设备最引人注目的特点在于其可伸缩的屏幕。13.3英寸的显示屏能够平滑地扩展至...
08:04
2025年12月20日,科技界迎来重大突破——苹果公司与普渡大学联合研发的AI图像增强技术DarkDiff正式问世。这项创新技术专注于解决手机摄影在极低光照环境下的核心痛点,为用户带来前所未有的暗光拍摄体验。DarkDiff通过将生成式扩散模型深度集成至相机图像信号处理器ISP流程的早期阶段,实现了对原始Raw数据的直接处理。这一技术突破的关键在于,它能够在...
07:34
2026年1月15日起,OpenAI将正式终止macOS桌面版ChatGPT应用中的“语音模式”功能。这一重要调整旨在实现跨平台语音体验的统一化,并全面提升技术标准。对于Mac用户而言,尽管语音功能将不再可用,但文本对话及其他核心功能仍将保持正常服务。用户若需使用语音交互,将需要通过网页端或移动设备进行访问。值得注意的是,Windows、iOS、Androi...
07:34
沪电股份近日正式向香港交易所递交了上市申请,联席保荐机构由中金公司及汇丰银行联合担任。这家公司早在2010年便在深圳证券交易所成功挂牌上市,长期专注于印制电路板(PCB)产品的研发与制造,其产品广泛应用于数据通讯和智能汽车等前沿领域,市场地位稳固。 报告期内,沪电股份展现出强劲的增长势头,公司总收入从83.36亿元稳步提升至133.42亿元,净利润也实现了从...
07:34
2025年12月18日,知名科技媒体Six Colors发布重磅报道,揭示了苹果公司在iOS 26.2系统更新后的一项重大策略调整。据悉,苹果已全面停止向仍运行iOS 18但硬件支持iOS 26的iPhone用户提供独立安全补丁iOS 18.7.3的推送。这一举措的核心原因在于,iOS 26.2更新集中修复了Safari浏览器引擎WebKit中存在的两个高危...
07:03
2025年12月19日,苹果公司正式宣布停止对iOS 26.1系统的签名服务。这一重要决策意味着所有已升级至iOS 26.2或更高版本的iPhone用户,将无法再通过Finder或Apple Devices应用等官方途径降级回iOS 26.1版本。作为替代方案,苹果官方目前仅开放iOS 26.2作为最低可降级版本,同时已向开发者和公众测试者广泛推送了iOS ...
07:03
2025年12月20日,全球航空制造业巨头波音公司正式向美国联邦航空管理局(FAA)递交了一份关键申请,旨在获得延续生产777货运飞机的许可,使其制造周期得以延长至2028年之后。这一战略举措的核心目标在于精准响应并满足当前全球范围内持续增长的航空货运市场需求,确保关键物流链的稳定与高效运转。 波音公司表示,未来数年间将全面投入资源,致力于对现有供应链体系进...
04:30
2025年12月20日,科技巨头谷歌正式对数据服务公司Serpapi提起诉讼,这起备受瞩目的法律纠纷在美国正式拉开序幕。据悉,此次诉讼的核心争议聚焦于Serpapi通过自动化技术大规模抓取谷歌搜索结果数据的行为。谷歌在诉讼中明确指控Serpapi违反了双方的服务条款,并涉嫌触犯相关法律法规,其自动化抓取行为不仅严重损害了谷歌的系统安全,也对公司的商业利益构成...