您现在的位置是:首页 > 文章详情

Stability AI 发布专业音频生成模型 Stable Audio 2.5

日期:2025-09-11点击:7

Stability AI 推出专业音频生成模型 Stable Audio 2.5,借助 Adversarial Relativistic-Contrastive(ARC)后训练技术,实现复杂音乐结构的高效生成。

在英伟达 H100 GPU 上,模型可在 2 秒内完成最长 3 分钟的音频创作,支持前奏、发展、尾声等多段落结构,并集成音频修复功能,允许用户上传现有音频进行续写。

该模型同步推出移动端轻量版 Stable Audio Open Small,可在手机端 7 秒内生成 11 秒立体声。为确保商用合规,Stable Audio 2.5 基于 licensed 数据集训练,并通过版权识别系统限制用户上传版权受限内容。

Stability AI 希望该技术能应用于广告、零售、品牌音效等多个领域,与 WPP 旗下的音效品牌代理机构 Amp 合作,为大型客户提供一致的音频识别服务。

Stability AI 的音频团队还可以根据公司的音效库调整模型,打造独特的音频标识。Stable Audio2.5 将通过 WPP Open 平台面向 WPP 的全球客户开放。

原文链接:https://www.oschina.net/news/371600/stability-ai-introduces-stable-audio-2-5
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章