谷歌推出 MusicLM,从文本生成音乐的模型

谷歌研究院宣布推出 MusicLM,这是一种从文本描述中生成高保真音乐的模型。MusicLM 将音乐的生成过程视为分层的序列到序列建模任务,并以 24 kHz 的频率生成音乐。

无论文本描述是一段话、一个故事,或仅为一个单词,MusicLM 都能生成对应对应的音乐,还能根据文本中的年代、时间、地点等要素来调整音乐的风格。

MusicLM 主页中有许多样本,可以看到,文本描述中有许多氛围描述的语句,比如“迷失在太空中的体验”、“营造出一种舒缓和冒险的氛围”、“唤起一种惊奇和敬畏的感觉”,也有一些具体的应用场景,比如“街机游戏的配乐”、“适合跳舞”。可以看 MusicLM 可以轻松驾驭这些模糊的描述和具体场景的组合 。

除了长文本,MusicLM 也能从一个单词或短语中创造出对应的旋律,比如“摇摆“、”轻松的爵士“、”旋律技术“等:

除此之外还可以按”故事模式“生成音乐,只需设定对应的时间戳,MusicLM 就会根据时间戳生成不同风格的音乐(不过转换起来非常生硬,有种”画风突变“的感觉)。

除了上述生成方式,MusicLM 还可以通过在描述文本中插入一些关键词来精修音乐,如”嗡嗡声“、”原声吉他“”指弹吉他“等。也可以通过”柏林 90 年代的房子“、”加勒比海的海滩“、”19世纪“等描述场景和时代等要素的词汇来调整音乐的风格。

据谷歌研究院介绍,MusicLM 在音频质量和对文本描述的理解方面都优于以前的音频生成 AI 系统,包括谷歌前几个月推出的 AudioLM。为了支持对 MusicLM 的质量评估,谷歌还发布了 MusicCaps 音乐数据集,这是一个由 5.5k 音乐-文本对组成的数据集,包含 5,521 个音乐示例,每个示例都标有由音乐家编写的描述文本。

不过 MusicLM 目前并没有对外公开的计划。根据谷歌方面的解释,首先是虽然大多数 MusicLM 生成的音乐还算自然,但很多时候也会生成一些”对人类文明似乎为时尚早“的诡异作品;其次就是 MusicLM 约有 1% 的旋律会直接抄袭训练的音乐数据,凭这一点就不敢公开了。毕竟关于 AI 艺术作品的版权问题正闹得沸沸扬扬,相信 GitHub Copilot 被起诉、 Stable Diffusion 因版权问题被起诉也给谷歌带来了不小的震撼。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/226617/google-musiclm

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。