Google 推出神经网络编解码器 SoundStream,将整合进开源项目 Lyra
Google 近日发布了一个端到端的神经音频编解码器 —— SoundStream
。最重要的是,Google 表示这是世界上第一个由神经网络驱动并支持语音、音乐和环境声音等不同声音类型的音频编解码器,可以在智能手机的处理器上实时处理上述各种音频。
音频编解码器是压缩音频文件的基本工具,以使其体积更小,并在传输过程中尽可能节省时间。因此,音频编解码器对于流媒体、在线语音和视频通话这类有音频传输需求的服务而言至关重要。
虽然音频编解码器能够压缩音频体积,加速音频传输过程,但压缩后的音频也会损失音频质量和细节,产生可以让用户察觉到的差异。而这就是 SoundStream 能够弥补的地方。
今年 2 月的时候,Google 发布了一个用于低比特率语音的神经音频编解码器 Lyra,并在今年 4 月正式开源。SoundStream 是 Lyra 的一个扩展版本。SoundStream 不仅集成了 Lyra 在低比特率「语音」方面的能力,还具有对更多声音类型的编码支持,包括清晰的语音、嘈杂的语音、带有回声的语音、音乐和环境声音等。
SoundStream 是围绕一个由编码器、解码器和量化器组成的神经网络系统而建立的。编码器将音频转换为编码信号,之后使用量化器进行压缩,并使用解码器转换回音频。因此,在经过训练神经网络模型后,编码器和解码器可以在不同的客户端工作,有助于在各种环境下以不损失质量的前提传输音频。
Google 已经在网站上发布了不同音频压缩样本与原始音频样本的对比。通过对比测试,经过 SoundStream 处理过的 3 kbps 的音频要优于 Opus 音频编解码器处理过的 12 kbps 音频,效果与 ECS 编解码器处理过的 9 kbps 十分接近。
目前 Google 自己的在线会议平台 Google Meet 和视频平台 YouTube 仍在使用 Opus 音频编解码器。随着 SoundStream 技术的不断进步,可能很快就能看到 Google 将在自己的服务中使用自己的技术。
Google 表示,SoundStream 是将机器学习技术应用在音频编解码器中重要的一步,比目前最先进的编解码器 Opus 和 EVS 效果更好。SoundStream 将被整合进 Lyra,并随着 Lyra 下一版本的发布一同推出。开发人员可以利用现有的 Lyra API 和工具,来提供更好的音质。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
.NET 6 Preview 7 发布
.NET 6 Preview 7 现已。这是发布 RC 版本之前的最后一次预览。本次更新包括对各种功能的最后一点润色,以及一次性的大型功能发布,并且受 Visual Studio 2022 Preview 3 支持。 .NET SDK:现代化的 C# 项目模板 该版本更新了 .NET SDK 模板以使用最新的 C# 语言功能和模式。新模板中使用了以下语言功能: Top-level 语句 异步Main 全局 using 指令(通过 SDK 驱动的默认值) 文件范围的命名空间 目标类型的新表达式 可空引用类型 通过项目模板启用这些功能,新代码可以从启用这些功能开始,但升级时现有代码不受影响。 var builder = WebApplication.CreateBuilder(args); var app = builder.Build(); if (app.Environment.IsDevelopment()) { app.UseDeveloperExceptionPage(); } app.MapGet("/", () => "Hello World!"...
- 下一篇
GoLand 2021.3 路线图公布
Goland2021.2稳定版已于几周前正式发布。现在,下一个大版本 2021.3的开发计划也已经公布,具体路线图如下: Go 1.17 开发团队计划为使用泛型添加代码检查、重构和意图动作。在此基础上,其将引入一种新的 workspace 模式,以使得从一个地方跨多个模块实施更改成为可能。 支持 WSL 计划添加在 WSL 下使用 Go SDK 的功能。 Code Inspections 计划在 GoLand 中集成 go linter。因此,用户将不再需要为此目的配置 File Watchers。 Debugger GoLand 2021.3 将允许用户在不需要时隐藏对象类型,以最大限度地减少 CPU 消耗。 Code Editing GoLand 将帮助在以 select、delete、insert、update 或 create 命令开头的每个字符串中立即注入 SQL。 Other 将添加对asdf 的支持,让你可以在每个项目的基础上管理多个语言运行时版本。 将添加更多用于测试的模板。 值得注意的是,Goland 团队并不保证路线图中所列出的这些功能会全都包含在 GoLand 2...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7,8上快速安装Gitea,搭建Git服务器