Google 开源 Lyra 编解码器,利用机器学习减少语音通话带宽使用
在疫情的持续影响下,过去一年多的时间表明,在线交流对我们的生活十分重要。无论你身处何地,无论网络条件如何,清楚地了解彼此的在线情况从未像现在这样重要。这就是为什么 Google 在 2 月份推出了 Lyra 的原因:一个革命性的新音频编解码器,使用机器学习来产生高质量的语音通话。
为了让这个编解码器变得更加完善,Google 近日通过官方博客宣布将 Lyra 进行开源,允许其他开发者为他们的通信应用提供助力。这个版本提供了开发者使用 Lyra 进行音频编码和解码所需的工具,针对 64 位 ARM Android 平台进行了优化,并在 Linux 上进行了开发。Google 希望能够扩展这个代码库,并与社区一起开发对其他平台的支持和改进。
Lyra 架构
Lyra的架构分为两部分,编码器和解码器。当有人对着手机说话时,编码器会从他们的语音中捕捉独特的属性。这些语音属性,也称为特征,以40ms为单位提取,然后压缩并通过网络发送。解码器的工作是将这些特征转换回音频波形,以便通过电话听筒播放出来。
将特征解码回波形的过程是通过生成模型(Generative models)处理的,生成模型是一种特殊类型的机器学习模型,非常适合从有限的特征中重新创建一个完整的音频波形。Lyra架构与传统的音频编解码器非常相似,几十年来,传统的音频编解码器已经构成了互联网通信的主干。这些传统的编解码器是基于数字信号处理(DSP)技术,而 Lyra 的关键优势来自于生成模型重建高质量语音信号的能力。
Lyra 架构图
影响
在过去十年中,设备上计算能力的爆炸性增长超过了可靠的高速无线基础设施的建设。对于存在这种反差的地区——特别是对发展中国家而言,技术将使人们能够更紧密地联系在一起的承诺仍然遥遥无期。即使在拥有高度可靠网络环境的地区,"随时随地"工作和远程办公的出现也进一步限制了移动数据的使用。虽然 Lyra 将原始音频压缩到 3kbps,质量优于其他编解码器(如 Opus),但它并不打算成为一个完全的替代方案,而是可以在这种情况下节省带宽。
此外,Google 还认识到 Lyra 可能会有其他一些独特的应用,由于 Lyra 可以显著减少音频文件大小,因此可以用于存档大量的语音;通过利用 Lyra 编码器来节省移动设备的电量;缓解紧急情况下许多人试图同时拨打电话的网络拥堵。
开源版本
Lyra 的代码是用 C++ 所编写的,以提高速度、效率和互操作性,使用 Bazel 构建框架和 GoogleTest 框架进行彻底的单元测试,并基于 Apache 许可协议进行分发。感兴趣的用户可以访问 GitHub 查看源代码及演示。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
亚马逊和红帽宣布 OpenShift 服务在 AWS 上全面可用
亚马逊和红帽日前宣布 AWS 上的红帽 OpenShift Service (ROSA) 全面可用,这是一项通过 AWS Console 提供的新管理服务,使红帽 OpenShift 客户更容易在 AWS 上构建、扩展和管理容器化应用。通过 ROSA,用户可以使用熟悉的红帽 OpenShift 控制台、功能和工具享受更简化的 Kubernetes 集群创建,而没有手动扩展和管理底层基础设施的负担。 他们表示,ROSA 简化了将内部红帽 OpenShift 工作负载转移到 AWS 的过程,并提供了与其他 AWS 服务更紧密的集成。ROSA 还使客户能够直接通过 AWS 访问红帽 OpenShift 并获得计费和支持,为在 AWS 上运行红帽 OpenShift 的用户提供单一供应商的简单体验。 亚马逊和红帽表示:"事实证明,容器受到 AWS 和红帽用户的欢迎,因为它们提高了开发人员的速度,改善了应用的可移植性。目前,AWS 在云端提供了最广泛的容器技术,包括为希望与 AWS 服务进行最深度集成的用户提供的 Amazon Elastic Containers Service(ECS),以及...
- 下一篇
最新开源索引发布:VSCode 成为第一代码编辑器、百度 Apollo 增长最快
投资机构 Two Sigma Ventures 上周发布了最新的开源索引(Open Source Index),这是一份 GitHub 上最受欢迎且增长最快的 TOP100 开源项目的目录。 值得一提的是,这份开源索引对项目考察的指标不包括其在 GitHub 的 Star 数量,具体的分数由下面列出的变量的加权平均值计算出来,这个分数被 Two Sigma Ventures 称为“TSV 分数”(TSV Score)。 Watcher数量 (40%) –项目的 Watcher 数量是评估项目受欢迎程度的主要指标 Watcher 增长量 (25%) – 项目在过去一个季度的 Watcher 增长量代表了它在开发者生态系统中的发展趋势 Contributor 数量(15%) –contributor 数量反映了社区活跃程度 发布节奏 (10%) – 根据项目在其生命周期中已经提交的 commit 次数来计算发布节奏,该指标主要是反映项目的发展和增长速度 社区健康度评分 (10%) –这里使用了 Github 自己的社区健康度评分指标,该指标评估了一个仓库及其文档的维护情况 根据上述评估策略...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS8编译安装MySQL8.0.19
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能