谷歌开源的语音编解码器 Lyra V2 发布
Lyra 是谷歌去年开源的低比特率语音编解码器,与开放的 AV1 编解码器相结合,可以在 56kbps 的连接上实现语音聊天。Lyra 利用机器学习和其他技术来实现可在 3kbps 下运行的极低比特率语音压缩。 谷歌去年正式开源 Lyra,近日宣布推出 Lyra V2。与 V1 相比,Lyra V2 采用了新架构、支持更多平台、提供可扩展的比特率、具有更好的性能,可生成质量更高的音频。 采用新架构 Lyra V2 基于称为 SoundStream的端到端神经音频编解码器。该架构在传输通道之前和之后都有一个残差矢量量化器 (RVQ),它将编码信息量化为比特流并在解码器端对其进行重构。 提供更好的性能 新架构使延迟从之前版本的 100ms 减少到 20ms。在这方面,Lyra V2 可与目前使用最广泛的音频编解码器OpusforWebRTC相媲美,其典型延迟分别为 26.5ms、46.5ms 和 66.5ms。 Lyra V2 的编码和解码速度也比以前的版本快五倍。在 Pixel 6 Pro 手机上,Lyra V2 需要 0.57ms 来编码和解码 20ms 的音频帧,比实时快 35 倍。...