您现在的位置是:首页 > 文章详情

EnCodec —— 基于深度学习的音频编解码器

日期:2022-11-14点击:1111

EnCodec 是一个基于深度学习的音频编解码器,由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

实现过程如下:

  • 首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);
  • 然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);
  • 最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

安装

EnCodec 需要 Python 3.8 和 PyTorch 1.11.0,要安装 EnCodec,可以运行:

pip install -U encodec  # stable release
pip install -U git+https://git@github.com/facebookresearch/encodec#egg=encodec  # bleeding edge
# of if you cloned the repo locally
pip install .

使用

然后,可以使用 EnCodec 命令:

python3 -m encodec [...]
# or
encodec [...]
 
原文链接:https://www.oschina.net/p/encodec
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章