Meta 推出 SeamlessM4T,可转录和翻译近 100 种语言
Meta 宣布推出 SeamlessM4T,一种基础的多语言和多任务模型,可以无缝翻译和转录语音和文本。SeamlessM4T 支持:
- 自动语音识别近百种语言
- 近 100 种输入和输出语言的语音到文本翻译
- 语音翻译,支持近 100 种输入语言和 35 种(+英语)输出语言
- 近 100 种语言的文本到文本翻译
- 文本转语音翻译,支持近 100 种输入语言和 35种(+英语)输出语言
目前,SeamlessM4T 已在 CC BY-NC 4.0 许可下发布,以便研究人员可以在此基础上进行开发。与此同时,Meta 还发布了一个多模式翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。
Meta 表示,现有的语音转语音和语音转文本程序仅覆盖世界上一小部分语言, 而 SeamlessM4T 代表了语音到语音和语音到文本领域的重大突破,它解决了语言覆盖面有限和依赖独立系统的难题,将语音到语音的翻译任务分成多个阶段,跨越多个子系统。
“我们所面临的挑战是创建一个可以完成这一切的统一多语言模型。我们相信,我们今天宣布的工作是在这一征程中迈出的重要一步。我们的单一模式可提供按需翻译,让使用不同语言的人能够更有效地交流。我们显着提高了我们支持的中低资源语言的性能...... SeamlessM4T 能隐式识别源语言,无需单独的语言识别模型。”
SeamlessM4T 建立在 Meta 在该领域的现有工作基础上,包括 No Language Left Behind、Universal Speech Translator、SpeechMatrix 和 Massively Multilingual Speech。
Meta 方面表示,他们在研发过程中遵循"five pillars of Responsible AI"指导原则;并进行了毒性和偏见研究,以了解模式中可能存在的敏感区域。并对模型进行了性别偏见评估,目前已能够量化数十个语音翻译方向的性别偏见。
当使用允许跨语音和文本单元进行评估的 BLASER 2.0 进行测试时,与目前最先进的语音到文本任务模型相比,SeamlessM4T 模型在语音到文本任务中对抗背景噪声和说话者变化的表现更好(平均分别提高了 37% 和 48%)。“SeamlessM4T 的性能也优于之前最先进的竞争对手。”
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
自动跳过开屏广告应用「李跳跳」无限期停止更新
“李跳跳”是一款利用无障碍权限进行跳过 APP 开屏广告的 Android 辅助应用,无需联网,免费使用。 今日凌晨,“李跳跳”作者在公众号宣布无限期停止更新,原因是收到了某集团律师函,对方称“李跳跳” APP 涉嫌不正当竞争,对旗下的浏览器产生影响,并要求四十八小时内全网下架“李跳跳”。 最后附上开发者对此事的看法: 除了“李跳跳”,其他同类开屏广告应用近日都收到了律师函,比如“大圣净化”、“一指禅”和“叮小跳”。
- 下一篇
龙芯中科:上半年营收 3 亿、亏损 1 亿
2023年8月23日,龙芯中科发布《2023年半年度报告》。 龙芯中科2023年半年度报告 龙芯中科2023年半年度报告摘要 2023 年上半年,公司营业收入 3.08 亿元,与去年同期 3.48 亿元相比下降 11.43%;归属上市公司的股东净亏损为 1.038 亿元,比去年同期的净利润 8876.33 万元下降了 216.92%。 2023 年上半年费用化研发投入 1.97 亿,同比增长 57.64%: 研发人员共 620 人,上半年平均薪酬为 24.6 万元,平均月薪超 4 万元。 本月初,龙芯中科宣布,基于龙架构的新一代四核处理器龙芯 3A6000 流片成功,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。 龙芯 3A6000 处理器是龙芯第四代微架构的首款产品,集成 4 个最新研发的高性能 6 发射 64 位 LA664 处理器核。主频达到 2.5GHz,支持 128 位向量处理扩展指令(LSX)和 256 位高级向量处理扩展指令(LASX),支持同时多线程技术(SMT2),全芯片共 8 个逻辑核。龙芯 3A6000 处理器采用龙芯自主指令系统龙架构(LoongArch...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路