Meta 推出 SeamlessM4T，可转录和翻译近 100 种语言-低调大师

Meta 推出 SeamlessM4T，可转录和翻译近 100 种语言

2023-08-24 983

Meta 宣布推出 SeamlessM4T，一种基础的多语言和多任务模型，可以无缝翻译和转录语音和文本。SeamlessM4T 支持：

自动语音识别近百种语言
近 100 种输入和输出语言的语音到文本翻译
语音翻译，支持近 100 种输入语言和 35 种（+英语）输出语言
近 100 种语言的文本到文本翻译
文本转语音翻译，支持近 100 种输入语言和 35种（+英语）输出语言

目前，SeamlessM4T 已在 CC BY-NC 4.0 许可下发布，以便研究人员可以在此基础上进行开发。与此同时，Meta 还发布了一个多模式翻译数据集 SeamlessAlign，包含 270,000 小时的语音和文本对齐。

Meta 表示，现有的语音转语音和语音转文本程序仅覆盖世界上一小部分语言，而 SeamlessM4T 代表了语音到语音和语音到文本领域的重大突破，它解决了语言覆盖面有限和依赖独立系统的难题，将语音到语音的翻译任务分成多个阶段，跨越多个子系统。

“我们所面临的挑战是创建一个可以完成这一切的统一多语言模型。我们相信，我们今天宣布的工作是在这一征程中迈出的重要一步。我们的单一模式可提供按需翻译，让使用不同语言的人能够更有效地交流。我们显着提高了我们支持的中低资源语言的性能...... SeamlessM4T 能隐式识别源语言，无需单独的语言识别模型。”

SeamlessM4T 建立在 Meta 在该领域的现有工作基础上，包括 No Language Left Behind、Universal Speech Translator、SpeechMatrix 和 Massively Multilingual Speech。

Meta 方面表示，他们在研发过程中遵循"five pillars of Responsible AI"指导原则；并进行了毒性和偏见研究，以了解模式中可能存在的敏感区域。并对模型进行了性别偏见评估，目前已能够量化数十个语音翻译方向的性别偏见。

当使用允许跨语音和文本单元进行评估的 BLASER 2.0 进行测试时，与目前最先进的语音到文本任务模型相比，SeamlessM4T 模型在语音到文本任务中对抗背景噪声和说话者变化的表现更好（平均分别提高了 37% 和 48%）。“SeamlessM4T 的性能也优于之前最先进的竞争对手。”

更多详情可查看官方博客。

微信关注我们

原文链接：https://www.oschina.net/news/255168/meta-seamless-m4t

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

自动跳过开屏广告应用「李跳跳」无限期停止更新

“李跳跳”是一款利用无障碍权限进行跳过 APP 开屏广告的 Android 辅助应用，无需联网，免费使用。今日凌晨，“李跳跳”作者在公众号宣布无限期停止更新，原因是收到了某集团律师函，对方称“李跳跳” APP 涉嫌不正当竞争，对旗下的浏览器产生影响，并要求四十八小时内全网下架“李跳跳”。最后附上开发者对此事的看法：除了“李跳跳”，其他同类开屏广告应用近日都收到了律师函，比如“大圣净化”、“一指禅”和“叮小跳”。

2023-08-24

895

2023年8月23日，龙芯中科发布《2023年半年度报告》。龙芯中科2023年半年度报告龙芯中科2023年半年度报告摘要 2023 年上半年，公司营业收入 3.08 亿元，与去年同期 3.48 亿元相比下降 11.43%；归属上市公司的股东净亏损为 1.038 亿元，比去年同期的净利润 8876.33 万元下降了 216.92%。 2023 年上半年费用化研发投入 1.97 亿，同比增长 57.64%：研发人员共 620 人，上半年平均薪酬为 24.6 万元，平均月薪超 4 万元。本月初，龙芯中科宣布，基于龙架构的新一代四核处理器龙芯 3A6000 流片成功，代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器是龙芯第四代微架构的首款产品，集成 4 个最新研发的高性能 6 发射 64 位 LA664 处理器核。主频达到 2.5GHz，支持 128 位向量处理扩展指令（LSX）和 256 位高级向量处理扩展指令（LASX），支持同时多线程技术（SMT2），全芯片共 8 个逻辑核。龙芯 3A6000 处理器采用龙芯自主指令系统龙架构（LoongArch...

2023-08-24

384

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。