Meta 开发了实时翻译闽南语的 AI
目前大多数的人工智能翻译都集中在翻译书面语言上,因为这些语言具有丰富的数据集,对 AI 而言这也是训练机器学习系统理解和翻译的最简便的方法。然而,全球共有超过 7000 种不同的语言,其中更有超过 40% 的语言是没有标准书写系统的。 来自 Meta(前 Facebook) 的人工智能研究团队就专门针对这种场景开发了一个 AI 翻译系统,这是一个面向口头语言的实时翻译系统,并以闽南语与英文互译为首要目标。 闽南语主要在我国福建和台湾广泛使用,其次在新加坡、印尼、马来西亚等东南亚国家的使用群体也不小。根据 Meta 的统计,目前约有 4600 万人说闽南语。闽南语本身没有标准的书写系统,主要就是通过口语交流。相比传统的 AI 翻译项目,Meta 探索的这个项目显得十分新颖。 这项工作是 Meta AI 的通用语音翻译器项目的一部分,这个机器语言模型的最终目标是允许实时翻译众多不同的口语和书面语言,使任何人都能轻松沟通。 建构新模型的挑战在于,大多数实时翻译技术主要使用书面语言作为语音编码的数据集和注释基础(例如,英语、西班牙语、汉语普通话等有大量使用者的主流语言),因为有更多数据支持,使...
