首个 AI 翻译实战榜单发布,GPT-4o 领跑市场
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。
传统翻译评测不同,TransBench 引入了幻觉率、文化禁忌词和敬语规范等新指标,专注于大模型翻译中的关键问题。这些指标来源于真实使用场景的反馈,力求反映翻译的实用性和文化适应性。比如,翻译结果虽然流畅,但若存在 “编造” 信息的情况,便会被标记为 “幻觉”;同样,翻译不符合当地文化或缺乏必要的礼貌用语,也会影响评估结果。
根据榜单的最新评测结果,GPT-4o 稳居翻译 AI 的 “天花板”,在多语言翻译中表现出色,综合得分最高。紧随其后的是 DeepL Translate 和 GPT-4-Turbo。其中,DeepL Translate 是专为机器翻译设计的模型,其最新版本刚于上月发布,显著提升了翻译质量。在电商行业中,DeepSeek-R1的表现同样突出,显示了其在特定领域的竞争力。
在文化特性方面,Qwen 系列模型表现亮眼,Qwen2.5-0.5B-Instruct 和 Qwen2.5-1.5B-Instruct 分列前两位,展示了其在跨文化翻译中的优势。此系列模型是由多个研究机构联合开发,支持多种语言,旨在提升翻译的文化适应性。
在中文翻译方面,GPT-4o 再次名列第一,DeepSeek-V3和 Claude-3.5-Sonnet 紧随其后。尤其在电商领域,DeepSeek-V3以其优异的得分引起了广泛关注。
TransBench 的评测方法和数据集现已开源,鼓励各大 AI 翻译机构参与,进行横向比较和性能评估。
阿里国际 AI Business 团队表示,随着翻译技术的不断进步,行业对翻译模型的要求愈加严格,TransBench 正是响应这一需求而推出的评测标准。未来,阿里国际还将继续致力于 AI 技术的应用,帮助更多企业实现全球化发展。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Anthropic 首席执行官:AI 模型产生的幻觉比人类少
Anthropic 首席执行官 Dario Amodei 在日前举行的 Anthropic 首届开发者活动 Code with Claude 的新闻发布会上发布观点称,当今的 AI 模型产生幻觉的比例要低于人类。他还表示,AI 幻觉不会限制 Anthropic 走向 AGI。 Amodei 在回答科技媒体 TechCrunch 的问题时表示,“这实际上取决于你如何衡量它,我怀疑 AI 模型产生的幻觉可能比人类少,但它们产生幻觉的方式更令人惊讶。” Anthropic 的首席执行官是业内对 AI 模型实现 AGI 前景最为看好的领导者之一。Amodei 在他去年撰写的一篇论文中表示,他相信 AGI 最早可能在 2026 年实现。在这场新闻发布会上,这位 Anthropic 的首席执行官表示,他看到这一目标的稳步推进,并指出“到处都在水涨船高”。 “大家都在寻找(AI)能做什么的硬性障碍。但根本找不到。根本就没有这种东西。” 其他一些 AI 领袖则认为,幻觉是实现 AGI 的一大障碍。本周早些时候,谷歌 DeepMind 首席执行官 Demis Hassabis 表示,目前的 AI 模型存...
- 下一篇
网安卫士“变身”木马黑客,敲诈企业 33 万元
浙江杭州市上城区人民法院近日一审宣判了一起特殊的敲诈勒索案件,四名被告分别以犯敲诈勒索罪、侵犯公民个人信息罪被判处有期徒刑。 事件起因为:2023年底,杭州一家“老字号”医疗机构的技术部负责人陆续接到各个科室的来电,反映系统无法正常登录。技术人员进入操作页面后发现,所有系统文件的后缀名都变成了“.uncle”。 经过排查,后台管理系统中一个名为readme.html的文件引起了他们的注意。点开一看,文件中赫然写着:“Important Notice!Your Files Have Been Locked!”(“注意!你们的文件已经被锁定!”)。随后,技术人员又在文件中找到了“Payment Method”(支付方式)“Wallet Address”(钱包地址)等内容。 经过核实,公司共计89台服务器无法运行,包括电子病历、批发连锁在内的业务系统彻底陷入瘫痪。为尽快恢复线上挂号等业务,最大程度保障患者不延误诊疗,该医疗机构无奈答应了对方支付数字加密货币作为“解锁赎金”的要求。 在这家机构报案之后,杭州警方又发现了两家被该团伙敲诈勒索的企业。经统计,三家被害企业为恢复正常经营,共计花费33...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Mario游戏-低调大师作品
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7安装Docker,走上虚拟化容器引擎之路