Qwen3-LiveTranslate 发布:视、听、说全模态同传大模型
阿里通义Qwen团队宣布推出Qwen3-LiveTranslate-Flash,这是一款基于大语言模型的高精度、高响应、高鲁棒性的多语言实时音视频同传模型。
依托Qwen3-Omni强大的基座能力、海量多模态数据、百万小时音视频数据,Qwen3-LiveTranslate-Flash 实现了覆盖18种语言的离线和实时两种音视频翻译能力。
核心亮点
-
多语言和方言:支持中文、英文、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语、印尼语、泰语、越南语、阿拉伯语、印地语、希腊语、土耳其语等主要官方语言和普通话、粤语、北京话、吴话、四川话、天津话的方言翻译。
-
视觉增强:首次引入视觉上下文增强技术,让 Qwen3-LiveTranslate-Flash 不仅“听得懂”,还能“看得懂”,通过识别和利用口型、动作、文字、实体等多模态信息,有效应对嘈杂音频环境以及一词多译词场景下的翻译不准问题。
-
3秒延迟:轻量的混合专家架构与动态采样策略实现最低3秒延迟的同传体验。
-
无损同传:采用语义单元预测技术缓解跨语言翻译的调序问题,实现与离线翻译几乎无损的翻译质量。
-
音色自然:海量语音数据训练,可以根据原始语音内容自适应调节语气和表现力的拟人音色。
模型性能
在公开测试集上中英及多语言语音翻译,Qwen3-LiveTranslate-Flash 的准确度显著优于当前主流大模型 Gemini-2.5-Flash、GPT-4o-Audio-Preview 和 Voxtral Small-24B 等。
Qwen3-LiveTranslate-Flash 在不同领域和复杂声学环境下均展现出持续领先的翻译性能。
Qwen3-LiveTranslate-Flash 在嘈杂音频、一词多译、专有名词翻译等场景翻译更精准。在实时场景中,视觉信息弥补了语音上下文的缺失,优势更明显。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
九科Agent上线6大新功能,助力企业自动化效率再升级
经过数月的实战探索,九科信息团队捕捉到企业在使用自动化工具时面临的界面理解难、执行易卡壳、任务管控散等核心痛点,全新推出bit-Agent的6大功能,从“界面认知、稳定执行、任务管理、生态扩展”四大维度实现体验优化,让自动化真正贴合业务场景,为企业降本增效注入新动力。 针对企业各部门业务系统的强个性化属性导致界面理解偏差的问题,bit-Agent新增“网页说明管理”功能,构建起内置的网页知识库。用户可对网页链接、页面模块进行人工标注与详细说明,Agent运行时能基于这些标注实现智能监管、导航引导和自动补全逻辑三大能力,既能依据业务规则规范员工操作,又能跨模块跳转,还能在批量任务中修正输入错误,彻底破解非标准化界面的认知难题。 任务执行中的意外中断常常拖累整体进度,“跳过错误步骤”功能为此赋予Agent容错能力。当遇到必要信息缺失、系统接口中断等问题且自动纠错无效时,Agent会自动跳过异常步骤优先推进其他环节,待人工介入后再处理问题环节,有效避免任务整体延误。 在复杂自动化场景中,模糊的任务指令易导致执行偏差,“设置参数”功能则解决了这一问题。用户创建任务时可对关键信息进行精细化参数配...
-
下一篇
Figma 推出新功能,让 AI 与设计工具无缝对接
Figma 近期推出了一系列新更新,旨在使 AI 模型能够直接与其应用构建工具进行通信,并远程访问设计。这些更新的核心是 Figma 的模型上下文协议(MCP)服务器,这一桥梁使得 AI 模型能够直接访问在 Figma 工具中创建的原型和设计背后的代码。 根据 Figma 技术负责人克里斯・拉斯穆森(Kris Rasmussen)的介绍,MCP 服务器已经扩展,支持 Figma 的 AI 提示到应用编码工具 Figma Make。通过使用 MCP 客户端访问 Figma Make 文件,AI 模型可以查看底层代码,而不仅仅是渲染的原型或图像。这意味着 MCP 服务器能够向 AI 模型和代理精确展示如何在 Figma Make 中构建应用程序,从而避免了基于视觉设计的猜测。 Figma 表示,Make MCP 服务器体验已经支持来自 Anthropic、Cursor、Windsurf 和 VS Code 等产品,并且未来的更新将允许第三方 MCP 服务器与 Figma Make 连接。MCP 服务器的远程访问功能使得 AI 编码代理、基于浏览器的模型和集成开发环境的开发者能够更便捷地使用...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音