Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型-低调大师

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

2025-09-24 272

阿里通义Qwen团队宣布推出Qwen3-LiveTranslate-Flash，这是一款基于大语言模型的高精度、高响应、高鲁棒性的多语言实时音视频同传模型。

依托Qwen3-Omni强大的基座能力、海量多模态数据、百万小时音视频数据，Qwen3-LiveTranslate-Flash 实现了覆盖18种语言的离线和实时两种音视频翻译能力。

核心亮点

多语言和方言：支持中文、英文、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语、印尼语、泰语、越南语、阿拉伯语、印地语、希腊语、土耳其语等主要官方语言和普通话、粤语、北京话、吴话、四川话、天津话的方言翻译。
视觉增强：首次引入视觉上下文增强技术，让 Qwen3-LiveTranslate-Flash 不仅“听得懂”，还能“看得懂”，通过识别和利用口型、动作、文字、实体等多模态信息，有效应对嘈杂音频环境以及一词多译词场景下的翻译不准问题。
3秒延迟：轻量的混合专家架构与动态采样策略实现最低3秒延迟的同传体验。
无损同传：采用语义单元预测技术缓解跨语言翻译的调序问题，实现与离线翻译几乎无损的翻译质量。
音色自然：海量语音数据训练，可以根据原始语音内容自适应调节语气和表现力的拟人音色。

模型性能

在公开测试集上中英及多语言语音翻译，Qwen3-LiveTranslate-Flash 的准确度显著优于当前主流大模型 Gemini-2.5-Flash、GPT-4o-Audio-Preview 和 Voxtral Small-24B 等。

Qwen3-LiveTranslate-Flash 在不同领域和复杂声学环境下均展现出持续领先的翻译性能。

Qwen3-LiveTranslate-Flash 在嘈杂音频、一词多译、专有名词翻译等场景翻译更精准。在实时场景中，视觉信息弥补了语音上下文的缺失，优势更明显。

微信关注我们

原文链接：https://www.oschina.net/news/374128

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

九科Agent上线6大新功能，助力企业自动化效率再升级

经过数月的实战探索,九科信息团队捕捉到企业在使用自动化工具时面临的界面理解难、执行易卡壳、任务管控散等核心痛点,全新推出bit-Agent的6大功能,从“界面认知、稳定执行、任务管理、生态扩展”四大维度实现体验优化,让自动化真正贴合业务场景,为企业降本增效注入新动力。针对企业各部门业务系统的强个性化属性导致界面理解偏差的问题,bit-Agent新增“网页说明管理”功能,构建起内置的网页知识库。用户可对网页链接、页面模块进行人工标注与详细说明,Agent运行时能基于这些标注实现智能监管、导航引导和自动补全逻辑三大能力,既能依据业务规则规范员工操作,又能跨模块跳转,还能在批量任务中修正输入错误,彻底破解非标准化界面的认知难题。任务执行中的意外中断常常拖累整体进度,“跳过错误步骤”功能为此赋予Agent容错能力。当遇到必要信息缺失、系统接口中断等问题且自动纠错无效时,Agent会自动跳过异常步骤优先推进其他环节,待人工介入后再处理问题环节,有效避免任务整体延误。在复杂自动化场景中,模糊的任务指令易导致执行偏差,“设置参数”功能则解决了这一问题。用户创建任务时可对关键信息进行精细化参数配...

2025-09-24

133

Figma 近期推出了一系列新更新，旨在使 AI 模型能够直接与其应用构建工具进行通信，并远程访问设计。这些更新的核心是 Figma 的模型上下文协议（MCP）服务器，这一桥梁使得 AI 模型能够直接访问在 Figma 工具中创建的原型和设计背后的代码。根据 Figma 技术负责人克里斯・拉斯穆森（Kris Rasmussen）的介绍，MCP 服务器已经扩展，支持 Figma 的 AI 提示到应用编码工具 Figma Make。通过使用 MCP 客户端访问 Figma Make 文件，AI 模型可以查看底层代码，而不仅仅是渲染的原型或图像。这意味着 MCP 服务器能够向 AI 模型和代理精确展示如何在 Figma Make 中构建应用程序，从而避免了基于视觉设计的猜测。 Figma 表示，Make MCP 服务器体验已经支持来自 Anthropic、Cursor、Windsurf 和 VS Code 等产品，并且未来的更新将允许第三方 MCP 服务器与 Figma Make 连接。MCP 服务器的远程访问功能使得 AI 编码代理、基于浏览器的模型和集成开发环境的开发者能够更便捷地使用...

2025-09-24

134

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。