阿里云推出全球首个全模态 AI 模型 Qwen3-Omni-低调大师

阿里云推出全球首个全模态 AI 模型 Qwen3-Omni

2025-09-23 161

阿里云发布了 Qwen3-Omni，标志着全球首个原生端到端全模态 AI 模型的问世，并且该模型现已开源。Qwen3-Omni 具备处理文本、图像、音频和视频等多种输入类型的能力，能够实现实时流式输出，无论是通过文本还是自然语音，均能快速响应。

Qwen3-Omni 模型在多个领域展现出跨模态的先进表现。通过早期以文本为核心的预训练和混合多模态训练，该模型具备了强大的多模态能力。在音频和视频的性能上尤为出色，同时在文本和图像的效果上也能保持高标准。根据36项音频和视频的基准测试，Qwen3-Omni 在22项中达到了最新的领先水平，尤其是在自动语音识别和音频理解等领域的表现已与同行业的 Gemini2.5Pro 不相上下。

Qwen3-Omni 支持119种文本语言和19种语音输入语言，另外还有10种语音输出语言，包括英语、中文、法语和德语等多种语言。此项功能让它能够更好地服务于全球用户。其创新的架构设计基于 MoE（专家混合）系统，结合了 AuT 预训练，从而使模型具有强大的通用表征能力。同时，多码本设计确保了低延迟的实时音频和视频交互，支持自然对话的流畅进行。

除了 Qwen3-Omni，阿里云还发布了 Qwen3-TTS，一个支持17种音色选择的文本转语音模型。该模型在多项评估基准中表现出色，超越了多款竞品，尤其在语音稳定性和音色相似度方面尤为突出。

Qwen-Image-Edit-2509是另一个新发布的工具，专注于图像编辑的多图像支持，显著提升了编辑的一致性和效果。它不仅能够处理单图像，还支持多图像的拼接编辑，能够满足更复杂的编辑需求。

微信关注我们

原文链接：https://www.oschina.net/news/373838

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OPPO 官宣“繁星编译器”，Android 首个跨级融合编译技术

OPPO ColorOS 16 流畅技术沟通会今天在深圳举办，宣布了 Android 首个无缝架构“极光引擎”、“潮汐引擎”和跨级融合编译技术“繁星编译器”等。据介绍，OPPO 繁星编译器是 ColorOS 16 中推出的全新自研编译技术，号称“安卓首个跨级融合编译技术”。它从底层重构 Java 代码与专属硬件的编译链路，实现硬件级优化，提升整体编译效率。该技术可显著提升系统流畅度，尤其在 API 性能、应用启动速度和响应效率方面优化明显，使千元机等中低端设备也能获得接近旗舰的流畅体验。繁星编译器与极光引擎、潮汐引擎协同工作，共同提升全场景、全机型的持久流畅性。

2025-09-22

213

9月22日，“全球Robotaxi第一股”文远知行宣布，东南亚超级应用Grab与其合作将在新加坡推出Grab首个面向消费者的自动驾驶出行服务——Ai.R（Autonomously Intelligent Ride）项目。 Ai.R项目由新加坡陆路交通管理局（LTA）选定，将是新加坡首次在居民区开展自动驾驶接驳服务，将在榜鹅（Punggol）沿两条指定路线为居民提供服务。Ai.R是唯一入选在榜鹅服务两条路线的自动驾驶接驳项目，初期将投入11辆自动驾驶车辆。 Ai.R车队将采用文远知行的两款产品：可坐5名乘客的Robotaxi GXR与可坐8名乘客的Robobus。这两款产品均已通过新加坡严格的Milestone 1（M1）认证，是首批获得该认证的专为榜鹅服务的自动驾驶车辆。M1认证旨在验证车辆在遵守新加坡交通规则的前提下，以自动驾驶模式在公共道路上安全运行的能力。项目初期，每辆Ai.R自动驾驶车辆将配备一名经专业培训的Grab安全员。这些安全员均由资深Grab网约车及出租车司机转型而来，拥有良好的安全驾驶记录和乘客评分。今年8月起，文远知行与Grab Academy联合开展了安全员相关...

2025-09-23

174

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。