阿里云推出全球首个全模态 AI 模型 Qwen3-Omni
阿里云发布了 Qwen3-Omni,标志着全球首个原生端到端全模态 AI 模型的问世,并且该模型现已开源。Qwen3-Omni 具备处理文本、图像、音频和视频等多种输入类型的能力,能够实现实时流式输出,无论是通过文本还是自然语音,均能快速响应。
Qwen3-Omni 模型在多个领域展现出跨模态的先进表现。通过早期以文本为核心的预训练和混合多模态训练,该模型具备了强大的多模态能力。在音频和视频的性能上尤为出色,同时在文本和图像的效果上也能保持高标准。根据36项音频和视频的基准测试,Qwen3-Omni 在22项中达到了最新的领先水平,尤其是在自动语音识别和音频理解等领域的表现已与同行业的 Gemini2.5Pro 不相上下。
Qwen3-Omni 支持119种文本语言和19种语音输入语言,另外还有10种语音输出语言,包括英语、中文、法语和德语等多种语言。此项功能让它能够更好地服务于全球用户。其创新的架构设计基于 MoE(专家混合)系统,结合了 AuT 预训练,从而使模型具有强大的通用表征能力。同时,多码本设计确保了低延迟的实时音频和视频交互,支持自然对话的流畅进行。
除了 Qwen3-Omni,阿里云还发布了 Qwen3-TTS,一个支持17种音色选择的文本转语音模型。该模型在多项评估基准中表现出色,超越了多款竞品,尤其在语音稳定性和音色相似度方面尤为突出。
Qwen-Image-Edit-2509是另一个新发布的工具,专注于图像编辑的多图像支持,显著提升了编辑的一致性和效果。它不仅能够处理单图像,还支持多图像的拼接编辑,能够满足更复杂的编辑需求。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
OPPO 官宣“繁星编译器”,Android 首个跨级融合编译技术
OPPO ColorOS 16 流畅技术沟通会今天在深圳举办,宣布了 Android 首个无缝架构“极光引擎”、“潮汐引擎”和跨级融合编译技术“繁星编译器”等。 据介绍,OPPO 繁星编译器是 ColorOS 16 中推出的全新自研编译技术,号称“安卓首个跨级融合编译技术”。 它从底层重构 Java 代码与专属硬件的编译链路,实现硬件级优化,提升整体编译效率。该技术可显著提升系统流畅度,尤其在 API 性能、应用启动速度和响应效率方面优化明显,使千元机等中低端设备也能获得接近旗舰的流畅体验。 繁星编译器与极光引擎、潮汐引擎协同工作,共同提升全场景、全机型的持久流畅性。
-
下一篇
文远知行与 Grab 携手推出新加坡首个面向消费者的自动驾驶出行服务
9月22日,“全球Robotaxi第一股”文远知行宣布,东南亚超级应用Grab与其合作将在新加坡推出Grab首个面向消费者的自动驾驶出行服务——Ai.R(Autonomously Intelligent Ride)项目。 Ai.R项目由新加坡陆路交通管理局(LTA)选定,将是新加坡首次在居民区开展自动驾驶接驳服务,将在榜鹅(Punggol)沿两条指定路线为居民提供服务。Ai.R是唯一入选在榜鹅服务两条路线的自动驾驶接驳项目,初期将投入11辆自动驾驶车辆。 Ai.R车队将采用文远知行的两款产品:可坐5名乘客的Robotaxi GXR与可坐8名乘客的Robobus。这两款产品均已通过新加坡严格的Milestone 1(M1)认证,是首批获得该认证的专为榜鹅服务的自动驾驶车辆。M1认证旨在验证车辆在遵守新加坡交通规则的前提下,以自动驾驶模式在公共道路上安全运行的能力。 项目初期,每辆Ai.R自动驾驶车辆将配备一名经专业培训的Grab安全员。这些安全员均由资深Grab网约车及出租车司机转型而来,拥有良好的安全驾驶记录和乘客评分。今年8月起,文远知行与Grab Academy联合开展了安全员相关...
相关文章
文章评论
共有0条评论来说两句吧...