阿里发布 Qwen3.5-Omni 全模态大模型-低调大师

阿里发布 Qwen3.5-Omni 全模态大模型

2026-03-31 43

阿里通义实验室宣布全模态大模型 Qwen3.5-Omni 系列上线，包含 Plus、Flash、Light 三种尺寸的 Instruct 版本。

核心亮点速览

真正的“全模态”原生，无缝理解文本、图片、音频及音视频输入，支持细粒度、带时间戳的音视频 Caption 生成；
215 项 SOTA 霸榜，在音频及音视频分析、推理、对话、翻译等任务超过 Gemini3.1-Pro；
自然涌现的 Audio-Visual Vibe Coding 能力；
支持语义打断、音色克隆及语音控制，让对话体验更自然；
支持 256K 超长上下文与 113 种语言识别，可处理 10 小时音频或 1 小时视频。
原生支持 WebSearch 和复杂 Function Call，不仅能聊天，更能帮你做事。

根据介绍，Qwen3.5-Omni 延续了上一代的 Thinker-Talker 分工架构——Thinker 负责理解，Talker 负责表达。但这一次，两者都升级为 Hybrid-Attention MoE，效率和性能均有显著提升。

Thinker：接收视觉+音频信号，通过 TMRoPE 编码位置信息，输出文本。Hybrid-Attention 让它在处理 10 小时长音频、1小时视频时，依然能快速抓住重点。
Talker：接收 Thinker 的多模态输出，进行 contextual 语音生成，用 RVQ 编码替代繁重的 DiT 运算。配合全新的 ARIA 技术，动态对齐文本和语音单元，解决了偶尔漏字、数字念不清的问题。你说“大声点、开心一点”，它当场就改。
而 MoE 的本质是“专家混合”——听音频的专家、看视频的专家、理解文本的专家各司其职，不会互相干扰。这就是为什么它能做到 215 项 SOTA 的同时，文本和视觉能力还能保持和单模态模型一样强。

相比上一代，Qwen3.5-Omni 在长上下文、多语言、音视频理解能力上都有明显提升，同时新增了语义打断、音色克隆、语音控制等实时交互能力，让对话体验更接近真人。配合 ARIA 技术，语音输出的稳定性和自然度也进一步改善。详细对比见下表：

Qwen3.5-Omni-Plus 在音频/音视频的理解、推理和交互任务上，共取得 215 项 SOTA 成绩，涵盖音视频、音频、语音识别、语音翻译等多个方向。

其中，通用音频理解、推理、识别、翻译、对话全面超越 Gemini-3.1 Pro，音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时，视觉和文本能力与同尺寸 Qwen3.5 模型持平。

微信关注我们

原文链接：https://www.oschina.net/news/416053

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微软确认正在大幅改进 Windows 11 搜索功能

微软 Windows 团队证实，针对 Windows 搜索功能的一系列重大改进正在开发当中，目标是解决长期以来搜索结果缓慢、本地文件难以命中、网络推荐过多等问题，让搜索体验变得更简单、更少干扰。这一轮调整由负责 Windows Shell 的产品负责人 Tali Roth 领衔，她在社交平台上多次回应用户质疑，表示搜索将“更简单、更不分散注意力”，并强调微软已经意识到 Windows 目前在搜索、资源管理器、系统行为等方面偏离了用户期待。此前，微软刚刚对外宣称要“修好 Windows 11”，承诺提高性能和可靠性，包括更快的文件资源管理器、更合理的任务栏改进、减少侵入式 Copilot 集成等，但当时的公开说明并未详细提及搜索。这一遗漏迅速在社交平台 X 上引发围绕 Windows 搜索的大量吐槽，许多用户抱怨搜索速度不如从前、本地文件经常找不到、广告和推荐内容过多、结果中夹杂大量网页内容，严重偏离了“帮我在电脑上找东西”这一最基本的用途。在 Tali Roth 关于开始菜单、任务栏和文件资源管理器改进的讨论贴下，搜索被反复点名为“系统中最让人讨厌的一部分”。 Roth 随即回应...

2026-03-30

49

特朗普政府发布了《国家人工智能立法框架》，旨在通过统一的国家政策确保美国在AI领域保持全球领先地位。该框架涵盖六大核心目标：保护儿童与赋能家长、维护与强化美国社区、尊重知识产权与支持创作者、防止审查与保护言论自由、促进创新与确保美国AI主导地位、教育美国民众与培养AI就绪劳动力。在保护儿童方面，框架呼吁国会赋予家长管理子女数字环境的工具，要求AI平台实施功能以减少对儿童的潜在性剥削或自残诱导。在知识产权方面，框架提出在保护创作者权益的同时，确保AI能够公平使用学习内容，实现创新与保护的平衡。在促进创新方面，框架呼吁国会消除过时或不必要的创新障碍，加速AI在各行业的部署，并促进测试环境的广泛接入。同时，政府希望通过 workforce development 和技能培训项目，帮助美国工人参与并收获AI驱动的增长红利。该框架的成功关键在于全国统一实施。政府认为，各州相互冲突的法律将削弱美国创新能力和全球AI竞争中的领导地位。未来几个月，政府将与国会合作，将这一框架转化为可签署的立法。参考来源： https://www.whitehouse.gov/releases/2026/03/...

2026-03-31

42

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。