Qwen3 即将来袭：阿里云新模型相关支持已合并至 vLLM 代码库-低调大师

Qwen3 即将来袭：阿里云新模型相关支持已合并至 vLLM 代码库

2025-04-08 885

阿里云旗下人工智能大模型系列 Qwen 迎来重要进展，其下一代模型Qwen3的相关支持已正式合并至vLLM（高效大语言模型推理框架）的代码库中，标志着Qwen3的发布已进入倒计时阶段。

据悉，Qwen3将包含至少两个版本：Qwen3-8B和Qwen3-MoE-15B-A2B。Qwen3-8B作为系列中的基础模型，预计将延续Qwen家族在语言理解与生成任务上的优异表现。业界推测，这一版本可能在多模态能力上有所突破，能够同时处理文本、图像甚至其他数据类型，从而满足更广泛的应用场景需求。

Qwen3-MoE-15B-A2B则采用了混合专家（Mixture-of-Experts， MoE）架构，拥有15亿参数，其中约2亿为活跃参数。这种设计旨在通过高效的专家路由机制，在保持较低计算成本的同时实现接近更大模型的性能表现。分析人士指出，若Qwen3-MoE-15B-A2B能在性能上媲美此前的Qwen2.5-Max(一款以高智能著称的模型)，其在实际应用中的潜力将不可小觑。

此次vLLM对Qwen3的支持合并，意味着开发者将能够利用这一高性能推理框架，轻松部署Qwen3模型以实现快速、稳定的推理任务。vLLM以其高效的内存管理和并行处理能力闻名，能够显著提升大模型在生产环境中的运行效率。

尽管Qwen3的具体功能和性能细节尚未完全公开，业界对其寄予厚望。Qwen2.5系列此前已在编码、数学推理和多语言任务中展现出超越同行的实力，而Qwen3被期待在这些领域进一步突破，尤其是在资源受限环境下的表现。

MoE架构的引入也引发了讨论：相比传统密集模型，Qwen3-MoE-15B-A2B可能在能效比上更具优势，适合部署在边缘设备或中小型服务器上。然而，也有声音认为，15亿参数的规模相对较小，是否能完全满足复杂任务的需求仍需实测验证。

微信关注我们

原文链接：https://www.oschina.net/news/343339

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

首款行业算力本 AIBOOK 发布，最高支持 32B 大语言模型

爱簿智能发布产品 AIBOOK，声称为行业首款"算力本"暨首台Linux AI开发本。面向开发者、AI爱好者和大学生，旨在打造理想的AI学习与开发工具，解决大模型开源时代算力不足且成本高等问题。可支持DeepSeek、Qwen、Llama等主流开源大模型（最高支持32B大语言模型），以及机器视觉与AI训推等。该产品以50TOPS端侧算力为核心，搭载Linux原生环境及开箱即用的AI开发工具套件，通过端云一体架构实现“AI实训”能力，同时将强大功能浓缩于轻薄机身，旨在重新定义个人AI生产力工具的行业标准。作为"个人AI智算中心"的开创性产品，AIBOOK的问世将推动"人人都是开发者"的时代愿景迈入现实。根据介绍，AIBOOK 搭载自研SoC芯片AB100，在端侧即可提供高达50TOPS的澎湃算力，配合创新的"端云一体"架构，可为开发者提供开放自由的算力。基于Linux内核的MT AIOS操作系统和预置的完整AI开发与工具链，可实现开箱即用的AI开发体验。此外，内置的原生智能体"穆莎"和丰富的AI应用套件，让模型从训练到应用的全流程变得更简单高效。支持主流大模型：支持DeepSeek...

2025-04-08

235

谷歌正在为其谷歌搜索实验项目“AI 模式”（AI Mode）引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题，并通过追问深入探索相关主题。如今，拥有 AI 模式访问权限的用户可以点击该功能，针对他们上传的照片或使用相机拍摄的照片提出问题。谷歌在本周一的博客文章中表示，AI 模式中的新图像分析功能由 Google Lens 的多模态能力提供支持。据谷歌介绍，AI 模式能够理解图像中的整个场景，包括物体之间的相互关系，以及它们的材质、颜色、形状和排列方式。通过采用“query fan-out”技术，AI 模式会针对图像本身以及图像中展示的物体提出多个问题，从而提供比传统谷歌搜索更详细的信息。例如，用户可以拍摄自己书架的照片，并输入问题：“如果我喜爱这些书，有哪些类似且评价很高的书呢？”AI 模式将识别每本书，并提供一份推荐书籍的列表，并带有链接，可供用户进一步了解或购买。此外，AI 模式还允许用户提出后续问题以缩小搜索范围，例如：“我在寻找一本快速阅读的书，这些推荐中哪一本最短？” 谷歌表示将向数百万参与实验室计划的用户开放 AI 模式，实验室是谷歌用于实验性功能...

2025-04-08

322

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。