Qwen3 即将来袭:阿里云新模型相关支持已合并至 vLLM 代码库
阿里云旗下人工智能大模型系列 Qwen 迎来重要进展,其下一代模型Qwen3的相关支持已正式合并至vLLM(高效大语言模型推理框架)的代码库中,标志着Qwen3的发布已进入倒计时阶段。
据悉,Qwen3将包含至少两个版本:Qwen3-8B和Qwen3-MoE-15B-A2B。Qwen3-8B作为系列中的基础模型,预计将延续Qwen家族在语言理解与生成任务上的优异表现。业界推测,这一版本可能在多模态能力上有所突破,能够同时处理文本、图像甚至其他数据类型,从而满足更广泛的应用场景需求。
Qwen3-MoE-15B-A2B则采用了混合专家(Mixture-of-Experts, MoE)架构,拥有15亿参数,其中约2亿为活跃参数。这种设计旨在通过高效的专家路由机制,在保持较低计算成本的同时实现接近更大模型的性能表现。分析人士指出,若Qwen3-MoE-15B-A2B能在性能上媲美此前的Qwen2.5-Max(一款以高智能著称的模型),其在实际应用中的潜力将不可小觑。
此次vLLM对Qwen3的支持合并,意味着开发者将能够利用这一高性能推理框架,轻松部署Qwen3模型以实现快速、稳定的推理任务。vLLM以其高效的内存管理和并行处理能力闻名,能够显著提升大模型在生产环境中的运行效率。
尽管Qwen3的具体功能和性能细节尚未完全公开,业界对其寄予厚望。Qwen2.5系列此前已在编码、数学推理和多语言任务中展现出超越同行的实力,而Qwen3被期待在这些领域进一步突破,尤其是在资源受限环境下的表现。
MoE架构的引入也引发了讨论:相比传统密集模型,Qwen3-MoE-15B-A2B可能在能效比上更具优势,适合部署在边缘设备或中小型服务器上。然而,也有声音认为,15亿参数的规模相对较小,是否能完全满足复杂任务的需求仍需实测验证。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
首款行业算力本 AIBOOK 发布,最高支持 32B 大语言模型
爱簿智能发布产品 AIBOOK,声称为行业首款"算力本"暨首台Linux AI开发本。面向开发者、AI爱好者和大学生,旨在打造理想的AI学习与开发工具,解决大模型开源时代算力不足且成本高等问题。可支持DeepSeek、Qwen、Llama等主流开源大模型(最高支持32B大语言模型),以及机器视觉与AI训推等。 该产品以50TOPS端侧算力为核心,搭载Linux原生环境及开箱即用的AI开发工具套件,通过端云一体架构实现“AI实训”能力,同时将强大功能浓缩于轻薄机身,旨在重新定义个人AI生产力工具的行业标准。作为"个人AI智算中心"的开创性产品,AIBOOK的问世将推动"人人都是开发者"的时代愿景迈入现实。 根据介绍,AIBOOK 搭载自研SoC芯片AB100,在端侧即可提供高达50TOPS的澎湃算力,配合创新的"端云一体"架构,可为开发者提供开放自由的算力。基于Linux内核的MT AIOS操作系统和预置的完整AI开发与工具链,可实现开箱即用的AI开发体验。此外,内置的原生智能体"穆莎"和丰富的AI应用套件,让模型从训练到应用的全流程变得更简单高效。 支持主流大模型:支持DeepSeek...
- 下一篇
谷歌搜索“AI 模式”(AI Mode)引入多模态搜索功能
谷歌正在为其谷歌搜索实验项目“AI 模式”(AI Mode)引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题,并通过追问深入探索相关主题。如今,拥有 AI 模式访问权限的用户可以点击该功能,针对他们上传的照片或使用相机拍摄的照片提出问题。 谷歌在本周一的博客文章中表示,AI 模式中的新图像分析功能由 Google Lens 的多模态能力提供支持。据谷歌介绍,AI 模式能够理解图像中的整个场景,包括物体之间的相互关系,以及它们的材质、颜色、形状和排列方式。 通过采用“query fan-out”技术,AI 模式会针对图像本身以及图像中展示的物体提出多个问题,从而提供比传统谷歌搜索更详细的信息。 例如,用户可以拍摄自己书架的照片,并输入问题:“如果我喜爱这些书,有哪些类似且评价很高的书呢?”AI 模式将识别每本书,并提供一份推荐书籍的列表,并带有链接,可供用户进一步了解或购买。 此外,AI 模式还允许用户提出后续问题以缩小搜索范围,例如:“我在寻找一本快速阅读的书,这些推荐中哪一本最短?” 谷歌表示将向数百万参与实验室计划的用户开放 AI 模式,实验室是谷歌用于实验性功能...
相关文章
文章评论
共有0条评论来说两句吧...