您现在的位置是:首页 > 文章详情

Qwen3 即将来袭:阿里云新模型相关支持已合并至 vLLM 代码库

日期:2025-04-08点击:243

阿里云旗下人工智能大模型系列 Qwen 迎来重要进展,其下一代模型Qwen3的相关支持已正式合并至vLLM(高效大语言模型推理框架)的代码库中,标志着Qwen3的发布已进入倒计时阶段。

据悉,Qwen3将包含至少两个版本:Qwen3-8B和Qwen3-MoE-15B-A2B。Qwen3-8B作为系列中的基础模型,预计将延续Qwen家族在语言理解与生成任务上的优异表现。业界推测,这一版本可能在多模态能力上有所突破,能够同时处理文本、图像甚至其他数据类型,从而满足更广泛的应用场景需求。

Qwen3-MoE-15B-A2B则采用了混合专家(Mixture-of-Experts, MoE)架构,拥有15亿参数,其中约2亿为活跃参数。这种设计旨在通过高效的专家路由机制,在保持较低计算成本的同时实现接近更大模型的性能表现。分析人士指出,若Qwen3-MoE-15B-A2B能在性能上媲美此前的Qwen2.5-Max(一款以高智能著称的模型),其在实际应用中的潜力将不可小觑。

此次vLLM对Qwen3的支持合并,意味着开发者将能够利用这一高性能推理框架,轻松部署Qwen3模型以实现快速、稳定的推理任务。vLLM以其高效的内存管理和并行处理能力闻名,能够显著提升大模型在生产环境中的运行效率。

尽管Qwen3的具体功能和性能细节尚未完全公开,业界对其寄予厚望。Qwen2.5系列此前已在编码、数学推理和多语言任务中展现出超越同行的实力,而Qwen3被期待在这些领域进一步突破,尤其是在资源受限环境下的表现。

MoE架构的引入也引发了讨论:相比传统密集模型,Qwen3-MoE-15B-A2B可能在能效比上更具优势,适合部署在边缘设备或中小型服务器上。然而,也有声音认为,15亿参数的规模相对较小,是否能完全满足复杂任务的需求仍需实测验证。

原文链接:https://www.oschina.net/news/343339
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章