您现在的位置是:首页 > 文章详情

阿里通义发布 Qwen3-Max,其迄今为止规模最大、能力最强的模型

日期:2025-09-24点击:34

阿里通义Qwen团队发布了其迄今为止规模最大、能力最强的Qwen3-Max模型,包含Base、Instruct和Thinking三个版本。

Instruct正式发布版本在代码生成与智能体表现方面表现卓越,而Thinking版本虽仍在训练中,但已展现出强大的推理能力。Qwen3-Max-Instruct正式版已经上线Qwen Chat并在阿里云百炼提供API。

Qwen3-Max-Base是Qwen3-Max的基础版本,模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式。

Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。

Qwen3-Max-Thinking是Qwen3-Max的推理增强版本,目前仍在训练中。该模型通过集成代码解释器并运用并行测试时计算技术情况下,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试AIME 25和HMMT上,均取得了满分。Qwen团队表示期待在不久的将来公开发布这一版本。

目前可以在Qwen Chat 官网直接与Qwen3-Max-Instruct模型对话,该模型的API(模型名称为qwen3-max)也已开放使用。

原文链接:https://www.oschina.net/news/374086
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章