阿里通义发布 Qwen3-Max,其迄今为止规模最大、能力最强的模型
阿里通义Qwen团队发布了其迄今为止规模最大、能力最强的Qwen3-Max模型,包含Base、Instruct和Thinking三个版本。
Instruct正式发布版本在代码生成与智能体表现方面表现卓越,而Thinking版本虽仍在训练中,但已展现出强大的推理能力。Qwen3-Max-Instruct正式版已经上线Qwen Chat并在阿里云百炼提供API。
Qwen3-Max-Base是Qwen3-Max的基础版本,模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式。
Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。
Qwen3-Max-Thinking是Qwen3-Max的推理增强版本,目前仍在训练中。该模型通过集成代码解释器并运用并行测试时计算技术情况下,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试AIME 25和HMMT上,均取得了满分。Qwen团队表示期待在不久的将来公开发布这一版本。
目前可以在Qwen Chat 官网直接与Qwen3-Max-Instruct模型对话,该模型的API(模型名称为qwen3-max)也已开放使用。


