您现在的位置是:首页 > 文章详情

阿里开源 AI 编程模型 Qwen3-Coder

日期:2025-07-23点击:11

阿里通义千问宣布正式推出 Qwen3-Coder,“这是我们迄今为止最具代理能力的代码模型。”

根据介绍,Qwen3-Coder 拥有多个尺寸,其中 Qwen3-Coder-480B-A35B-Instruct 是当前最强大的版本。这是一个 480B 参数激活 35B 参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。

Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。

与此同时,阿里方面还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 基于 Gemini Code 进行二次开发,但进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。Qwen3-Coder 可以和 Claude Code、Cline 等结合使用。

Qwen3-Coder 从不同角度进行 Scaling,以提升模型的代码能力:

  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;
  • 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化,助力 Agentic Coding;
  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,显著提升整体数据质量。

Scaling Code RL: Hard to Solve, Easy to Verify

Scaling Long-Horizon RL

更多详情可查看官方公告。 

原文链接:https://www.oschina.net/news/361848
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章