阿里开源 AI 编程模型 Qwen3-Coder
阿里通义千问宣布正式推出 Qwen3-Coder,“这是我们迄今为止最具代理能力的代码模型。”
根据介绍,Qwen3-Coder 拥有多个尺寸,其中 Qwen3-Coder-480B-A35B-Instruct 是当前最强大的版本。这是一个 480B 参数激活 35B 参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。
Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。
与此同时,阿里方面还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 基于 Gemini Code 进行二次开发,但进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。Qwen3-Coder 可以和 Claude Code、Cline 等结合使用。
Qwen3-Coder 从不同角度进行 Scaling,以提升模型的代码能力:
- 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;
- 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化,助力 Agentic Coding;
- 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,显著提升整体数据质量。
Scaling Code RL: Hard to Solve, Easy to Verify
Scaling Long-Horizon RL
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Java 自动化内网穿透(wlcn)1.3.2-JDK24
项目介绍 wu-lazy-cloud-network 是一款基于(wu-framework-parent)孵化出的项目,内部使用Lazy ORM操作数据库,主要功能是网络穿透,对于没有公网IP的服务进行公网IP映射 使用环境JDK24 Spring Boot 3.5.0 版本更新 1.3.2-JDK24 [add] 新增代理请求日志、代理返回日志 通过配置:spring.lazy.netty.protocol.proxy.enableProxyLog=true [add] 升级使用jdk24、springboot 3.5.0 [add] 添加socks授权验证。通过配置:spring.lazy.netty.protocol.proxy.authentication=true
- 下一篇
Gemini 2.5 Flash-Lite 稳定版(GA)发布
谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态(GA)。 Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡,原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元,每百万输出 token 0.40 美元,与 GPT-4.1 Nano 的价格相当。与预览版相比,其音频输入定价降低了 40%。 Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite,支持 100 万 token 的上下文窗口、可控的思考预算(thinking budgets),以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。 开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。
相关文章
文章评论
共有0条评论来说两句吧...