阿里发布 Qwen3.6-Plus:中国编程能力最强的模型
阿里巴巴宣布新一代大语言模型 Qwen3.6-Plus 正式发布。较之上一代模型,整体性能提升明显,尤其是编程Coding能力、智能体Agent能力和工具调用能力都实现了全面跃升,同时深度适配主流Agent框架。 公告称,在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2、长程编程任务NL2Repo,以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus显著超越一众模型,成为中国编程能力最强的模型。 在前端网页开发、仓库级复杂任务等实测场景中,千问 3.6 可自主拆解任务、规划路径、测试修改直至任务完成。Qwen3.6-Plus 不仅能实现高质量代码修复,而且擅长复杂的终端操作与自动化任务执行,取得了多个高难度的长程规划任务中的最优成绩。 基于原生多模态数据训练,千问3.6发展出更敏锐的理解感知能力和更强大的多模态推理能力。同时,Qwen3.6-Plus面向真实任务持续迭代优化,具备更强的指令遵循、文本和物体识别能力,在实际场景中表现更稳健。 Qwen3.6-Plus 模型可基于界面截图、设计稿或自...


