蚂蚁百灵开源 Ling-2.6-1T：面向复杂任务的万亿级综合旗舰模型-低调大师

蚂蚁百灵开源 Ling-2.6-1T：面向复杂任务的万亿级综合旗舰模型

2026-04-30 10

蚂蚁集团旗下的百灵大模型团队宣布，正式开源其面向复杂任务的万亿级综合旗舰模型 Ling-2.6-1T。

根据介绍，Ling-2.6-1T 并不是为了单纯追求更长的思考链，或制造更强的“参数规模体感”，而是面向真实复杂任务，系统性优化模型的智效比、指令执行、工具适配、长上下文承接和工程任务处理能力。

“我们希望它能够成为复杂工作流中的核心模型：既能理解复杂目标、拆解任务路径，也能在多样化 Agent harness、开发工具链和真实业务流程中稳定推进执行。”

具体而言，Ling-2.6-1T 重点解决三个问题：

第一，在更低 Token 开销下保持强综合智能。依托 MLA 与 Linear Attention 的 Hybrid 架构创新，结合抑制“过程冗余”的强化奖励策略，Ling-2.6-1T 在保持 1T 参数能力上限的同时，减少对冗长思考链的依赖，以更高效的“快思考”机制直达结果，从而压缩同等智能水平下的输出成本。
第二，在复杂任务中实现更可靠的多步执行。在 Agent、Coding 和工作流场景中，模型需要的不只是单点回答能力，而是对指令、工具、上下文和中间状态的持续把控，在噪声环境下的推理与精准作答。Ling-2.6-1T 加强对复合型任务的学习，在 AIME26、SWE-bench Verified、BFCL-V4 、TAU2-Bench、IFBench 等执行类基准上达到开源 SOTA 水平，展现出面向复杂任务的综合执行能力。
第三，让万亿级模型真正进入开发者和企业的生产工作流。Ling-2.6-1T 具备从代码生成到缺陷修复的完整工程落地能力，并与主流 Agent 框架高度兼容，适用于多工具、多步骤、多约束的复杂场景。它的目标不是停留在单次演示，而是成为真实业务系统中可部署、可协同、可持续运行的模型能力底座。

Ling-2.6-1T 在底层训练策略上实现了深度演进，以大幅提升 Token Efficiency 作为关键的优化维度：

高智效比优势突出：Artificial Analysis中，Ling-2.6-1T 以约 16M output tokens 达到约 34分 Intelligence Index，进入图中的高吸引力区间，说明它能够在相对克制的 token 消耗下，提供较强的综合智能表现。
综合智能已进入领先模型区间：相比 Ling 系列早期旗舰 Ling-1T，Ling-2.6-1T 在能力上实现了明显跃迁，并已展现出与 GPT-5.4（Non-Reasoning）同档的综合智能表现。
更适合真实部署的能力—效率平衡：相较部分依赖更高 token 消耗来换取更高分数的模型，Ling-2.6-1T 在效率与能力之间更均衡，更适合需要兼顾成本、吞吐与任务完成度的真实业务场景。

与此同时，Ling-2.6-1T 以仅 16M tokens 完成 Artificial Analysis 完整评测，在同类模型中展现出极突出的 Token Efficiency，体现出更低成本、更高吞吐与更强落地性的综合优势。

在推理、代码、工具调用、多步任务执行等维度，Ling-2.6-1T 展现出均衡的综合能力，对多样化的 Agent harness、工具链与工作流编排环境具备良好的适配性，在多个执行类 benchmark 上达到开源 SOTA 水平。

高难推理能力突出：在 AIME26 上，Ling-2.6-1T 显著领先于其他非思考模型，展现出更强的复杂问题分析与求解能力。
Agent 执行能力处于第一梯队：在 SWE-bench Verified、TAU2-Bench、Claw-Eval、BFCL-V4 和 PinchBench 上，Ling-2.6-1T 达到第一梯队，在工具调用、多步任务推进与真实工作流执行中均有不错的表现。
长上下文理解与优秀的指令遵循能力：在 MRCR（16K-256K）和 IFBench 均取得较高的分数，模型不仅具备更强的长文本理解能力，同时能够保证多重约束下的执行准确率与逻辑一致性。

接下来，项目团队计划持续提升 Ling-2.6-1T 在知识密集型任务下的 Token 效率表现，追求更优的智能表现。同时，面对真实世界更严苛的交互需求，进一步优化 Agent 长程规划的全局一致性与复杂信息检索能力，并重点打磨复杂指令下的跨语言动态对齐，改善偶发的中英双语切换偏移现象。下一步，将继续拓宽模型性能边界，推动全场景复杂任务的交付效率与交互体验全面进化。

此外，为支持更多开发者体验与评测 Ling-2.6-1T，其还宣布将 OpenRouter 平台的免费 API 调用服务延期一周。

微信关注我们

原文链接：https://www.oschina.net/news/437609

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Anthropic 拟以超 9000 亿美元估值开启新一轮 500 亿美元融资

外媒援引六位知情人士消息称，AI 助手 Claude 的开发商 Anthropic 已收到多份抢先融资要约，拟以 8500 亿美元至 9000 亿美元的估值筹集约 500 亿美元的新资金。彭博社和《商业内幕》本月早些时候曾报道，收到了多份以 8000 亿美元估值提出的优先认购要约，但当时该公司尚未决定是否进行融资。不过，消息人士称，Anthropic 难以抵挡住压力，急需在可能进行 IPO 前的最后一轮私募融资中获得更多资金。一位知情人士告诉 TechCrunch，该公司预计将在 5 月份的董事会会议上就此轮融资及其估值做出最终决定。据知情人士透露，此轮融资预计总额在400亿至500亿美...

2026-04-30

9

4 月 28 日，NVIDIA 正式发布开源全模态推理模型 Nemotron 3 Nano Omni，将文本、图像、音频、视频、文档、图表乃至 GUI 界面等多种感知能力整合至单一系统，旨在解决传统 AI 智能体系统中多模型碎片化导致的延迟高、上下文断裂和成本攀升等痛点。 Nemotron 3 Nano Omni 采用 30B-A3B 混合专家（MoE）架构，总参数量约 300 亿，每次前向传播仅激活约 30 亿参数。该模型融合了 Mamba 层（提升长序列处理与内存效率）与 Transformer 层（保障推理精度），并集成 Conv3D、高效视频采样（EVS）等技术。其上下文窗口支持 25...

2026-04-30

10

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。