快手 Kwaipilot 团队开源 KAT-Dev-72B-Exp
快手 Kwaipilot 团队发布了 KAT-Dev-72B-Exp。
KAT-Dev-72B-Exp 是 KAT-Coder 模型强化学习的实验版本,在软件开发能力评测基准 SWE-Bench Verified 上取得了74.6%的卓越性能,在开源模型领域创下新纪录。
据介绍,该模型基于快手自研 SeamlessFlow 工业级强化学习框架,通过创新的数据平面架构实现了训练逻辑与 Agent 的完全解耦,成功支持多智能体和在线强化学习等复杂场景。
针对复杂 Agent 场景的技术挑战,团队创新性地引入 Trie Packing 机制,并对训练引擎进行了重构优化,使模型能够高效地在共享前缀轨迹上开展训练。通过难度感知的策略优化,实现了探索与利用的平衡,并结合基于开源仓库构建的大规模端到端可验证软件工程任务,KAT-Dev-72B-Exp 在编程领域展现出强大的能力。
免费试用 KAT-Coder:https://www.streamlake.ai/product/kat-coder
KAT-Dev-72B-Exp 开源地址:https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
高通涉嫌违反反垄断法被市场监管总局立案调查
中国国家市场监管总局10日通报,因高通公司收购Autotalks公司未依法申报经营者集中,涉嫌违反《中华人民共和国反垄断法》,国家市场监管总局依法对高通公司开展立案调查。 高通公司官网披露的信息显示,高通公司于今年6月宣布收购Autotalks公司。Autotalks是一家致力于V2X(Vehicle-to-Everything,即车联网)通信的无晶圆厂半导体公司。V2X技术可让车辆直接相互通信以及与其周围环境通信来减少车辆碰撞事故,以保护驾驶员和行人安全。
-
下一篇
字节跳动张一鸣近年首次公开露面,称很多人才潜力没有被充分挖掘
10月10日,上海徐汇知春创新中心正式开业,该创新中心由字节跳动创始人张一鸣、上海交通大学ACM班创始人俞勇教授共同发起。作为民办非营利性机构,中心计划招聘对泛计算机和人工智能感兴趣的年轻人。 据了解,本次开业,张一鸣也来到了现场并发言,他提到,自己长期关注人才招聘和培养,注意到很多人才潜力没有被充分挖掘,他以机器学习模型中的过拟合(Overfit)现象作为类比,有的人才可能专业知识扎实,也有高精准的技能,但面对创新任务就不行了。 值得注意的是,余勇作为中国最早的计算机教育布道者,和他的学生林晨曦、戴文渊、胡哲人、李磊、李沐、陈天奇、王敏捷、张伟楠、郑曌等等,共同书写了无数段传奇故事。而这直接推动了此后中国计算机技术的发展,ACM班也在后来被冠以“人工智能CTO摇篮”的盛誉。
相关文章
文章评论
共有0条评论来说两句吧...