DeepSeek 提出「CodeI/O」:通过代码输入-输出预测提炼推理模式
DeepSeek 团队最近提出了一种名为「CodeIO」的新方法,用来提升大型语言模型(如ChatGPT等)的推理能力。传统方法通常专注于训练模型解决数学题或生成代码,但其他类型的推理任务(如逻辑推理、科学推理)由于缺乏高质量的训练数据,效果往往不佳。
这项研究的核心思路是:用代码教模型“解题思维”。
代码中其实隐藏着丰富的“解题套路”。例如,一段计算阶乘的代码,本质上包含了“从1连乘到n”的数学推理步骤。
CodeIO 的巧妙之处在于:
1. 把代码变成“输入-输出”练习题:给定一个代码函数和输入,让模型预测输出;或者给定代码和输出,让模型反推输入。
2. 用自然语言描述推理过程:模型需要像学生写解题步骤一样,用文字说明“为什么输入A会得到输出B”,而不是直接生成代码。这种“思维链”训练让模型学会通用的推理方法,比如如何拆解问题、如何验证条件等。
如何实现?
⭐收集代码:从算法题库、数学问题等来源筛选45万多个代码函数。
⭐生成练习题:为每个代码函数自动生成多组输入输出对,例如测试阶乘函数时,输入5对应输出120。
⭐让模型“写解题步骤”:使用一个强大的开源模型(DeepSeek-V2.5)为每个练习题生成自然语言的推理过程。
⭐纠错升级(CoDEI/O++):如果模型预测错误,系统会通过执行代码得到正确答案,并让模型根据反馈重新生成推理步骤。类似老师批改作业后让学生订正。
效果如何?
⭐在14个不同类型的推理测试中(涵盖数学、逻辑、常识等),经过CoDEI/O训练的模型表现更全面:
⭐不偏科:传统方法可能在数学题上得分高,但逻辑题得分低,而CoDEI/O在所有任务中均有提升。
⭐验证可靠:模型的推理步骤可以通过代码执行直接验证,确保正确性。
⭐开源共享:所有训练数据和模型已公开(GitHub),方便后续研究。
总结一下,CodeI/O 就像是一种新的“思考训练营”,它利用代码这种结构化的信息,让AI学习更通用、更可靠的推理能力。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
最新尸检报告认定 OpenAI“吹哨人”死因为自杀
2024 年 11 月 26 日,前 OpenAI 员工 Suchir Balaji 在旧金山的公寓中被发现死亡,年仅 26 岁。时至今日,旧金山法医部门在最新公布的尸检报告裁定 Balaji 的死因为开枪自杀,驳斥了 Balaji 家人有关他杀的怀疑。 资料显示,Balaji 是一名印度裔美国人,曾在加州大学伯克利分校学习并获得了计算机科学学士学位。大学期间,他于 2019 年在 Scale AI 实习,并于 2021 年毕业后加入 OpenAI,参与过WebGPT的研发,后来又加入GPT-4的预训练团队,o1的推理团队以及ChatGPT的后训练团队。2024 年 8 月,他因对公司的商业行为感到失望后离职,并公开表达了自己的担忧:“如果你相信我所相信的,你就必须离开公司”。 10 月份,Balaji 因指控 OpenAI非法使用受版权保护的材料来训练其 AI 模型而广受关注。《纽约时报》后来将他列为该报对 OpenAI 的诉讼中“拥有独特和相关文件”的关键人物。彼时,OpenAI 正在被众多著名作家和新闻出版商起诉侵犯版权。 离开 OpenAI 后,Balaji 表示自己一直在从事...
- 下一篇
中国移动申请 AI 数智人相关商标
天眼查知识产权信息显示,中国移动通信集团有限公司近日申请注册“中移智安麒”“中移安麒”商标,国际分类为通讯服务、科学仪器,当前商标状态均为等待实质审查。 根据介绍,作为中国移动自主研发的专家型数字员工,中国移动AI数智人安麒以大数据为基础、人工智能算法为驱动、安全专家知识为核心,具备自动化安全测试、个性化安全培训等功能。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6