AI 编程工具 Cursor 升级 Tab 模型

AI编程工具Cursor宣布对其代码自动补全系统Tab模型进行重大升级。此次升级聚焦于减少低质量建议,显著提升准确性。据Cursor称,新模型提供的建议数量比旧版减少21%,但接受率提高了28%。

为解决此前模型存在的问题,Cursor最初考虑训练单独模型预测建议接受度,参考2022年GitHub Copilot相关研究,采用逻辑回归过滤技术。但Cursor期望更通用机制,最终利用强化学习中的策略梯度方法,使模型因建议被接受获奖励,被拒则受惩罚。该方法需“在线策略”数据,Cursor通过每日多次向用户部署新检查点,并依据最新交互快速重新训练模型来实现。

Cursor希望实现不只是事后过滤失败建议,而是让主模型本身在建议生成阶段就尽量避免“坏建议”。他们用policy gradient方法来训练Tab模型,让模型在做出建议vs不建议的决策上,最大化一个定义好的reward函数。这个reward重在:

  1. 鼓励建议被接受(accept suggestions)
  2. 惩罚建议被拒绝
  3. 不建议(show nothing)在模型判断不确定或建议被低接收率预计的情况下也给予中性或某种 reward。

举例来说,如果模型估计建议被接受的机会至少 25%,显示建议会有正 reward;如果低于,则建议不被显示以避免 negative reward。

目前,Tab模型在平台上响应用户每一次操作,每日处理超4亿次请求。业内对此次升级反响积极,有OpenAI工程师称赞Cursor在前沿技术规模化应用方面的领先尝试。

今年6月,Cursor母公司Anysphere融资9亿美元,估值达99亿美元,并推出高端订阅计划,同时平台更新了自动代码审查等功能。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/372303

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。