​Cursor 升级 Tab 模型,实时强化学习提升开发者建议精准度

Cursor 是一款基于人工智能的编程平台,最近宣布对其 Tab 模型进行了升级。Tab 模型是为开发者提供自动补全建议的系统。此次升级显著减少了低质量建议的数量,提高了建议的准确性。具体来说,新的 Tab 模型相比于之前的版本,建议数量减少了21%,而接受率提高了28%。

Cursor 在其博客中表示,实现高接受率不仅仅是让模型变得更智能,还需要懂得何时提供建议、何时不提供。为了应对这一挑战,Cursor 考虑了训练一个单独的模型,用于预测某个建议是否会被接受。该公司引用了一项2022年的研究,指出这种方法在 GitHub Copilot 中取得了成功。研究中采用了逻辑回归过滤器,分析编程语言、最近的接受历史和训练字符等特征,将那些得分较低的建议隐藏起来。

然而,Cursor 认为这种解决方案虽然可以预测用户接受建议的概率,但希望有一个更通用的机制,能够重用 Tab 模型学到的强大代码表示。Cursor 希望通过改变 Tab 模型的结构,避免在最初就产生低质量建议,而不是后续再进行过滤。

因此,Cursor 采用了策略梯度方法,这是一种强化学习的方法。当用户接受建议时,模型会得到奖励;当建议被拒绝时,模型会受到惩罚;而在选择保持沉默时则不会得到任何反馈。此方法需要 “在线” 数据,即从当前使用的模型收集的反馈。Cursor 通过每天多次向用户部署新的检查点,并迅速基于新交互对模型进行再训练,来解决这一问题。

Cursor 表示,当前从部署检查点到收集数据的过程仅需1.5到2小时,这在 AI 行业中已经算是较快,但仍有进一步加速的空间。该公司的 Tab 模型每天处理超过4亿个请求,Cursor 希望这一改进能够提升开发者的编码体验,并计划在未来进一步开发这些方法。

在线强化学习是该领域最令人兴奋的方向之一,一位在 OpenAI 从事后训练的工程师在社交媒体上对此表示赞赏,称 Cursor 似乎是第一个成功在大规模上实施该技术的公司。 

不久前,Cursor 的母公司 Anysphere 宣布融资9亿美元,估值达99亿美元,并推出了一项月费200美元的 “超值” 计划,承诺提供20倍于20美元月费 “专业版” 的使用量。此外,Cursor 还在同月进行了平台更新,新增了自动代码审查、记忆功能和一键设置模型上下文协议服务器的功能。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/372315

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。