论文:大模型代码生成服务的稳定性和可靠性研究
加州大学两名华人学生发表论文《A Study on Robustness and Reliability of Large Language Model Code Generation》,研究了大模型 (LLM) 生成的代码的稳定性和可靠性。
论文提到,生成的代码中滥用 API 可能会导致严重的问题,例如资源泄漏、程序崩溃等。
更糟糕的是,使用 LLM 代码生成服务的用户实际上是最容易受到这些看似正确的代码影响的开发者——他们不熟悉 LLM 生成代码的 API。因此,他们很难分辨出 LLM 生成的代码中存在的误用,这进一步放大了错误代码在实际软件中的应用。
现有的代码评估基准和数据集主要集中在制作编码面试的编程问题等小任务上,但这与开发者向 LLM 寻求实际编码帮助的问题有所偏差。为了弥补这一缺失,研究者在这项工作中提出了一个数据集 RobustAPI,用于评估 LLM 生成的代码的可靠性和稳定性。
他们从 StackOverflow 收集了 1208 个具有代表性的编码问题,涉及到了 24 个常用 的Java API 。研究人员总结了这些 API 的常见误用模式,并在当前流行的 LLM 上对其进行了评估。评估结果表明,即使是 GPT-4,也有 62% 的生成代码包含 API 误用,如果将这些代码引入实际软件中,将会造成意想不到的后果。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
eBPF 到底是可观测领域的神器 or 鸡肋?
当下,eBPF 无疑是最火热的技术之一,它为云原生环境下的网络、安全和可观测性解决方案提供了全新的思路。 作为一种无需入侵应用代码、直接向操作系统内核安全添加代码的革命性技术,eBPF 使得企业能够不依赖内核固有的指标数据,直接编写代码收集自定义数据,并生成可观测性指标和事件。这不仅将可观测性扩展到内核,还能够实现零插桩的应用代码可观测性,同时保证了运行安全和开销可控。于是,不少人认为 eBPF 是可观测领域的未来之星。 然而,也有人觉得,eBPF 的作用被夸大了。它并不是适合每个项目或生态系统的灵丹妙药 —— 仅限于 Linux 和它的最新内核。而且“沙箱程序也是有限制的”,通过限制程序可以访问的操作系统部分,功能也可能受到限制。因此 eBPF 只不过是可观测体系中的一个小补充罢了,并不是可观测领域的未来主要方向。 对此,你怎么看呢?在你的工作中,eBPF 技术是不可或缺的“神器”,还是能力有限的“鸡肋”?企业和个人开发者又该怎么选呢? 本期,OSCHINA【开源漫谈】特地邀请了 5 位业内具有代表性的专家,直播探讨一下,eBPF 到底是可观测领域的神器 or 鸡肋? 直播主题:e...
- 下一篇
使用DWS集群,用户被锁定如何解锁
本文分享自华为云社区《【如何保证你的DWS数据更安全】使用DWS集群,用户被锁定如何解锁?》,作者:Shirley_Dou 。 一、管理员用户被锁定,怎么破?gsql: FATAL: The account has been locked. 1、重置集群密码可自动解锁,在集群管理页面,找到对应集群重置密码 2、使用重置后的密码连接数据库 二、get普通用户解锁新技能 1、解锁之前,先查询确认一下当前所有用户的状态 rolstatus: • 0:正常状态。 • 1:由于登录失败次数超过阈值被锁定了一定的时间。 • 2:被管理员锁定。 2、使用管理员用户连接数据库,然后执行以下命令进行解锁 三、GUC参数设置 出于安全机制考虑,GaussDB(DWS)在集群参数中通过以下GUC参数管理帐户密码,在管理控制台,单击集群名称,切换到“参数修改”页面可进行参数修改 • failed_login_attempts:输入密码错误的次数(建议值为10),超出设置值,数据库帐户会被自动锁定,可通过上述方法二解锁。 • password_effect_time:帐户密码的有效期(默认为90天),可以在连接...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7