论文:大模型代码生成服务的稳定性和可靠性研究

加州大学两名华人学生发表论文《A Study on Robustness and Reliability of Large Language Model Code Generation》,研究了大模型 (LLM) 生成的代码的稳定性和可靠性。

论文提到,生成的代码中滥用 API 可能会导致严重的问题,例如资源泄漏、程序崩溃等。

更糟糕的是,使用 LLM 代码生成服务的用户实际上是最容易受到这些看似正确的代码影响的开发者——他们不熟悉 LLM 生成代码的 API。因此,他们很难分辨出 LLM 生成的代码中存在的误用,这进一步放大了错误代码在实际软件中的应用。

现有的代码评估基准和数据集主要集中在制作编码面试的编程问题等小任务上,但这与开发者向 LLM 寻求实际编码帮助的问题有所偏差。为了弥补这一缺失,研究者在这项工作中提出了一个数据集 RobustAPI,用于评估 LLM 生成的代码的可靠性和稳定性。

他们从 StackOverflow 收集了 1208 个具有代表性的编码问题,涉及到了 24 个常用 的Java API 。研究人员总结了这些 API 的常见误用模式,并在当前流行的 LLM 上对其进行了评估。评估结果表明,即使是 GPT-4,也有 62% 的生成代码包含 API 误用,如果将这些代码引入实际软件中,将会造成意想不到的后果。

论文地址:https://arxiv.org/pdf/2308.10335

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/255785

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。