ChatGPT 和 Stack Overflow,谁的解答更胜一筹?
美国普渡大学最新发布的一份“谁的回答更好?深入分析 ChatGPT 和 Stack Overflow 对软件工程问题的回答”研究报告指出,ChatGPT 在回答软件编程问题时,错误率高达一半以上。
研究团队共分析了 ChatGPT 对 517 个 Stack Overflow 问题的回答,以评估 ChatGPT 回答的正确性、一致性、全面性和简洁性。同时还就这些答案进行了大规模的语言分析和用户研究,以便从语言和人性化方面了解 ChatGPT 答案的特点。
结果表明,52% 的 ChatGPT 答案是错误的,77% 的回答过于冗长。但尽管如此,鉴于其全面性和清晰的语言风格,仍有 39.34% 的人选择 ChatGPT 的回答。
且深入的人工分析结果得出,ChatGPT 答案中存在大量概念和逻辑错误;“由于 ChatGPT 无法理解所提出问题的基本语境,许多答案都是不正确的”。语言分析结果则指出 ChatGPT 的回答非常正式,很少描绘负面情绪或风险;“我们多次观察到 ChatGPT 插入了诸如‘我当然能帮你’、‘这肯定能解决’等语句。”
“我们的结果表明,有必要对 ChatGPT 中的错误进行仔细检查和纠正,同时让用户意识到看似正确的 ChatGPT 答案所带来的风险。”
研究人员观察到,只有当 ChatGPT 答案中的错误非常明显时,用户才能意识到。但当错误不易验证或需要外部 IDE 或文档时,用户往往会无法识别错误或者会低估答案的错误程度。“礼貌用语、清晰的教科书式风格的答案、全面性以及答案的关联性会使得完全错误的答案显得正确。”
普渡大学博士生、该论文的作者之一 Samia Kabir 向 The Register 表示,与 Stack Overflow 的答案相比,受访者更偏向不正确且冗长的 ChatGPT 答案。造成这一现象的原因有多种:
其中一个主要原因是 ChatGPT 的回答非常详细。在很多情况下,如果参与者从冗长而详细的答案中获得有用的信息,他们并不会介意答案的长度。此外,积极的情绪和答案的礼貌性也是另外两个因素。
当参与者发现 ChatGPT 的答案很有见地时,他们就会忽略错误。ChatGPT 自信地传达有洞察力的信息(即使信息不正确)的方式赢得了用户的信任,这使他们更喜欢错误的答案。
研究人员对 ChatGPT 答案和 Stack Overflow 答案的语言分析表明,机器人的反应“更正式,表达了更多分析思维,表达了更多的分析性思维,展示了更多为实现目标所做的努力,并表现出较少的负面情绪”。情感分析得出的结论是,ChatGPT 的答案比 Stack Overflow 的答案表达了“更积极的情绪”。
“根据我们的发现和这项研究的观察,我们建议 Stack Overflow 可以采用有效的方法来检测评论和答案中的毒性和负面情绪,以改善情感和礼貌。我们还认为 Stack Overflow 可能希望提高答案的可发现性,以帮助找到有用的答案。此外,Stack Overflow 可能希望提供更具体的指南来帮助回答者构建答案,例如:以循序渐进、注重细节的方式。”
此外论文指出,这项研究工作还旨在鼓励进一步研究如何识别和减少不同类型的概念和事实错误。“我们希望这项工作能促进更多关于机器生成答案中不正确性的透明度和交流的研究,尤其是在 SE 的背景下。”
详情可查看完整报告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
谷歌发布 AI 代码编辑器:Project IDX
8 月 8 日,谷歌宣布推出 AI 代码编辑器 Project IDX,这是一个基于浏览器的开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于构建全栈网络和多平台应用程序。 谷歌在创建 Project IDX 时并没有构建新的 IDE(集成开发环境),而是使用 VS Code 作为其项目的基础。这让团队能够专注于与 Codey 的集成,Codey 是谷歌基于 PaLM 2 的编程任务基础模型。Project IDX 支持智能代码补全,可以帮助开发者解答一般编码问题,提供与你正在处理的代码有关的特定问题(包括解释能力)的类似 ChatGPT/Bard 的聊天机器人,以及添加如“添加注释”等上下文代码操作的能力。 目前,Project IDX 支持 Angular、Flutter、Next.js、React、Svelte 和 Vue 等框架以及 JavaScript 和 Dart 等语言,后续还将支持 Python、Go 和其他语言。 Project IDX 特性 随时随地快速开始:你能够在任何地方、任何设备上进行开发,具有本地开发的全部保真度。每个 Project I...
- 下一篇
OpenSSL 3.0.0 设计(一)|介绍、术语与架构
译|王祖熙(花名:金九) 蚂蚁集团开发工程师负责国产化密码库 Tongsuo 的开发和维护**专注于密码学、高性能网络、网络安全等领域 本文 4830 字 阅读 13 分钟 本文翻译 OpenSSL 官网文档:https://www.openssl.org/docs/OpenSSL300Design.html Tongsuo-8.4.0 是基于 OpenSSL-3.0.3 开发,所以本文对 Tongsuo 开发者同样适用,内容丰富,值得一读! 由于文章篇幅较长,今天发布的是介绍、术语和架构三部分内容,后续内容将随每周推送完整发布,请持续关注铜锁公众号。 1►介绍 这份文件概述了 OpenSSL 3.0 的设计,它是在 1.1.1 版本之后的又一个版本。阅读本文需要您已经熟悉名为“OpenSSL 战略架构”的文件,并具备对 OpenSSL 1.1.x 的工作知识。 OpenSSL 3.0 版本对大多数现有应用程序影响很小;几乎所有性能良好的应用程序都只需重新编译即可。 OpenSSL 3.0 中的大部分改动都是内部架构重组,以促进建立一个可长期支持的加密框架,从而更好地将算法实现与算法 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6