GPT 模型容易被误导从而输出问题内容-低调大师

GPT 模型容易被误导从而输出问题内容

2023-10-19 317

微软研究院近日发布文章介绍了他们对 GPT 模型可信度的研究。文章称 GPT 模型很容易被误导，产生有毒和有偏见的输出，并泄露训练数据和对话历史中的隐私信息。

微软联合伊利诺伊大学厄巴纳-香槟分校与斯坦福大学、加州大学伯克利分校、人工智能安全中心发布了一款面向大语言模型的综合可信度评估平台——DecodingTrust，对大模型的毒性、刻板偏见、对抗稳健性、分布稳健性、对抗演示稳健性、隐私、机器伦理和公平性等内容进行评估。

根据测试，研究者发现GPT 模型很容易被误导，产生有毒和有偏见的输出，并泄露训练数据和对话历史中的隐私信息。

研究还发现，虽然在标准基准上，GPT-4 通常比 GPT-3.5 更值得信赖，但在越狱系统或用户提示的情况下，GPT-4 更容易受到攻击，这些提示是恶意设计来绕过 LLM 的安全措施的，这可能是因为 GPT-4 更精确地遵循了（误导性的）指令。

微信关注我们

原文链接：https://www.oschina.net/news/262405/trustworthiness-in-gpt-models

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Gartner 发布 2024 十大战略技术趋势

Gartner 最新发布了预计将在未来 36 个月内为 IT 领导者带来重大颠覆和机遇的 10 大战略技术趋势。“这些创新可以推动你更快地实现业务目标，尤其是在人工智能快速发展的时代。” 十大技术趋势具体如下：人工智能信任、风险和安全管理 (AI TRiSM) 持续威胁暴露管理 (CTEM) 可持续技术平台工程人工智能增强开发行业云平台智能应用全民化的生成式人工智能增强型互联员工队伍（Augmented-Connected Workforce）机器客户（Machine Customers）该公司每年都会列出一份它认为下一年将在科技行业占据主导地位的 10 大趋势。每种趋势都与企业的一个或多个关键主题有关：保护和保存过去和未来的投资，在正确的时间为正确的利益相关者构建正确的解决方案，以及为内部和外部客户不断变化的环境提供价值。在今年的清单中，其中有 5 个趋势属于“资产保护”的类别：人工智能信任、风险和安全管理 (AI TRiSM)，持续威胁暴露管理 (CTEM)，行业云平台，可持续技术，全民化的生成式人工智能。 Gartner 表示，实现这种保护的关键在于要深思熟虑...

2023-10-19

312

ScyllaDB是一家成立于2012年12月的美国公司，总部位于加利福尼亚州桑尼维尔。作为一家数据密集型应用程序数据库供应商，ScyllaDB生产的NoSQL数据库兼容Apache Cassandra和Amazon DynamoDB，具有可靠的低延迟和10倍的吞吐量。在2023年10月17日，该公司成功获得了4300万美元的融资。截至目前，ScyllaDB已经筹集了1.03亿美元的风险投资。关于ScyllaDB公司本篇内容是根据 Kyle Wiggers 发布在 TechCrunch 网站上的文章翻译整理，以下是玖章算术NineData的工程师点评：：对于日新月异的高科技领域，NoSQL属于爷爷辈的技术名词。ScyllaDB 成立在10+年前，对标MongoDB, Cassandra和DynamoDB，依然显示其生命活力，主要的优势在于其向云原生的成功转型，精简的团队（168人）和成功的生态构建。在市场相对萎靡的情况下，作为一个数据库引擎公司，获得了投资者的青睐，说明投资方对于优质团队的信心。当然，我们也要看到现在数据库系统的公司暂时的困境，比如去年勉强上市的MariaD...

2023-10-19

333

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。