Paper Digest | GPT-RE：基于大语言模型针对关系抽取的上下文学习-低调大师

Paper Digest | GPT-RE：基于大语言模型针对关系抽取的上下文学习

2024-04-02 469

笔记整理：张廉臣，东南大学硕士，研究方向为自然语言处理、信息抽取

链接：https://arxiv.org/pdf/2305.02105.pdf

持续分享SPG及SPG + LLM双驱架构应用相关进展

查看官网： spg.openkg.cn/

1、动机

在很多自然语言处理任务中，上下文学习的性能已经媲美甚至超过了全资源微调的方法。但是，其在关系抽取任务上的性能却不尽如人意。以GPT-3为例，一些基于GPT-3的上下文学习抽取方法在关系抽取任务上不理想的效果主要来自于两个方面：① 检索演示示例中实体、关系的相关度较低；② 大语言模型具有将NULL例子错误分类成为预定义关系类型的强烈倾向。造成①的原因主要是以上方法通过随机选择或基于句子表示的K近邻法检索演示示例。这会导致演示示例实体、关系的相关度低；造成②的原因主要是相对于符合预定义类型的示例，NULL示例的复杂度更高，该类型是包含各种未定义的关系的集合。针对以上问题，该论文提出了结合实体感知检索策略和事实标签诱导策略的GPT-RE，以提高基于大语言模型的上下文学习在关系抽取任务上的性能。

2、贡献

该论文的主要贡献包括：1）提出了实体感知检索策略和事实标签诱导策略，实体感知检索策略能够在演示检索中结合实体信息，获取更适合关系抽取任务的表示；事实标签诱导策略能够引导大语言模型输出更理想的结果；2）通过实验验证了结合以上两种策略的基于大语言模型的上下文学习框架能够在关系抽取任务中取得很好的效果，在测试数据集上的性能已经赶上甚至超过了现有全监督基线模型；

3、方法

图1 GPT-RE框架

GPT-RE是一个使用GPT-3的基于上下文学习的关系抽取框架，其具体方法如下：

3.1提示构建：

GPT-RE的提示主要包括三部分，分别是：①任务描述和关系预定义类型，②小样本演示示例，③输入样本。提示包含的任务描述和关系预定义类型是对关系抽取的任务描述和其相关的关系预定义类型的一个简洁概括，模型会根据这部分的内容输出预定义的关系类型，若测试样本不属于任何预定义关系类型，模型会输出NULL标签。小样本演示示例是输入模型的演示示例，其中，每条样例包含文本和该文本中所包含的关系，演示示例可以通过后续推理过程进一步的丰富。输入样本为一条文本，GPT-3的任务就是输入文本中实体对所对应的关系。

3.2 实体感知演示检索：

因为演示示例在表示空间中接近测试样本可以使模型表现出更好的性能，最近的一些工作使用K近邻法选出与测试样本句子表示最相近的演示示例。但是，由于句子表示和关系抽取之间的差异，原始上下文的表示在关系抽取任务中不足以完全作为检索演示示例的标准，该论文提出了两种新的获取表示方法提升检索演示示例的质量。

3.2.1 实体提示句子表示：

首先，考虑到实体信息在关系抽取任务中的重要性，作者利用实体对信息重建原始上下文。其具体做法是在原文中加入描述原文中实体对关系类型的内容。在计算句子相似度时，作者使用了最新的健壮模型SimCSE来计算句子之间的相似度。

3.2.2微调关系表示：

由于关系表示在很多情况下天然地包含了实体表示的信息，与将实体信息加入到上下文中相比，更直接的解决方法是从微调模型中提取关系表示用于检索演示示例。作者认为这种方法可以潜在地弥补GPT-3在关系抽取任务中的局限性。虽然基于GPT-3的上下文学习只使用有限的演示示例，但预训练模型的微调过程可以在整个训练集上进行。这种方法有两个优点：首先，直接使用适应关系抽取任务的关系表示可以显著提高整体检索质量；其次，由于微调后的模型可以准确识别NULL类型，因此过度预测NULL问题将得到缓解。

3.3事实标签诱导推理：

最近的工作表明，逻辑提示可以引导大语言模型获得理想输出。在该论文中，作者让GPT-3通过相应的事实关系标签来生成每个演示示例的推理逻辑过程。例如，给定一个选定的示例，作者首先基于该示例文本提出一个提示，然后利用GPT-3生成推理上下文中实体对之间关系类型的逻辑线索。最后，作者通过将生成的线索与原始示例结合起来增强演示示例。

4、实验

该论文使用了三个开放领域关系抽取数据集和一个科学领域关系抽取数据集共四个数据集作为实验数据，分别为：Semeval 2010 task 8, TACRED, ACE05和SciERC。基于以上四个数据集的对比方法共分为两大类，第一类为传统的微调基线模型，如PURE；第二类是基于GPT-3的基线模型，如GPT-Random等。该论文对比了以上基线模型和GPT-RE在使用不同表示检索演示示例时的性能，并对比了是否加入实施标签诱导推理提示时GPT-RE的性能差异，其主实验结果如下图所示：

图2 实验结果

此外，该论文也进行了一系列消融实验和在低资源场景下的实验，具体实验结果请参照原论文。实验结果表明：① 在检索演示示例时，使用适合特定任务的句子表示是有必要的，无论是使用GPT-RE_SimCSE还是GPT-RE_FT都取得了比GPT-Sent更好的效果；② GPT-RE_FT表现出的性能表明，基于GPT-3的上下文学习有潜力在关系抽取上取得很好的效果，甚至已经在Semeval和SciERC上取得了SOTA效果；③ 相比于GPT-RE_SimCSE，推理模块对GPT-RE_FT的加成更小，这说明GPT-RE_FT获得的演示示例在本实验中质量更高。同时，小样本时推理模块会使模型具有更好的性能。

5、总结

总的来说，该论文探索了GPT-3上下文学习在关系抽取任务上的潜力。针对GPT-3在此任务上存在的问题，该论文提出了两个策略弥补了基于GPT-3框架和目前SOTA基线模型的差距，实验结果表明，GPT-RE在三个数据集上显著优于微调基线模型，并在Semeval和SciERC上实现了SOTA效果。同时，作者对GPT-3如何克服现有困难，如NULL标签的影响等进行了详细的实例分析，以上工作对后续研究具有比较大的意义。

持续分享SPG及SPG + LLM双驱架构应用相关进展

查看官网： spg.openkg.cn/

Github： github.com/OpenSPG/ope…

微信关注我们

原文链接：https://my.oschina.net/u/7032067/blog/11050320

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

客户案例丨拓数派向量计算引擎PieCloudVector助力东吴证券AIGC应用升级

1.项目背景随着人工智能技术的不断创新和应用，我们可以看到人工智能在各个领域的应用越来越广泛。深度学习技术在图像识别、语音识别、自然语言处理等领域表现出色。机器学习算法的改进将解决更多实际问题，如增强学习、迁移学习和联合学习等，以更有效地处理复杂的数据问题。自然语言处理技术的不断进步，有助于实现更自然的对话和交流方式，在智能客服、虚拟助手、智能翻译等方面有着广泛应用。数据与AI融合是不可阻挡的历史潮流，大数据和AI技术相互激发、相辅相成，共同推进彼此的发展，两把“金钥匙”握手会再次在金融行业掀起高潮。 AIGC类应用是数智融合的典型，底层基础是强大的数据治理能力，预训练语言大模型不断获得高质量数据进行训练、迭代和优化，从而带来远胜以往的智能应用理念。大模型将激活证券行业的非结构化数据，更高效地释放数据价值，应用将渗透到业务前中后段，带来新的生产力升级。大模型的爆发，将金融业带入到了一个全新时代，但同时也给行业带来了一些难题。 2.现状及痛点 2.1 数据安全问题涉及敏感信息的业务应用，数据隐私是一个不可忽视的问题。部分场景中存在调用LLMAPI接口服务的情况，不能直接拿取业务数据，...

2024-04-02

419

升级内容： 1、基于React重构Web端，提升Web端操作体验；2、支持自定义存储引擎和rpc组件功能；3、文档优化和部分代码逻辑优化一键部署，一行代码接入，无需大数据研发运维经验，轻松实现海量数据实时统计，使用 XL-LightHouse 后： 1、再也不需要用 Flink、Spark、ClickHouse 或者基于 Redis 这种臃肿笨重的方案跑数了； 2、再也不需要疲于应付对个人价值提升没有多大益处的数据统计需求了，能够帮助您从琐碎反复的数据统计需求中抽身出来，从而专注于对个人提升、对企业发展更有价值的事情； 3、轻松帮您实现任意细粒度的监控指标，是您监控服务运行状况，排查各类业务数据波动、指标异常类问题的好帮手； 4、培养数据思维，辅助您将所从事的工作建立数据指标体系，量化工作产出，做专业严谨的职场人，创造更大的个人价值；概述 XL-LightHouse 是针对互联网领域繁杂的流式数据统计需求而开发的一套集成了数据写入、数据运算、数据存储和数据可视化等一系列功能，支持超大数据量，支持超高并发的【通用型流式大数据统计平台】。 XL-LightHouse 目前已基本涵盖了常...

2024-04-02

359

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。