什么是机器阅读理解？跟自然语言处理有什么关系？-低调大师

什么是机器阅读理解？跟自然语言处理有什么关系？

2020-04-29 800

云栖号资讯：【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！

导读：机器阅读理解（Machine Reading Comprehension，MRC）是一种利用算法使计算机理解文章语义并回答相关问题的技术。由于文章和问题均采用人类语言的形式，因此机器阅读理解属于自然语言处理（Natural Language Processing，NLP）的范畴，也是其中最新、最热门的课题之一。

近年来，随着机器学习（Machine Learning），特别是深度学习（Deep Learning）的发展，机器阅读理解研究有了长足的进步，并在实际应用中崭露头角。

本文将介绍机器阅读理解任务的相关概念，并讨论这项课题所涉及的自然语言处理这项关键支撑技术。

01 机器阅读理解任务

学者C. Snow于2002年发表的一篇论文中将阅读理解定义为“通过交互从书面文字中提取与构造文章语义的过程”。而机器阅读理解的目标是利用人工智能技术，使计算机具有和人类一样理解文章的能力。

图1所示为机器阅读理解的一个样例。示例中，机器阅读理解模型需要用文章中的一段原文来回答问题。

1. 机器阅读理解模型

机器阅读理解模型的输入为文章和问题文本，输出为最终的回答。为了完成任务，模型需要深度分析文章语义以及文章和问题之间的联系，然后根据文章中的内容作出准确回答。

当前，绝大多数机器阅读理解算法均采用深度学习模型，利用深度神经网络进行建模与优化。深度学习的特点是，模型能根据训练集上预测的准确度直接优化参数，不断提高模型性能，从而达到很好的效果。

由于深度学习需要在数值空间处理信息，因此阅读理解模型首先要对文章和问题进行数字化表示，形成文本编码。常见的方法是词向量（word vector）：将文本分成若干单词，然后用一串数字（即一个向量）表示一个单词。

常用的中英文分词算法我们已经在《为什么中文分词比英文分词更难？有哪些常用算法？（附代码）》介绍。

接下来，机器阅读理解模型会对这些数字化编码进行各种操作，获得上下文信息以及文章和问题之间的语义关联，从而获取有关答案的线索。一般而言，基于深度学习的机器阅读理解模型的架构分为3个部分：

编码层对文章和问题进行单词编码，并完成上下文语义分析；
交互层处理文章和问题之间的关联信息，找出文章中与问题相关的线索；
输出层将之前处理的信息按照任务要求生成答案。

不同的机器阅读理解模型通常是上述3个部分中使用不同的模块与连接方式。但无论哪种阅读理解模型，其训练过程都依赖于人工标注的数据，如大量文章–问题–答案的三元组。

但是，生成这些标注数据需要花费大量的时间和人力。因此，近年来自然语言处理界提出了预训练+微调模式：在大量无标注文本数据上训练大规模模型，然后在少量具体任务的标注数据（如阅读理解）上进行微调。这种模式取得了很好的效果，也有效缓解了标注数据缺乏的问题。

2. 机器阅读理解的应用

随着各行各业文本数据的大量产生，传统的人工处理方式因为处理速度慢、开销巨大等因素成为产业发展的瓶颈。因此，能自动处理分析文本数据并从中抽取语义知识的机器阅读理解技术逐渐受到人们的青睐。

例如，传统的搜索引擎只能返回与用户查询相关的文档，而阅读理解模型可以在文档中精确定位问题的答案，从而提高用户体验。

在客户服务中，利用机器阅读理解在产品文档中找到与用户描述问题相关的部分并给出详细解决方案，可以大大提高客服效率。
在智能医疗领域，阅读理解模型能根据患者症状描述自动查阅大量病历和医学论文，找到可能的病因并输出诊疗方案。
在语言教育方面，可以利用阅读理解模型批改学生的作文并给出改进意见，随时随地帮助学生提高作文水平。

可以看出，凡是需要自动处理和分析大量文本内容的场景下，机器阅读理解都可以帮助节省大量人力和时间。

在很多领域中，如果阅读理解模型的质量没有达到完全替代人类的水平，可采用与人工结合的方式，利用计算机处理简单高频的问题，从而达到降低成本的作用。因此，机器阅读理解成为当前人工智能研究中最前沿、最热门的方向之一。

02 自然语言处理

机器阅读理解属于语言处理的范畴，而自然语言处理是人工智能领域的重要研究方向。它主要分析人类语言的规律和结构，设计计算机模型理解语言并与人类进行交流。自然语言处理的历史可以追溯到人工智能的诞生。

在数十年的发展中，自然语言的处理、理解和生成等领域的研究已经取得了长足的进步。这些都为机器阅读理解研究奠定了坚实的基础。本节主要介绍自然语言处理的研究现状及其对机器阅读理解的影响。

1. 研究现状

经过70余年的发展，自然语言处理相关研究已经细化分类成许多子任务。以下是与机器阅读理解相关的重要研究方向。

(1).信息检索（information retrieval）。研究如何在海量文档或网页中寻找与用户查询相关的结果。信息检索方面的研究已经相当成熟，并广泛应用在网页搜索等产品中，为信息的传播和获取提供了极大的便利。当一个阅读理解任务涉及大规模文本库时，信息检索通常作为系统中抽取相关信息的第一个模块。
(2).问答系统（question and answering system）是指可以自动回答用户提出问题的系统。问答系统与信息检索的区别在于，问答系统需要理解复杂问题的语义，并支持多轮有上下文的对话。例如，对话式阅读理解需要模型同时分析文章语义和之前对话轮次的信息，再对当前问题作出回答。
(3).文本分类（text classification）是指对文章、段落、语句进行分类，如将大量网页按照内容和主题进行划分。一些机器阅读理解模型对问题进行分类，如关于时间的问题、关于地点的问题等，以提高答案的准确性。这种问题分类就属于文本分类的范畴。
(4).机器翻译（machine translation）研究如何让计算机自动翻译文本，可以应用在跨语言的阅读理解任务中。例如，当文本来自小语种语言时，我们可以利用机器自动翻译常用语言中的阅读理解数据，从而解决训练数据缺乏的问题。
(5).文本摘要（text summarization）研究如何用简洁的语言概括文章的主旨和重要信息。由于文本摘要需要对文章语义进行分析并生成结果，其中的很多技术被应用到机器阅读理解中，例如序列到序列模型（sequence-to-sequence），拷贝–生成网络（pointer-generator network）等。

2. 仍需解决的问题

随着相关模型的不断发展，自然语言处理在许多任务中取得了令人瞩目的成绩。但是，仍有许多没有很好解决的问题，其中也包括对基本语言结构和语义的理解。这些也是机器阅读理解研究中亟待解决的问题。

1）语言的歧义性

由于语言的一大特性是用较为精练的语句代表复杂的语义，因此一段文本时常会存在多义和歧义等情况，也就是有多种合理的解释方式。来看下面几个例子。

示例1：工厂领导对小张的批评意见进行过多次讨论。

这里，既可以理解为领导讨论了小张对工厂提出的批评意见，也可以理解为领导讨论了对小张的批评意见。原因是“对”的对象可以是“小张的批评意见”，也可以是“小张”。

示例2：化学所取得的成绩是有目共睹的。

这里，既可以理解为成绩是“化学”取得的，也可以理解为成绩是“化学所”取得的。原因是“所”既可以作为介词，也可以作为“化学所”的一部分。

示例3：我要炒青菜。

这里，可以认为“炒青菜”是一道菜，而“我”在点菜，也可以认为“我”要去炒青菜。原因是“炒”可以作为整句话的动词，也可以和“青菜”组成菜名。

这样的歧义性示例还有许多。即使人类在面对这些语句时，也很难判断说话者的真实意图。但是，如果有上下文信息，歧义就会消除。

例如，“我要炒青菜”发生在餐馆点菜语境中，就说明“炒青菜”是一道菜；“化学所取得的成绩是有目共睹的”出现在学校领导对化学所的考评中，就表示成绩是属于“化学所”的。

到目前为止，自然语言处理的模型仍不能很好地理解上下文的语义。研究人员通过分析自然语言处理模型在机器阅读理解模型等任务上的结果，发现现有模型很大程度上是基于单词或关键词进行匹配，这也导致这些模型对于歧义性文本的处理能力很低。

2）推理能力

在人类语言交流中，许多时候可以从语言推理得出结论，而不需要详细说明。例如，下面这个顾客通过客服订票的对话例子：

客服：您好，请问我可以怎样帮助您？
顾客：我想订一张5月初从北京去上海的机票。
客服：好的，那么您想哪天出发？
顾客：嗯，我是去上海开会，这个会从4号开到7号。
客服：好的，下面是5月3日从北京出发到上海的直达航班信息……

上面的对话中，顾客并没有正面回答客服关于哪天出发的问题，而是给出了开会的时间段。

但是，从订机票去开会这个事件可以推理出，顾客一定是想在会议开始前到达目的地，因此客服给出了5月3日出发的航班信息。当然，如果顾客想要订上海回北京的机票，客服就应该给出5月7日晚或5月8日出发的航班信息。

因此，智能客服的模型需要根据之前的谈话内容推断出所需要的信息——出发日期。这种推断需要模型具有一定的常识，即航班必须在开会前到达目的地。

近年来已经出现常识和推理在自然语言处理应用上的研究，但如何让模型包含海量的常识并进行有效的推理仍是一个需要解决的问题。

【云栖号在线课堂】每天都有产品技术专家分享！
课程地址：https://yqh.aliyun.com/zhibo

立即加入社群，与专家面对面，及时了解课程最新动态！
【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间：2020-04-29
本文作者：朱晨光
本文来自：“大数据DT 微信公众号”，了解相关信息可以关注“大数据DT”

微信关注我们

原文链接：https://yq.aliyun.com/articles/758311

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

ES[7.6.x]学习笔记（五）动态映射

通常情况下，我们使用ES建立索引的步骤是，先创建索引，然后定义索引中的字段以及映射的类型，然后再向索引中导入数据。而动态映射是ES中一个非常重要的概念，你可以直接向文档中导入一条数据，与此同时，索引、字段、字段类型都会自动创建，无需你做其他的操作。这就是动态映射的神奇之处。动态字段映射 ES的动态映射默认是开启的，动态映射的默认规则如下： JSON的数据类型 ES中的数据类型 null 不会映射字段 true 或 false boolean类型浮点型数字 float 整型数字 long JSON对象 Object 数组第一个非空值得类型 String 1、如果满足日期类型的格式，映射为日期类型 2、如果满足数字型的格式，映射为long或者float 3、如果就是字符串，会映射为一个text类型和一个keyword类型接下来我们看看动态映射的一个例子，我们直接向dynamic-index索引中存放一条数据，注意，dynamic-index这个索引我们没有创建过，直接存放数据，索引会自动创建。接下来，我们看一下具体的请求： PUT /dynamic-index/_doc/1 { "...

2020-04-29

596

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！随着内部部署数据库基础设施和传统数据库管理系统的衰落，其逐渐被在云平台中运行的灵活、可扩展、经济高效的数据库管理系统所取代。这是因为很多组织需要采用创新的数据库管理系统(DBMS)，因此希望迁移到云平台中。云计算数据库管理系统(DBMS)利用即付即用模型，可以提供灵活的定价、减少资本支出，并降低运营支出。因此，数据库即服务(DBaaS)的应用日益广泛。根据调查机构的预测，到2021年，云计算数据库管理系统(DBMS)的收入将占数据库管理系统(DBMS)市场总收入的50%。到2023年，75%的数据库将位于云平台上。这些趋势将对数据库管理系统(DBMS)供应商格局产生重大影响。什么是云计算数据库即服务? 云计算数据库即服务(DBaaS)使组织能够访问、更改和管理数据，而无需设置内部基础设施。数据库即服务(DBaaS)托管在云平台上，可以将操作和维护人员从运行企业数据库所需的日常任务中解脱出来。当数据库集群在云平台中时，与基础设施相关的一切都由云计算提供商处理和管理。这使得企业能够更好...

2020-04-29

657

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。