Learning Distributed Representations of Sentences from...-低调大师

Learning Distributed Representations of Sentences from...

2017-07-31 545

sentence representation的文章已经分享了几篇，包括了supervise和unsupervise的方法，但并没有对各种model进行系统地对比和分析，今天分享的这篇文章对现有各种各样的distributed representations of sentences model进行了分类、对比和分析，为了增强对比效果，还提出了两种虚拟的模型。最后将所有的模型在supervised和unsupervised评价任务中进行对比，得出了一些有意义的结论。本文的题目是：Learning Distributed Representations of Sentences from Unlabelled Data，作者是来自剑桥大学的Felix Hill博士。

首先对现有模型进行了分类描述。

1、直接在纯文本上进行训练的模型，模型包括：Skip-Thought Vector、Paragraph Vector，两种模型都在之前分享过。

2、在结构化资源上进行训练的模型，这种模型借助了一些纯文本之外的资源进行辅助练。模型包括：DictRep、CaptionRep、NMT。

DictRep是本文作者之前提出的一个模型，模型训练了一个从词典定义到预训练好的词向量之间的映射。

CaptionRep模型架构与DictRep一样，采用的数据集不同而已，这里使用了COCO数据集，训练一个从图像vector representation到图像caption的映射。

NMT是神经网络机器翻译，该模型架构与skip-thought vector模型相同，但训练数据换成了sentence-aligned翻译文本，WMT语料中的En-Fr和En-De。

3、本文提出的一些新模型。为了解决当前存在模型的问题，本文设计了两种虚拟模型。包括：Sequential (Denoising) Autoencoders(SDAE、SAE)和FastSent。

SDAE模型是为了解决Skip-Thought Vector模型对语料中句子连贯性的依赖问题。传统的去噪自编码器（DAE）一般都是一个输入是固定尺寸图像数据的前馈神经网络，本文利用一个噪声函数将传统的DAE扩展到变长度句子中，噪声函数是N(S|p0,px)，S表示一个句子，p0,px都是一个[0,1]的数，表示概率。首先，对于每一个S中的word，N函数会以一个p0的概率来删除word，概率是相互对立的。然后，对于S中的每一对不重叠的bigram，w(i)w(i+1)，N函数会以一个px的概率来交换两个词的位置。最后用一个类似NMT的encoder-decoder模型进行训练，只不过不同的是目标函数变了，变成了使得噪声最小。这里，source是经过噪声函数处理过的sentence，target是原始的sentence。这个模型就是SDAE模型，相比于skip-thought vector，可以处理任意顺序的句子集。如果令px=0,p0=0，我们称为SAE模型。这里p0其实就是防止深度网络模型训练时过拟合的正则化方法Dropout。

FastSent模型旨在解决Skip-Thought Vector模型计算速度慢的缺点，解决的思路与word2vec突破传统多层神经网络语言模型的思路类似，只用了一个简单的log-linear层。给定一个用词袋模型表示的句子，模型来预测该句子两边相邻的句子。该模型在训练时也会学习句中每个单词的词向量，并且将句子用句中所有词的词向量之和来表示。

下图给出了所有模型在性能上的比较：

其中，OS是指是否需要保留句子在语料中的顺序；R表示需要结构化的训练资源；WO：对词序敏感；SD：句子向量维度；WD：词向量维度；TR：训练时间；TE：编码50w句子需要的时间。

任务评价一共分为两类，监督学习任务和无监督学习任务。通过大量实验的比较，得出了一下的结论：

不同的任务适合不同的表示模型，这听起来像一句废话，也就是说没有哪种模型可以通吃所有的任务。比如：Skip-Thought Vector模型在TREC任务中最好，是因为句子和句子之间的衔接非常好，非常适合这个模型的特点。而Paraphrase detection任务更加适合于SDAE模型。

监督学习和无监督学习任务的表现存在差异，在监督学习任务中表现好的模型在无监督学习模型中表现的就会很一般，带有非线性网络结构的Skip Thought Vector、SDAE、NMT模型在监督学习中表现更好，而log-linear类的模型FastSent则在无监督学习任务中表现更好。

额外的资源会影响到训练处模型的通用性和实用性，比如一个在线demo需要很快的查询最近邻速度，用fastsent可能就没有问题，但用其他模型就达不到快速的要求。

词序的重要性并没有得到体现。本文的结果给出了一个与常识相左的结论，词序在决定句子意思表示时并没有想象中的那么重要。作者说到，可能是因为当前的评价方式并不能反映出词序的重要性，所以这个问题得不出一个明确的答案。（这点很有意思，在前面分享的一篇文章How to Generate a Good Word Embedding中，引用了一个结论，词序信息占了语义信息的20%，那么到底词序对于句子语义有多大的影响？需要好好研究一番）

评价指标存在缺陷，并不能绝对准确的对比出各个模型的差异。

最后，展示一个各模型训练之后的应用效果。

来源：paperweekly

原文链接

微信关注我们

原文链接：https://yq.aliyun.com/articles/175461

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《云计算：原理与范式》一第3章云时代的“集成即服务”范式使人受益匪浅

第3章云时代的“集成即服务”范式使人受益匪浅 PETHURU RAJ 3.1 简介引领潮流的云范式实际上代表了许多被证实为有应用前景的Web与企业技术的联合体。尽管云的理念并不是什么新概念，但实际上它却为整个信息与通信技术（ICT）产业带来了众多结构性转变。云的概念日渐影响信息技术（IT）和业务领域的某些重要方面。云计算带来了一系列新颖性：部署、交付、消费和定价模式。其中，定价模式的服务方向规定了一个更为简单的应用程序设计机制。被广泛探讨的云计算的突出贡献在于其快速实现、动态扩散、融合、自适应以及在线计算基础设施——这是未来IT的关键需求。在这里明显的区别是：云服务保证大多数的非功能需求（服务质量（QoS）特性），例如可用性、高性能、按需可扩展性/弹性、经济承受能力、全球规模的易用性以及可用性、能源效率等。理解了云基础设施（本书今后

2017-08-01

666

说明：本文主要学习Laravel的Middleware的源码设计思想，并将学习心得分享出来，希望对别人有所帮助。Laravel学习笔记之Decorator Pattern已经聊过Laravel使用了Decorator Pattern来设计Middleware，看Laravel源码发现其巧妙用了Closure和PHP的一些数组函数来设计Middleware。开发环境：Laravel5.3 + PHP7 + OS X 10.11 PHP内置函数array_reverse、array_reduce、call_user_func和call_user_func_array 看Laravel源码之前，先看下这几个PHP内置函数的使用。首先array_reverse()函数比较简单，倒置数组，看测试代码： $pipes=[ 'Pipe1', 'Pipe2', 'Pipe3', 'Pipe4', 'Pipe5', 'Pipe6', ]; $pipes=array_reverse($pipes); var_dump($pipes); //output array(6){ [0]=> str...

2017-08-01

539

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。