《中国人工智能学会通讯》——7.2 基于深度学习的自然语言处理-低调大师

《中国人工智能学会通讯》——7.2 基于深度学习的自然语言处理

2017-09-03 739

7.2 基于深度学习的自然语言处理

深度学习旨在模拟人脑对事物的认知过程，一般是指建立在含有多层非线性变换的神经网络结构之上，对数据的表示进行抽象和学习的一系列机器学习算法。该方法已对语音识别、图像处理等领域的进步起到了极大的推动作用，同时也引起了自然语言处理领域学者的广泛关注。

如图 1 所示，深度学习为自然语言处理的研究主要带来了两方面的变化，一方面是使用统一的分布式（低维、稠密、连续）向量表示不同粒度的语言单元，如词、短语、句子和篇章等；另一方面是使用循环、卷积、递归等神经网络模型对不同的语言单元向量进行组合，获得更大语言单元的表示。除了不同粒度的单语语言单元外，不同种类的语言，甚至不同模态（语言、图像等）的数据都可以通过类似的组合方式，表示在相同的语义向量空间中；然后通过在向量空间中的运算来实现分类、推理、生成等各种能力，并应用于各种相关的任务之中。下面分别对这两方面加以详细的阐述。

微信关注我们

原文链接：https://yq.aliyun.com/articles/216565

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《中国人工智能学会通讯》——12.53 知识图谱构建技术

12.53 知识图谱构建技术知识图谱中知识的来源有两类，一类是互联网上分布、异构海量资源；一类是已有的结构化的异构语义资源。从第一类资源中构建知识图谱的方法根据获取知识的类型分为概念层次学习、事实学习、事件学习等，而第二类资源进行的工作是异构资源的语义集成。概念层次学习概念是人们理解客观世界的线索，是人们对客观世界中的事物在不同层次上的概念化描述，概念层次是知识图谱的“骨骼”。概念层次学习就是通过合理的技术，抽取知识表示中的概念，并确定其上下位关系。概念层次学习多采用基于启发式规则的方法，其基本思路是根据上下位概念的陈述模式，从大规模资源中找出可能具有上下位关系的概念对，并对上下位关系进行归纳。另一类是基于统计的概念层次学习方法[27] ，假设相同概念出现的上下文也相似，利用词语或实体分布的相似性，通过定义计算特征学习概率模型来得到概念结构。事实学习知识图谱中事实以三元组的形式表示，事实的数量决定了知识图谱的丰富程度。按照知识图谱构建时采用的机器学习方法可以分为有监督、半有监督及无监督的知识图谱构建方法。有监督的事实知识获取方法需要有已标注文档作为训练集，可以分为基于规则学习、...

2017-09-03

594

7.3 分布式表示深度学习最早在自然语言处理中的应用是神经网络语言模型[4] ，其背后的一个基本假设是使用低维、稠密、连续的向量表示词汇，又被称为分布式词表示（Distributed Word Representation）或词嵌入（Word Embedding）。从直觉上来讲，使用该项技术，可以将相似的词汇表示为相似的向量，如“马铃薯”和“土豆”的词向量比较相似。这样，如果我们在训练数据中只观察到了“马铃薯”，即使在测试时出现了“土豆”，也能通过词向量判断其与“马铃薯”比较相似，从而在一定程度上缓解了自然语言处理中常见的数据稀疏问题。在理论上，将原有高维、稀疏、离散的词汇表示方法（又称为 One-hot 表示）映射为分布式表示是一种降维方法，可有效克服机器学习中的“维数灾难（Curse of Dimensionality）”问题，从而获得更好的学习效果。同时这种分布式表示的表达能力更强，理论上其表达能力与其维度成指数关系，而传统离散表示是线性关系。另外一种对分布式词表示的理解是，不同维度表示了词的不同主题，各维度上的数值表示了一个词对于不同主题的权重，这相当于将原来线性不可分的一...

2017-09-03

733

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。