《R语言数据挖掘》----1.5　文本挖掘-低调大师

《R语言数据挖掘》----1.5　文本挖掘

2017-05-01 722

本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章，第1.5节，作者［哈萨克斯坦］贝特·麦克哈贝尔（Bater Makhabel），李洪成许金炜段力辉译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.5　文本挖掘

文本挖掘基于文本数据，关注从大型自然语言文本中提取相关信息，并搜寻有意义的关系、语法关系以及提取实体或各项之间的语义关联。它也被定义为自动或半自动的文本处理。相关的算法包括文本聚类、文本分类、自然语言处理和网络挖掘。

文本挖掘的特征之一是数字与文本混合，或者用其他的观点来说，就是源数据集中包含了混合数据类型。文本通常是非结构化文件的集合，这将被预处理并变换成数值或者结构化的表示。在变换之后，大部分的数据挖掘算法都可以应用，并具有不错的效果。

文本挖掘的过程描述如下：
第一步准备文本语料库，包括报告、信函等。

微信关注我们

原文链接：https://yq.aliyun.com/articles/89555

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《游戏大师Chris Crawford谈互动叙事》一9.5　真实案例

本节书摘来异步社区《游戏大师Chris Crawford谈互动叙事》一书中的第9章，第9.5节，作者：【美】Chris Crawford译者：方舟责编：陈冀康，更多章节内容可以访问云栖社区“异步社区”公众号查看。 9.5　真实案例游戏大师Chris Crawford谈互动叙事下面我们来看一个真实的文字冒险的例子：由Jon Ingold与2009年创作的《Make It Good》。下面列出游戏回显的所有文本（未经编辑）；以大于号“>”开头的文本是玩家的输入。我们不难看出，其中的文字叙述比一般电子游戏当中的要更有文采，具有更多文学作品的品质。 Broken Top Boulevard, Outside No. 15 (in the black chevy) The boulevard through the windscreen is lined with ash trees, thick trunks casting shadows and gnarled roots mangling up the sidewalk. You're sitting in your ca...

2017-05-01

555

本节书摘来自华章出版社《深度学习导论及案例分析》-书中的第1章，第1.1节，作者李玉鑑张婷，更多章节内容可以访问云栖社区“华章计算机”公众号查看第1章概述如何让机器从经验中学习长期以来都是哲学界和科学界的研究目标之一。学习能力对人类智能的形成和发展无疑起着至关重要的作用，而机器学习的研究显然有助于提高人工智能的水平。从原始的输入数据到产生意义的理解过程往往需要经过许多不同层次的信息处理、转换、表达和抽象，如果涉及的层次较深，深度学习的模型和方法就可能发挥重要作用。本章主要勾画深度学习的起源和发展、特点和优势、模型和算法。 1.1深度学习的起源和发展作为一种实现人工智能的强大技术，深度学习（deep learning）已经在手写数字识别、维数约简、语音识别、图像理解、机器翻译、蛋白结构预测和情感识别等各个方面获得了广泛应用［1

2017-05-01

570

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。