《R与Hadoop大数据分析实战》一第1章 R和Hadoop入门
本节书摘来自华章出版社《R与Hadoop大数据分析实战》一书中的第1章,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区“华章计算机”公众号查看
第1章 R和Hadoop入门
第1章讲述了几个与R和Hadoop基本知识相关的主题,包括:
R的安装、功能和数据建模
Hadoop的安装、特征和组成部分
前言已介绍了R和Hadoop。本章将重点关注了解并使用这两种技术。到目前为止,R主要用于统计分析,但由于功能和程序包越来越多,在其他一些领域内,它也很受欢迎,例如机器学习、可视化和数据操作。R不能加载所有数据(大数据)到机器内存。所以,可以选择Hadoop把数据用作大数据加载。不是所有的算法都能在Hadoop中运行,而且在一般情况下,这些算法并不属于R算法。尽管如此,使用R语言进行分析还是在某些方面与大数据相关。为了分