10分钟大数据Hadoop基础入门
前言
目前人工智能和大数据火热,使用的场景也越来越广,日常开发中前端同学也逐渐接触了更多与大数据相关的开发需求。因此对大数据知识也有必要进行一些学习理解。
基础概念
大数据的本质
一、数据的存储:分布式文件系统(分布式存储)
二、数据的计算:分部署计算
基础知识
学习大数据需要具备Java知识基础及Linux知识基础
学习路线
(1)Java基础和Linux基础
(2)Hadoop的学习:体系结构、原理、编程
第一阶段:HDFS、MapReduce、HBase(NoSQL数据库)
第二阶段:数据分析引擎 -> Hive、Pig
数据采集引擎 -> Sqoop、Flume
第三阶段:HUE:Web管理工具
ZooKeeper:实现Hadoop的HA
Oozie:工作流引擎
(3)Spark的学习
第一阶段:Scala编程语言 第二阶段:Spark Core

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
【飞天存储服务月报】2018年6月刊
【重点新闻】 1、产品降价:阿里云对象存储OSS刷新行业最低价 6月7日,在2018云栖大会·上海峰会上,阿里云宣布云存储产品开启新一轮降价,其中对象存储OSS产品价格下调了18.9%,刷新了云存储的全网最低价,表格存储TableStore按量读写及资源包最高下调50%。调价后,对象存储OSS标准型的最低售价为0.12元/GB/月,购买500TB存储资源包相当于用户每月最多可节省7000多元。此番调价将进一步扩大云存储对线下存储的竞争优势。 2、耗时仅45天!全球互联网史上规模最大的公共云数据迁移完成 在2018云栖大会上海峰会上,阿里云和115科技共同宣布完成全球互联网史上规模最大的公共云数据迁移,总量超过100PB。同时,整个过程仅耗时45天,刷新了百PB级数据公共云迁移的新纪录,打破AWS用时3个月完成70PB数据迁移记录,成为全球
- 下一篇
elasticsearch安装ik中文分词插件
在这里我将介绍一下如何给elasticsearch安装ik中文分词插件。 注意:选择的elasticsearch和ik版本要正确,否则会出现错误。在这里我选择的是elasticsearch1.4.0和ik1.2.9版本。 所需要的文件已上传到百度云盘,请读者自行下载 链接: http://pan.baidu.com/s/1migZtag 密码: 3ym8 步骤1:将elasticsearch-1.4.0.tar.gz解压 步骤2:将解压后的ik文件夹放到config路径下; 将解压后的httpclient-4.4.1.jar和httpcore-4.4.1.jar放到lib路径下 步骤3:新建plugins文件夹,如果有plugins目录,直接在该目录下新建文件夹analysis-ik,将elasticsearch-analysis-ik-1.2.9.jar放到该路径下 步骤4:在配置文件config/elasticsearch.yml中增加ik的配置,最末尾添加 index: analysis: analyzer: ik: alias: [ik_analyzer] type: org....
相关文章
文章评论
共有0条评论来说两句吧...