如何正确学习大数据,才能少走弯路?
https://img.mukewang.com/5cb7cc4f0001a4f206560411.jpg
在技术论坛中或知乎上,看到近几万的冤家都在疑惑,学习Java应该选择什麼展开方向,这个我们在之前的文章中有提到过,Java展开在范围上有三个选择方向:
这是全国最大的大数据学习交流的地方,2000人聚集,不管你是小白还是大牛,
小编我都挺欢迎,今天的已经资讯上传到群文件,不定期分享干货,
JavaEE,主要运用于企业级运用开发;安卓开发方向;嵌入式运用开发方向。在此建议大家选择JavaEE方向,由于运用非常普遍,岗位设置也比较多。
Java的职业展开规划之路我们也曾在(一文阐述Java从初级到初级的学习之路——
)详细罗列,这里就不逐一罗列了。
但我们历来没有讨论过学习Java,难道这辈子就只能做Java后端开发吗?只能在这条路上妥协终究吗?难道中途没有其他的选择吗?
偶然看法的一个冤家,最末尾是从事Java后端开发的,后来他在专业时间自学成功转入大数据行业,如今是一名大数据工程师,待遇也比之前好更多。前提是他是一名Java后端开发。
大数据是我们如今比较火的一个展开方向,但是很多培训机构有提到几个月速成的,小编觉得不是特别靠谱。
缘由有以下:
大数据是一个重生行业,还不太成熟。
Java展开了将近20年,也没有说几个月速成的,最多也就是带你入门,让你对Java的知识结构体系有一个明晰的认知,在后期的义务实际时期生长的速度更快。
大数据的起点要高,并不是所谓的零基础就可以入门的。
我们接上去讲述的有关大数据的学习是有条件限制的,首先你需求是一名普通的工程师,假设你是Java工程师的话更好,但假设你是小白的话,那就只能成爲一名工程师的后再来学习大数据吧。
一、看法大数据
大数据本质其实也是数据,不过也包括了些新的特征,
数据来源广;
数据格式多样化(结构化数据、非结构化数据、Excel文件等);
数据量大(最少也是TB级别的、甚至可以是PB级别);
数据增长速度快。
而针对以上新的特征需求思索很多成果:
例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何经过运算转化本钱人想要的结果呢?
关于这些成果,我们需求有相对应的知识处置。
二、大数据所需技艺要求
Python言语:编写一些脚本时会用到。
Scala言语:编写Spark顺序的最佳言语,当然也可以选择用Python。
Ozzie,azkaban:定时义务调度的工具。
Hue,Zepplin:图形化义务执行管理,结果反省工具。
Allluxio,Kylin等:经过对存储的数据中止预处置,加快运算速度的工具。
https://img.mukewang.com/5cb7cc960001afb207220480.jpg
必需掌握的技艺:
Java初级(虚拟机、并发)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅佐小工具(Sqoop/Flume/Oozie/Hue等)
高阶技艺6条:
机器学习算法以及mahout库加MLlib、 R言语、Lambda 架构、Kappa架构、Kylin、Alluxio
三、学习规划
每天需求有3个小时的学习时间,周末的时分需求10小时,假设做不到的话,只能是
第一阶段(基础阶段)
Linux学习
Linux操作系统引见与安装、Linux常用命令、Linux常用软件安装、Linux网络、 防火墙、Shell编程等。
Java 初级学习(《深化理解Java虚拟机》、《Java高并发实战》)
掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和静态代理、了解JMS。
Zookeeper学习
Zookeeper分布式协调效力引见、Zookeeper集群的安装部署、Zookeeper数据结构、命令。
第二阶段(攻坚阶段)
Hadoop、Hive、HBase、Scala、Spark、Python
第三阶段(辅佐工具工学习阶段)
Sqoop、Flume、Oozie、Hue这些工具的学习主要在CSDN,51CTO以及官网都可以学习。
https://img.mukewang.com/5cb7cc790001015003680269.jpg
总结
在技术行业里面,每天都会有新的东西出现,需求关注最新技术静态,不时学习。任何普通技术都是先学习实践,然后在实际中不时完善实践的进程。
假设你觉得自己看书效率太慢,你可以网上搜集一些课程。
快速学习的才干、处置成果的才干、沟通才干在这个行业是真的非常重要的目的。
要擅长运用StackOverFlow和Google来帮助你学习进程遇到的成果。
坚实的Java技术作为基础支持,之后学习:Hadoop,大数据存储,大数据架构设计,大数据实时计算,大数据数据采集,大数据商业实战等。
技术人员就业方向:大数据系统研发人才,大数据应用开发人才和大数据分析人才。
以上是我们对大数据学习的总结,当然我们也提到了,并不是说零基础的就可以直接学习,需求有编程的基础,要先掌握扎实的编程基础,在此建议学习Java,成爲一名工程师的时分,有一定编程阅历,自学起来也相对比末尾要复杂一点,然后对大数据有兴味或许想要进入这个行业的就可以去学习了 以上内容是我个人见解,希望对你有帮助不
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ELK日志分析方案
针对公司项目微服务化,随着项目及服务器的不断增多,决定采用ELK(Elasticsearch+Logstash+Kibana)日志分析平台进行微服务日志分析。 1.ELK整体方案 1.1 ELK架构图 1.2 ELK工作流程 1.在微服务服务器上部署Logstash,作为Shipper的角色,对微服务日志文件数据进行数据采集,将采集到的数据输出到Redis消息队列。 2.在另外一台服务器上部署Logstash,作为Indexer的角色,从Redis消息队列中读取数据(可以对数据进行处理),输出到Elasticsearch-Master主节点。 3.Elasticsearch-Master主节点内部与副节点同步数据。(Elasticsearch集群建议3个服务以上奇数) 4.Kibana部署一台服务器内,读取Elasticsearch集群数据,展
- 下一篇
阿里靠什么支撑 EB 级计算力?
阿里妹导读:MaxCompute 是阿里EB级计算平台,经过十年磨砺,它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。去年MaxCompute 做了哪些工作,这些工作背后的原因是什么?大数据市场进入普惠+红海的新阶段,如何与生态发展共赢?人工智能进入井喷阶段,如何支持与借力?本文从过去一年的总结,核心技术概览,以及每条技术线路未来展望等几个方面做一个概述。 BigData 概念在上世纪90年代被提出,随 Google 的3篇经典论文(GFS,BigTable,MapReduce)奠基,已经发展了超过10年。这10年中,诞生了包括Google 大数据体系,微软 Cosmos 体系,开源 Hadoop 体系等优秀的系统,这其中也包括阿里云的飞天系统。这些系统一步一步推动业界进入“数字化“和之后的“ AI 化”的时代。 同时,
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Docker安装Oracle12C,快速搭建Oracle学习环境