谈谈我和大数据的情缘及入门
当年我是做C#+Java软件开发,然后考取OCP来了上海,立志要做一名DBA。只记得当年试用期刚过时,阴差阳错轮到我负责公司的大数据平台这块,刚开始很痛苦,一个陌生的行业,一个讨论的小伙伴都没有,一份现成资料都没有,心情焦虑。后来我调整心态,从DB转移到对大数据的研究,决定啃下这块硬骨头,把它嚼碎,把它消化吸收。 由于当时公司都是CDH环境,刚开始安装卡了很久都过不去,后面选择在线安装,很慢,有时需要1天。后来安装HDFS ,YARN,HIVE组件,不过对它们不理解,不明白,有时很困惑。这样的过程大概持续三个月了。 后来看了很多博文,都是Apache Hadoop版本搭建,于是我先试试用Apache Hadoop搭建部署单节点和集群,然后配置HA,最后我发现自己比较喜欢这种方式,因为我能了解其配置参数,配置文件和常规命令等等,再回头去对比CDH安装HDFS服务,真是太爽了,因为Apache Hadoop版本有真正体验感,这时我就迅速调整方向 : 先Apache版本,再CDH。 由于公司项目环境,推进自己实在太慢,于是我在网上看各种相关视频教程;加n种群,在群里潜水,看水友们提的问题自己...