五种大数据框架你必须要知道
学习大数据不可不知的五种大数据框架,码笔记分享大数据框架Hadoop、Storm、Samza、Spark和Flink五种大数据框架详解:
一:Hadoop大数据框架
大数据框架?第一映入眼帘的就是这枚大象Hadoop,Hadoop是一个由Apache基金会所开发的分布式系统基础架构,它是目前应用最广泛的大数据工具,Hadoop拥有容错率和极低的硬件价格。
Hadoop是成为了一个广阔的生态圈的批处理框架,Hadoop提出的Map和Reduce的计算模式简洁而优雅,它实现了大量算法和组件。但是,由于Hadoop的计算任务需要在集群的多个节点上多次读写,因此在速度上会稍显劣势,但是Hadoop的吞吐量也同样是其他框架所不能匹敌的。
二:Storm大数据框架
Storm由Twitter开源并且托管在GitHub上的,Storm大数据框架与Hadoop的批处理模式不同,Storm采用的是流计算框架。但Storm与Hadoop相似之处是也提出了Spout和Bolt两个计算角色。
举个通俗的例子来说明Storm和Hadoop的不同之处,Hadoop类似水桶,而Storm类似水龙头,想要获取水,Hadoop是一桶一桶的去扛回来,而Storm只需要打开水龙头就行了。Storm流计算框架使用的是内存,延迟上具有优势,但是不会持久化数据。
Storm对Java、Ruby、Python等语言都有很好的支持。
三:Samza大数据框架
Samza大数据框架与Storm一样都是流计算框架,Samza必须和Kafka共用,Samza目前只支持JVM语言。
四:Spark大数据框架
Spark大数据框架是一种混合式的计算框架,Spark自带实时流处理工具;Spark也可以与Hadoop集成代替MapReduce;甚至Spark还可以单独拿出来借助HDFS等分布式存储系统部署集群。
Spark的运算速度与Storm相似,Spark的速度大约为Hadoop的一百倍,而Spark的成本要比Hadoop低,但是Spark目前还没有Hadoop拥有上万级别的集群,所以现阶段将Spark和Hadoop搭配起来使用是比较不错的方案。
五:Flink大数据框架
Flink大数据框架也是一种混合式的计算框架,Fink与Spark相反的地方在于Fink重点在于处理流式数据,目前Fink还不算成熟。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ODPS-0420095: Access Denied
最近想用阿里的MaxCompute,然后我自己写了一个mr程序,用MaxCompute Studio中的一键发布"Deploy to server"后,用客户端去执行jar,抛出了Access Denied的异常,请问是我没有开通MaxCompute的缘故吗?(目前申请使用的MaxCompute是开发版),还是我配置的问题?Exception in thread "main" com.aliyun.odps.OdpsException: ODPS-0420095: Access Denied - The task is not in release range: LOT at com.aliyun.odps.rest.RestClient.handleErrorResponse(RestClient.java:378) at com.aliyun.odps.rest.RestClient.request(RestClient.java:318) at com.aliyun.odps.rest.RestClient.request(RestClient.java:274) at com....
- 下一篇
Apache Flink 为什么能够成为新一代大数据计算引擎?
众所周知,Apache Flink(以下简称 Flink)最早诞生于欧洲,2014 年由其创始团队捐赠给 Apache 基金会。如同其他诞生之初的项目,它新鲜,它开源,它适应了快速转的世界中更重视的速度与灵活性。 大数据时代对人类的数据驾驭能力提出了新的挑战,Flink 的诞生为企业用户获得更为快速、准确的计算能力提供了前所未有的空间与潜力。作为公认的新一代大数据计算引擎,Flink 究竟以何魅力成为阿里、腾讯、滴滴、美团、字节跳动、Netflix、Lyft 等国内外知名公司建设流计算平台的首选? 听听 Flink 的核心贡献者们怎么说!11 月 28-30 日,Flink Forward Asia 2019,Apache Flink 核心贡献者与业界资深专家带你全方位解锁 Flink 的独特技术魅力。 惊喜环节:ASK ME ANYTHING 提前剧透:大会现场将邀请 Apache Flink 核心贡献者们设置 Ask Me Anything 惊喜环节,Flink SQL、Runtime、Hive 等任何关于 Flink 的技术问题可以现场提问! Flink 亲爹 Stephan 同...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7设置SWAP分区,小内存服务器的救世主