Hadoop专业解决方案之构建Hadoop企业级应用
一、大数据的挑战
大数据面对挑战是你必须重新思考构建数据分析应用的方式。传统方式的应用构建是基于数据存储在不支持大数据处理的基础之上。这主要是因为一下原因:
1.传统应用的基础设施是基于传统数据库访问模式设计的,它不支持Hadoop;
2.数据存储在Hadoop之上,实时访问集群中部分数据是可行的;
3.Hadoop大数据存储能力使得你可以存储数据集的多个版本,来挑战传统覆写数据方式。
二、大数据应用系统架构
三、架构说明
1.数据源层:DataSource数据的收集可以基于Flume或者Sqoop进行;
2.数据仓库层:需要区分结构化数据和非结构化数据存储,同时需要考虑过程数据的存储问题;
3.业务层:针对数据处理层OOzie可以做为工作流调度的工具,Map/Reduce任务可以作为任务执行的单元;
4.实时查询:必须加访问限制和条件过滤;
。。。未完待续。。。
《Hadoop专业解决方案》同步更新中,请关注Hadoop高级培训交流群:293503507
作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
《Wrox.Professional.Hadoop.Solutions》中文目录全稿
前言:最近有朋友给推荐一本书,英文原版《Wrox.Professional.Hadoop.Solutions》,感觉很好打算翻译成中文,共享给朋友,时间关系,不知能否成行,先干着吧。以下部分是本书的目录,算是一个开始,至于何时能够成稿,且干着吧,毕竟最近不是一般的忙。 关于中文名称,英文直译《专业的Hadoop解决方案》,个人更倾向于使用《Hadoop专业解决方案》至于选择哪个最终还没有确定,也想听一听大家的意见。敬请留言。 图书大纲: 中文部分: chapter1:大数据和Hadoop生态圈 1.1当大数据遇到Hadoop 1.2Hadoop生态圈 1.3Hadoop核心组件 1.4Hadoop版本分发 1.5 基于Hadoop开发企业级应用 chapter2:数据存储之Hadoop 2.1 HDFS2.2 HBase2.3 HDFS和HBase相结合,进行实际数据存储2.4 使用Apache Avro2.5 使用HCatalog管理元数据2.6 Hadoop数据组织模式设计 chapter3:数据计算之MapReduce 3.1 认识MapReduce 3.2 第一个MapRedu...
- 下一篇
跟我一起云计算(3)——hbase
hbase HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop 项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。 hadoop家族 hadoop家族成员: Hadoop Common Hadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。 Avro Avro是doug cutting主持的RPC项目,有点类似Google的protobuf和Facebook的thrift。avro用来做以后hadoop的RPC,使hadoop的RPC模块通信速度更快、数据结构更紧凑。 Chukwa Chukwa是基于Hadoop的大集群监控系统,由yahoo贡献。 H...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7