【Hadoop Summit Tokyo 2016】使用Hadoop来构建实时和批数据的数据质量服务

本讲义出自Alex Lv与Amber Vaidya在Hadoop Summit Tokyo 2016上的演讲,主要分享了构建于Spark和Hadoop上的开源数据质量平台Griffin,Griffin可以用于处理批量数据、实时数据和非结构化的数据,并且构建了统一的过程来检测无效或者不准确等DQ问题,讲义中介绍了eBayGriffin的技术架构、以及用例等。

e6705bd264fb7b5a5262f51a80902ea6f67445bf

9f9648022f3db655b2df007702b4fa6bbe3a9789

66d6f6c9ecb99596117c4fdd46fea5613ba37b69

d787b36250d7092e43bcb5f32ad0fa548075c9f1

0b8bd2d5a8bd3d4c2235b5b3e05bedd0ae090938

3d6868cf80515a28d3309e8040fbe18da75a8ffc

43149dc4c81602aca547bd14ecff49c28d9b3b19

1c7874787f2c9d4bdee92abed63cd7f9b3f79a6b

e06d2633259682ebb96c7f32192e958be34f5354

c626769679f85708661bdf77a4b429c43896c788

aa62a7c80cc6a1ac21f4bda947c28b5373308639

41aa3bedc2d2bf4a24c54cc9f699d27f4d1372e2

658d009a031eca5de61e8dff762f1715e9248ae0

76730a12ffa6a56f43ad02aa341127e6f7901473

5f01035799c2beccd0b3260d57f63008887ca58b

bae26f857d1e820dd1f28ab6e2f184e1dd08a4a1

17c57dec59dc613d172c48c81802c1f0e3cf9d86

8300d914e4f05e034c3636c69eb1f0c468f5d89b

126531d247d39519c29d5e5f1effac0c8335423d

227d2c1a59d190cf0c30498bee094187f3855ac7

304d10388d3c7368aca688c8f3c428d6738e33b5

2ba2dcd11158bc6771cfd585c3c6695801552e16


优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/71102

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。