首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/619152

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

KYLIN&GP性能测试报告

KYLIN&GP性能测试报告 版本信息 系统/软件名 版本 centos CentOS Linux release 7.3.1611 hadoop hadoop-2.7.4 hive apache-hive-2.1.1-bin hbase hbase-1.4.0 zookeeper zookeeper-3.3.6 sqoop sqoop-1.4.6.bin__hadoop-2.0.4-alpha kylin apache-kylin-2.3.1-bin GP greenplum-db-4.3.8.2-build-1-RHEL5-x86_64 集群环境 节点 内存 磁盘 服务 bigdata-3-22 15G 50G Namenode,secondarynamenode, datanode,QuorumPeerMain,metastore,hmaster,HRegionServer,JobHistoryServer,ResourceManager,nodemanager,kylin,greenplum bigdata-3-23 15G 50G Datanode,HRegionS...

饿了么元数据管理实践之路

一、背景 大数据挑战 大数据时代,饿了么面临数据管理、数据使用、数据问题等多重挑战。具体可以参考下图: 数据问题:多种执行、存储引擎,分钟、小时、天级的任务调度,怎样梳理数据的时间线变化?数据使用:任务、表、列、指标等数据,如何进行检索、复用、清理、热度Top计算?数据管理:怎样对表、列、指标等进行权限控制、任务治理以及上下游依赖影响分析? 元数据定义与价值 元数据打通数据源、数据仓库、数据应用,记录了数据从产生到消费的完整链路。它包含静态的表、列、分区信息(也就是MetaStore);动态的任务、表依赖映射关系;数据仓库的模型定义、数据生命周期;以及ETL任务调度信息、输入输出等。 元数据是数据管理、数据内容、数据应用的基础。例如可以利用元数据构建任务、表、列、用户之间的数据图谱;构建任务DAG依赖关系,编排任务执行序列;构建任务画像,进行任务质量治理;数据分析时,使用数据图谱进行字典检索;根据表名查看表详情,以及每张表的来源、去向,每个字段的加工逻辑;提供个人或BU的资产管理、计算资源消耗概览等。 开源解决方案 WhereHows是LinkedIn开源的元数据治理方案。Azkaba...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册