如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue
前言
目前Aliyun E-MapReduce支持了Appache Zeppelin和Hue,在Aliyun E-MapReduce集群上可以很方便的使用zeppelin和hue。
Apache Zeppelin是一个提供了web版的类似ipython的notebook,用于做数据分析和可视化。背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo。
Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Spark-SparkSQL深入学习系列十一(转自OopsOutOfMemory)
上周Spark1.2刚发布,周末在家没事,把这个特性给了解一下,顺便分析下源码,看一看这个特性是如何设计及实现的。 /**SparkSQL源码分析系列文章*/ (Ps: External DataSource使用篇地址:Spark SQL之External DataSource外部数据源(一)示例http://blog.csdn.net/oopsoom/article/details/42061077) 一、Sources包核心 Spark SQL在Spark1.2中提供了External DataSource API,开发者可以根据接口来实现自己的外部数据源,如avro, csv, json, parquet等等。 在Spark SQL源代码的org/spark/sql/sources目录下,我们会看到关于External DataSource的相关代码。这里特别介绍几个: 1、DDLParser 专门负责解析外部数据源SQL的SqlParser,解析createtemporarytable xxx using options (key 'value', key 'v...
- 下一篇
【原创】HBase 基础知识
特点 1. 在 HDFS 之上开发的; 2. 面向列(实际是面向列族)的存储器 3. 实时读写 4. 随机读写 5. 针对超大规模数据集 6. 不支持 SQL 基本概念 单元格(cell) 由行和列的坐标交叉决定,有版本号; 版本号默认为自动分配,为 HBase 向单元格插入数据时的时间戳; 单元格中的内容为未解释的字节数组 行的键 表中行的键为字节数组; 表中的行根据行的键值(即表的主键)进行排序; 排序依据为字节序; 所有对表的访问都要通过表的主键(二级索引问题); 列族(column family) 行中的列会被划分成不同的列族; 同一列族中成员具有相同的前缀; 列族的前缀必须是可打印字符构成的; 列族修饰符,即结尾字符,可以为任意字符; 在 HBase 中,规定使用冒号来分隔列族和列族修饰符; 一个表的列族必须作为表模式定义的一部分预先给出,但是心的列族成员可以随后按需要加入; 物理上,所有的列族成员都一起存放在文件系统中; HBase 的调优和存储都在列族这个层次上进行的,所以最好使所有列族成员都有相同的访问模式(access pattern)和大小特征...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装Nodejs环境
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8安装Docker,最新的服务器搭配容器使用