Apache Spark 系列技术直播 - Spark SQL 实践与优化
直播回看点我
Apache Spark 系列技术直播
Spark SQL 实践与优化
内容简介:
SparkSQL介绍
- 基本原理
- 支持的DataSource介绍
- Hue/Zepplin/Livy周边跟SparkSQL的集成使用等
SparkSQL优化
- SparkSQL Catalyst优化
- AE优化
- Shuffle优化
直播时间: 2018.11.27 周二 晚 19:00 - 20:00
欢迎加入钉钉收看直播
入群方式:
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
0039-如何使用Python Impyla客户端连接Hive和Impala
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 1.文档编写目的 继上一章讲述如何在CDH集群安装Anaconda&搭建Python私有源后,本章节主要讲述如何使用Pyton Impyla客户端连接CDH集群的HiveServer2和Impala Daemon,并进行SQL操作。 内容概述 1.依赖包安装 2.代码编写 3.代码测试 测试环境 1.CM和CDH版本为5.11.2 2.RedHat7.2 前置条件 1.CDH集群环境正常运行 2.Anaconda已安装并配置环境变量 3.pip工具能够正常安装Python包 4.Python版本2.6+ or 3.3+ 5.非安全集群环境 2.Impyla依赖包安装 Impyla所依赖的Python包 six bit_array thrift (on Python 2.x) orthriftpy (on Python 3.x) thrift_sasl sasl 1.首先安装Impyla依赖的Python包 [root@ip-172-31-22-86 ~]# pip install bit_array [root@i...
- 下一篇
HBase+Spark技术双周刊第一期
精彩视频 HBase多模式HBase多模式,包括 分析层:支持复杂分析、算子下推;多模式层:提供各种模型转换,贴切业务;索引引擎:提供索引支持,基于 Lucene ;存储引擎:提供 KV 支持,基于LSM;分布式文件层:保障低成本、与上层分离、共享降低成本。本次直播,阿里云数据架构师明惠就为大家分享HBase多模式。 HBase内核及能力HBase内核及能力包括:HBase的特性与生态:自动分区、LSM Tree、存储计算分离、HBase生态;全新的HBase2.0版本新功能:小对象存储MOB、读写链路Off-heap 、Region Replica 、In Memory Compaction 、Assignment MangerV2。在本次直播中,阿里巴巴技术专家正研就将为大家分享HBase内核及能力。 中国HBase技术社区第八届MeetUp(南京站) ——HBase应用实践专场 【培训视频及资料下载】2018年11月17号,由中国HBase技术社区、DataFun社区联合氪空间主办的中国第八届HBase Meetup将来到南京,届时来自阿里云、毕马威、苏宁等公司HBase的专家们...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长