海胜专访--MaxCompute 与大数据查询引擎的技术和故事
摘要:在2019大数据技术公开课第一季《技术人生专访》中,阿里巴巴云计算平台高级技术专家苑海胜为大家分享了《MaxCompute 与大数据查询引擎的技术和故事》,主要介绍了MaxCompute与MPP Database的异同点,分布式系统上Join的实现,且详细讲解了MaxCompute针对Join和聚合引入的Hash Clustering Table和Range Clustering Table的优化。
以下内容根据演讲视频以及PPT整理而成。
一、MaxCompute VS MPP Database
MaxCompute 与 MPP Database有非常大的不同,主要体现在性能(Performance)、成本(Cost)、可扩展性(Scalability)及灵活性(Flexibility)等度量纬度。
- 性能(Performance)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据平台常用组件
BigData-Alpha-0.1.0 闲暇无趣时梳理了一版接触过涉及做大数据的组件,根据自己理解简单分类 备注: 未增加Doris、CarbonData 部分归类模糊 仅供参考
- 下一篇
X-Pack Spark使用[FAQ]
概述 本文主要列出在使用X-Pack Spark的FAQ。 Spark服务使用问题 1. X-Pack Spark如何监控核心指标 答:x-pack spark如何监控核心指标、X-Pack Spark 监控指标详解 2. 通过数据工作台上传资源文件慢答:这个主要取决于用户的上行带宽,如果上行带宽无法调整,可以使用vpc内网通过hdfs上传、httpfs上传 3. X-Pack Spark yarn任务数超过9999查看方法答:https://developer.aliyun.com/ask/139396 4. X-Pack Spark 集群如何访问外网数据接口答:Spark集群默认不能访问外网,可以通过NAT网关的方式访问。具体开通方式请参考:NAT网关。 Spark Connectors 主要列举Spark 对接其它数据源遇到的问题 Spark
相关文章
文章评论
共有0条评论来说两句吧...