MaxCompute JOIN优化小结-低调大师

MaxCompute JOIN优化小结

2018-03-08 825

Join是MaxCompute中最基本的语法，但由于数据量和倾斜问题，非常容易出现性能问题。一般情况下，join产生的问题有两大类：

数据倾斜问题：join会将key相同的数据分发到同一个instance上处理，如果某个key上的数据量特别多则会导致该instance处理时间比其他instance处理时间长，这就是我们常说的数据倾斜，这也是join计算性能问题的罪魁祸首；
数据量问题：关联的两表基本没有热点问题，但两个表数据量都非常大同样会影响性能，比如记录数达几十亿条，如商品表、库存表等；

虽然MaxCompute中提供了一些通用的优化算法，但从业务角度解决性能问题往往更精确，更有效。对于MaxCompute sql优化，在云栖社区上已经有比较多的经验积累，本文主要对join产生的性能问题以及解法做些总结。

不同数据类型k

微信关注我们

原文链接：https://yq.aliyun.com/articles/523635

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive|| beeline连接的Invalid URL

今天在使用hive的client工具beeline时遇到了一个Invalid URL的错误。环境信息如下： hiveclient: bd23 hiveserver2: cloud011 hiveclient所在主机的jdk 1.7_51，hive 0.12和hadoop 2.3.0是从服务器端拷贝过来的，环境变量一切OK. 执行连接报了Invalid URL的错误： $ beeline Beeline version 0.12.0 by Apache Hive beeline> !connect jdbc:hive2://cloud011:10000 scan complete in 2ms Connecting to jdbc:hive2://cloud011:10000 Enter username for jdbc:hive2://cloud011:10000: Enter password for jdbc:hive2://cloud011:10000: Error: Invalid URL: jdbc:hive2://cloud011:10000 (state=08S0...

2018-03-08

893

1.搭建专用网络 1.1 登录专有网络管理控制台阿里云Elasticsearch是搭建在专有网络上的，所以我们先开通阿里云专有网络,点击开通. 1.2 创建专有网络点击创建专有网络在专有网络名称和交换机上写好名字，后续在购买es和ecs时候对应需要。参考链接：https://helpcdn.aliyun.com/document_detail/65430.html 2. 购买Elasticsearch服务 2.1 购买入口 2.2 购买服务在订单页面上选择已经创建的专有网络并设置登录密码购买页面的登录账号默认为“elastic”，密码可自行设置，与登录Kibana的账号密码是一致的。 2.3 控制台查看状态成功购买之后进入阿里云控制台选择大数据(数加)->阿里云Elasticsearch 2.4 登录kibana控制台从控制台点击实

2018-03-09

808

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。