MaxCompute 表(Table)设计规范

2018-12-11 716

表的限制项
表(Table)设计规范表设计主要目标
- 表设计的影响
- 表设计步骤
- 表数据存储规范
  - 按数据分层规范数据生命周期
  - 按数据的变更和历史规范数据的保存
- 数据导入通道与表设计
- 分区设计与逻辑存储的对应
- 表和分区设计基本规则
- 分区设计
  - 分区字段和普通字段的选择
  - 分区字段定义依据
  - 分区个数定义依据
  - 分区数量和数据量建议

表的限制项

表(Table)设计规范表设计主要目标

降低存储成本。合适的表设计可以在数据分层设计上降低冗余存储，减少中间表数据量大小。同时正确的对表数据进行生命周期管理，更能够直接降低存储的数据量以降低存储成本。
降低计算成本。对表设计规范化，以便在后续对表数据进行查询计算过程中，可以依据这些规范优化数据的读取，减少计算过程中的冗余读写和计算，提升计算性能的同时降低成本。
降低维护复杂度。规范化的表分层设计能够直接体现业务的特点。如通过对数

微信关注我们

原文链接：https://yq.aliyun.com/articles/676656

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive分桶表学习总结

版权声明：本文由董可伦首发于https://dongkelun.com，非商业转载请注明作者及原创出处。商业转载请联系作者本人。 https://blog.csdn.net/dkl12/article/details/84964628 前言学习总结一下Hive的分桶表。分桶规则：对分桶字段值进行哈希，哈希值除以桶的个数求余，余数决定了该条记录在哪个桶中，也就是余数相同的在一个桶中。优点：1、提高join查询效率 2、提高抽样效率 1、建表通过 clustered by(字段名) into bucket_num buckets 分桶，意思是根据字段名分成bucket_num个桶 create table test_bucket ( id int comment 'ID', name string comment '名字' ) comment '测试分桶' clustered by(id) into 4 buckets ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ; 2、插入数据 2.1 数据 buckt_data.txt 1,nam...

2018-12-11

566

内容提要：本次讲座主要涵盖Spark RDD编程入门基础，包括： Spark、RDD简介 RDD API简介打包与spark-submit 性能分析与调优基础主讲人：王道远(健身) 阿里巴巴计算平台EMR技术专家直播时间：2018.12.13（本周四）19:00 - 20:00 ppt链接：https://yq.aliyun.com/download/3142视频链接：https://yq.aliyun.com/live/720 加入Apache Spark中国技术交流钉钉群与大牛交流经验欢迎大家扫码加入~~

2018-12-11

779

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

MaxCompute 表(Table)设计规范

表的限制项

表(Table)设计规范表设计主要目标

Hive分桶表学习总结

# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门】

相关文章

发表评论

资源下载

Mario

Spring

Sublime Text

WebStorm

欢迎您来访！

MaxCompute 表(Table)设计规范

表的限制项

表(Table)设计规范 表设计主要目标

Hive分桶表学习总结

# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门 】

相关文章

发表评论

资源下载

Mario

Spring

Sublime Text

WebStorm

欢迎您来访！

表(Table)设计规范表设计主要目标

# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门】