MaxCompute2.0更新对数据仓库教学的影响
因为之前在学校授课过程中讲授数据仓库课程时是通过MaxCompute来进行讲解的,因此针对这次MaxCompute2.0的升级,在我在教学中也对课程内容同样进行了升级,这里针对主要的升级点进行一些说明。
针对数据科学与大数据技术专业的学生来说,数据仓库应该算是他们必须要掌握的技能之一,而开源数据仓库环境搭建对本地系统要求很高,同时企业中关注的也不是环境搭建而是基于数据仓库的数据分析和数据处理,因此在这门课程的设计中,我们通过使用MaxCompute来替代本地搭建Hive作为学生的学习和实验环境,以保证所有学生都能够有一个稳定的实验环境。
本次更新影响相对比较大的点主要有:
- 开发环境与生产环境的问题,因为之前版本中开发环境和生产环境并没有这次这么明确的区分,因此更新后很多学生在学习和使用时发现找不到自己建立的表,原因就是没有注意查找的是开发环境还是生产环境。当然明确区分开发和生产环境这是很好的设计,但是建议在相对更明显的地方提供切换开发生产环境的按钮与标识,方便用户来查看与切换。
- 新增业务流程和解决方案:业务流程与之前的工作流功能类似,算是一个升级版,节点图标优化的比较好,方便查看和管理,而且可以很方便的通过解决方案查看和导入机器学习PAI中准备好的算法模型
因为在授课中主要讲解数据仓库的基础知识,以及让学生基于现有系统自行设计数据仓库各层的架构,并完成ETL,因此通过MaxCompute的流程管理就很容易直观的让学生感受到处理过程。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
8月14日Spark社区直播【Spark Shuffle 优化】
直播间直达链接:(回看链接) https://tianchi.aliyun.com/course/live?&liveId=41076 或钉钉扫描海报上二维码,进群直接观看。 时间 8月14日19:00 主讲人: 辰石,阿里巴巴计算平台事业部EMR团队技术专家,目前从事大数据存储以及Spark相关方面的工作。 简介: 本次直播介绍EMR Spark 在shuffle方面的相关优化工作,主要包含shuffle 优化的背景以及shuffle 优化的设计方案,最后会介绍Spark shuffle 在 TPC-DS测试中的性能数据
- 下一篇
Tablestore + Blink实战:交易数据的实时统计
背景 交易数据的实时统计是电商网站一个核心功能,可以帮助用户实时统计网站的整体销售情况,快速验证“新销售策略”的效果。我们今天介绍一个基于表格存储(Tablestore)实现交易数据的实时计算,给大家提供一个新使用方式。 Tablestore作为在线的结构化数据库,提供了毫秒级的访问延时和丰富的查询方式,能高效的支撑交易数据的存储和查询,同时Tablestore已经原生支持阿里云的流计算框架Flink/Blink,可以实现数据的实时计算。 架构 示例设计 基本场景 注意:示例是模拟一个电商网站的交易数据的存储和实时计算,目的是为了展示Tablestore + Blink的使用流程。 用户通过SDK将网站交易数据实时的存储(PutRow/BatchWrite/TableStoreWriter)到Tablestore的source_order表中,
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS关闭SELinux安全模块