MaxCompute(原ODPS)开发入门指南——数据开发工具篇
MaxCompute(原ODPS)开发入门指南——数据开发工具篇
写在最前面
>>>进入了解更多>>>阿里云数加·MaxCompute大数据计算服务.
大家在使用大数据计算服务MaxCompute时,最头疼就是我现在已有的数据如何快速上云?我的日志数据如何采集到MaxCompute上?等等。。。具体详见《MaxCompute(原ODPS)开发入门指南——数据上云篇》。
但是数据在MaxCompute上了之后,问题又来了,我怎么基于上面进行快速的数据开发,构建大数据仓库。
本文就重点为大家推荐和介绍开发工具:① 大数据开发套件Data IDE; ② MaxCompute Studio。
大数据开发套件Data IDE
大数据开发套件基于MaxCompute强大的计算存储能力,提供多人协作开发能力且支持百万级别任

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Elasticsearch 交互
elasticsearch 权威指南在线链接 https://www.elastic.co/guide/cn/elasticsearch/guide/current/_document_oriented.html Relational DB/Elasticsearch Relational DB -> Databases -> Tables -> Rows -> Columns Elasticsearch -> Indices -> Types -> Documents -> Fields
- 下一篇
[Spark]Spark RDD 指南三 弹性分布式数据集(RDD)
Spark2.3.0 版本:Spark2.3.0 创建RDD Spark的核心概念是弹性分布式数据集(RDD),RDD是一个可容错、可并行操作的分布式元素集合。有两种方法可以创建RDD对象: 在驱动程序中并行化操作集合对象来创建RDD 从外部存储系统中引用数据集(如:共享文件系统、HDFS、HBase或者其他Hadoop支持的数据源)。 1. 并行化集合 通过在驱动程序中的现有集合上调用JavaSparkContext的parallelize方法创建并行化集合(Parallelized collections)。集合的元素被复制以形成可以并行操作的分布式数据集。 例如,下面是如何创建一个包含数字1到5的并行化集合: Java版本: List<Integer> list = Arrays.asList(1,2,3,4,5); JavaRDD<Integer> rdd = sc.parallelize(list); Scala版本: val data = Array(1, 2, 3, 4, 5) val distData = sc.parallelize(data)...
相关文章
文章评论
共有0条评论来说两句吧...