【MaxCompute Spark】不想自己搭Spark集群, 也能跑Spark分布式作业???
MaxCompute Spark 是什么?
阿里云的用户大部分应该都听说过MaxCompute,但是MaxCompute Spark是什么?我尝试用几个问题来回答这个问题。
- 公司准备把Spark的业务和作业上阿里云,从以前的经验来看,运维Spark+Hadoop集群可是个重头活,存不存在这种提供Spark服务的PaaS产品?
- 公司的部分业务以及作业顺利迁移至MaxCompute了,Spark作业还得能够和MaxCompute的数据无缝集成呀?
- 云上的Spark作业成本不知道该怎么打算盘了?
MaxCompute Spark提供了:
- 全托管、与MaxCompute一体化集成的Spark解决方案,只需关注Spark Application开发,没有集群运维的脏活累活。
- 从调度上、存储上,与MaxCompute native集成,性能最优解;并且能够

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
解析-hadoop五大节点
1.NameNode(管理节点)Namenode 管理着文件系统的命令空间(Namespace)。它维护着文件系统树以及文件树中所有的文件和文件夹的元数据(metadata),元数据包括编辑日志(edits)和镜像文件。管理这些信息的文件有两个,分别是Namespace 镜像文件(fsimage)和编辑日志文件,编辑日志主要是记录对hdfs进行的修改。镜像文件主要是记录hdfs的文件树形结构。这些信息被Cache在RAM中,当然,这两个文件也会被持久化存储在本地硬盘。Namenode记录着每个文件中各个块所在的数据节点的位置信息,但是他并不持久化存储这些信息,因为这些信息会在系统启动时从数据节点重建。2.DataNode(工作节点) Datanode是文件系统的工作节点,他们根据客户端或者是namenode的调度存储和检索数据,并且定期向namenode发送他们所存储的块(block)的列表。没有namenode,文件系统是无法使用的。事实上,如果运行namenode服务的服务器坏掉,文件系统上的所有文件将会丢失。因为我们不知道如何根据DataNode的块进行重建文件。所有对NameN...
- 下一篇
MaxCompute预付费套餐(计算资源+存储资源)发布
信息摘要: MaxCompute的预付费新增套餐规格类型,购买套餐即包含计算资源和存储资源。 适用客户: 适用于使用MaxCompute包年包月资源,同时存储量比较大的企业大数据开发用户,通过套餐使用可以更大降低成本,如: 原来每日存储量达150TB,计算资源用量150CU,按每天平均存储150TB算一个月30天,存储和计算资源的费用大概50000¥。 购买套餐可选存储密集型160套餐,含计算资源160CU足够使用,同时还有每日150TB的免费存储量,该套餐一个月费用35000¥。 两者相比成本节约大概30%。 版本/规格功能: 目前MaxCompute推出套餐有: 存储密集型160套餐(含计算资源160CU+存储资源150TB)、存储密集型320套餐(含计算资源320CU+存储资源300TB)、存储密集型600套餐(含计算资源600
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7