8月14日Spark社区直播【Spark Shuffle 优化】
直播间直达链接:(回看链接)
https://tianchi.aliyun.com/course/live?&liveId=41076
或钉钉扫描海报上二维码,进群直接观看。
时间
8月14日19:00
主讲人:
辰石,阿里巴巴计算平台事业部EMR团队技术专家,目前从事大数据存储以及Spark相关方面的工作。
简介:
本次直播介绍EMR Spark 在shuffle方面的相关优化工作,主要包含shuffle 优化的背景以及shuffle 优化的设计方案,最后会介绍Spark shuffle 在 TPC-DS测试中的性能数据
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Giraph源码分析(六)——Edge 分析
1.在Vertex类中,顶点的存储方式采用邻接表形式。每个顶点有 VertexId、VertexValue、OutgoingEdges和Halt,boolean型的halt变量用于记录顶点的状态,false时表示active,true表示inactive状态。 片段代码如下。 2.org.apache.giraph.edge.Edge 接口,用于存储顶点的边,每条边包含targetVertexId和edgeValue两个属性。类关系图如下: Giraph默认使用DefaultEdge类存储边,该类中有两个变量: I targetVertexId和 E value,I为顶点ID的类型,E为边的类型。注意,DefaultEdge类同时继承ReusableEdge接口,在ReusableEdge类的定义中,有如下说明文字:A complete edge, the target vertex and the edge value. Can only be one edge with a destination vertex id per edge map. This edge can be r...
- 下一篇
MaxCompute2.0更新对数据仓库教学的影响
因为之前在学校授课过程中讲授数据仓库课程时是通过MaxCompute来进行讲解的,因此针对这次MaxCompute2.0的升级,在我在教学中也对课程内容同样进行了升级,这里针对主要的升级点进行一些说明。 针对数据科学与大数据技术专业的学生来说,数据仓库应该算是他们必须要掌握的技能之一,而开源数据仓库环境搭建对本地系统要求很高,同时企业中关注的也不是环境搭建而是基于数据仓库的数据分析和数据处理,因此在这门课程的设计中,我们通过使用MaxCompute来替代本地搭建Hive作为学生的学习和实验环境,以保证所有学生都能够有一个稳定的实验环境。 本次更新影响相对比较大的点主要有: 开发环境与生产环境的问题,因为之前版本中开发环境和生产环境并没有这次这么明确的区分,因此更新后很多学生在学习和使用时发现找不到自己建立的表,原因就是没有注意查找的是开发环境还是生产环境。当然明确区分开发和生产环境这是很好的设计,但是建议在相对更明显的地方提供切换开发生产环境的按钮与标识,方便用户来查看与切换。 新增业务流程和解决方案:业务流程与之前的工作流功能类似,算是一个升级版,节点图标优化的比较好,方便查看和管理...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS关闭SELinux安全模块
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启