取之开源,用之开源-深度剖析阿里巴巴对Flink的优化与改进
彼时的 Flink 不管是规模还是稳定性尚未经历实践,成熟度有待商榷。阿里巴巴实时计算团队决定在阿里内部建立一个 Flink 分支 Blink,并对 Flink 进行大量的修改和完善,让其适应阿里巴巴这种超大规模的业务场景。那么,阿里巴巴对 Flink 究竟做了哪些优化呢?
Apache Flink 概述
Apache Flink(以下简称 Flink)是诞生于欧洲

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
CentOS7 上搭建多节点 Elasticsearch集群
本文内容脑图如下: 文章共 747字,阅读大约需要 2分钟 ! 概 述 最近学 Elasticsearch,既然学之,怎么能没有实际的集群来把玩呢,因此自己必须动手搭一个! 注: 本文首发于 My Personal Blog:CodeSheep·程序羊,欢迎光临 小站 环境准备 节点准备 本文准备搭建 双节点 Elasticsearch集群,因此这里准备了两台 Linux CentOS 7.4 64bit 机器: 节点1:192.168.31.8 节点2:192.168.31.9 Elasticsearch 安装包准备 这里下载的是截止到当前日期的最新版:6.4.2 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.2.tar.gz 安装目录准备 这里拟将 Elasticsearch安装在 /opt/elasticsearch 目录下: mkdir /opt/elasticsearch 将压缩包复制到该目录下并解压 Elasticsearch 集群配置 需要修改两个节点上的配置文件 e...
- 下一篇
MaxCompute Hash Clustering介绍
背景 在MaxCompute查询中,Join是很常见的场景。例如以下Query,就是一个简单的Inner Join把t1表和t2表通过id连接起来: SELECT t1.a, t2.b FROM t1 JOIN t2 ON t1.id = t2.id; Join在MaxCompute内部主要有三种实现方法: Broadcast Hash Join - 当Join存在一个很小的表时,我们会采用这种方式,即把小表广播传递到所有的Join Task Instance上面,然后直接和大表做Hash Join。 Shuffle Hash Join - 如果Join表比较大,我们就不能直接广播了。这时候,我么可以把两个表按照Join Key做Hash Shuffle,由于相同的键值Hash结果也是一样的,这就保证了相同的Key的记录会收集到同一个Joi
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Hadoop3单机部署,实现最简伪集群
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,8上快速安装Gitea,搭建Git服务器