Apache Flink 1.9.0 发布，开源流处理框架-低调大师

Apache Flink 1.9.0 发布，开源流处理框架

2019-08-23 785

Apache Flink 1.9.0 已经发布，Apache Flink 项目的目标是开发一个流处理系统，以统一和支持多种形式的实时和离线数据处理应用程序以及事件驱动的应用程序。

此版本包括批处理作业的批处理式恢复，以及新的基于闪烁的表 API 和 SQL 查询引擎的预览，还有状态处理器 API 的可用性，它是最常见的请求特性之一，允许用户使用 Flink DataSet 作业读写保存点。最后，包括一个重新设计的 WebUI 和 Flink 新的 Python Table API 的预览以及它与 Apache Hive 生态系统的集成。

TableAPI & SQL

将 Table 模块进行拆分（FLIP-32，FLIP 即 Flink Improvement Proposals，专门记录一些对Flink 做较大修改的提议），对 Java 和 Scala 的 API 进行依赖梳理，并且提出了 Planner 接口以支持多种不同的 Planner 实现。Planner 将负责具体的优化和将 Table 作业翻译成执行图的工作，我们可以将原来的实现全部挪至 Flink Planner 中，然后把对接新架构的代码放在 Blink Planner 里。

不仅让 Table 模块在经过拆分后更加清晰，更重要的是不影响老版本用户的体验。在 1.9 版本中，已经 merge 了大部分当初从 Blink 开源出来的 SQL 功能。

除了架构升级之外，Table 模块在 1.9 版本还做了几个相对比较大的重构和新功能，包括：

FLIP-37：重构 Table API 类型系统
FLIP-29：Table 增加面向多行多列操作的 API
FLINK-10232：初步的 SQL DDL 支持
FLIP-30：全新的统一的 Catalog API
FLIP-38：Table API 增加 Python 版本

批处理改进

Flink的批处理功能在 1.9 版本有了重大进步，首当其冲的是优化批处理的错误恢复代价：FLIP-1（Fine Grained Recovery from Task Failures），从这个 FLIP 的编号就可以看出，该优化其实很早就已经提出，1.9 版本终于有机会将 FLIP-1 中未完成的功能进行了收尾。

在新版本中，如果批处理作业有错误发生，那么 Flink 首先会去计算这个错误的影响范围，即 Failover Region。因为在批处理作业中，有些节点之间可以通过网络进行Pipeline 的数据传输，但其他一些节点可以通过 Blocking 的方式先把输出数据存下来，然后下游再去读取存储的数据的方式进行数据传输。

如果算子输出的数据已经完整的进行了保存，那么就没有必要把这个算子拉起重跑，这样一来就可以把错误恢复控制在一个相对较小的范围里。

如果作业极端一点，在每一个需要Shuffle 的地方都进行数据落盘，那么就和 MapReduce 以及 Spark 的行为类似了。只是 Flink 支持更高级的用法，你可以自行控制每种 Shuffle 是使用网络来直连，还是通过文件落盘来进行。

流处理改进

这个版本增加了一个非常实用的功能，即 FLIP-43（State Processor API）。Flink 的 State 数据的访问，以及由 State 数据组成的 Savepoint 的访问一直是社区用户呼声比较高的一个功能。

这次的 State Processor API 则提供了更加灵活的访问手段，也能够让用户完成一些比较黑科技的功能：

用户可以使用这个 API 事先从其他外部系统读取数据，把它们转存为 Flink Savepoint 的格式，然后让 Flink 作业从这个 Savepoint 启动。这样一来，就能避免很多冷启动的问题。
使用 Flink 的批处理 API 直接分析State 的数据。State 数据一直以来对用户是个黑盒，这里面存储的数据是对是错，是否有异常，用户都无从而知。有了这个 API 之后，用户就可以像分析其他数据一样，来对 State 数据进行分析。
脏数据订正。假如有一条脏数据污染了你的 State，用户还可以使用这个 API 对这样的问题进行修复和订正。
状态迁移。当用户修改了作业逻辑，想复用大部分原来作业的 State，但又希望做一些微调。那么就可以使用这个 API 来完成相应的工作。

Hive 集成

在 1.9 版本中，通过 FLIP-30 提出的统一的 Catalog API 的帮助，目前 Flink 已经完整打通了对 Hive Meta Store 的访问。同时，也增加了 Hive 的 Connector，目前已支持 CSV, Sequence File, Orc, Parquet 等格式。用户只需要配置 HMS 的访问方式，就可以使用 Flink 直接读取 Hive 的表进行操作。在此基础之上，Flink 还增加了对 Hive 自定义函数的兼容，像 UDF， UDTF和 UDAF，都可以直接运行在Flink SQL里。

Flink WebUI 修改

组件使用了最新的稳定版本的 Angular。

发布说明

微信关注我们

原文链接：https://www.oschina.net/news/109303/apache-flink-1-9-0-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Apache ShardingSphere 4.0.0 RC2 发布

Apache ShardingSphere 4.0.0 RC2 发布了，作为 ShardingSphere 进入 Apache 基金会后第二个发布版本，4.0.0 RC2 带来了以下更新内容： API 调整删除 LogicIndex 配置 API，改为内部自动生成逻辑索引名称。更新及增加脱敏模块 API，支持脱敏数据与原文数据共存。新功能集成分布式事务 Seata。用户可以使用 ShardingProxy 进行数据脱敏。用户可以使用 Leaf-segment 生成器来获取分布式 ID。支持使用 SkyWalking 插件进行应用程序性能管理。增强在线动态修改数据源配置，仅重新创建当前修改的数据源对象优化解析引擎，提高 SQL 兼容性。重构删除数据库枚举类型，使用 SPI 方式动态识别数据源类型。解析引擎从第二代升级到第三代。重构 SQL 改写模块。详情查看发布公告：Apache ShardingSphere 4.0.0-RC2发布

2019-08-23

924

GNU Scientific Library (GSL) 是一个用于科学计算的 C 语言类库，有超过 1000 个函数。这个版本是对公共线性代数矩阵分解的主要性能改进，以及许多新特性和错误修复。如下：为下列函数添加 BLAS 调用：gsl_vector_memcpy、gsl_vector_scale、gsl_matrix_memcpy、gsl_matrix_transpose_memcpy、gsl_matrix_tricpy 、gsl_matrix_transpose_tricpy 删除函数 GSL_linalg_Complex_home_hm 和 GSL_linalg_Complex_home_mh 添加 GSL_linalg_symmtd 和 GSL_linalg_hermtd 的单元测试已将多个大型 TSQR 算法转换为使用新的 3 级 QR分解非线性最小二乘 Cholesky 解算器现在使用新的 3 级 BLAS方法；旧的改进 Cholesky 求解器仍然适用于 gsl_multifit_nlinear_solver_mcholesky 和gsl_multilarge_n...

2019-08-23

883

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。