重新定义流计算:第三代流处理系统 RisingWave 的 2024 年展望
流处理技术在过去的 20 年里经历了从学术概念到商业应用的演变。流处理系统从无到有,我们见证了从第一代数据流管理系统如 IBM System S、Oracle CQL、Esper 等,到第二代基于 MapReduce 思想发展出的分布式流计算平台,如 Apache Spark Streaming、Apache Flink 等,再到如今的第三代云原生流处理系统,如 RisingWave。这一发展标志着流处理技术的普及和简化,已成为众多行业中不可或缺的关键技术。
图片来源:Fragkoulis, Marios, et al. "A survey on the evolution of stream processing systems." The VLDB Journal (2023): 1-35.
RisingWave 诞生于 2021 年初。经过三年的打磨,已然成长为第三代流处理系统中最具代表性的产品。自 2022 年 4 月开源以来,在全球范围内更是增长迅速,互联网、金融、能源、航空航天、供应链、智能汽车等多个领域的生产环境中都得到了落地应用。到今天,RisingWave 的全球日活集群已达上百个。
RisingWave 集群全球部署情况(2023 年 12 月数据)
2024 年对于 RisingWave 来说,是走向成熟阶段的重要转折之年。我们将全力加速推动产品普及化,为全球用户提供更易用、更高效的流处理服务。在本文中,我们将对 RisingWave 的 2024 年做出展望。
1强化易用性与性价比两大特性
RisingWave 诞生之初,便将"使流计算平民化"作为长期发展目标, 致力于强化流处理系统的易用性与高性价比,不断降低流计算学习、使用与维护的门槛。
在易用性方面,RisingWave 实现了与 PostgreSQL 的协议兼容性,能与 PostgreSQL 生态圈的系统进行有效交互。用户能够使用遵循 PostgreSQL 语法规范的 SQL 语句来构建物化视图,进而直接执行流计算操作。此外,RisingWave 支持用户创建层级物化视图,并能确保计算一致性与实时性,显著简化了相对于传统流计算基于"流计算引擎 + 消息队列 + 数据库"组合架构的复杂性,从而在系统开发与维护方面实现成本的大幅降低。
使用 RisingWave 大幅简化流处理应用开发架构复杂度
在性价比方面,RisingWave 持续优化存算分离架构,以稳定且高效地支持大规模状态计算。RisingWave 将远端对象存储作为计算状态的持久化介质,依靠此架构实现了秒级系统故障恢复及弹性扩缩容能力。此外,RisingWave 通过实施分层存储以及智能缓存机制来尽可能避免出现访问远端对象存储的情况,从而缓解远端对象存储访问可能带来的延迟升高问题。
2自动弹性扩缩容与极致性能
RisingWave 采用存算分离架构,实现了无限水平扩展,同时保障了系统的高可用性和弹性扩缩容能力。在 2024 年,我们将加大力度对 RisingWave 的架构和用户体验进行全面升级。
当前,虽然 RisingWave 支持秒级弹性扩缩容,但这一过程仍需用户基于线上负载进行手动调整,这在一定程度上限制了其便利性。为此,RisingWave 计划在近期版本中推出自动扩缩容功能,自主根据集群变化动态调整流计算分布,充分适应集群规模。
此外,RisingWave 将进一步对其分层存储进行优化。由于远端对象存储性能问题,可能会导致 RisingWave 在缓存未命中的情况下出现性能抖动。RisingWave 将进一步优化缓存策略,降低性能抖动出现概率。对于如多流 join 等大计算状态查询,RisingWave 也会进一步对优化器与执行器进行升级,以巩固其在性能方面相较于同类产品的领先地位。
3全面拥抱数据湖
RisingWave 已实现了对多种数据湖格式的读写支持。值得一提的是,RisingWave 与 Apache Iceberg 等社区一同参与贡献了 Apache Iceberg Rust 项目,不仅为 Rust 项目提供了 Iceberg 接口,而且实现了对 Iceberg 格式写入性能的三倍提升。
在 2024 年,RisingWave 计划与各大数据湖社区紧密合作,进一步加强与各大数据湖的集成。这将显著提升 RisingWave 对数据湖的直接读写能力,使用户能通过 RisingWave 进行实时数据湖写入,并直接在数据湖上构建物化视图,根据数据湖变更直接为用户呈现实时计算结果。这也意味着用户可以直接通过 RisingWave 对实时流数据与历史批数据进行统一分析。
同时,RisingWave 将联合主流数据湖以及实时分析系统厂商一起构建流式湖仓,为用户带来更低成本、更加实时的数据管理体验。
4显著提升在线数据服务体验
RisingWave 定位为流数据库,而非流计算引擎。这意味着用户会经常将 RisingWave 使用于在线数据服务中,为传统操作型数据库(如 MySQL、PostgreSQL、MongoDB 等)提供功能增强。典型场景比如:使用 RisingWave 直接消费操作型数据库 CDC,构建实时物化视图,为用户应用直接提供在线数据查询服务。
在 2024 年,RisingWave 将投入更多资源来提升在线数据服务应用的体验。从数据导入方面,将为更多应用开发直连数据导入能力,使用户更加轻松的将数据实时传输至 RisingWave;在数据存储方面,RisingWave 计划引入新型表结构,对数据进行高效压缩以节省存储成本,同时允许外部引擎直接访问 RisingWave 数据;在数据服务方面,RisingWave 将添加轻量级全文检索等功能,进一步优化高并发查询响应能力,使用户更加稳定高效地构建在线数据应用。
5归于开源,回馈社区
RisingWave 流数据库能够在流处理领域占有一席之地,离不开近 150 位开源贡献者及近 3000 名社区成员的支持与贡献。RisingWave 始终倾听社区声音,积极响应用户反馈,虚心采纳用户意见。在未来的一年里,RisingWave 将举办多场线上、线下社区活动,以进一步推广流计算系统应用。
为了更好地服务中文用户,我们将在 2024 年初上线全新中文文档,让更多中文用户了解与使用 RisingWave,并推动中文社区蓬勃发展。
RisingWave 期望与社区成员一道,共同打造下一代流处理系统,推动流计算技术的繁荣和普及。
RisingWave是一款基于 Apache 2.0 协议开源的分布式流数据库,致力于降低流计算使用门槛。RisingWave 采用存算分离架构,实现了高效的复杂查询、瞬时动态扩缩容以及快速故障恢复,帮助用户轻松快速搭建稳定高效的流计算系统。使用 RisingWave 处理流数据的方式类似使用 PostgreSQL,通过创建实时物化视图,让用户能够轻松编写流计算逻辑,并通过访问物化视图来进行即时、一致的查询流计算结果。了解更多:
💻 官网: risingwave.com
✨GitHub: risingwave.com/github
📖 教程: risingwavetutorial.com

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
2024 第一弹,JAVA 原生 AI 算法引擎 EasyAI 加入 Dromara 开源社区
如今AI项目无论在工业领域还是生活领域都开始逐渐深入,chatGPT,文心一言等大模型更是如火如荼,让我们看到了AI的强大。不知道多少小伙伴想快速涉猎到AI领域呢?因为各种原因JAVA在AI领域一直是传统弱项,但是JAVA程序员却占据了国内程序员就业的半壁江山,所以这次我带来的java原生开源AI算法引擎-easyAI(不依赖任何第三方库,开箱即用的引擎),介绍给大家。 EasyAI - JAVA原生AI算法引擎 作者介绍 dromara 开源组织成员,dromara/easyAI 作者。 2年JAVA开发工程师,2年游戏开发工程师,5年图像/自然语言算法研究员与工程师。从业IT九年,做算法工作时产出视觉与语言算法发明专利共三件(独立发明),项目若干。工作经历以图像算法为主,语言为辅。做游戏工作时休闲小游戏产出不计其数,做JAVA工作时以中间件研发工作为主。 背景与简介 广大公司,尤其是中小公司是不是遇到过以下痛点? 1.公司后端突然需要一个AI模块来辅助某业务场景,但是因为传统业务关系公司后端大部分都是java程序员。 去招个资深的算法工程师吧,先不说招聘的时间成本,就因为这么一个需...
- 下一篇
Ubuntu 考虑停止为源代码打包 ISO 镜像
Ubuntu 的安装介质 (ISO) 生成器最近不再提供源代码 ISO 的组装。这些 ISO 包含了 Ubuntu Linux 的所有源代码打包,其初衷是帮助用户遵守 GPL 许可证并确保代码易于访问。但此举在现实中的作用有限,现在 Ubuntu 开发者正在考虑停止为源代码打包 ISO 镜像。 源代码 ISO 在理论上可以帮助确保所使用的 GPL 许可代码确实可用,但在实践中并没有被广泛使用...... 想一下你上次下载六张 DVD 的 Ubuntu 源码包是什么时候? Ubuntu/Debian 的单个源码包仍然以非 ISO 的形式提供,供需要不同资产的用户单独使用。Ubuntu 源代码 ISO 并不与其他 Ubuntu ISO 二进制版本打包成镜像,因此可用性较低。 还有人提出,各种 Ubuntu 桌面环境/混合版本也没有发布它们对应的源代码 ISO。此外,这还只代表源代码发布时的状态,如果想要获得当前所有的 Ubuntu 源代码包和安全更新等,还需要从镜像中手动获取源代码包。 目前 Ubuntu 开发者邮件列表出现了关于彻底停止提供 Ubuntu 源代码 ISO 的讨论。这并不是...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块