首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/669045

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

容错和高性能如何兼得: Flink创始人谈流计算核心架构演化和现状

前言# 当前,流数据平台的普及率正在飙升。为了解决日益增长的实时数据处理需求,一些公司正在将其部分大数据基础架构转换为流式处理模型。 基于流数据的基础架构不仅能够更好地解决延迟敏感的数据处理业务需求,同时提供更多深入业务洞察 ; 另外,流式数据处理平台让传统的数据仓库建设更加简单灵活。 流式基础架构的关键部分是流计算引擎。优秀的流式计算引擎可以让业务即使在有状态计算的情况下,也能提供低延迟、高吞吐、强一致性。 在本文中,我们将深入探讨 Flink 的检查点机制如何工作,以及它如何取代旧架构以实现流容错和恢复。 我们测量 Flink 在各种类型的流媒体应用程序中的性能,并通过在 Apache Storm(一种广泛使用的低延迟流处理器)上运行相同系列的实验来进行效果对比。 流式处理架构演化# 在流式计算领域,同一套系统需要同时兼具容错和高性能其实非常难。 在传统的批处理中,当作业失败时,可以简单地重新运行作业的失败部分以修复由于之前失败导致的数据丢失。 这对于批处理是完全可行的,因为批处理的数据是静态的,可以从头到尾重放。 在连续的流式处理模型中,这种处理思路是完全不可行的。 原则上,数据...

实时计算Flink——产品定位

实时计算 Flink提供Flink SQL,协助您简单轻松完成流式计算逻辑的处理。实时计算 Flink提供的全功能的UDF函数,能够帮助您完成定制化业务的数据处理逻辑。在流数据分析领域,Flink SQL和UDF能够完成大部分流式数据分析处理逻辑。目前的实时计算更擅长于流式数据分析、统计、处理。相对于非SQL能够解决的领域,例如,复杂的迭代数据处理、复杂的规则引擎告警,则不适合现有的流计算产品去解决。 目前实时计算 Flink擅于处理以下应用场景。 实时的网络点击PV、UV统计。 统计交通卡口平均每5分钟的车流量。 水利大坝的压力数据的统计和展现。 网络支付中涉及金融盗窃固定行为规则的告警。 曾经实时计算 Flink对接,但无法实现的场景。 Oracle存储过程使用实时计算 Flink替换。 实时计算无法从功能上完全替换掉Oracle存储过程,两者面向问题领域不一致。 Spark作业无缝迁移到实时计算。Spark部分涉及实时计算可以考虑改造并迁移到实时计算,用户可以完全省去运维Spark和开发Spark的各类成本,但无法做到Spark作业无缝迁移到实时计算。 多种复杂规则引擎告警。 针...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。