开发大数据的正确姿势--交互式分析
在大数据技术领域里,用户通常希望获得高可靠、低延时的数据服务,来满足简单或者复杂的查询场景。本文整理自2019年云栖大会大数据技术专场交互式分析团队的精彩演讲,为您深度揭秘交互式分析的核心技术以及应用场景,打开开发大数据的正确姿势!
本文内容整理自云栖大会演讲视频以及PPT。
更多详情请点击:云栖大会交互式分析现场分享
交互式分析是阿里云的一款实时数仓产品,实时数仓最常用的两种查询为简单查询和复杂查询,简单查询例如典型的双11媒体大屏,复杂查询例如AB实时test。针对两种实时数仓的查询场景,典型的业务架构为:用户产生的数据进入消息队列(例如阿里云的DataHub),然后经过实时处理(例如Flink)初步聚合,存储到存储服务里,之后进行数据服务,但由此会产生两个核心的问题:
1.数据选用什么存储服务?
2.如何对外提供高可靠、低延时的数据服务?
针对数据存储,目前市面上常用的产品可能是:
1.基于行存适用于高并发简单查询的Hbase、Cassandra;
2.基于列存适用于复杂大扫描查询的Druid、Kudu。
而开发人员往往会根据业务特性来选择适合自己的存储,当业务足够复杂的时候,可能一个业务需要多套存储系统,为开发、运维带来难度。除此之外,根据业务不同的需求,在数据查询方面也会有不同的需求,比如有时需要简单查询,有时需要复杂关联查询,这时又需要使用不同的计算引擎来提供数据服务,这无疑又给开发、运维带来一定难度。
交互式分析的诞生就是为了解决以上问题,为用户提供一站式高并发、低延时的存储和计算一体化的数据服务,并与大数据生态无缝打通,让你使用现有BI工具就能实现PB级数据的秒级查询分析。
交互式分析--秒级实时数仓
- 大规模计算型存储
采用存储、计算分离的架构,支持简单查询与复杂SQL查询。 - 高性能查询服务
使用交互式分析实现PB级数据秒级查询响应。 - 兼容PostgreSQL生态
意味着只要会使用PostgreSQL就能使用交互式分析,大大降低学习成本。同时,也意味着所有对接PostgreSQL的工具也能对接交互式分析,例如PostgreSQL自有的客户端(psql)、BI分析工具(Tableau、Quick BI)等。
典型应用场景
交互式分析经过在集团内的多年沉淀,已形成自有的典型应用场景,并且广泛用于互联网、新零售、IOT、金融等各个业务。
系统架构
- 底层存储在盘古系统中,存储计算分离,并与MaxCompute在底层无缝打通,可直接对MaxCompute数据加速查询。
- 兼容PostgreSQL,提供JDBC、ODBC接口可直接对接各种开发工具、BI分析工具。
关于交互式分析的更多详细信息,可前往交互式分析官网查看。
同时也欢迎大家进入交互式分析的钉钉交流群,技术专家实时在线为您解决问题。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
RocketMQ 整合 DLedger(多副本)即主从切换实现平滑升级的设计技巧
源码分析 RocketMQ DLedger 多副本系列已经进行到第 8 篇了,前面的章节主要是介绍了基于 raft 协议的选主与日志复制,从本篇开始将开始关注如何将 DLedger 应用到 RocketMQ中。 摘要:详细分析了RocketMQ DLedger 多副本(主从切换) 是如何整合到 RocketMQ中,本文的行文思路首先结合已掌握的DLedger 多副本相关的知识初步思考其实现思路,然后从 Broker启动流程、DLedgerCommitlog 核心类的讲解,再从消息发送(追加)与消息查找来进一步探讨 DLedger 是如何支持平滑升级的。 1、阅读源码之前的思考 RocketMQ 的消息存储文件主要包括 commitlog 文件、consumequeue 文件与 Index 文件。commitlog 文件存储全量的消息,consumequeue、index 文件都是基于 commitlog 文件构建的。要使用 DLedger 来实现消息存储的一致性,应该关键是要实现 commitlog 文件的一致性,即 DLedger 要整合的对象应该是 commitlog 文件,即只需...
- 下一篇
源码分析 RocketMQ DLedger 多副本即主从切换实现原理
DLedger 基于 raft 协议,故天然支持主从切换,即主节点(Leader)发生故障,会重新触发选主,在集群内再选举出新的主节点。 RocketMQ 中主从同步,从节点不仅会从主节点同步数据,也会同步元数据,包含 topic 路由信息、消费进度、延迟队列处理队列、消费组订阅配置等信息。那主从切换后元数据如何同步呢?特别是主从切换过程中,对消息消费有多大的影响,会丢失消息吗? 温馨提示:本文假设大家已经对 RocketMQ4.5 版本之前的主从同步实现有一定的了解,这部分内容在《RocketMQ技术内幕》一书中有详细的介绍,大家也可以参考如下两篇文章:1、 RocketMQ HA机制(主从同步) 。2、RocketMQ 整合 DLedger(多副本)即主从切换实现平滑升级的设计技巧 1、BrokerController 中与主从相关的方法详解 本节先对 BrokerController 中与主从切换相关的方法。 1.1 startProcessorByHa BrokerController#startProcessorByHa private void startProcessor...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,7,8上安装Nginx,支持https2.0的开启