阿里云HBase SQL一站式解决复杂查询难题-低调大师

阿里云HBase SQL一站式解决复杂查询难题

2019-06-18 704

一、背景概述

HBase作为海量在线存储引擎，被广泛应用于推荐、风控、物联网、画像、表单等大数据场景。Phoenix作为HBase的SQL层，极大降低了用户使用门槛，并且实现了二级索引、加盐表、动态列等大量实用功能。HBase底层存储基于LSM，LSM能将业务的随机写转为顺序写，能有效提升写吞吐，但是其查询只适合于Rowkey的前缀匹配，查询模式单一；Phoenix二级索引，底层是跟原表关联的索引表，同样也是前缀匹配，一个表可以有多个索引，这样可以增加查询范式，但是索引数目不能太多，否则写放大的问题会比较严重。对于更加复杂的查询场景，比如表单、日志查询里面的模糊查找，用户画像里面的随机条件组合等等，HBase + Phoenix的组合就不能支持。该问题是基于LSM的NoSQL数据库的通用问题，除了HBase，Cassandra、Le

微信关注我们

原文链接：https://yq.aliyun.com/articles/705943

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

DLA支持MaxCompute(ODPS)数据源

DLA支持MaxCompute(ODPS)数据源 1. 概述支持功能包括： MaxCompute（ODPS）的数据查询，目前复杂数据类型以字符串形式返回；一条命令同步对应project下的所有表。不支持数据回流ODPS。其他说明：基于MaxCompute tunnel拉取数据；通过在查询中指定WHERE <分区列> = <分区key>的形式进行分区过滤（裁剪），避免全表扫描数据，目前支持如下一些形式进行分区过滤（裁剪）： WHERE<分区列> = <分区key> WHERE<分区列> = <分区key1> OR<分区列> = <分区key2> ... WHERE<分区列> IN (<分区key1>,<分区k

2019-06-18

1105

本文会就与cassandra备份恢复相关的模块进行系列介绍，大概包括：incremental backups；snapshot；nodetool相关(refresh，rebuild_index等)，这里会优先介绍下incremental_backups；注本系列使用代码为cassandra-3.11版本； incremental backups Incremental backup 顾名思义就是增量备份，大概可以理解为对cassandra新增的数据进行备份。开启incremental backups 默认情况下incremental backups是关闭的，有2种途径可以开启incremental backups：在cassandra 的conf目录下面的cassandra.yaml配置文件里面有 incremental_backups

2019-06-19

741

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。