毫秒级从百亿大表任意维度筛选数据,是怎么做到的...
作者:闲鱼技术-才思
1、业务背景
随着闲鱼业务的发展,用户规模达到数亿级,用户维度的数据指标,达到上百个之多。如何从亿级别的数据中,快速筛选出符合期望的用户人群,进行精细化人群运营,是技术需要解决的问题。业界的很多方案常常需要分钟级甚至小时级才能生成查询结果。本文提供了一种解决大数据场景下的高效数据筛选、统计和分析方法,从亿级别数据中,任意组合查询条件,筛选需要的数据,做到毫秒级返回。
2、技术选型分析
从技术角度分析,我们这个业务场景有如下特点:
- 需要支持任意维度的组合(and/or)嵌套查询,且要求低延迟;
- 数据规模大,至少亿级别,且需要支持不断扩展;
- 单条数据指标维度多,至少上百,且需要支持不断增加;
综合分析,这是一个典型的OLAP场景。
2.1 OLTP与OLAP
下面简单对比下OLTP和OLAP:
| OLTP | OLAP | |
|---|---|---|
| 定义 | 联机事务处理 | 联机分析 |