【双11背后的技术】双11背后的大规模数据处理
选自《不一样的技术创新——阿里巴巴2016双11背后的技术》,全书目录:https://yq.aliyun.com/articles/68637
本文作者:惠岸 朋春 谦乐
1. 实时数据总线服务-TT
TimeTunnel(TT)在阿里巴巴集团内部是一个有着超过6年历史的实时数据总线服务,它是前台在线业务和后端异步数据处理之间的桥梁。从宏观方面来看,开源界非常著名的Kafka+Flume的组合在一定程度上能够提供和TT类似的基础功能;不同的是,在阿里巴巴的业务体量和诉求下,我们有比较多的配置管控、资源调度、轨迹校验和血缘识别等方面的工作。
TimeTunnel产品架构
1.1 Pub/Sub服务
通过上图我们清楚地看到,TT的核心部分是一个基于HBase做中间存储的Pub/Sub服务,它提供了一个能支撑高读写比、大吞吐量和数据不丢的队列