Apache Samza - Reliable Stream Processing atop Apache Kafka and Hadoop...
前两年一直在使用Kafka, 虽说Kafka一直说可用于online分析, 但是实际在使用的时候会发现问题很多, 比如deploy, 调度, failover等, 我们也做了一些相应的工作 Samza算是把这个补全了, 可以更加简单的在Kafka上进行online分析, 所以看着比较亲切 1 Background 首先对messaging系统和stream processing系统的阐述, 很清晰 messaging系统, 数据的传递, 是比较low-level infrastructure, 可以使用各种方案, 纯message queue, pub-sub system 或log aggregation system stream processing系统, 关注的是更高层的(processing layer)问题, 可以看下面写的一些, 容错, 事务等 What is messaging? Messaging systems are a popular way of implementing near-realtime asynchronous computation. Mes...
