用Kafka和HBase构建一个基于Docker的数据采集器
本文讲的是用Kafka和HBase构建一个基于Docker的数据采集器, 【编者的话】本文主要介绍在Docker上,用Kafka和HBase构建一个数据采集器,并用这个采集器用来记录 Caltrain Rider 这款应用的GPS数据。本文只是一个简单的实践,读者可以将此方法进行拓展,以更好的学习Docker。 不难看出Docker近来 发展迅速 。分布式计算现在已日益普遍,而适用于分布式环境的开发工具仍在发展之中。一个多平台的应用在开发、测试以及部署方面已经成为一大难题,但好在虚拟机为我们提供了一个非常有用的简化抽象概念,允许应用的依赖性独立于物理硬件进行配置,但容器化技术通过运行宿主机的独立进程,避免了与虚拟化硬件竞争,从而进一步实现了这一点。同时,Docker是管理Linux容器的一个重要工具,也具备了分享容器镜像和协同工作的功能。 本文中将使用一个例子进行详述,即使用Docker构建数据采集途径,从而运用Kafka和HBase记录手机应用程序GPS数据,它是基于 Caltrain Rider 应用的部分后端基础架构,以帮助使用者查询列车时刻,但是本文中我提及的方法可广泛适用于诸...