《Storm实时数据处理》一1.7 获取基本的点击率统计信息
本节书摘来华章计算机《Storm实时数据处理》一书中的第1章 ,第1.7节,(澳)Quinton Anderson 著 卢誉声 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.7 获取基本的点击率统计信息
统计点击率Topology用于记录基本的网站使用量统计信息,具体来说它会统计以下信息:
- 访客数量
- 独立访客数量
- 特定国家的访客数量
- 特定城市的访客数量
- 特定国家中每个城市访客数量的百分比
该系统假定访客总量一定,而且希望服务端的用户标示与客户端的Cookies是相对应的。该Topology通过IP地址和公用IP解析服务获取地理位置信息。
统计点击率Topology还将使用Redis存储发送到Topology的点击事件,具体来说就是将其作为一个持久化队列;除此以外还要利用Redis记录再次访问网站的访客信息。
关于Redis的更多信息,