13【在线日志分析】之舍弃Redis+echarts3,选择InfluxDB+Grafana
1.最初选择Redis作为存储,是主要有4个原因:a.redis是一个key-value的存储系统,数据是存储在内存中,读写性能很高;b.支持多种数据类型,如set,zset,list,hash,string;c.key过期策略;d.最主要是网上的博客全是sparkstreaming+redis,都互相模仿;至于缺点,当时还没考虑到。2.然后开始添加CDHRolelog.class类和将redis模块加入代码中,使计算结果(本次使用spark streaming+spark sql,之前仅仅是spark streaming,具体看代码)存储到redis中,当然存储到redis中,有两种存储格式。2.1 key为机器名称,服务名称,日志级别拼接的字符串,如hadoopnn-01_namenode_WARN, value为数据类型list,其存储为json格式的 [{"timeStamp": "2017-02-09 17:16:14.249","hostName": "hadoopnn-01","serviceName": "namenode","logType":"WARN","cou...


