Codis 千万并发下调优
环境: 8台机器 32C 256G,redis 6主6从在同一台机器上,dashbaord也在redis00上。codis-proxy 开8C,每台机器开2个proxy。万M网络,CentosOS 6.5 内核2.6.32-431.el6.x86_64。 现象: sprak 70台机器 向codis写 开启pipline,不控制pipline大小,同时调度400个CPU,有大量reset报错。长链接。 排查: 1、Redis没有报错 2、查看qps 流量很低 3、Codis proxy 没有报错,通过网页查看流量过山车 一时无法定位问题 解决方案: 方案一: 把codis-proxy 从 redis分开,分4台,cpu 30C ,每台要机器部署1个codis-proxy日志级别调到warn, 此方案未解决问题,问题依然出现。 通过tcpdump:tcpdump -i bond0 -vnn port 9100 >tcp.log 一个pipline seesion的读写buffers各13M,生产速度大于消费时,各session的buffers不够用,将停止消费,服务端t...