Locust + python + influxdb + grafana 展示性能压测QPS图表-低调大师

Locust + python + influxdb + grafana 展示性能压测QPS图表

2020-07-07 553

需求

在使用locust压测的时候，如果使用web则可以查看到QPS压测过程的曲线图。而如果使用no web模式启动，则只有一些打印的日志可以查看。

那么能否将no web模式启动的locust执行过程日志转化为曲线图表呢？

如果需要将日志转化为曲线图表，那么则以下步骤：1、将locust执行任务日志序列化，方便程序读取 2、需要定时刷新获取执行日志文件，将日志信息写入数据库 3、读取数据库数据，将其进行图表化呈现。

并且还要求这个日志采集处理要足够轻量级、资源消耗小，只有在执行locust的时候才启动即可。所以，我也放弃了filebeat + logstash + Elasticsearch 或者 kafka 、redis等大型采集日志的方案。

自己定制化写一个即可。

将locust执行任务日志序列化

方式一，直接在locust源码中挂上钩子，将日志格式化写入文件

对于locust执行任务的日志序列化我尝试过直接在locust源码中挂上钩子，然后将日志进行格式化之后，再写入一个文件中。功能上是可以实现的，但是压测性能上就会大打折扣，由于locust在压测过程需要对每个压测请求都进行格式化以及写入文件，这样就很影响压测机的并发效率。

所以这种方式已经被我抛弃。

有兴趣可以参考：Matplotlib可视化查看Locust测试结果(一)

方式二，过滤locust使用no web模式下打印出来的日志

在经过多测压测测试之后，我决定直接使用locust执行过程打印的日志来生成图表。

1、首先将locust执行过程的日志写入文件中 2、通过读取执行文件的日志信息，再将其转化存储到influxdb数据库 3、最后根据influxdb数据库的数据，展示图表

在这个过程，对于locust自身的压测过程，我并没有嵌入代码去影响执行效率。而是将locust执行过程自动打印出来的信息进行二次处理而已。

这样做的好处就是不会对locust压测造成较大的性能损耗，因为大概是5秒打印一次执行日志，相信这个损耗是比较低的了。

原生的locust执行日志：

可以从图中看到，在执行locust脚本使用no web模式的时候，执行的日志默认是INFO级别的，一般我们都是这样去使用。此时，INFO的日志信息和locust压测执行结果混合在一起打印，这就让人很不开心了。所以必须将其分开。

首先确定我只需要的信息，如下：

如果压测的接口有多个，那么就会有对应的多条信息。示例如下：

 Name                                                          # reqs      # fails     Avg     Min     Max  |  Median   req/s
--------------------------------------------------------------------------------------------------------------------------------------------
 GET /apis1                                                        988     0(0.00%)      20       5      73  |      16   97.12
--------------------------------------------------------------------------------------------------------------------------------------------
 GET /apis2                                                        988     0(0.00%)      20       5      73  |      16   97.12
--------------------------------------------------------------------------------------------------------------------------------------------
 Total                                                            988     0(0.00%)                                      97.12

确定好了需要的数据日志信息之后，下面第一步就是可以将INFO信息和执行结果信息拆分写入不同的日志文件中。

拆分日志中的INFO信息与执行结果信息

--logfile=locust.log --loglevel=INFO 将 INFO信息写到 locust.log日志中
1>run.log 2>&1 将压测执行的结果信息写到 run.log日志中

命令执行如下：locust -f locustfile.py --no-web -c 100 -r 50 --run-time=30 --expect-slaves=2 --csv=result --host='http://127.0.0.1:8000' --logfile=locust.log --loglevel=INFO 1>run.log 2>&1

查看执行压测结果日志run.log如下：

查看执行INFO信息日志locust.log如下：

可以看到INFO信息和locust执行的压测结果已经分开日志文件存储好了。那么下面就需要想办法将执行压测结果的数据进行序列化读取，存储到influxdb中。

使用python实时读取run.log日志信息

在这里可以写一个简单的功能，如下：

在开启执行locust脚本的同时，也启动这个python脚本或者一直长时间执行。
在python脚本执行的过程期间，需要执行两个动作即可：读取日志信息，然后写入influxdb

下面直接将实现好的python代码show出来，如下：

import subprocess
import re
import os

def main():

    # 实时读取日志信息
    shell = 'tail -F run.log'
    p = subprocess.Popen(shell, shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
    for line in iter(p.stdout.readline, b''):
        line = line.rstrip().decode('utf8')
        # print(line)
        
        # 正则匹配获取所有的需要参数
        res = re.match(
            r'^\s+(?P<method>GET|POST)\s+(?P<api>[\/\w\?\=\&]+)\s+(?P<reqs>\d+)\s+(?P<fails>[\d\(\.\)\%]+)\s+(?P<Avg>\d+)\s+(?P<Min>\d+)\s+(?P<Max>\d+)\s+(\|)\s+(?P<Median>\d+)\s+(?P<QPS>[\w\.]+)$',
            line)
        if res:
            print("method: %s, api: %s, reqs: %s, fails: %s, Avg: %s, Min: %s, Max: %s, Median: %s, QPS: %s " % (
                res.group('method'), res.group('api'), res.group('reqs'), res.group('fails').split('(')[0], res.group('Avg'),
                res.group('Min'), res.group('Max'), res.group('Median'), res.group('QPS')
            ))

            # 设置需要写入influxdb的参数
            method = res.group('method')
            api = res.group('api')
            reqs = res.group('reqs')
            fails = res.group('fails').split('(')[0]
            avg = res.group('Avg')
            min = res.group('Min')
            max = res.group('Max')
            median = res.group('Median')
            qps = res.group('QPS')

            # 往influxdb写入数据
            # 创建数据库 curl -i -XPOST http://localhost:8086/query --data-urlencode "q=CREATE DATABASE testdb"
            # 插入数据
            #                                                                       表名   索引 tag              字段 fields
            # curl -i -XPOST 'http://localhost:8086/write?db=testdb' --data-binary 'locust,method=GET,api=/apis reqs=2099,fails=10,avg=20,min=5,max=83,median=16,qps=95.10'
            database = 'testdb'
            table_name = 'locust'
            insert_data = "curl -i -XPOST 'http://localhost:8086/write?db=%s' --data-binary '%s,method=%s,api=%s reqs=%s,fails=%s,avg=%s,min=%s,max=%s,median=%s,qps=%s'" % (database,table_name,method,api,reqs,fails,avg,min,max,median,qps)
            os.system(insert_data)

if __name__ == '__main__':
    main()

此时执行的参数已经可以实时写入influxdb中了，如下：

> precision rfc3339
>
> select * from locust limit 10 tz('Asia/Shanghai')
name: locust
time                                api   avg fails max   median method min qps   reqs
----                                ---   --- ----- ---   ------ ------ --- ---   ----
2019-11-21T14:59:19.040228993+08:00 /apis 16  0     43    14     GET    6   0     191
2019-11-21T14:59:21.039195477+08:00 /apis 62  0     206   55     GET    6   36    481
2019-11-21T14:59:23.059811043+08:00 /apis 151 0     1305  110    GET    6   96.2  765
2019-11-21T14:59:25.077216006+08:00 /apis 211 0     2098  160    GET    6   103.5 990
2019-11-21T14:59:27.066784427+08:00 /apis 272 0     4700  180    GET    6   110   1262
2019-11-21T14:59:29.061261969+08:00 /apis 384 0     6386  190    GET    6   126.1 1532
2019-11-21T14:59:31.079897673+08:00 /apis 395 0     9465  190    GET    6   133.4 1804
2019-11-21T14:59:33.076470655+08:00 /apis 422 0     9707  200    GET    6   132   2034
2019-11-21T14:59:35.084000478+08:00 /apis 526 0     13796 200    GET    6   127.1 2270
2019-11-21T14:59:37.102809695+08:00 /apis 574 0     15456 200    GET    6   127.5 2553
>

那么下一步只要在grafana展示图表就可以了。

Grafana设置图表

创建table图表

先创建一个table表格，如下：

将查询语句直接写入查询框中，然后选择数据库（我前面已经设置好，这里就不展示了），最后设置查询的时间，就可以看到数据展示了。

最后修改标题，保存起来就可以了，下面再来做一个折线图。

创建折线图

同样的操作，如何需要在折线图上显示什么曲线，那就增加字段即可。在复制到grafana之前，最好在influx查询执行一下，看看能否执行成功。

我的测试执行如下：

> select "qps","avg" from locust limit 5 tz('Asia/Shanghai')
name: locust
time                                qps   avg
----                                ---   ---
2019-11-21T14:59:19.040228993+08:00 0     16
2019-11-21T14:59:21.039195477+08:00 36    62
2019-11-21T14:59:23.059811043+08:00 96.2  151
2019-11-21T14:59:25.077216006+08:00 103.5 211
2019-11-21T14:59:27.066784427+08:00 110   272
>

到这里就已经实现locust执行日志的实时查看了。

效果图

最后设置一下页面自动刷新，如下：

另外，如果有不清楚influxdb和grafana安装和基本操作的，可以看看我之前写关于这两个工具的篇章：Grafana系列InfluxDB系列

本文分享自微信公众号 - DevOps社群（DevOpsCommunity）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4011572/blog/4538440

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

堂妹问我：Dubbo的服务暴露过程

这周去苏州见大佬，没想到遇到一堆女粉丝，其中居然还有澡堂子堂妹，堂妹一遇到我就说敖丙哥哥我超级喜欢你写的dubbo系列，你能跟我好好讲一下他的服务暴露过程么？我笑了笑：傻瓜，你想看怎么不早点说呢？我今天来就带大家看看 Dubbo 服务暴露过程，这个过程在 Dubbo 中其实是很核心的过程之一，关乎到你的 Provider 如何能被 Consumer 得知并调用。今天还是会进行源码解析，毕竟我们需要深入的去了解 Dubbo 是如何做的，只有深入它才能了解它。不用担心源码问题，因为不仅仅有源码解析，敖丙也会通过画图和总结性的语言帮助大家理解，而且在面对面试官的时候，总结性的语言才是最重要的，因为不见得面试官也懂得或者记得具体的细节。对了，源码是 2.6.5 版本。 URL 不过在进行服务暴露流程分析之前有必要先谈一谈 URL，有人说这 URL 和 Dubbo 啥关系？有关系，有很大的关系！一般而言我们说的 URL 指的就是统一资源定位符，在网络上一般指代地址，本质上看其实就是一串包含特殊格式的字符串，标准格式如下： protocol://username:password@ho...

2020-08-30

625

Scrum 是用于开发、交付和持续支持复杂产品的一个框架，是一个增量的、迭代的开发过程。敏捷的原则和方法必须在每天的实践中落地，对人和管理要求高。所以有scrum master 为了适应变化，敏捷的迭代周期短特征迭代开发：这意味着你应该重复开发过程。增量交付：意味着你应该一步一步地创建产品的“可用”子集，而不是在项目结束时一次性交付。原则迭代是受时间框限制的，也就是说即使放弃一些功能，也必须结束迭代。每次迭代结束的时候让产品达到可交付状态十分重要，每次迭代都以一个可运行的产品的公布而结束。迭代开发是在变与不变中寻求平衡，在迭代开始的时候寻求变，而在迭代开发期间不能改变，以期集中精力完成已经确定的工作。由于一次迭代的时间并不长，所以就使稳定性和易变性得到很好的平衡。经验证明：4周是非常好的时间。能否每个Sprint生成满足质量定义的PSPI 是Scrum 执行效果的试金石。角色 product owner 作为产品负责人，PO清楚地知道产品的愿景，需要对产品待办列表的梳理、优化、优先级排序等负责。PO决定Why和What，一般可以对应为我们理...

2020-08-31

722

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。