arthas 阿尔萨斯 Java诊断工具
下载和安装 curl -O https://alibaba.github.io/arthas/arthas-boot.jar java -jar arthas-boot.jar 使用as.sh curl -L https://alibaba.github.io/arthas/install.sh | sh 直接在shell下面执行./as.sh,就会进入交互界面。也可以执行./as.sh -h来获取更多参数信息。 常用的命令 基本命令 help——查看命令帮助信息 cat——打印文件内容,和linux里的cat命令类似 pwd——返回当前的工作目录,和linux命令类似 cls——清空当前屏幕区域 session——查看当前会话的信息 reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类 version——输出当前目标 Java 进程所加载的 Arthas 版本号 history——打印命令历史 quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响 shutdown——关闭 Arthas 服务端,所有 Arthas 客户端全部退出 查看系统整体情况 dashboard——当前系统的实时数据面板 thread——查看当前 JVM 的线程堆栈信息 jvm——查看当前 JVM 的信息 sysprop——查看和修改JVM的系统属性 sysenv——查看JVM的环境变量 getstatic——查看类的静态属性 类相关命令 sc——查看JVM已加载的类信息 sm——查看已加载类的方法信息 jad——反编译指定已加载类的源码 mc——内存编绎器,内存编绎.java文件为.class文件 redefine——加载外部的文件,redefine到JVM里 dump——dump 已加载类的 byte code 到特定目录 classloader——查看classloader的继承树,urls,类加载信息,使用classloader去getResource 监控相关 monitor——方法执行监控 watch——方法执行数据观测 trace——方法内部调用路径,并输出方法路径上的每个节点上耗时 stack——输出当前方法被调用的调用路径 tt——方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测 问题 初次使用时的一些问题 [ERROR] Target process 9298 is not the process using port 3658, you will connect to an unexpected process. [ERROR] 1. Try to restart as.sh, select process 959, shutdown it first with running the 'stop' command. [ERROR] 2. Try to use different telnet port, for example: as.sh --telnet-port 9998 --http-port -1 这个问题初用者必出,原因为 arthas 选择一个应用进行诊断时弄了一个 session,可以使用 arthas-client ,web arthas client 进行登录,这个提示告诉你要先关闭以前的 arthas-boot ,或者重新选择一个端口。 在 ~/.arthas/lib/3.1.7/arthas 下有一个 arthas-client.jar 使用 java -jar arthas-client.jar 可以进入上次的 session ,shutdown 后就可以选择其它的进程进行诊断了,或者你可以继续诊断当前应用 反编译失败 Memory compiler error, exception message: Compilation Error line: 9 , message: package org.springframework.stereotype does not exist , line: 11 , message: cannot find symbol symbol: class Service , , please check $HOME/logs/arthas/arthas.log for more details. Affect(row-cnt:0) cost in 16 ms. mc命令有可能失败。如果编译失败可以在本地编译好.class文件,再上传到服务器 可以使用sc命名查找相应类的ClassLoader,获取classLoaderHash。再用mc命令进行反编译 # 获取classLoaderHash sc -d *SayService | grep classLoaderHash # classLoaderHash 439f5b3d # 使用classLoaderHash进行反编译 mc -c 439f5b3d /tmp/SayService.java -d /tmp 实战操作 使用monitor命令对类、方法的调用进行监控。 monitor -c 2 com.example.arthastest.service.SayService sayHello 从上图的监控可以看出类SayService的sayHello方法耗时抖动比较大,需进一步排查 使用trace命令对方法内部调用路径,并输出方法路径上的每个节点上耗时统计 trace com.example.arthastest.service.SayService sayHello '#cost > 300' 从上图的监控数据可以看到processName方法耗时多 使用watch命令观察到指定方法的调用情况。能观察到的范围为:返回值、抛出异常、入参,通过编写 OGNL 表达式进行对应变量的查看。 watch com.example.arthastest.service.SayService processName "{params,returnObj}" -x 2 '#cost>300' 从上图的监控可以看出传入参数xiaoming时的耗时较多 使用jad反编译指定已加载类的源码 jad --source-only com.example.arthastest.service.SayService # 可以使用如下命令将生成后的源码指定到文件中 jad --source-only com.example.arthastest.service.SayService > /tmp/SayService.java 看到反编译后的代码,基本可以确认问题出在哪里。 使用sc命令获取加载该方法的classLoaderHash sc -d *SayService | grep classLoaderHash 修改源码后使用mc编译.java文件生成.class修改后的源码如下图 mc -c 439f5b3d /tmp/SayService.java -d /tmp 使用redefine命令重新加载修改后的代码 redefine -c 439f5b3d /tmp/com/example/arthastest/service/SayService.class 再次使用相同的参数访问该方法,会发现耗时明显降低。 注意:redefine命令和jad/watch/trace/monitor/tt等命令会冲突。执行完redefine之后,如果再执行上面提到的命令,则会把redefine的字节码重置。 原因是jdk本身redefine和Retransform是不同的机制,同时使用两种机制来更新字节码,只有最后修改的会生效。redefine后使用jad再次查看源码会发现依旧是以前的,这是命令冲突导致的,会使已生效redefine修改失效。 参考文档 官方文档 arthas常用命令