troubleshoot之:用control+break解决线程死锁问题

2020-08-07 593

简介

如果我们在程序中遇到线程死锁的时候，该怎么去解决呢？

本文将会从一个实际的例子出发，一步一步的揭开java问题解决的面纱。

死锁的代码

写过java多线程程序的人应该都知道，多线程中一个很重要的事情就是状态的同步，但是在状态同步的过程中，一不小心就有可能会导致死锁的问题。

一个最简单的死锁情况就是thread1占有资源1，然后又要去获取资源2. 而thread2占有资源2，又要去获取资源1的情况。

举个具体的例子：

public class TestDeadLock {
    public static Object lock1= new Object();
    public static Object lock2= new Object();
    public static void main(String[] args) {
        Runnable runnable1= ()-> {
            System.out.println("in lock1");
            synchronized(lock1){
                System.out.println("Lock1 lock obj1");
                try {
                    Thread.sleep(3000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized(lock2){
                    System.out.println("Lock1 lock obj2");
                }
            }
        };

        Runnable runnable2= ()-> {
            System.out.println("in lock2");
            synchronized(lock2){
                System.out.println("Lock2 lock obj2");
                try {
                    Thread.sleep(3000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized(lock1){
                    System.out.println("Lock2 lock obj1");
                }
            }
        };

        Thread a = new Thread(runnable1);
        Thread b = new Thread(runnable2);
        a.start();
        b.start();
    }
}

我们运行上面的代码：

in lock1
Lock1 lock obj1
in lock2
Lock2 lock obj2

发送了锁循环等待的情况，程序执行不下去了，发送了死锁。

control+break命令

在代码很简单的情况下，我们很容易就能分析出来死锁的原因，但是如果是在一个非常庞大的线上项目的时候，分析代码就没有那么容易了。

怎么做呢？

今天教给大家一个方法，使用control+break命令。

control+break在linux表示的是Control+backslash，而在Windows下面就是Control+Break按钮。

当然，还有一个更加通用的就是使用：

kill -QUIT pid命令。

我们用jps命令获取到执行java程序的进程id，然后执行kill -QUIT命令。

执行完毕，我们会发现运行的java进程会输出一些额外的日志，这些额外的日志就是我们找出死锁的关键因素。

注意，这个kill命令并不会终止程序的运行。

输出的内容比较多，我们一部分一部分的讲解。

Full thread dump

日志的第一部分就是Full thread dump，包含了JVM中的所有线程的状态信息。

我们看一下我们代码中的两个关键线程信息：

"Thread-0" #13 prio=5 os_prio=31 cpu=4.86ms elapsed=230.16s tid=0x00007fc926061800 nid=0x6403 waiting for monitor entry  [0x0000700008d6a000]
   java.lang.Thread.State: BLOCKED (on object monitor)
    at com.flydean.TestDeadLock.lambda$main$0(TestDeadLock.java:21)
    - waiting to lock <0x0000000787e868f0> (a java.lang.Object)
    - locked <0x0000000787e868e0> (a java.lang.Object)
    at com.flydean.TestDeadLock$$Lambda$14/0x0000000800b69840.run(Unknown Source)
    at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)

"Thread-1" #14 prio=5 os_prio=31 cpu=4.32ms elapsed=230.16s tid=0x00007fc924869800 nid=0x6603 waiting for monitor entry  [0x0000700008e6d000]
   java.lang.Thread.State: BLOCKED (on object monitor)
    at com.flydean.TestDeadLock.lambda$main$1(TestDeadLock.java:36)
    - waiting to lock <0x0000000787e868e0> (a java.lang.Object)
    - locked <0x0000000787e868f0> (a java.lang.Object)
    at com.flydean.TestDeadLock$$Lambda$15/0x0000000800b69c40.run(Unknown Source)
    at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)

上面的输出列出了线程名字，线程的优先级，cpu时间，是否是daemon线程，线程ID，线程状态等有用的信息。

看到上面的输出，我们看到两个线程都是处于BLOCKED状态，都在等待object monitor。

还记得线程的几个状态吗？我们再来复习一下。

死锁检测

接下来的部分就是我们最关心的死锁检测了。

Found one Java-level deadlock:
=============================
"Thread-0":
  waiting to lock monitor 0x00007fc926807e00 (object 0x0000000787e868f0, a java.lang.Object),
  which is held by "Thread-1"

"Thread-1":
  waiting to lock monitor 0x00007fc926807f00 (object 0x0000000787e868e0, a java.lang.Object),
  which is held by "Thread-0"

Java stack information for the threads listed above:
===================================================
"Thread-0":
    at com.flydean.TestDeadLock.lambda$main$0(TestDeadLock.java:21)
    - waiting to lock <0x0000000787e868f0> (a java.lang.Object)
    - locked <0x0000000787e868e0> (a java.lang.Object)
    at com.flydean.TestDeadLock$$Lambda$14/0x0000000800b69840.run(Unknown Source)
    at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)
"Thread-1":
    at com.flydean.TestDeadLock.lambda$main$1(TestDeadLock.java:36)
    - waiting to lock <0x0000000787e868e0> (a java.lang.Object)
    - locked <0x0000000787e868f0> (a java.lang.Object)
    at com.flydean.TestDeadLock$$Lambda$15/0x0000000800b69c40.run(Unknown Source)
    at java.lang.Thread.run(java.base@14.0.1/Thread.java:832)

Found 1 deadlock.

上面的日志我们可以很明显的看出来，两个线程分别获得了对方需要的锁，所以导致了死锁。

同时还详细的列出了thread stack的信息，供我们分析。

如果我们添加了参数-XX:+PrintConcurrentLocks，还会输出各个线程的获得的concurrent lock信息。

Heap信息

最后一部分是Heap的统计信息：

Heap
 garbage-first heap   total 133120K, used 3888K [0x0000000780000000, 0x0000000800000000)
  region size 1024K, 4 young (4096K), 0 survivors (0K)
 Metaspace       used 1122K, capacity 4569K, committed 4864K, reserved 1056768K
  class space    used 108K, capacity 412K, committed 512K, reserved 1048576K

如果我们添加了-XX:+PrintClassHistogram命令，还可以额外的输出class直方图统计信息。

总结

上面就是使用Control+Break命令来分析java死锁问题的具体例子，希望大家能够喜欢。

本文作者：flydean程序那些事

本文链接：http://www.flydean.com/jvm-diagnostic-control-break/

本文来源：flydean的博客

欢迎关注我的公众号:程序那些事，更多精彩等着您！

微信关注我们

原文链接：https://yq.aliyun.com/articles/769880

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2.1.2 类加载器的工作原理与自定义加载器 -《SSM深入解析与项目实战》

@[TOC] 2.1.3 类加载器的工作原理类加载器加载流程由前面，我们应该都可以知道，Java中的类加载器大致可以分为两类，一类是系统提供的，另一类是由开发者编写的自定义类加载器。系统提供的三个类加载器在前面已经介绍了。根据类加载器的双亲委派机制来理解类加载器的加载流程图，就非常容易理解了。如图2-2所示。图2-2 类加载器加载流程上图的箭头不是代表着父类加载器是继承关系实现的，而是通过组合关系来复用父加载器中的代码实现。可以通过代码清单2-2运行验证图2-2过程代码清单2-2：ClassLoaderTest类 ...... 更多内容请阅读原文： https://chenhx.blog.csdn.net/article/details/107871197

2020-08-07

582

超详细的RabbitMQ入门，看这篇就够了！

思维导图一、什么是消息队列消息指的是两个应用间传递的数据。数据的类型有很多种形式，可能只包含文本字符串，也可能包含嵌入对象。 “消息队列(Message Queue)”是在消息的传输过程中保存消息的容器。在消息队列中，通常有生产者和消费者两个角色。生产者只负责发送数据到消息队列，谁从消息队列中取出数据处理，他不管。消费者只负责从消息队列中取出数据处理，他不管这是谁发送的数据。二、为什么使用消息队列主要有三个作用：解耦。如图所示。假设有系统B、C、D都需要系统A的数据，于是系统A调用三个方法发送数据到B、C、D。这时，系统D不需要了，那就需要在系统A把相关的代码删掉。假设这时有个新的系统E需要数据，这时系统A又要增加调用系统E的代码。为了降低这种强耦合，就可以使用MQ，系统A只需要把数据发送到MQ，其他系统如果需要数据，则从MQ中获取即可。异步。如图所示。一个客户端请求发送进来，系统A会调用系统B、C、D三个系统，同步请求的话，响应时间就是系统A、B、C、D的总和，也就是800ms。如果使用MQ，系统A发送数据到MQ，然后就可以返回响应给客户端，不需要再等待系统B、C、D的响...

2020-08-08

585

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

JDK

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。