系统稳定性——StackOverFlowError 常见原因及解决方法-低调大师

系统稳定性——StackOverFlowError 常见原因及解决方法

2019-07-25 625

作者：涯海
创作日期：2019-07-26
专栏地址：【稳定大于一切】

每一个 JVM 线程都拥有一个私有的 JVM 线程栈，用于存放当前线程的 JVM 栈帧（包括被调用函数的参数、局部变量和返回地址等）。如果某个线程的线程栈空间被耗尽，没有足够资源分配给新创建的栈帧，就会抛出 java.lang.StackOverflowError 错误。

线程栈是如何运行的？

首先给出一个简单的程序调用代码示例，如下所示：

public class SimpleExample {
      public static void main(String args[]) {
            a();
      }
      public static void a() {
            int x = 0;
            b();
      }
      public static void b() {
            Car y = new Car();
            c();
      }
      public static void c() {
            float z = 0f;
      }
}

当 main() 方法被调用后，执行线程按照代码执行顺序，将它正在执行的方法、基本数据类型、对象指针和返回值包装在栈帧中，逐一压入其私有的调用栈，整体执行过程如下图所示：

首先，程序启动后，main() 方法入栈。
然后，a() 方法入栈，变量 x 被声明为 int 类型，初始化赋值为 0。注意，无论是 x 还是 0 都被包含在栈帧中。
接着，b() 方法入栈，创建了一个 Car 对象，并被赋给变量 y。请注意，实际的 Car 对象是在 Java 堆内存中创建的，而不是线程栈中，只有 Car 对象的引用以及变量 y 被包含在栈帧里。
最后，c() 方法入栈，变量 z 被声明为 float 类型，初始化赋值为 0f。同理，z 还是 0f 都被包含在栈帧里。

当方法执行完成后，所有的线程栈帧将按照后进先出的顺序逐一出栈，直至栈空为止。

StackOverFlowError 是如何产生的？

如上所述，JVM 线程栈存储了方法的执行过程、基本数据类型、局部变量、对象指针和返回值等信息，这些都需要消耗内存。一旦线程栈的大小增长超过了允许的内存限制，就会抛出 java.lang.StackOverflowError 错误。

下面这段代码通过无限递归调用最终引发了 java.lang.StackOverflowError 错误。

public class StackOverflowErrorExample {
      public static void main(String args[]) {
            a();
      }
      public static void a() {
            a();
      }
}

在这种情况下，a() 方法将无限入栈，直至栈溢出，耗尽线程栈空间，如下图所示。

Exception in thread "main" java.lang.StackOverflowError
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
    at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)

如何解决 StackOverFlowError？

引发 StackOverFlowError 的常见原因有以下几种：

无限递归循环调用（最常见）。
执行了大量方法，导致线程栈空间耗尽。
方法内声明了海量的局部变量。
native 代码有栈上分配的逻辑，并且要求的内存还不小，比如 java.net.SocketInputStream.read0 会在栈上要求分配一个 64KB 的缓存（64位 Linux）。

除了程序抛出 StackOverflowError 错误以外，还有两种定位栈溢出的方法：

进程突然消失，但是留下了 crash 日志，可以检查 crash 日志里当前线程的 stack 范围，以及 RSP 寄存器的值。如果 RSP 寄存器的值超出这个 stack 范围，那就说明是栈溢出了。
如果没有 crash 日志，那只能通过 coredump 进行分析。在进程运行前，先执行 ulimit -c unlimited，当进程挂掉之后，会产生一个 core.[pid] 的文件，然后再通过 jstack $JAVA_HOME/bin/java core.[pid] 来看输出的栈。如果正常输出了，那就可以看是否存在很长的调用栈的线程，当然还有可能没有正常输出的，因为 jstack 的这条从 core 文件抓栈的命令其实是基于 Serviceability Agent 实现的，而 SA 在某些版本里有 Bug。

常见的解决方法包括以下几种：

修复引发无限递归调用的异常代码， 通过程序抛出的异常堆栈，找出不断重复的代码行，按图索骥，修复无限递归 Bug。
排查是否存在类之间的循环依赖。
排查是否存在在一个类中对当前类进行实例化，并作为该类的实例变量。
通过 JVM 启动参数 -Xss 增加线程栈内存空间， 某些正常使用场景需要执行大量方法或包含大量局部变量，这时可以适当地提高线程栈空间限制，例如通过配置 -Xss2m 将线程栈空间调整为 2 mb。

线程栈的默认大小依赖于操作系统、JVM 版本和供应商，常见的默认配置如下表所示：

JVM 版本	线程栈默认大小
Sparc 32-bit JVM	512 kb
Sparc 64-bit JVM	1024 kb
x86 Solaris/Linux 32-bit JVM	320 kb
x86 Solaris/Linux 64-bit JVM	1024 kb
Windows 32-bit JVM	320 kb
Windows 64-bit JVM	1024 kb

提示： 实际生产系统中，可以对程序日志中的 StackOverFlowError 配置关键字告警，一经发现，立即处理。

参考文章

加入我们

【稳定大于一切】打造国内稳定性领域知识库，让无法解决的问题少一点，让世界的确定性多一点。

GitHub 地址
钉钉群号：23179349

微信关注我们

原文链接：https://yq.aliyun.com/articles/711191

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Java秒杀系统实战系列~整合Shiro实现用户登录认证

摘要：本篇博文是“Java秒杀系统实战系列文章”的第五篇，在本篇博文中，我们将整合权限认证-授权框架Shiro，实现用户的登陆认证功能，主要用于：要求用户在抢购商品或者秒杀商品时，限制用户进行登陆！并对于特定的url（比如抢购请求对应的url）进行过滤（即当用户访问指定的url时，需要要求用户进行登陆）。内容：对于Shiro，相信各位小伙伴应该听说过，甚至应该也使用过！简单而言，它是一个很好用的用户身份认证、权限授权框架，可以实现用户登录认证，权限、资源授权、会话管理等功能，在本秒杀系统中，我们将主要采用该框架实现对用户身份的认证和用户的登录功能。值得一提的是，本篇博文介绍的“Shiro实现用户登录认证”功能模块涉及到的数据库表为用户信息表user，下面进入代码实战环节。  <dependency> <groupId>org.apache.shiro</groupId> <artifactId>shiro-ehcache</artifactId> <version&gt...

2019-07-25

627

前言文章开始前，我们先了解一下什么是消息中间件？什么是中间件？非底层操作系统软件，非业务应用软件，不是直接给最终用户使用的，不能直接给客户带来价值的软件统称为中间件。什么是消息中间件？是关注于数据的发送和接收，利用高效可靠的异步消息传递机制集成分布式系统图示：消息中间件RabbitMQ+ActiveMQ+Kafka的对比接下来就是消息中间件面试题RabbitMQ+ActiveMQ+Kafka RabbitMQ消息中间件系列 1：RabbitMQ 中的 broker 是指什么？cluster 又是指什么？答：broker 是指一个或多个 erlang node 的逻辑分组，且 node 上运行着 RabbitMQ 应用程序。cluster 是在 broker 的基础之上，增加了 node 之间共享元数据的约束。 2：什么是元数据？元数据分为哪些类型？包括哪些内容？与 cluster 相关的元数据有哪些？元数据是如何保存的？元数据在 cluster 中是如何分布的？答：在非 cluster 模式下，元数据主要分为 Queue 元数据（queue 名字和属性等）、Exch...

2019-07-25

740

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。