系统稳定性——StackOverFlowError 常见原因及解决方法
作者:涯海
创作日期:2019-07-26
专栏地址:【稳定大于一切】
每一个 JVM 线程都拥有一个私有的 JVM 线程栈,用于存放当前线程的 JVM 栈帧(包括被调用函数的参数、局部变量和返回地址等)。如果某个线程的线程栈空间被耗尽,没有足够资源分配给新创建的栈帧,就会抛出 java.lang.StackOverflowError
错误。
目录
线程栈是如何运行的?
首先给出一个简单的程序调用代码示例,如下所示:
public class SimpleExample { public static void main(String args[]) { a(); } public static void a() { int x = 0; b(); } public static void b() { Car y = new Car(); c(); } public static void c() { float z = 0f; } }
当 main()
方法被调用后,执行线程按照代码执行顺序,将它正在执行的方法、基本数据类型、对象指针和返回值包装在栈帧中,逐一压入其私有的调用栈,整体执行过程如下图所示:
- 首先,程序启动后,
main()
方法入栈。 - 然后,
a()
方法入栈,变量x
被声明为int
类型,初始化赋值为0
。注意,无论是x
还是0
都被包含在栈帧中。 - 接着,
b()
方法入栈,创建了一个Car
对象,并被赋给变量y
。请注意,实际的Car
对象是在 Java 堆内存中创建的,而不是线程栈中,只有Car
对象的引用以及变量y
被包含在栈帧里。 - 最后,
c()
方法入栈,变量z
被声明为float
类型,初始化赋值为0f
。同理,z
还是0f
都被包含在栈帧里。
当方法执行完成后,所有的线程栈帧将按照后进先出的顺序逐一出栈,直至栈空为止。
StackOverFlowError 是如何产生的?
如上所述,JVM 线程栈存储了方法的执行过程、基本数据类型、局部变量、对象指针和返回值等信息,这些都需要消耗内存。一旦线程栈的大小增长超过了允许的内存限制,就会抛出 java.lang.StackOverflowError
错误。
下面这段代码通过无限递归调用最终引发了 java.lang.StackOverflowError
错误。
public class StackOverflowErrorExample { public static void main(String args[]) { a(); } public static void a() { a(); } }
在这种情况下,a()
方法将无限入栈,直至栈溢出,耗尽线程栈空间,如下图所示。
Exception in thread "main" java.lang.StackOverflowError at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10) at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
如何解决 StackOverFlowError?
引发 StackOverFlowError
的常见原因有以下几种:
- 无限递归循环调用(最常见)。
- 执行了大量方法,导致线程栈空间耗尽。
- 方法内声明了海量的局部变量。
- native 代码有栈上分配的逻辑,并且要求的内存还不小,比如
java.net.SocketInputStream.read0
会在栈上要求分配一个 64KB 的缓存(64位 Linux)。
除了程序抛出 StackOverflowError
错误以外,还有两种定位栈溢出的方法:
- 进程突然消失,但是留下了 crash 日志,可以检查 crash 日志里当前线程的 stack 范围,以及 RSP 寄存器的值。如果 RSP 寄存器的值超出这个 stack 范围,那就说明是栈溢出了。
- 如果没有 crash 日志,那只能通过 coredump 进行分析。在进程运行前,先执行
ulimit -c unlimited
,当进程挂掉之后,会产生一个 core.[pid] 的文件,然后再通过jstack $JAVA_HOME/bin/java core.[pid]
来看输出的栈。如果正常输出了,那就可以看是否存在很长的调用栈的线程,当然还有可能没有正常输出的,因为 jstack 的这条从 core 文件抓栈的命令其实是基于 Serviceability Agent 实现的,而 SA 在某些版本里有 Bug。
常见的解决方法包括以下几种:
- 修复引发无限递归调用的异常代码, 通过程序抛出的异常堆栈,找出不断重复的代码行,按图索骥,修复无限递归 Bug。
- 排查是否存在类之间的循环依赖。
- 排查是否存在在一个类中对当前类进行实例化,并作为该类的实例变量。
- 通过 JVM 启动参数
-Xss
增加线程栈内存空间, 某些正常使用场景需要执行大量方法或包含大量局部变量,这时可以适当地提高线程栈空间限制,例如通过配置-Xss2m
将线程栈空间调整为 2 mb。
线程栈的默认大小依赖于操作系统、JVM 版本和供应商,常见的默认配置如下表所示:
JVM 版本 | 线程栈默认大小 |
---|---|
Sparc 32-bit JVM | 512 kb |
Sparc 64-bit JVM | 1024 kb |
x86 Solaris/Linux 32-bit JVM | 320 kb |
x86 Solaris/Linux 64-bit JVM | 1024 kb |
Windows 32-bit JVM | 320 kb |
Windows 64-bit JVM | 1024 kb |
提示: 实际生产系统中,可以对程序日志中的 StackOverFlowError 配置关键字告警,一经发现,立即处理。
推荐工具&产品
参考文章
- StackOverFlow Error: Causes and Solutions
- The Structure of the Java Virtual Machine
- The StackOverflowError in Java
- JVM源码分析之栈溢出完全解读
加入我们
【稳定大于一切】打造国内稳定性领域知识库,让无法解决的问题少一点,让世界的确定性多一点。
- GitHub 地址
- 钉钉群号:23179349
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Java秒杀系统实战系列~整合Shiro实现用户登录认证
摘要: 本篇博文是“Java秒杀系统实战系列文章”的第五篇,在本篇博文中,我们将整合权限认证-授权框架Shiro,实现用户的登陆认证功能,主要用于:要求用户在抢购商品或者秒杀商品时,限制用户进行登陆!并对于特定的url(比如抢购请求对应的url)进行过滤(即当用户访问指定的url时,需要要求用户进行登陆)。 内容: 对于Shiro,相信各位小伙伴应该听说过,甚至应该也使用过!简单而言,它是一个很好用的用户身份认证、权限授权框架,可以实现用户登录认证,权限、资源授权、会话管理等功能,在本秒杀系统中,我们将主要采用该框架实现对用户身份的认证和用户的登录功能。 值得一提的是,本篇博文介绍的“Shiro实现用户登录认证”功能模块涉及到的数据库表为用户信息表user,下面进入代码实战环节。 <!--shiro权限控制--> <dependency> <groupId>org.apache.shiro</groupId> <artifactId>shiro-ehcache</artifactId> <version>...
- 下一篇
消息中间件面试题31道RabbitMQ+ActiveMQ+Kafka
前言 文章开始前,我们先了解一下什么是消息中间件? 什么是中间件? 非底层操作系统软件,非业务应用软件,不是直接给最终用户使用的,不能直接给客户带来价值的软件统称为中间件。 什么是消息中间件? 是关注于数据的发送和接收,利用高效可靠的异步消息传递机制集成分布式系统 图示: 消息中间件RabbitMQ+ActiveMQ+Kafka的对比 接下来就是消息中间件面试题RabbitMQ+ActiveMQ+Kafka RabbitMQ消息中间件系列 1:RabbitMQ 中的 broker 是指什么?cluster 又是指什么? 答:broker 是指一个或多个 erlang node 的逻辑分组,且 node 上运行着 RabbitMQ 应用程序。cluster 是在 broker 的基础之上,增加了 node 之间共享元数据的约束。 2:什么是元数据?元数据分为哪些类型?包括哪些内容?与 cluster 相关的元数据有哪些?元数据是如何保存的?元数据在 cluster 中是如何分布的? 答:在非 cluster 模式下,元数据主要分为 Queue 元数据(queue 名字和属性等)、Exch...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- 设置Eclipse缩进为4个空格,增强代码规范
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装