- 线程dump的目的是转存线程快照。快照中是当前JVM所有线程正在执行方法的堆栈信息
- 通过线程dump来分析定位线程出现长时间停顿的原因,如线程死锁、线程死循环、线程请求外部资源长时间等待等。
一、jstack
1.1 描述
- 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源(死循环、死锁)。
- 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。
- jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。
文档:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/jstack.html#BABGJDIF
1.2 操作
转存线程快照,并通过查看当前进程中占用资源异常的线程pid,快速定位到问题线程的堆栈信息。
- 查看线程堆栈信息
jstack [Pid] jstack -l -F [Pid] //查看进程是否存在死锁
- 转存线程堆栈映像文件
jstack [pid]> loop.txt //jstack会自动找出死锁,并把死锁信息放在文件末尾
- 查看进程中线程资源占用情况
top -p [pid] -H
- pid转十六进制
printf "%x" 5016 //pid转十六进制为了查看dump文件中,该线程的堆栈信息(dump文件中,线程id以16进制呈现)
1.3 分析

1.3.1 相关概念
- nid:nid是线程的唯一标识符,是16进制的,通常用于定位某一个线程。
- java.lang.Thread.State:线程的状态标识。
- NEW 未启动的新线程
- RUNNABLE 正在运行的线程
- BLOCKED 阻塞状态,一般都是在等待锁资源
- WAITING 等待状态
- TIMED_WAITING 有时间的等待状态
- TERMINATED 线程已退出
1.3.2 排查思路
- 线程状态的问题优先级:BLOCKED>WAITING
- BLOCKED状态的线程通常在dump文件的末尾部分
- 当发现某线程池中出现大量线程为WAITTING状态,需要查看一下线程的堆栈信息必要则进行源代码分析
二、案例分析
2.1 现象
进程cpu和内存运行正常,服务出现长时间假死
2.2 日志和分析
2.2.1 关键日志

2.2.2 分析
- 大量线程在执行日志持久化时,状态为“java.lang.Thread.State: WAITING (parking)”,此时线程状态有一下两种可能:
- java.lang.Thread.State: WAITING (parking):一直等某个条件发生后(死等),才会进入RUNNABLE状态。
- java.lang.Thread.State: TIMED_WAITING (parking或sleeping):定时的,那个条件不到来,也将定时唤醒自己。
- 其次,根据AbstractQueuedSynchronizer猜测,该线程在等待另一个线程释放锁,因此这就是本线程在等待的条件。
- 通过堆栈信息源代码分析logback-spring.xml中优化日志持久化的appender。
![]()

2.3 解决方案
在logback-spring.xml文件中appender新增属性:
<appender name="ASYNC" class="ch.qos.logback.classic.AsyncAppender"> <discardingThreshold>256</discardingThreshold>
<queueSize>2048</queueSize>
<neverBlock>true</neverBlock>
<maxFlushTime>3000</maxFlushTime>
<includeCallerData>true</includeCallerData>
<appender-ref ref ="FILE"/>
</appender>

本文介绍了如何利用jstack工具分析线程dump,包括线程状态、排查思路,以及针对线程死锁、长时间等待资源等问题的案例分析和解决方案。


被折叠的 条评论
为什么被折叠?



