竹笋

首页 » 问答 » 常识 » 死磕JVM看完这篇我也会排查JVM内
TUhjnbcbe - 2025/1/9 22:22:00

前言

CPU是时分的,操作系统里面有很多线程,每个线程的运行时间由CPU决定,CPU会分给每一个线程一个时间片,时间片是一个很短的时间长度,如果在时间片内,线程一直占有,就是%,我们应该意识到,CPU运行速度很快(主频非常高),除非是密集型耗费CPU的运算,其他类型的任务都会在小于时间片的时间内结束。

内存过高一般有两种情况:内存溢出和内存泄露

内存溢出:程序分配的内存超过物理机的内存大小,导致无法继续分配内存,出现OOM报错内存泄露:不再使用的对象一直占据着内存不释放,导致这块内存浪费掉,久而久之,内存泄露的对象堆积起来,也会导致物理机的内存被耗尽,出现OOM报错具体操作

如何监控JVM,我们可以通过一个案例在了解一些实际当中的操作,大家可以看到下面的代码,下面的代码只是模拟了当中的一个场景,一个风险控制的场景,一般银行或者第三方公司在向一个人发放贷款的时候,会调用这个人的征信已经还款能力,给出响应的评级。

importjava.math.BigDecimal;importjava.util.ArrayList;importjava.util.Date;importjava.util.List;importjava.util.concurrent.ScheduledThreadPoolExecutor;importjava.util.concurrent.ThreadPoolExecutor;importjava.util.concurrent.TimeUnit;publicclassFullGCTest{//模拟银行卡的类privatestaticclassCardInfo{//小农的银行卡信息记录BigDecimalprice=newBigDecimal(00.0);Stringname=牧小农;intage=18;Datebirthdate=newDate();publicvoidm(){}}//线程池定时线程池//50个,然后设置拒绝策略privatestaticScheduledThreadPoolExecutorexecutor=newScheduledThreadPoolExecutor(50,newThreadPoolExecutor.DiscardOldestPolicy());publicstaticvoidmain(String[]args)throwsException{executor.setMaximumPoolSize(50);for(;;){modelFit();Thread.sleep();}}/***对银行卡进行风险评估*/privatestaticvoidmodelFit(){ListCardInfotaskList=getAllCardInfo();//拿出每一个信息出来taskList.forEach(info-{//dosomethingexecutor.scheduleWithFixedDelay(()-{//调用M方法info.m();},2,3,TimeUnit.SECONDS);});}privatestaticListCardInfogetAllCardInfo(){ListCardInfotaskList=newArrayList();//每次查询张卡出来for(inti=0;i;i++){CardInfoci=newCardInfo();taskList.add(ci);}returntaskList;}}程序的设计其实比较简单,就是我们用信用卡的案例来进行说明,比如CardInfo就是信用卡类,我们把这个人对应的信用卡的记录都调用出来,之后做一些自己响应的业务处理方法来对它进行处理和计算,来看看我们这个模型是否符合modelFit,具体怎么做呢,在应用程序中有一个类是CardInfo,有一个方法叫做getAllCardInfo,每次都是拿个出来,拿个之后用线程池做计算,线程池用的是ScheduledThreadPoolExecutor(定时任务),new出来线程池之后,50个线程池,然后做对应的业务逻辑处理,会调用modelFit(),使用毫秒模拟业务的停顿。

首先我们需要使用javac命令将Java文件进行编译javacFullGCTest.java进行编译,然后打印GC日志,进行风险监控

打印GC日志:java-XmsM-XmxM-XX:+PrintGCFullGCTest

怎么知道JVM内存过高?

在公司里面,如果遇到了JVM内存过高的情况,那么一般是运维团队首先受到报警信息,然后通知对应的开发人员去查看,那么开发人员应该如何查看,或者怎么样去排查呢?

1、top查看进程

受到报警信息后,拿top命令去查询

[root

root~]#top

查看内存不断增长,CPU占用率居高不下的。top后你会看到它的PID()。它占比比较高。

2、top-Hp查看线程

找到CPU占用比较高的进程PID,这里我们以java的进程为例使用命令top-Hp,这个时候它会把这个进程里面所有的线程全部线程都罗列出来吗,这些都是Java这个进程里面内部的一些线程,如下图所示:

我们会看到每个线程的占比都差不多,偶尔会有某一个线程比较高,在某些线程占得比较高的时候,这个小例子最终会是垃圾回收的线程占得比较高,因为垃圾回收不过来了,所以需要不停的来回回收,每次都回收一点点,实际这种例子里面非常有可能是你业务逻辑线程,那一块的业务逻辑线程占比非常高,这是时候就需要用到另外的命令——jstack

3、jstack

当我们使用top-Hp知道了是哪个线程后,我们下一步就可以使用jstack命令,比如我们要查看这个线程号,是我们的进程PID,我们要定位某一个线程cpu的占比会比其他cpu高很多,那么我们就要定位这个线程里面到底是什么样的问题的时候,就需要把这个线程号()记下来。

因为jstack用到的线程号是16进制的,所以我们需要把的10进制转换成16进制才可以

特点:

每个线程有自己的线程号码,里面有线程的状态,可以观察线程是否阻塞,如果长时间的wait和block说明这个线程是有问题的4、转换16进制

因为Java线程文件中的线程ID是16进制,所以需要将线程ID从十进制转换成十六进制命令:echoobase=16;

bc

5、jstack用法解析

[root

root~]#jstackUsage:jstack[-l]pid(toconnecttorunningprocess)jstack-F[-m][-l]pid(toconnecttoahungprocess)jstack[-m][-l]executablecore(toconnecttoacorefile)jstack[-m][-l][server_id

]remoteserverIPorhostname(toconnecttoaremotedebugserver)Options:-Ftoforceathreaddump.Usewhenjstackpiddoesnotrespond(processishung)-mtoprintbothjavaandnativeframes(mixedmode)-llonglisting.Printsadditionalinformationaboutlocks-hor-helptoprintthishelpmessage6、jstack查看输出

我们也可以用jps或者javaps-ef

java来查看Java进程,这里我们用jps来查看

[root

root~]#jps

[root

root~]#jstack

pool-1-thread-3#10prio=5os_prio=0tid=0xfnid=0xwaitingoncondition[0xfcf]java.lang.Thread.State:WAITING(parking)atsun.misc.Unsafe.park(NativeMethod)-parkingtowaitfor0x00f8a(ajava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)atjava.util.concurrent.locks.LockSupport.park(LockSupport.java:)atjava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)atjava.lang.Thread.run(Thread.java:)pool-1-thread-2#9prio=5os_prio=0tid=0xfnid=0xwaitingoncondition[0xfd0]java.lang.Thread.State:WAITING(parking)atsun.misc.Unsafe.park(NativeMethod)-parkingtowaitfor0x00f8a(ajava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)atjava.util.concurrent.locks.LockSupport.park(LockSupport.java:)atjava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)atjava.lang.Thread.run(Thread.java:)pool-1-thread-1#8prio=5os_prio=0tid=0xf8nid=0xfwaitingoncondition[0xfd0]java.lang.Thread.State:WAITING(parking)atsun.misc.Unsafe.park(NativeMethod)-parkingtowaitfor0x00f8a(ajava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)atjava.util.concurrent.locks.LockSupport.park(LockSupport.java:)atjava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)atjava.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)atjava.lang.Thread.run(Thread.java:)ServiceThread#7daemonprio=9os_prio=0tid=0xfb4nid=0xdrunnable[0x0]java.lang.Thread.State:RUNNABLEC1CompilerThread1#6daemonprio=9os_prio=0tid=0xfb0nid=0xcwaitingoncondition[0x0]java.lang.Thread.State:RUNNABLEC2CompilerThread0#5daemonprio=9os_prio=0tid=0xfafnid=0xbwaitingoncondition[0x0]java.lang.Thread.State:RUNNABLESignalDispatcher#4daemonprio=9os_prio=0tid=0xfadnid=0xarunnable[0x0]java.lang.Thread.State:RUNNABLEFinalizer#3daemonprio=8os_prio=0tid=0xf7cnid=0x9inObject.wait()[0xf3558300]java.lang.Thread.State:WAITING(onobjectmonitor)atjava.lang.Object.wait(NativeMethod)-waitingon0x00f8a86b38(ajava.lang.ref.ReferenceQueue$Lock)atjava.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:)-locked0x00f8a86b38(ajava.lang.ref.ReferenceQueue$Lock)atjava.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:)atjava.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:)ReferenceHandler#2daemonprio=10os_prio=0tid=0xf77nid=0x8inObject.wait()[0xf3558400]java.lang.Thread.State:WAITING(onobjectmonitor)atjava.lang.Object.wait(NativeMethod)-waitingon0x00f8a86cf0(ajava.lang.ref.Reference$Lock)atjava.lang.Object.wait(Object.java:)atjava.lang.ref.Reference.tryHandlePending(Reference.java:)-locked0x00f8a86cf0(ajava.lang.ref.Reference$Lock)atjava.lang.ref.Reference$ReferenceHandler.run(Reference.java:)main#1prio=5os_prio=0tid=0xf09nid=0x6waitingoncondition[0xfed59]java.lang.Thread.State:TIMED_WAITING(sleeping)atjava.lang.Thread.sleep(NativeMethod)atFullGCTest.main(FullGCTest.java:35)VMThreados_prio=0tid=0xf6enid=0x7runnableVMPeriodicTaskThreados_prio=0tid=0xfb7nid=0xewaitingonconditionJNIglobalreferences:

通过threaddump分析线程状态

大多数情况下会基于theaddump分析当前各个线程的运行情况,如是否存在死锁,是否存在一个线程长时间持有锁不释放等等

在dump中,线程一般存在如下几种状态:1、RUNNABLE,线程处于执行中2、BLOCKED,线程被阻塞3、WAITING,线程正在等待

locked0x6bf说明线程对地址为0x6bf对象进行了加锁;waitingtolock0x6bf说明线程在等待地址为0x6bf对象上的锁;waitingformonitorentry[0x001e21f]说明线程是通过synchronized关键字进入了监视器的临界区,并处于EntrySet队列,等待monitor;waitingon0x0088ca(ajava.lang.Object)等待锁的释放

假如有一个进程中有个线程,很多线程都在waitingon某一把锁,然后线程不该阻塞的被阻塞了,该结束的没结束掉,一定要找到哪个线程持有这把锁,我们可以搜索jstackdump的信息,找到0X...的信息,看哪个线程只有了这把锁,一般这个线程状态是RUNNABLE,表示这个线程正在运行但是一直持有这把锁不释放,那么就会导致整个线程的死锁

7、jstack分析死锁

publicclassTestDeadLock{privatestaticObjectobj1=newObject();privatestaticObjectobj2=newObject();publicstaticvoidmain(String[]args){newThread(newThread1()).start();newThread(newThread2()).start();}privatestaticclassThread1implementsRunnable{

Overridepublicvoidrun(){synchronized(obj1){System.out.println(Thread1拿到了obj1的锁!);try{//停顿2秒的意义在于,让Thread2线程拿到obj2的锁Thread.sleep(0);}catch(InterruptedExceptione){e.printStackTrace();}synchronized(obj2){System.out.println(Thread1拿到了obj2的锁!);}}}}privatestaticclassThread2implementsRunnable{

Overridepublicvoidrun(){synchronized(obj2){System.out.println(Thread2拿到了obj2的锁!);try{//停顿2秒的意义在于,让Thread1线程拿到obj1的锁Thread.sleep(0);}catch(Exceptione){e.printStackTrace();}synchronized(obj1){System.out.println(Thread2拿到了obj1的锁!);}}}}}

通过命令查看分析日志

[root

rootfuccGC]#jpsBootstrapJpsQuorumPeerMainTestDeadLock[root

rootfuccGC]#jstack

内存监控工具的使用

我们可以使用jvm自带的命令去进行监控GC的信息:jinfopid:这个命令就是把这个进程的一些详细信息列出来[root

root~]#jinfo这个只是有帮助,但是帮助不是特别大,大家只要记住有这个命令就行,不做深入了解

jstat-gcpid0:这个就是每一秒钟将GC的日志打印出来,动态观察GC情况/阅读GC日志发现频繁GC等等,但是这个信息看起来不是很直观,能够分析出来的东西也不多,所以一般使用的也不是很多

我们用的最多的还是通过工具去查看,比如jconsole/jvisualvm

1、jconsole

这两个是JDK自带的一个工具,也是一个图形界面的工具,只要你装了JDK就有这两个工具,可以从本机去跟踪远程服务器上的一个进程,作为Linux服务器,很少有人会装图形界面,如下图所示:

在我们程序启动的时候要加入参数:

java-Djava.rmi.server.hostname=.XX.XXX.XX-D

1
查看完整版本: 死磕JVM看完这篇我也会排查JVM内