【基础+实战】JVM原理及优化系列之二:JVM内存管理

1. 内存分配策略:

  1. 对象优先在Eden分配
  2. 大对象直接进入老年代
  3. 长期存活对象将进入老年代(当它的年龄增加到一定程度 (默认为15岁 ),就会被晋升到老年代中 。对象晋升老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold来设置)
  4. 动态对象年龄判定(如果在 Survivor空间中相同年龄所有对象大小的总和大于 Survivor空间的一半,那么年龄大于或等于该年龄的对象就直接进行老年代,无须等到 MaxTenuringThreshold中要求的年龄)
  5. 空间分配担保

    a> 在发生Minor GC时,虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代剩余空间的大小,如果大于,则改为直拉进行一次Full GC。如果小于,则查看HandlePromotionFailure设置是否允许担保失败;如果允许,那只会进行Minor GC;如果不允许,则要改为进行一次Full GC。
b> 新生代使用复制收集算法,但为了提高内存利用率,只使用其中一个Survivor空间来作为轮换备份,因此当出现大量对象在Minor GC后仍然存活的情况时,最需要老年代进行分配担保,让Survivor空间无法容纳的对象直接进入老年代。
c> 取平均值进行比较仍然是一种动态概率的手段,也就是说如果某次Minor GC存活的对象突增,远高于平均值的话,依然会导致担保失败(HandlePromotionFailure)。如果出现了HandlePromotionFailure,那只好在失败后重新发起一次Full GC。虽然担保失败时绕圈子是最大的,但是大部情况下还是会将HandlePromotionFailure开关打开,避免Full GC过于频繁。

2. 垃圾收集行为分类:

备注:
1、concurrent: 并发, 多个线程协同做同一件事情(有状态)
2、parallel: 并行, 多个线程各做各的事情(互相间无共享状态)

3. 垃圾收集算法:

3.1 标记清除算法

标记-清除(Mark-Sweep)算法是最基础的算法,它分为”标记”和”清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。之所以说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。
处理过程:
标记清除收集器停止所有的工作,从根扫描每个活跃的对象,然后标记扫描过的对象,标记完成以后,清除那些没有被标记的对象

优点:
1、解决循环引用的问题
2、不需要编译器的配合,从而就不执行额外的指令
缺点:
1、每个活跃的对象都要进行扫描,标记和清楚过程的效率都不高,收集暂停的时间比较长。
2、另外一个是空间问题,标记清楚后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运
行 过程中需要分配较大对象时无法找到足够连续的内存空间而不得不提前出发另一次垃圾收集动作。

3.2 复制算法

为了解决效率问题,一种称为复制(Copying)的收集算法就出现了,它将可用内存按容量划分为大小相等的两块,每次只是用其中一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉
收集过程:
回收时,将 Eden和Survivor 中还存活着的兑现个一次性地拷贝到另外一块 Survivor空间上,最后清理掉Eden和刚才用过的 Survivor的空间。HotSpot虚拟机默认 Eden和Survivor的大小比例是 8:1,也就是每次新生代中可用内存空间为整个新生代容量的 90%,只有10%的内存是会被浪费的
优点:
1、只扫描可以到达的对象,不需要扫描所有的对象,从而减少了应用暂停的时间
缺点:
1. 需要额外的空间消耗,某一个时刻,总是有一块内存处于未使用状态
2. 复制对象需要一定的开销

3.3 标记整理算法

复制算法不适用于老年代:
在对象存活率较高时就要执行较多的复制操作,效率将会贬低。 更关键的是,如果不想浪费 50% 的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都 100% 存活的极端情况,所以在老年代一般不能直接选用这种算法 。

根据老年代的特点,有人?出了另外一种 ”标记- 整理”算法,标记过程仍然与标记 -清楚算法一样,但是后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界意外的内存。
执行过程:
1、第一个阶段,扫?所有活跃的对象(即有用对象),并标记所有活跃的对象
2、第二个阶段,清除未标记的对象,然后将活跃的的对象复制到堆得底部。

4. GC执行条件:

5. GC性能指标:

下面的几个指标用来衡量GC的执行性能,包括:

  1. 吞吐量(Throughput):在一段长时间内,没有花费在垃圾收集上的时间所占的比例。
  2. 垃圾收集代价(Garbage Collection Overhead):与吞吐量相反,垃圾收集时间所占的比例。
  3. 暂停时间(Pause Time):当执行垃圾收集时,应用程序被迫暂停的时间长度。
  4. 垃圾收集频率(Frequency Of Collection):相对于应用程序的执行,垃圾收集执行的频率。
  5. 覆盖区(Footprint):一种大小的度量,如堆的大小。
  6. 敏捷度(Promptness):指从一个对象成为垃圾时到该对象所占用的内存被回收时之间的时间长度。

 

该专题是一个系列,参照了一系列JVM资料,对JVM基础知识做了摘要总结,并结合实战做了总结:

【基础+实战】JVM原理及优化系列之一:JVM体系结构

【基础+实战】JVM原理及优化系列之二:JVM内存管理

【基础+实战】JVM原理及优化系列之三:JVM垃圾收集器

【基础+实战】JVM原理及优化系列之四:JVM参数说明

【基础+实战】JVM原理及优化系列之五:JVM默认设置

【基础+实战】JVM原理及优化系列之六:JVM主要调优参数

【基础+实战】JVM原理及优化系列之七:JVM调优注意事项

【基础+实战】JVM原理及优化系列之八:如何查看JVM参数配置?

【基础+实战】JVM原理及优化系列之九:JVM监控、分析与故障处理实战

【基础+实战】JVM原理及优化系列之十:JVM内存泄漏专题实战

通览该系列文章之后,对JVM会有一个整体的认识,对于JVM问题排查和优化会有一定的帮助,如果想对JVM有更深入的理解和认知,建议深入看一下这本书《Java虚拟机:JVM高级特性与最佳实践(最新第二版)》,网上可以找到pdf版的,大家可以自己百度一下。

 

代码交流 2021