今年花胜去年红。可惜明年花更好,知与谁同?
——欧阳修《浪淘沙》
JVM之深入理解堆
1. 堆的核心概念
堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。
一个JVM实例只存在一个堆内存,
堆也是Java内存管理的核心区域。
Java堆区在JVM启动的时候即被创建,其空间大小也就确定了。是JVM管理的最大一块内存空间。
堆内存的大小是可以调节的。
// 如果设置最小堆内存和最大堆内存,建议设置成相同值 -Xms10m:最小堆内存 -Xmx10m:最大堆内存 <!--0-->
针对下面的代码
public static StringBuffer createStringBuffer(String s1, String s2) { StringBuffer sb = new StringBuffer(); sb.append(s1); sb.append(s2); return sb; } <!--1-->
逃逸分析代码举例
1 | /** |
逃逸分析参数设置
在JDK 1.7 版本之后,HotSpot中默认就已经开启了逃逸分析。如果使用的是较早的版本,开发人员则可以通过:
- 选项“
-XX:+DoEscapeAnalysis
“显式开启逃逸分析。- 通过选项“
-XX:+PrintEscapeAnalysis
“查看逃逸分析的筛选结果。
逃逸分析的结论
开发中能使用局部变量的,就不要使用在方法外定义。
使用逃逸分析,编译器可以对代码做如下优化:
栈上分配:
将堆分配转化为栈分配。如果一个对象在子程序中被分配,要使指向该对象的指针永远不会发生逃逸,对象可能是栈上分配的候选,而不是堆上分配。同步省略:
如果一个对象被发现只有一个线程被访问到,那么对于这个对象的操作可以不考虑同步。分离对象或标量替换:
有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。
11.2 栈上分配
JIT编译器在编译期间根据逃逸分析的结果,发现如果一个对象并没有逃逸出方法的话,就可能被优化成栈上分配。分配完成后,继续在调用栈内执行,最后线程结束,栈空间被回收,局部变量对象也被回收。这样就无须进行垃圾回收了。
- 在逃逸分析中,已经说明了。分别是给成员变量赋值、方法返回值、实例引用传递。
栈上分配举例
- 我们通过举例来
说明 开启逃逸分析 和 未开启逃逸分析时候的情况。
1 | /** |
- 设置JVM参数,表示
未开启逃逸分析
。
1 | -Xmx1G -Xms1G -XX:-DoEscapeAnalysis -XX:+PrintGCDetails |
- 运行结果,同时还触发了GC操作
1 | 花费的时间为:116 ms |
- 然后查看内存的情况,发现有大量的User存储在堆中。
- 我们在开启逃逸分析。
1 | -Xmx1G -Xms1G -XX:+DoEscapeAnalysis -XX:+PrintGCDetails |
然后查看运行时间,我们能够发现花费的时间快速减少,同时不会发生GC操作。
1 | 花费的时间为:8 ms |
- 然后在看内存情况,我们发现只有很少的User对象,说明User发生了逃逸,因为他们存储在栈中,随着栈的销毁而消失。
11.3 同步省略
线程同步的代价是相当高的,同步的后果是降低并发性和性能。
在动态编译同步块的时候,JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。如果没有,那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并发性和性能。这个取消同步的过程就叫同步省略,也叫锁消除。☆
1 | // 例如下面的代码 |
我们将其转换成字节码
11.4 分离对象和标量替换
标量(scalar)是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。
相对的,那些
还可以分解的数据叫做聚合量(Aggregate)
,Java中的对象就是聚合量,因为他可以分解成其他聚合量和标量。
在JIT阶段,如果经过逃逸分析,发现一个对象不会被外界访问的话,那么经过JIT优化,就会把这个对象拆解成若干个其中包含的若干个成员变量来代替。这个过程就是标量替换。
1 | public static void main(String args[]) { |
以上代码,经过标量替换后,就会变成
1 | private static void alloc() { |
- 可以看到,Point这个聚合量经过逃逸分析后,发现他并没有逃逸,就被替换成两个聚合量了。
那么标量替换有什么好处呢?就是可以大大减少堆内存的占用。因为一旦不需要创建对象了,那么就不再需要分配堆内存了。
- 标量替换为栈上分配提供了很好的基础。
代码优化之标量替换
上述代码在主函数中进行了1亿次alloc。调用进行对象创建,由于User对象实例需要占据约16字节的空间,因此累计分配空间达到将近1.5GB。如果堆空间小于这个值,就必然会发生GC。使用如下参数运行上述代码:
1 -server -Xmx100m -Xms100m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations这里设置参数如下:
- 参数
-server
:启动Server模式,因为在server模式下,才可以启用逃逸分析。- 参数
-XX:+DoEscapeAnalysis
:启用逃逸分析。- 参数
-Xmx10m
:指定了堆空间最大为10MB。- 参数
-XX:+PrintGC
:将打印Gc日志。- 参数
-xx:+EliminateAllocations
:开启了标量替换(默认打开),允许将对象打散分配在栈上,比如对象拥有id和name两个字段,那么这两个字段将会被视为两个独立的局部变量进行分配
11.5 逃逸分析的不足
关于逃逸分析的论文在1999年就已经发表了,但直到JDK1.6才有实现,
而且这项技术到如今也并不是十分成熟的。
其根本原因就是无法保证逃逸分析的性能消耗一定能高于他的消耗。虽然经过逃逸分析可以做标量替换、栈上分配、和锁消除。但是逃逸分析自身也是需要进行一系列复杂的分析的,这其实也是一个相对耗时的过程。
- 一个极端的例子,就是经过逃逸分析之后,发现没有一个对象是不逃逸的。那这个逃逸分析的过程就白白浪费掉了。
虽然这项技术并不十分成熟,但是它也是即时编译器优化技术中一个十分重要的手段。注意到有一些观点,认为通过逃逸分析,JVM会在栈上分配那些不会逃逸的对象,这在理论上是可行的,但是取决于JvM设计者的选择。
据我所知,Oracle Hotspot JVM中并未这么做,这一点在逃逸分析相关的文档里已经说明,所以可以明确所有的对象实例都是创建在堆上。
目前很多书籍还是基于JDK7以前的版本,JDK已经发生了很大变化,
intern字符串的缓存和静态变量曾经都被分配在永久代上,而永久代已经被元数据区取代。
但是,intern字符串缓存和静态变量并不是被转移到元数据区,而是直接在堆上分配
,所以这一点同样符合前面一点的结论:对象实例都是分配在堆上。
12. 堆小结
年轻代
是对象的诞生、成长、消亡的区域,一个对象在这里产生、应用,最后被垃圾回收器收集、结束生命。老年代
放置长生命周期的对象,通常都是从survivor区域筛选拷贝过来的Java对象。
- 当然,也有特殊情况,我们知道普通的对象会被分配在TLAB上;
- 如果对象较大,JVM会试图直接分配在Eden其他位置上;如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代。
- 当GC只发生在年轻代中,回收年轻代对象的行为被称为Minor GC。
当GC发生在老年代时则被称为Major GC或者Full GC。一般的,Minor GC的发生频率要比Major GC高很多,即老年代中垃圾回收发生的频率将大大低于年轻代。