玩點深入的:Java 虛擬機內存結構及編碼實戰

本文來源:不會 coding

瞭解 JVM 內存結構的目的

在 Java 的開發過程中,因爲有 JVM 自動內存管理機制,不再需要像在 C、C++ 開發那樣手動釋放對象的內存空間,不容易出現內存泄漏和內存溢出的問題。

但是,正是由於把內存管理的權利交給了 JVM,一旦出現內存泄漏和內存溢出方面的問題,如果不瞭解 JVM 是如何使用內存的,不瞭解 JVM 的內存結構是什麼樣子的,就很難找到問題的根源,就更難以解決問題。

JVM 內存結構簡介

在 JVM 所管理的內存中,大致分爲以下幾個運行時數據區域:

其中,黃色區域的程序計數器、虛擬機棧和本地方法棧是線程私有的,紅色區域的堆和方法區是線程共享的。下面我們逐一詳細分析各個區域。

程序計數器

程序計數器(Program Counter Register)是一塊較小的內存空間,它記錄了當前線程所執行的字節碼的行號。在 JVM 的概念模型裏,字節碼解釋器工作時就是通過改變它的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都是依賴它來完成的。

通過線程輪流切換並分配處理器執行時間,實現了 JVM 的多線程操作。在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個內核)只會執行一條線程中的指令。

因此,爲了線程切換後能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲,稱這類內存區域爲 “線程私有” 的內存。

如果線程正在執行的是一個 Java 方法,那麼它記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是 Natvie 方法,它的值就爲空(Undefined)。此內存區域是唯一一個在 Java 虛擬機規範中沒有規定任何 OutOfMemoryError 情況的區域。

虛擬機棧

與程序計數器一樣,Java 虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,如上圖每一個線程都有自己的虛擬機棧,它的生命週期與線程相同,當線程被創建時,虛擬機棧也同時被創建;當線程被銷燬時,虛擬機棧也同時被銷燬。

在線程內部,每個方法被執行的時候都會同時創建一個棧幀(Stack Frame),用於存儲局部變量表、操作數棧、動態鏈接、方法出口等信息,如上圖。每一個方法被調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中從入棧到出棧的過程。

其中棧幀中的局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference 類型)和 returnAddress 類型(指向了一條字節碼指令的地址)。

其中 64 位長度的 long 和 double 類型的數據會佔用 2 個局部變量空間(Slot),其餘的數據類型只佔用 1 個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。

在 Java 虛擬機規範中,對這個區域規定了兩種異常狀況:

如果線程請求的棧深度大於虛擬機所允許的深度,將拋出 StackOverflowError 異常,讓我們寫一段代碼,使其拋出該異常:

/**
 * VM Args: -Xss128k
 */
public class JVMStackSOF {
    private int stackLength = 1;

    public void stackLeak() {
        stackLength++;
        stackLeak();
    }

    public static void main(String[] args) {
        JVMStackSOF sof = new JVMStackSOF();
        try {
            sof.stackLeak();
        } catch (Throwable e) {
            System.out.println("Stack length:" + sof.stackLength);
            throw e;
        }
    }
}

在運行之前,設置 JVM 的參數爲 - Xss128k,運行結果如下:

Stack length:1002
Exception in thread "main" java.lang.StackOverflowError
    at OneMoreStudy.JVMStackSOF.stackLeak(JVMStackSOF.java:10)
    at OneMoreStudy.JVMStackSOF.stackLeak(JVMStackSOF.java:11)
    at OneMoreStudy.JVMStackSOF.stackLeak(JVMStackSOF.java:11)
......

棧的深度達到 1002 時,拋出了 StackOverflowError 異常。

如果虛擬機棧可以動態擴展,當擴展時無法申請到足夠的內存時會拋出 OutOfMemoryError 異常,還是讓我們寫一段代碼,使其拋出該異常:

/**
 * VM Args: -Xss2M
 */
public class JVMStackOOM {
    private void dontStop() {
        while (true) {

        }
    }

    public void stackLeakByThread() {
        while (true) {
            Thread t = new Thread(new Runnable() {
                public void run() {
                    dontStop();
                }
            });
            t.start();
        }
    }

    public static void main(String[] args) {
        JVMStackOOM oom = new JVMStackOOM();
        oom.stackLeakByThread();
    }
}

這段代碼會創建出無限多的線程,因爲 Java 的線程會映射系統的內核線程上,所以會造成 CPU 佔用率 100%,系統假死等現象,請謹慎運行。在運行之前,設置 JVM 的參數爲 - Xss2M,運行很長一段時間後結果如下:

Exception in thread "main" java.lang.OutMemoryError: unable to create new native thread
    at java.lang.Thread.start0(Native Method)
    at java.lang.Thread.start(Unknown Source)
    at OneMoreStudy.JVMStackOOM.stackLeakByThread(JVMStackOOM.java:18)
    at OneMoreStudy.JVMStackOOM.main(JVMStackOOM.java:24)

本地方法棧

本地方法棧(Native Method Stacks)與虛擬機棧所發揮的作用是非常相似的,其區別不過是虛擬機棧爲虛擬機執行 Java 方法(也就是字節碼)服務,而本地方法棧則是爲虛擬機使用到的 Native 方法服務。

虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,所以具體的虛擬機可以自由實現它。甚至有的虛擬機(比如 Sun HotSpot 虛擬機)直接就把本地方法棧和虛擬機棧合二爲一。與虛擬機棧一樣,本地方法棧區域也會拋出 StackOverflowError 和 OutOfMemoryError 異常。

Java 堆(Java Heap)是 Java 虛擬機所管理的內存中最大的一塊。它是被所有線程共享的一塊內存區域,在虛擬機啓動時創建。它就是用來存放對象實例的,幾乎所有的對象實例都在這裏分配內存。

堆是垃圾收集器管理的主要區域,如果從內存回收的角度看,由於現在收集器基本都是採用的分代收集算法,所以 Java 堆中還可以細分爲:新生代和老年代;再細緻一點的有 Eden 空間、From Survivor 空間、To Survivor 空間等。從內存分配的角度看,線程共享的堆中有可能劃分出多個線程私有的分配緩存區(Thread Local Allocation Buffer,TLAB)。

根據 Java 虛擬機規範的規定,Java 堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過 - Xmx 和 - Xms 控制)。

如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出 OutOfMemoryError 異常,再讓我們寫一段代碼,使其拋出該異常:

/*
 * VM Args: -Xms20M -Xmx20M
 */
public class HeapOOM {
    static class OOMObject{

    }

    public static void main(String[] args){
        List<OOMObject> list = new ArrayList<OOMObject>();

        while(true){
            //把對象實例放入列表中,
            //使其一直被引用,不會被垃圾回收
            list.add(new OOMObject());
        }
    }
}

在運行之前,設置 JVM 的參數爲 - Xms20M -Xmx20M,運行結果如下:

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
    at java.util.Arrays.copyOf(Unknown Source)
    at java.util.Arrays.copyOf(Unknown Source)
    at java.util.ArrayList.grow(Unknown Source)
    at java.util.ArrayList.ensureExplicitCapacity(Unknown Source)
    at java.util.ArrayList.ensureCapacityInternal(Unknown Source)
    at java.util.ArrayList.add(Unknown Source)
    at OneMoreStudy.HeapOOM.main(HeapOOM.java:18)

方法區

方法區(Method Area)與 Java 堆一樣,是各個線程共享的內存區域,它用於存儲已被 JVM 加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。

對於習慣在 HotSpot 虛擬機上開發和部署程序的開發者來說,很多人願意把方法區稱爲 “永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因爲 HotSpot 虛擬機的設計團隊選擇把 GC 分代收集擴展至方法區,或者說使用永久代來實現方法區而已。在 JDK7 的 HotSpot 中,已經把原本在永久代的字符串常量池移出,在 JDK8 的 HotSpot 中,已經沒有永久代的存在了,而是採用了新的內存空間:元空間(Metaspace)。

JVM 規範對這個區域的限制非常寬鬆,除了和 Java 堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行爲在這個區域是比較少出現的,但並不是數據進入了方法區就被一直存放。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收 “成績” 比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是有必要的。

根據 Java 虛擬機規範的規定,當方法區無法滿足內存分配需求時,將拋出 OutOfMemoryError 異常。再讓我們寫一段代碼,嘗試使其拋出該異常:

/*
 * VM Args: -XX:PermSize=2M -XX:MaxPermSize=2M
 */
public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        List<String> list = new ArrayList<String>();
        for (int i = 0; i < 100000; i++) {
            System.out.println(i);
            //將i轉化爲字符串,
            //並且調用intern(),把字符串放在運行時常量池
            list.add(String.valueOf(i).intern());
        }
    }
}

在運行之前,設置 JVM 的參數爲 - XX:PermSize=2M -XX:MaxPermSize=2M。

在 JDK6 中運行拋出了老年代的 OutOfMemoryError 異常,結果如下:

......
35813
35814
Exception in thread "main" java.lang.OutOfMemoryError: PermGen space
        at java.lang.String.intern(Native Method)
        at OneMoreStudy.RuntimeConstantPoolOOM.main(RuntimeConstantPoolOOM.java:12)

在 JDK7 中運行,循環全部完畢後,也沒有拋出任何異常,結果如下:

......
99996
99997
99998
99999

同一段代碼,在不同版本 JDK 中的運行結果爲什麼是不同的呢?這是因爲:在 JDK6 中,字符串常量池還在永久代中,而在 JDK7 中,已經把原本在永久代的字符串常量池移出了。

再再讓我們寫一段代碼,嘗試使其拋出該異常:

/*
 * VM Args: -XX:PermSize=2M -XX:MaxPermSize=2M
 */
public class MethodAreaOOM {
    static class OOMObject {

    }

    public static void main(String[] args) {
        for (int i = 0; i < 300; i++) {
            System.out.println(i);
            createNewClass();
        }
    }

    private static void createNewClass() {
        //這裏使用了CGLIB,動態創建類,載入方法區
        Enhancer enhancer = new Enhancer();
        enhancer.setSuperclass(OOMObject.class);
        enhancer.setUseCache(false);
        enhancer.setCallback(new MethodInterceptor() {

            @Override
            public Object intercept(Object obj, Method method,
                    Object[] args, MethodProxy proxy) throws Throwable {
                return proxy.invokeSuper(obj, args);
            }
        });
        enhancer.create();
    }
}

在運行之前,設置 JVM 的參數爲 - XX:PermSize=2M -XX:MaxPermSize=2M。

在 JDK6 中運行拋出了老年代的 OutOfMemoryError 異常,,結果如下:

......
Caused by: java.lang.OutOfMemoryError: PermGen space
        at java.lang.ClassLoader.defineClass1(Native Method)
        at java.lang.ClassLoader.defineClassCond(Unknown Source)
        at java.lang.ClassLoader.defineClass(Unknown Source)
        ... 12 more

在 JDK7 中運行也拋出了 OutOfMemoryError 異常,結果如下:

Exception in thread "main"
Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"

在 JDK8 中運行,循環全部完畢後,也沒有拋出任何異常,結果如下:

......
298
299
Java HotSpot(TM) 64-Bit Server VM warning: ignoring option PermSize=2M; support was removed in 8.0
Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize=2M; support was removed in 8.0

同一段代碼,在不同版本 JDK 中的運行結果爲什麼是不同的呢?這是因爲:在 JDK6 和 JDK7 中,永久代仍然存在,而在 JDK8 中,已經沒有永久代的存在了,而是採用了新的內存空間:元空間,並且 JVM 參數 PermSize 和 MaxPermSize 也被移除了。

總結

在 JVM 所管理的內存中,大致分爲:程序計數器、虛擬機棧、本地方法棧、堆和方法區。

程序計數器是當前線程所執行的字節碼的行號指示器。虛擬機棧是 Java 方法執行的內存模型,用於存儲局部變量表、操作數棧、動態鏈接、方法出口等信息。

本地方法棧是本地方法執行的內存模型,和虛擬機棧非常相似,其區別是本地方法棧爲 JVM 使用到的 Native 方法服務。

堆是用於存儲對象實例的,是垃圾收集器管理的主要區域。方法區用於存儲已被 JVM 加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/6kpKr72nsEoPT8wD9wO10g