13 張圖,深入理解 Synchronize

前言

在併發編程中Synchronized一直都是元老級的角色,Jdk 1.6以前大家都稱呼它爲重量級鎖,相對於J U C包提供的Lock,它會顯得笨重,不過隨着Jdk 1.6Synchronized進行各種優化後,Synchronized性能已經非常快了。

內容大綱

Synchronized 使用方式

SynchronizedJava提供的同步關鍵字,在多線程場景下,對共享資源代碼段進行讀寫操作(必須包含寫操作,光讀不會有線程安全問題,因爲讀操作天然具備線程安全特性),可能會出現線程安全問題,我們可以使用Synchronized鎖定共享資源代碼段,達到互斥mutualexclusion)效果,保證線程安全。

共享資源代碼段又稱爲臨界區critical section),保證臨界區互斥,是指執行臨界區critical section)的只能有一個線程執行,其他線程阻塞等待,達到排隊效果。

Synchronized的食用方式有三種

普通函數使用Synchronized的方式很簡單,在訪問權限修飾符函數返回類型間加上Synchronized

多線程場景下,threadthreadTwo兩個線程執行incr函數,incr函數作爲共享資源代碼段被多線程讀寫操作,我們將它稱爲臨界區,爲了保證臨界區互斥,使用Synchronized修飾incr函數即可。

public class SyncTest {

    private int j = 0;
    
    /**
     * 自增方法
     */
    public synchronized void incr(){
        //臨界區代碼--start
        for (int i = 0; i < 10000; i++) {
            j++;
        }
        //臨界區代碼--end
    }

    public int getJ() {
        return j;
    }
}

public class SyncMain {

    public static void main(String[] agrs) throws InterruptedException {
        SyncTest syncTest = new SyncTest();
        Thread thread = new Thread(() -> syncTest.incr());
        Thread threadTwo = new Thread(() -> syncTest.incr());
        thread.start();
        threadTwo.start();
        thread.join();
        threadTwo.join();
        //最終打印結果是20000,如果不使用synchronized修飾,就會導致線程安全問題,輸出不確定結果
        System.out.println(syncTest.getJ());
    }

}

代碼十分簡單,incr函數被synchronized修飾,函數邏輯是對j進行10000次累加,兩個線程執行incr函數,最後輸出j結果。

synchronized修飾函數我們簡稱同步函數,線程執行稱同步函數前,需要先獲取監視器鎖,簡稱鎖,獲取鎖成功才能執行同步函數同步函數執行完後,線程會釋放鎖並通知喚醒其他線程獲取鎖,獲取鎖失敗「則阻塞並等待通知喚醒該線程重新獲取鎖」,同步函數會以this作爲鎖,即當前對象,以上面的代碼段爲例就是syncTest對象。

靜態函數

靜態函數顧名思義,就是靜態的函數,它使用Synchronized的方式與普通函數一致,唯一的區別是鎖的對象不再是this,而是Class對象。

多線程執行Synchronized修飾靜態函數代碼段如下。

public class SyncTest {

    private static int j = 0;
    
    /**
     * 自增方法
     */
    public static synchronized void incr(){
        //臨界區代碼--start
        for (int i = 0; i < 10000; i++) {
            j++;
        }
        //臨界區代碼--end
    }

    public static int getJ() {
        return j;
    }
}

public class SyncMain {

    public static void main(String[] agrs) throws InterruptedException {
        Thread thread = new Thread(() -> SyncTest.incr());
        Thread threadTwo = new Thread(() -> SyncTest.incr());
        thread.start();
        threadTwo.start();
        thread.join();
        threadTwo.join();
        //最終打印結果是20000,如果不使用synchronized修飾,就會導致線程安全問題,輸出不確定結果
        System.out.println(SyncTest.getJ());
    }

}

Java的靜態資源可以直接通過類名調用,靜態資源不屬於任何實例對象,它只屬於Class對象,每個ClassJ V M中只有唯一的一個Class對象,所以同步靜態函數會以Class對象作爲鎖,後續獲取鎖、釋放鎖流程都一致。

代碼塊

前面介紹的普通函數與靜態函數粒度都比較大,以整個函數爲範圍鎖定,現在想把範圍縮小、靈活配置,就需要使用代碼塊了,使用{}符號定義範圍給Synchronized修飾。

下面代碼中定義了syncDbData函數,syncDbData是一個僞同步數據的函數,耗時2秒,並且邏輯不涉及共享資源讀寫操作非臨界區),另外還有兩個函數incrincrTwo,都是在自增邏輯前執行了syncDbData函數,只是使用Synchronized的姿勢不同,一個是修飾在函數上,另一個是修飾在代碼塊上。

public class SyncTest {

    private static int j = 0;


    /**
     * 同步庫數據,比較耗時,代碼資源不涉及共享資源讀寫操作。
     */
    public void syncDbData() {
        System.out.println("db數據開始同步------------");
        try {
            //同步時間需要2秒
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("db數據開始同步完成------------");
    }

    //自增方法
    public synchronized void incr() {
        //start--臨界區代碼
        //同步庫數據
        syncDbData();
        for (int i = 0; i < 10000; i++) {
            j++;
        }
        //end--臨界區代碼
    }

    //自增方法
    public void incrTwo() {
        //同步庫數據
        syncDbData();
        synchronized (this) {
            //start--臨界區代碼
            for (int i = 0; i < 10000; i++) {
                j++;
            }
            //end--臨界區代碼
        }

    }

    public int getJ() {
        return j;
    }

}


public class SyncMain {

    public static void main(String[] agrs) throws InterruptedException {
        //incr同步方法執行
        SyncTest syncTest = new SyncTest();
        Thread thread = new Thread(() -> syncTest.incr());
        Thread threadTwo = new Thread(() -> syncTest.incr());
        thread.start();
        threadTwo.start();
        thread.join();
        threadTwo.join();
        //最終打印結果是20000
        System.out.println(syncTest.getJ());

        //incrTwo同步塊執行
        thread = new Thread(() -> syncTest.incrTwo());
        threadTwo = new Thread(() -> syncTest.incrTwo());
        thread.start();
        threadTwo.start();
        thread.join();
        threadTwo.join();
        //最終打印結果是40000
        System.out.println(syncTest.getJ());
    }

}

先看看incr同步方法執行,流程和前面沒區別,只是Synchronized鎖定的範圍太大,把syncDbData()也納入臨界區中,多線程場景執行,會有性能上的浪費,因爲syncDbData()完全可以讓多線程並行併發執行。

我們通過代碼塊的方式,來縮小範圍,定義正確的臨界區,提升性能,目光轉到incrTwo同步塊執行,incrTwo函數使用修飾代碼塊的方式同步,只對自增代碼段進行鎖定。

代碼塊同步方式除了靈活控制範圍外,還能做線程間的協同工作,因爲Synchronized ()括號中能接收任何對象作爲鎖,所以可以通過Objectwait、notify、notifyAll等函數,做多線程間的通信協同(本文不對線程通信協同做展開,主角是Synchronized,而且也不推薦去用這些方法,因爲LockSupport工具類會是更好的選擇)。

Synchronized 原理

  public class SyncTest {

    private static int j = 0;


    /**
     * 同步庫數據,比較耗時,代碼資源不涉及共享資源讀寫操作。
     */
    public void syncDbData() {
        System.out.println("db數據開始同步------------");
        try {
            //同步時間需要2秒
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("db數據開始同步完成------------");
    }

    //自增方法
    public synchronized void incr() {
        //start--臨界區代碼
        //同步庫數據
        syncDbData();
        for (int i = 0; i < 10000; i++) {
            j++;
        }
        //end--臨界區代碼
    }

    //自增方法
    public void incrTwo() {
        //同步庫數據
        syncDbData();
        synchronized (this) {
            //start--臨界區代碼
            for (int i = 0; i < 10000; i++) {
                j++;
            }
            //end--臨界區代碼
        }

    }

    public int getJ() {
        return j;
    }

}

爲了探究Synchronized原理,我們對上面的代碼進行反編譯,輸出反編譯後結果,看看底層是如何實現的(環境 Java 11、win 10 系統)。

  只截取了incr與incrTwo函數內容
        
  public synchronized void incr();
    Code:
       0: aload_0                                         
       1: invokevirtual #11                 // Method syncDbData:()V 
       4: iconst_0                          
       5: istore_1                          
       6: iload_1                                     
       7: sipush        10000               
      10: if_icmpge     27
      13: getstatic     #12                 // Field j:I
      16: iconst_1
      17: iadd
      18: putstatic     #12                 // Field j:I
      21: iinc          1, 1
      24: goto          6
      27: return

  public void incrTwo();    
    Code:
       0: aload_0
       1: invokevirtual #11                 // Method syncDbData:()V
       4: aload_0
       5: dup
       6: astore_1
       7: monitorenter                     //獲取鎖
       8: iconst_0
       9: istore_2
      10: iload_2
      11: sipush        10000
      14: if_icmpge     31
      17: getstatic     #12                 // Field j:I
      20: iconst_1
      21: iadd
      22: putstatic     #12                 // Field j:I
      25: iinc          2, 1
      28: goto          10
      31: aload_1
      32: monitorexit                      //正常退出釋放鎖 
      33: goto          41
      36: astore_3
      37: aload_1
      38: monitorexit                      //異步退出釋放鎖    
      39: aload_3
      40: athrow
      41: return

ps: 對上面指令感興趣的讀者,可以百度或 google 一下 “JVM 虛擬機字節碼指令表”

先看incrTwo函數,incrTwo是代碼塊方式同步,在反編譯後的結果中,我們發現存在monitorentermonitorexit指令(獲取鎖、釋放鎖)。

monitorenter指令插入到同步代碼塊的開始位置,monitorexit指令插入到同步代碼塊的結束位置,J V M需要保證每一個 monitorenter都有monitorexit與之對應。

任何對象都有一個監視器鎖(monitor)關聯,線程執行monitorenter指令時嘗試獲取monitor的所有權。

回過頭看incr函數,incr是普通函數方式同步,雖然在反編譯後的結果中沒有看到monitorentermonitorexit指令,但是實際執行的流程與incrTwo函數一樣,通過monitor來執行,只不過它是一種隱式的方式來實現,最後放一張流程圖。

Synchronized 優化

Jdk 1.5以後對Synchronized關鍵字做了各種的優化,經過優化後Synchronized已經變得原來越快了,這也是爲什麼官方建議使用Synchronized的原因,具體的優化點如下。

鎖粗化

互斥的臨界區範圍應該儘可能小,這樣做的目的是爲了使同步的操作數量儘可能縮小,縮短阻塞時間,如果存在鎖競爭,那麼等待鎖的線程也能儘快拿到鎖。

但是加鎖解鎖也需要消耗資源,如果存在一系列的連續加鎖解鎖操作,可能會導致不必要的性能損耗,鎖粗化就是將「多個連續的加鎖、解鎖操作連接在一起」,擴展成一個範圍更大的鎖,避免頻繁的加鎖解鎖操作。

J V M會檢測到一連串的操作都對同一個對象加鎖(for循環10000次執行j++,沒有鎖粗化就要進行10000次加鎖 / 解鎖),此時J V M就會將加鎖的範圍粗化到這一連串操作的外部(比如for循環體外),使得這一連串操作只需要加一次鎖即可。

鎖消除

Java虛擬機在JIT編譯時 (可以簡單理解爲當某段代碼即將第一次被執行時進行編譯,又稱即時編譯),通過對運行上下文的掃描,經過逃逸分析(對象在函數中被使用,也可能被外部函數所引用,稱爲函數逃逸),去除不可能存在共享資源競爭的鎖,通過這種方式消除沒有必要的鎖,可以節省毫無意義的時間消耗。

代碼中使用Object作爲鎖,但是Object對象的生命週期只在incrFour()函數中,並不會被其他線程所訪問到,所以在J I T編譯階段就會被優化掉(此處的Object屬於沒有逃逸的對象)。

鎖升級

Java中每個對象都擁有對象頭,對象頭由Mark World 、指向類的指針、以及數組長度三部分組成,本文,我們只需要關心Mark World 即可,Mark World  記錄了對象的HashCode、分代年齡和鎖標誌位信息。

Mark World 簡化結構

讀者們只需知道,鎖的升級變化,體現在鎖對象的對象頭Mark World部分,也就是說Mark World的內容會隨着鎖升級而改變。

Java1.5以後爲了減少獲取鎖和釋放鎖帶來的性能消耗,引入了偏向鎖輕量級鎖Synchronized的升級順序是 「無鎖 --> 偏向鎖 --> 輕量級鎖 --> 重量級鎖,只會升級不會降級

偏向鎖

在大多數情況下,鎖總是由同一線程多次獲得,不存在多線程競爭,所以出現了偏向鎖,其目標就是在只有一個線程執行同步代碼塊時,降低獲取鎖帶來的消耗,提高性能(可以通過 J V M 參數關閉偏向鎖:-XX:-UseBiasedLocking=false,關閉之後程序默認會進入輕量級鎖狀態)。

線程執行同步代碼或方法前,線程只需要判斷對象頭的Mark Word中線程ID與當前線程ID是否一致,如果一致直接執行同步代碼或方法,具體流程如下

輕量級鎖

輕量級鎖考慮的是競爭鎖對象的線程不多,持有鎖時間也不長的場景。因爲阻塞線程需要C P U從用戶態轉到內核態,代價較大,如果剛剛阻塞不久這個鎖就被釋放了,那這個代價就有點得不償失,所以乾脆不阻塞這個線程,讓它自旋一段時間等待鎖釋放。

當前線程持有的鎖是偏向鎖的時候,被另外的線程所訪問,偏向鎖就會升級爲輕量級鎖,其他線程會通過自旋的形式嘗試獲取鎖,不會阻塞,從而提高性能。輕量級鎖的獲取主要有兩種情況:① 當關閉偏向鎖功能時;② 多個線程競爭偏向鎖導致偏向鎖升級爲輕量級鎖。

重量級鎖

輕量級鎖膨脹之後,就升級爲重量級鎖,重量級鎖是依賴操作系統的MutexLock互斥鎖)來實現的,需要從用戶態轉到內核態,這個成本非常高,這就是爲什麼Java1.6之前Synchronized效率低的原因。

升級爲重量級鎖時,鎖標誌位的狀態值變爲10,此時Mark Word中存儲內容的是重量級鎖的指針,等待鎖的線程都會進入阻塞狀態,下面是簡化版的鎖升級過程。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/zP1XnF_wvUD0HRS4cDCdVg