虛擬機中對象鎖實現分析
一、前言
編程過程中經常會遇到線程的同步問題,Java 中對同步問題的解決方案比較多(synchronized、JUC、原子操作、volatile、條件變量等),其中 synchronized 最方便、簡單易用,也是 java 編程中使用最多的臨界區保護方案。本文主要講述對象鎖的相關知識,詳細介紹 synchronized 和 Object 的關鍵方法的虛擬機實現原理。
二、Java 對象鎖的使用方式
2.1 實例方法的同步
synchronized 修飾實例方法,該同步僅對當前對象的該方法起作用,同一時間只能有一個線程可以進入該對象的此方法。對於不同對象的此函數,無法做到互斥保護。
2.2 靜態方法的同步
synchronized 修飾靜態方法,該同步對當前類對象的該方法起作用,同一時間只能有一個線程可以進入該方法。
2.3 代碼塊的同步
在大多少情況下,並不需要對整個方法進行保護,當 synchronized 修飾代碼塊時,該代碼塊的訪問依賴於 object 對象鎖的互斥訪問,同一時間只能有一個線程持有 object 對象鎖。
更準確的來講,synchronized 關鍵字是依賴於對象鎖而生效的,每個 synchronized 同步塊開始的地方都會生成 monitor-enter obj 指令,同步塊結束的地方生成 monitor-exit obj 的指令,其中 obj 爲用於控制互斥訪問的對象。同一時間只能有一個線程持有 obj 的對象鎖。在 2.1 中 synchronized 依賴的是實列對象,2.2 中 synchronized 依賴的是類對象,2.3 中 synchronized 依賴的是 object 對象。
當一個對象控制多個代碼塊時,多個代碼塊也是互斥訪問,如下面代碼:
代碼塊①和代碼塊② 雖然在兩個函數中,但是 synchronized 依賴的對象都爲 object,這兩個代碼塊也是互斥訪問。
2.4 Object wait() 和 notify() 使用方法
Object 作爲所有類的基類,都實現了 object 方法。典型的用法如下:
thread 1 持有 object 對象鎖,並調用 object.wait() 方法後,則該線程進入 WAITING 狀態,並釋放 object 對象鎖,等待其它線程來喚醒它。
當 thread 2 持有 object 對象鎖,並調用 object.notify() 方法後,喚醒 thread 1,thread 1
重新獲得 object 對象鎖繼續執行。Object 類方法說明:
三、Android 對象內存結構
3.1 對象內存結構
一個類的實例對象內存主要由 3 部分組成:
1). 對象頭:對象頭包括 kclass_和 monitor_兩個字段,其中 kclass_ 存放指向類對象的指針,通過該指針可以找到該對象對應的類,monitor_ 用於存放對象運行時的標識數據,例如: GC 標誌位、哈希碼、鎖狀態等信息, 後面詳細分析。
2). 實例數據,該部分存放實例變量值,父類實例變量值在前,子類在後,且實例變量值按照如下順序進行排序:
3). 對齊填充,對象在內存中是按照 8byte 對齊的,如果實例數據部分沒有按照 8byte 對齊,則填充爲 8byte 對齊。
**3.2 monitor_ 字段分析**
monitor_ 字段定義在 art/runtime/mirror/object.h,類型爲 uint32_t,主要有下面 3 個操作函數。
操作函數中 SetLockWord 和 CasLockWord 函數的入參或 GetLockWord 函數的返回值都包含 LockWord 變量,對 monitor_ 字段的操作是通過 LockWord 的值進行的。
下面再來看 LockWord 定義:
LockWord 類的定義在 art/runtime/lock_word.h 文件中,從註釋中可以看到 LockWord 的使用主要有 4 種狀態,如下:
LockWord 的設計非常精妙,一個 32 位數據的每一位都充分利用,而且很好的區分了不同狀態。下面對各狀態進行詳細說明:
-
unlocked/thin 狀態下 31-30 bit 爲 00,默認狀態下爲 unlocked 狀態,當對象進行線程同步時變成 thin lock 狀態,27-16bit 記錄了 thin lock 重入的次數,15-0 bit 記錄了持有該 thin lock 的線程 ID。
-
fat lock 狀態下 31-30 bit 爲 01,當對象鎖在 thin lock 狀態,且有新的 (非 owner) 線程與其競爭,經過適當的等待期(sched_yield 調用、循環獲取 thin lock 狀態)後依然無法拿到鎖,則轉換爲 fat lock 狀態,併爲該對象分配一個 Monitor 資源。
-
hash state 狀態下 31-30 bit 爲 10,在 27-0 bit 存儲對象的 hash code,當在其它模式下,hash code 會存儲在該對象關聯的 Monitor 對象中。
-
forwarding address state 狀態下 31-30 bit 爲 11,在 concurrent copying GC 的 copy 階段,當一個對象被拷貝後,指向拷貝後的對象地址,當線程訪問到該對象後,通過該轉發地址,訪問新的對象。
第 29 位爲 mark bit,通過該 bit 位可以快速判斷是否標記過,避免重複標記。
第 28 位爲 read barrier bit,如果對象 LockWorkd 的該 bit 被設置,則在訪問該對象的成員時會進入慢速路徑,判斷對象是不是需要更新,如果需要更新,則返回拷貝後的對象地址。
四、對象鎖代碼分析
4.1 首先我們看一段代碼
這段代碼比較簡單,主要有下面兩個核心點:
1). 在主線程執行的過程中,用 obj 對象進行線程同步,並調用 obj.wait() 函數,使線程阻塞在了 obj 對象鎖上等待喚醒。
2). main 函數中創建匿名線程,該線程首先 sleep 2000ms,然後喚醒阻塞在 obj 對象鎖上線程。
4.2 編譯 TestDemo.java, 命令如下:
1).Javac 將 TestDemo.java 文件編譯生成 TestDemo*.class 文件, java 編譯過程中每個類會生成一個 class 文件。
2).d8 命令將 TestDemo*.class 文件通過編譯、重構、重排、壓縮、混淆後生成對應的 dex (Dalvik Executable file)格式文件。
3).dexdump.exe 命令可以查看 dex 文件格式的詳細信息,如校驗信息、dex 頭信息、生成 dex 的 CFG 信息、dex 的反彙編信息等,詳細使用方法可以通過 dexdump.exe –help 命令查看
通過 dexdump.exe –d classes.dex 查看反彙編
其中 run 方法指令信息如下:
main 函數的指令信息如下:
對部分指令解析如下:
對於 dex 指令詳細格式可以閱讀 google 的官方文檔:
https://source.android.com/docs/core/runtime/dalvik-bytecode
本文重點分析 monitor-enter、monitor-exit、Object.wait()、Object.notify() 在虛擬機中的詳細實現。
4.3.Object.wait() 流程分析
Object.wait() 的調用關係如下:
Object 類是所有類的父類,任何類中都可以調用 public 的 wait() 方法,最終調用到虛擬機的 monitor.cc 文件的 wait 靜態方法,
首先構造了一個操作 obj 的 Handle 對象 h_obj,通過 ObjectWaitStart 函數通知 jvmti 調試系統發生了 JVMTI_EVENT_MONITOR_WAIT 事件。
JVMTI(JVM Tool Interface)是 Java 虛擬機所提供的 native 編程接口,可以用來開發並監控虛擬機,可以查看 JVM 內部的狀態,並控制 JVM 應用程序的執行。可實現的功能包括但不限於:調試、監控、線程分析、覆蓋率分析工具等。
首先獲得 h_obj 對象的 LockWord 字段,lock_word.GetState() 函數獲得當前的鎖狀態,主要有下面幾種情況:
1).hash 或 unlocked 狀態:
因爲調用 wait() 方法必須持有對象鎖,所以不會出現這兩種狀態,如果出現則拋出 IllegalMonitorStateException 異常。
2).thin lock 狀態:
當持有該對象鎖的線程不是要 wait 的線程,也拋出 IllegalMonitorStateException 異常,當持有鎖的線程與要 wait 的線程一致,這時需要將 thin lock inflate 爲 fat lock,inflate 的過程在 monitor-enter 指令分析中分析。
當對象鎖 inflate 爲 fat lock 狀態後,調用 Monitor 對象的實例方法 Wait 讓線程進入 sleep 狀態等待。
4.4 Object.notify() 流程分析
這裏我們直接分析 DoNotify 函數:
通過 lock_word.GetState() 獲得當前 obj 對象的鎖狀態,主要有下面情況:
- hash 或 unlocked 狀態 :
拋出 IllegalMonitorStateException 異常。
2).thin lock 狀態:
當持有該對象鎖的線程不是要 notify 的線程,也拋出 IllegalMonitorStateException 異常,當持有鎖的線程與要 notify 的線程一致,這時說明沒有需要通知喚醒的線程,直接返回。
3).fat lock 狀態:
在 Object.notify() 流程中參數 notify_all 爲 false,則直接調用 mon->Notify(self); 通知喚醒等待線程。
4.5monitor-enter 流程分析
對於解釋執行和機器碼執行模式,最終都會調用到 art/runtime/mirror/object-inl.h 文件 Object 對象的 MonitorEnter 函數。
下面來分析 Monitor 類的靜態方法 MonitorEnter 函數。
FakeLock 主要用於線程安全性檢查,主要在編譯期檢測。
kExtraSpinIters 定義了當對象鎖被其它線程持有且爲 thin lock 時,競爭線程循環獲取鎖的次數。
通過 lock_word.GetState() 獲取鎖狀態,當鎖狀態爲 unlocked 狀態時,轉換爲 thin lock 狀態,並通過 cas 操作更新 lock count。
當鎖狀態爲 thin lock 狀態時,首先獲取鎖的 owner 線程 id,如果 owner id 與競爭線程 id 一致,則有下面兩種情況:
-
如果 lock count 加 1 小於等於 (1<<12)-1(4095) 時,將 lock count+1 更新 lock count。
-
如果 lock count 加 1 大於 (1<<12)-1 時 (lock count 區域無法存儲),則調用 InflateThinLocked 函數對 thin lock 進行膨脹。
Atrace* 相關的函數主要用於 systrace 相關信息的打印,trylock 在這裏爲 false。
當鎖狀態爲 thin lock 狀態且鎖的 owner 線程 id 與競爭線程 id 不一致,則做一定的等待。
runtime->GetMaxSpinsBeforeThinLockInflation() 的值爲 50 ,也就是說執行 100 次的循環判斷鎖狀態後,再執行 50 次的 sched_yield() 後還未獲得鎖資源,如果還未拿到鎖,則對該鎖進行膨脹。sched_yield() 會主動讓出當前線程的執行權限,並在某個時間後恢復執行。
當鎖狀態已經是 fat lock 狀態,通過 lock_word.FatLockMonitor(); 獲取 Monitor 對象,並通過 Monitor 對象的 Lock 函數讓線程進入等待狀態。
當鎖狀態已經是 hash 狀態時,直接對鎖進行膨脹。
下面看鎖膨脹的過程:
thin lock 的膨脹有兩種情形:
1).lock count 的值超過了 4095,這時鎖的 owner 爲當前線程,即直接通過 Inflate 函數膨脹
2). 鎖的 owner 不是當前線程,通過 SuspendThreadByThreadId 暫停鎖的 owner 線程(主要是 owner 線程和鎖膨脹線程都需要訪問對象的 LockWord,避免競態問題),然後通過 Inflate 進行膨脹。膨脹完成後再喚醒鎖的 owner 線程。
再看 Inflate 的過程:
通過 MonitorPool::CreateMonitor 函數獲取一個 Monitor 的對象 m,並通過 m->install(self) 函數更新對象的 LockWord 字段,這時 LockWord 字段信息包含 fat lock 狀態、GC 狀態、MonitorId,然後將 m 保存在 monitor_list_ 中。
monitor_list_中存儲了當前虛擬機使用的所有 Monitor 對象。在 GC 的過程中,通過該鏈表,訪問到 Monitor 依賴的對象。如果對象變成垃圾對象,則回收該 Monitor,否則更新 Monitor 依賴的對象信息。
MonitorId 用於唯一標識一個 Monitor,生成的方法可以看 monitor_pool.h 中的實現。
再看 Monitor::Lock 的過程:
該函數的實現較長,省去調試相關的代碼。
首先介紹 Monitor 中最重要的成員 monitor_lock_ ,它是 Mutex 的實例,通過該實例實現鎖相關的核心邏輯。
TryLock 函數主要是通過 Mutex 的函數實現一定的自旋等待,並設置鎖的狀態爲線程持有的狀態。
monitor_lock_.ExclusiveLock(self); 在 Mutex 的 ExclusiveLock 函數中通過 futex 系統調用實現了線程的阻塞,futex 調用代碼如下。
4.6 monitor-exit 流程分析
解釋執行和機器碼執行模式都會調用到 MonitorExit 函數。
通過 lock_word.GetState() 獲取 LockWord 狀態,當狀態爲 hash 或 unlocked 狀態時,通過 FailedUnlock 函數拋出異常。
當 LockWord 的狀態爲 thin lock 狀態時,有下面兩種情況:
1). 鎖的 owner 與當前線程不一致,則出錯拋出異常。
2). 鎖的 owner 與當前線程爲同一線程,當鎖有重入時,則將 lock count -1,否則設置爲 unlocked 狀態。
當 LockWord 的狀態爲 fat lock 狀態時,獲取該對象關聯的 Monitor 對象,並調用 Unlock 函數
在 Unlock 函數中 lock_count 爲 0,說明該線程不在持有該鎖,通過
SignalWaiterAndReleaseMonitorLock 喚醒阻塞在該鎖上的線程。
五、總結
本文簡單的闡述了對象鎖的使用方式,對象在內存中的結構,並對對象頭中關鍵成員 LockWord 進行了分析,最後介紹了 synchronized、Object.wait() 和 Object.notify() 在虛擬機中的實現流程。
參考文獻:
深入理解 Android Java 虛擬機 ART 鄧凡平
深入理解 java 虛擬機 周志明
深入 java 虛擬機 bill venners
Android T 源碼
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/EeqCBKfQsfTEZLO7dEjvUg