如何監測 Linux 的磁盤 I-O 性能

鏈接:https://blog.devgenius.io/linux-disk-i-o-performance-1e920faba23

Linux 存儲系統 I/O 棧由文件系統層(file system layer)、**通用塊層( general block layer)設備層(device layer)**構成。

其中,通用塊層是 Linux 磁盤 I/O 的核心。向上,它爲訪問文件系統和應用程序的塊設備提供了標準接口;向下,它將各種異構磁盤設備抽象爲一個統一的塊設備,並響應文件系統和應用程序發送的 I/O。

在本文中,我們來看看磁盤的性能指標以及如何查看這些指標。

Linux 磁盤性能指標

在衡量磁盤性能時,我們經常提到五個常見指標:利用率、飽和度、IOPS、吞吐量和響應時間。這五個指標是衡量磁盤性能的基本指標。

  1. 利用率(Utilization):磁盤處理 I/O 的時間百分比。過度使用(如超過 80%)通常意味着磁盤 I/O 存在性能瓶頸。

  2. 飽和度(Saturation):指磁盤處理 I/O 的繁忙程度。過度飽和意味着磁盤存在嚴重的性能瓶頸。當飽和度爲 100% 時,磁盤無法接受新的 I/O 請求。

  3. IOPS(Input/Output Per Second):指每秒 I/O 請求的數量。

  4. 吞吐量(Throughput):每秒 I/O 請求的大小。

  5. 響應時間(Response time):指發送 I/O 請求和接收響應之間的間隔時間。

這裏需要注意的是,關於利用率,我們只考慮有無 I/O,而不考慮 I/O 的大小。也就是說,當利用率爲 100% 時,磁盤仍有可能接受新的 I/O 請求。

一般來說,在爲應用選擇服務器時,首先要對磁盤的 I/O 性能進行基準測試,這樣才能準確評估磁盤性能,以判斷是否能夠滿足應用的需求。

當然,這需要你在隨機讀順序讀隨機寫順序寫等各種應用場景下測試不同 I/O 大小(通常是 512B ~ 1MB 之間)的性能。

磁盤 I/O 觀察

首先要觀察的是每個磁盤的使用情況。iostat 是最常用的磁盤 I/O 性能觀察工具。它提供了各種常用性能指標,例如每個磁盤的利用率IOPS 和吞吐量。當然,這些指標實際上來自 /proc/diskstats

以下是 iostat 的輸出示例:

# -d -x means display all disk I/O performance
$ iostat -d -x 1 
Device            r/s     w/s     rkB/s     wkB/s   rrqm/s   wrqm/s  %rrqm  %wrqm r_await w_await aqu-sz rareq-sz wareq-sz  svctm  %util 
loop0            0.00    0.00      0.00      0.00     0.00     0.00   0.00   0.00    0.00    0.00   0.00     0.00     0.00   0.00   0.00 
loop1            0.00    0.00      0.00      0.00     0.00     0.00   0.00   0.00    0.00    0.00   0.00     0.00     0.00   0.00   0.00 
sda              0.00    0.00      0.00      0.00     0.00     0.00   0.00   0.00    0.00    0.00   0.00     0.00     0.00   0.00   0.00 
sdb              0.00    0.00      0.00      0.00     0.00     0.00   0.00   0.00    0.00    0.00   0.00     0.00     0.00   0.00   0.00

在上述指標中,您需要注意的是:

您可能已經注意到 iostat 不能直接獲取磁盤的飽和度。事實上,通常沒有什麼簡單的方法可以測量飽和度。但是,您可以將觀察到的平均請求隊列長度完成讀寫請求的等待時間基準測試(例如通過 fio)的結果進行比較,以綜合評估磁盤飽和度。

進程 I/O 觀察

除了每個磁盤的 I/O 情況,每個進程的 I/O 情況也是大家關注的重點。

上面提到的 iostat 只提供了觀察磁盤的整體 I/O 性能數據。缺點是無法知道哪些進程正在讀寫磁盤。要觀察進程的 I/O,還可以使用 pidstat 和 iotop 工具。

例如,要使用 pidstat

$ pidstat -d 1 
13:39:51      UID       PID   kB_rd/s   kB_wr/s kB_ccwr/s iodelay  Command 
13:39:52      102       916      0.00      4.00      0.00       0  rsyslogd

從 pidstat 的輸出可以看出,它可以實時查看每個進程的 I/O 情況,這包括以下內容:

除了使用 pidstat 實時查看進程磁盤 I/O 外,還有一個磁盤性能分析的常用方法是根據 I/O 大小對進程進行排序。爲此,我推薦 iotop 工具。它是一個類似於 top 的工具,您可以按 I/O 大小對進程進行排序,並找到具有更大 I/O 的進程。

$ iotop
Total DISK READ :       0.00 B/s | Total DISK WRITE :       7.85 K/s 
Actual DISK READ:       0.00 B/s | Actual DISK WRITE:       0.00 B/s 
  TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND 
15055 be/3 root        0.00 B/s    7.85 K/s  0.00 %  0.00 % systemd-journald

從該輸出可以看到,前兩行分別代表進程的磁盤讀寫總大小磁盤的實際讀寫總大小。由於緩存緩衝區I/O 合併等因素,它們可能不相等。

剩下的部分從各個角度代表了進程的 I/O 情況,包括 線程 IDI/O 優先級每秒磁盤讀取大小每秒磁盤寫入大小換入百分比等待 I/O 時鐘百分比

結論

在本文中,我介紹了 Linux 磁盤 I/O 的性能指標和查看性能工具。我們通常使用 IOPS吞吐量利用率飽和度響應時間等幾個指標來評估磁盤的 I/O 性能。

可以使用 iostat 獲取磁盤的 I/O 情況,也可以使用 pidstatiotop 等觀察進程的 I/O 情況。但在分析這些性能指標時,要注意結合讀寫比率I/O 類型I/O 大小等綜合分析。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/TxcbmTN8xFG0EPcMfEqagQ