硬核圖解網絡 IO 模型！

前言

文章會同步到個人網站，方便閱讀：https://xiaoflyfish.cn/

網站最近豐富了很多內容，都是滿滿的乾貨！
微信搜索：月伴飛魚，交個朋友，進面試交流羣！
公衆號後臺回覆 666，可以獲得免費電子書籍！

覺得不錯，希望點贊，在看，轉發支持一下，謝謝

背景介紹

在互聯網的時代下，絕大部分數據都是通過網絡來進行獲取的。
在服務端的架構中，絕大部分數據也是通過網絡來進行交互的。

而且作爲服務端的開發工程師來說，都會進行一系列服務設計、開發以及能力開放，而服務能力開放也是需要通過網絡來完成的，因此對網絡編程以及網絡 IO 模型都不會太陌生。

由於有很多優秀的框架（比如 Netty、HSF、Dubbo、Thrift 等）已經把底層網絡 IO 給封裝了，通過提供的 API 能力或者配置就能完成想要的服務能力開發，因此大部分工程師對網絡 IO 模型的底層不夠了解。

本文系統的講解了 Linux 內核的 IO 模型、Java 網絡 IO 模型以及兩者之間的關係！

什麼是 IO

我們都知道在 Linux 的世界，一切皆文件。

而文件就是一串二進制流，不管 Socket、FIFO、管道還是終端，對我們來說，一切都是流。

在信息的交換過程中，我們都是對這些流進行數據收發操作，簡稱爲 I/O 操作。
往流中讀取數據，系統調用 Read，寫入數據，系統調用 Write。

通常用戶進程的一個完整的 IO 分爲兩個階段：

磁盤 IO：

網絡 IO：

操作系統和驅動程序運行在內核空間，應用程序運行在用戶空間，兩者不能使用指針傳遞數據，因爲 Linux 使用的虛擬內存機制，必須通過系統調用請求內核來完成 IO 動作。

IO 有內存 IO、網絡 IO 和磁盤 IO 三種，通常我們說的 IO 指的是後兩者！

爲什麼需要 IO 模型

如果使用同步的方式來通信的話，所有的操作都在一個線程內順序執行完成，這麼做缺點是很明顯的：

因爲同步的通信操作會阻塞同一個線程的其他任何操作，只有這個操作完成了之後，後續的操作纔可以完成，所以出現了同步阻塞 + 多線程（每個 Socket 都創建一個線程對應），但是系統內線程數量是有限制的，同時線程切換很浪費時間，適合 Socket 少的情況。

因該需要出現 IO 模型。

Linux 的 IO 模型

在描述 Linux IO 模型之前，我們先來了解一下 Linux 系統數據讀取的過程：

以用戶請求 index.html 文件爲例子說明

基本概念

用戶空間和內核空間

操作系統的核心是內核，獨立於普通的應用程序，可以訪問受保護的內存空間，也有訪問底層硬件設備的所有權限。

爲了保證內核的安全，用戶進程不能直接操作內核，操作系統將虛擬空間劃分爲兩部分，一部分爲內核空間，一部分爲用戶空間。

進程切換

爲了控制進程的執行，內核必須有能力掛起正在 CPU 上運行的進程，並恢復以前掛起的某個進程的執行。

這種行爲被稱爲進程切換。

因此可以說，任何進程都是在操作系統內核的支持下運行的，是與內核緊密相關的。

進程的阻塞

正在執行的進程，由於期待的某些事件未發生，如請求系統資源失敗、等待某種操作的完成、新數據尚未到達或無新工作做等，則由系統自動執行阻塞原語 (Block)，使自己由運行狀態變爲阻塞狀態。

可見，進程的阻塞是進程自身的一種主動行爲，也因此只有處於運行態的進程（獲得 CPU），纔可能將其轉爲阻塞狀態。

當進程進入阻塞狀態，是不佔用 CPU 資源的。

文件描述符

文件描述符（File Descriptor）是計算機科學中的一個術語，是一個用於表述指向文件的引用的抽象化概念。

文件描述符在形式上是一個非負整數，實際上，它是一個索引值，指向內核爲每一個進程所維護的該進程打開文件的記錄表。

當程序打開一個現有文件或者創建一個新文件時，內核向進程返回一個文件描述符。

緩存 IO

大多數文件系統的默認 IO 操作都是緩存 IO。

其讀寫過程如下：

讀操作：操作系統檢查內核的緩衝區有沒有需要的數據，如果已經緩存了，那麼就直接從緩存中返回；否則從磁盤、網卡等中讀取，然後緩存在操作系統的緩存中；
寫操作：將數據從用戶空間複製到內核空間的緩存中。這時對用戶程序來說寫操作就已經完成，至於什麼時候再寫到磁盤、網卡等中由操作系統決定，除非顯示地調用了 sync 同步命令。

假設內核空間緩存無需要的數據，用戶進程從磁盤或網絡讀數據分兩個階段：

階段一： 內核程序從磁盤、網卡等讀取數據到內核空間緩存區；
階段二： 用戶程序從內核空間緩存拷貝數據到用戶空間。

緩存 IO 的缺點：

數據在傳輸過程中需要在應用程序地址空間和內核空間進行多次數據拷貝操作，這些數據拷貝操作所帶來的 CPU 以及內存開銷非常大。

同步阻塞

用戶空間的應用程序執行一個系統調用，這會導致應用程序阻塞，什麼也不幹，直到數據準備好，並且將數據從內核複製到用戶進程，最後進程再處理數據，在等待數據到處理數據的兩個階段，整個進程都被阻塞，不能處理別的網絡 IO。

調用應用程序處於一種不再消費 CPU 而只是簡單等待響應的狀態，因此從處理的角度來看，這是非常有效的。

這也是最簡單的 IO 模型，在通常 FD 較少、就緒很快的情況下使用是沒有問題的。

同步非阻塞

非阻塞的系統調用調用之後，進程並沒有被阻塞，內核馬上返回給進程，如果數據還沒準備好，此時會返回一個 error。

進程在返回之後，可以乾點別的事情，然後再發起系統調用。
重複上面的過程，循環往復的進行系統調用。這個過程通常被稱之爲輪詢。
輪詢檢查內核數據，直到數據準備好，再拷貝數據到進程，進行數據處理。
需要注意，拷貝數據整個過程，進程仍然是屬於阻塞的狀態。
這種方式在編程中對 Socket 設置O_NONBLOCK即可。

IO 多路複用

IO 多路複用，這是一種進程預先告知內核的能力，讓內核發現進程指定的一個或多個 IO 條件就緒了，就通知進程。

使得一個進程能在一連串的事件上等待。

IO 複用的實現方式目前主要有 Select、Poll 和 Epoll。

僞代碼描述 IO 多路複用：

while(status == OK) { // 不斷輪詢
 ready_fd_list = io_wait(fd_list); //內核緩衝區是否有準備好的數據
 for(fd in ready_fd_list) {
  data = read(fd) // 有準備好的數據讀取到用戶緩衝區
  process(data)
 }
}

信號驅動

首先我們允許 Socket 進行信號驅動 IO，並安裝一個信號處理函數，進程繼續運行並不阻塞。

當數據準備好時，進程會收到一個 SIGIO 信號，可以在信號處理函數中調用 I/O 操作函數處理數據。

流程如下：

開啓套接字信號驅動 IO 功能
系統調用 Sigaction 執行信號處理函數（非阻塞，立刻返回）
數據就緒，生成 Sigio 信號，通過信號回調通知應用來讀取數據

此種 IO 方式存在的一個很大的問題：Linux 中信號隊列是有限制的，如果超過這個數字問題就無法讀取數據

異步非阻塞

異步 IO 流程如下所示：

當用戶線程調用了aio_read系統調用，立刻就可以開始去做其它的事，用戶線程不阻塞
內核就開始了 IO 的第一個階段：準備數據。當內核一直等到數據準備好了，它就會將數據從內核內核緩衝區，拷貝到用戶緩衝區
內核會給用戶線程發送一個信號，或者回調用戶線程註冊的回調接口，告訴用戶線程 Read 操作完成了
用戶線程讀取用戶緩衝區的數據，完成後續的業務操作

相對於同步 IO，異步 IO 不是順序執行。

用戶進程進行aio_read系統調用之後，無論內核數據是否準備好，都會直接返回給用戶進程，然後用戶態進程可以去做別的事情。

等到數據準備好了，內核直接複製數據給進程，然後從內核向進程發送通知。

對比信號驅動 IO，異步 IO 的主要區別在於：

信號驅動由內核告訴我們何時可以開始一個 IO 操作 (數據在內核緩衝區中)，而異步 IO 則由內核通知 IO 操作何時已經完成 (數據已經在用戶空間中)。

異步 IO 又叫做事件驅動 IO，在 Unix 中，爲異步方式訪問文件定義了一套庫函數，定義了 AIO 的一系列接口。

使用aio_read或者aio_write發起異步 IO 操作，使用aio_error檢查正在運行的 IO 操作的狀態。

目前 Linux 中 AIO 的內核實現只對文件 IO 有效，如果要實現真正的 AIO，需要用戶自己來實現。

目前有很多開源的異步 IO 庫，例如 libevent、libev、libuv。

Java 網絡 IO 模型

BIO

BIO 是一個典型的網絡編程模型，是通常我們實現一個服務端程序的方法，對應 Linux 內核的同步阻塞 IO 模型，發送數據和接收數據的過程如下所示：

步驟如下：

主線程 accept 請求
請求到達，創建新的線程來處理這個套接字，完成對客戶端的響應
主線程繼續 accept 下一個請求

服務端處理僞代碼如下所示：

這是經典的一個連接對應一個線程的模型，之所以使用多線程，主要原因在於socket.accept()、socket.read()、socket.write()三個主要函數都是同步阻塞的。

當一個連接在處理 I/O 的時候，系統是阻塞的，如果是單線程的話必然就阻塞，但 CPU 是被釋放出來的，開啓多線程，就可以讓 CPU 去處理更多的事情。

其實這也是所有使用多線程的本質：

利用多核，當 I/O 阻塞時，但 CPU 空閒的時候，可以利用多線程使用 CPU 資源。

當面對十萬甚至百萬級連接的時候，傳統的 BIO 模型是無能爲力的。

隨着移動端應用的興起和各種網絡遊戲的盛行，百萬級長連接日趨普遍，此時，必然需要一種更高效的 I/O 處理模型。

NIO

JDK1.4 開始引入了 NIO 類庫，主要是使用 Selector 多路複用器來實現。

Selector 在 Linux 等主流操作系統上是通過 IO 複用 Epoll 實現的。

NIO 的實現流程，類似於 Select：

創建 ServerSocketChannel 監聽客戶端連接並綁定監聽端口，設置爲非阻塞模式
創建 Reactor 線程，創建多路複用器 (Selector) 並啓動線程
將 ServerSocketChannel 註冊到 Reactor 線程的 Selector 上，監聽 Accept 事件
Selector 在線程 run 方法中無線循環輪詢準備就緒的 Key
Selector 監聽到新的客戶端接入，處理新的請求，完成 TCP 三次握手，建立物理連接
將新的客戶端連接註冊到 Selector 上，監聽讀操作，讀取客戶端發送的網絡消息
客戶端發送的數據就緒則讀取客戶端請求，進行處理

簡單處理模型是用一個單線程死循環選擇就緒的事件，會執行系統調用（Linux 2.6 之前是 Select、Poll，2.6 之後是 Epoll，Windows 是 IOCP），還會阻塞的等待新事件的到來。

新事件到來的時候，會在 Selector 上註冊標記位，標示可讀、可寫或者有連接到來，簡單處理模型的僞代碼如下所示：

NIO 由原來的阻塞讀寫（佔用線程）變成了單線程輪詢事件，找到可以進行讀寫的網絡描述符進行讀寫。

除了事件的輪詢是阻塞的（沒有可乾的事情必須要阻塞），剩餘的 I/O 操作都是純 CPU 操作，沒有必要開啓多線程。

並且由於線程的節約，連接數大的時候因爲線程切換帶來的問題也隨之解決，進而爲處理海量連接提供了可能。

AIO

JDK1.7 引入 NIO2.0，提供了異步文件通道和異步套接字通道的實現。

其底層在 Windows 上是通過 IOCP 實現，在 Linux 上是通過 IO 複用 Epoll 來模擬實現的。

在 JAVA NIO 框架中，Selector 它負責代替應用查詢中所有已註冊的通道到操作系統中進行 IO 事件輪詢、管理當前註冊的通道集合，定位發生事件的通道等操作。

但是在 JAVA AIO 框架中，由於應用程序不是輪詢方式，而是訂閱 - 通知方式，所以不再需要 Selector（選擇器）了，改由 Channel 通道直接到操作系統註冊監聽。

JAVA AIO 框架中，只實現了兩種網絡 IO 通道：

AsynchronousServerSocketChannel（服務器監聽通道）
AsynchronousSocketChannel（Socket 套接字通道）。

具體過程如下所示：

創建 AsynchronousServerSocketChannel，綁定監聽端口
調用 AsynchronousServerSocketChannel 的 accpet 方法，傳入自己實現的 CompletionHandler，包括上一步，都是非阻塞的
連接傳入，回調 CompletionHandler 的 completed 方法，在裏面，調用 AsynchronousSocketChannel 的 read 方法，傳入負責處理數據的 CompletionHandler
數據就緒，觸發負責處理數據的 CompletionHandler 的 completed 方法，繼續做下一步處理即可
寫入操作類似，也需要傳入 CompletionHandler

最後

覺得有收穫，希望幫忙點贊，轉發下哈，謝謝，謝謝

微信搜索：月伴飛魚，交個朋友

公衆號後臺回覆 666，可以獲得免費電子書籍

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/fCGPemISp9JFjYEjTgAhAw

前言