Redis 新特性篇:多線程模型解讀

Redis 官方在 2020 年 5 月正式推出 6.0 版本,提供很多振奮人心的新特性,所以備受關注。

碼老溼,提供了啥特性呀?知道了我能加薪麼?

主要特性如下:

  1. 多線程處理網絡 IO;

  2. 客戶端緩存;

  3. 細粒度權限控制(ACL);

  4. RESP3 協議的使用;

  5. 用於複製的 RDB 文件不在有用,將立刻被刪除;

  6. RDB 文件加載速度更快;

其中備受關注的就是「多線程模型 + 客戶端緩存」,我們只有掌握了新特性原理,才能判斷什麼時候使用 6.0 版本,如何用的更好更快,不踩坑。

本篇先從 Redis 多線程模型開始,至於客戶端緩存、等且聽下回分解。

最後,點擊下方卡片關注「碼哥字節」能加薪。

公衆號

碼老溼,Redis 6.0 之前爲什麼不使用多線程?

官方答覆:

Redis 通過 AE 事件模型以及 IO 多路複用等技術,處理性能非常高,因此沒有必要使用多線程。

單線程機制讓 Redis 內部實現的複雜度大大降低,Hash 的惰性 Rehash、Lpush 等等『線程不安全』的命令都可以無鎖進行

在《Redis 爲什麼這麼快?》碼哥有詳細介紹快的原理

Redis 6.0 之前單線程指的是 Redis 只有一個線程幹活麼?

非也,Redis 在處理客戶端的請求時,包括獲取 (socket 讀)、解析、執行、內容返回 (socket 寫) 等都由一個順序串行的主線程處理,這就是所謂的「單線程」

其中執行命令階段,由於 Redis 是單線程來處理命令的,所有每一條到達服務端的命令不會立刻執行,所有的命令都會進入一個 Socket 隊列中,當 socket 可讀則交給單線程事件分發器逐個被執行。

此外,有些命令操作可以用後臺線程或子進程執行(比如數據刪除、快照生成、AOF 重寫)。

碼老溼,那 Redis 6.0 爲啥要引入多線程呀?

隨着硬件性能提升,Redis 的性能瓶頸可能出現網絡 IO 的讀寫,也就是:單個線程處理網絡讀寫的速度跟不上底層網絡硬件的速度

讀寫網絡的 read/write 系統調用佔用了 Redis 執行期間大部分 CPU 時間,瓶頸主要在於網絡的 IO 消耗, 優化主要有兩個方向:

添加對用戶態網絡協議棧的支持,需要修改 Redis 源碼中和網絡相關的部分(例如修改所有的網絡收發請求函數),這會帶來很多開發工作量。

而且新增代碼還可能引入新 Bug,導致系統不穩定。

所以,Redis 採用多個 IO 線程來處理網絡請求,提高網絡請求處理的並行度。

需要注意的是,Redis 多 IO 線程模型只用來處理網絡讀寫請求,對於 Redis 的讀寫命令,依然是單線程處理

這是因爲,網絡處理經常是瓶頸,通過多線程並行處理可提高性能。

而繼續使用單線程執行讀寫命令,不需要爲了保證 Lua 腳本、事務、等開發多線程安全機制,實現更簡單。

架構圖如下

圖片來源:後端研究所

主線程與 IO 多線程是如何實現協作呢?

如下圖:

Redis 多線程與 IO 線程

主要流程

  1. 主線程負責接收建立連接請求,獲取 socket 放入全局等待讀處理隊列;

  2. 主線程通過輪詢將可讀 socket 分配給 IO 線程;

  3. 主線程阻塞等待 IO 線程讀取 socket 完成;

  4. 主線程執行 IO 線程讀取和解析出來的 Redis 請求命令;

  5. 主線程阻塞等待 IO 線程將指令執行結果回寫回 socket完畢;

  6. 主線程清空全局隊列,等待客戶端後續的請求。

思路:將主線程 IO 讀寫任務拆分出來給一組獨立的線程處理,使得多個 socket 讀寫可以並行化,但是 Redis 命令還是主線程串行執行。

如何開啓多線程呢?

Redis 6.0 的多線程默認是禁用的,只使用主線程。如需開啓需要修改 redis.conf 配置文件:io-threads-do-reads yes

碼老溼,線程數是不是越多越好?

當然不是,關於線程數的設置,官方有一個建議:4 核的機器建議設置爲 2 或 3 個線程,8 核的建議設置爲 6 個線程,線程數一定要小於機器核數。

線程數並不是越大越好,官方認爲超過了 8 個基本就沒什麼意義了。

另外,開啓多線程後,還需要設置線程數,否則是不生效的

io-threads 4

總結與思考

隨着互聯網的飛速發展,互聯網業務系統所要處理的線上流量越來越大,Redis 的單線程模式會導致系統消耗很多 CPU 時間在網絡 I/O 上從而降低吞吐量,要提升 Redis 的性能有兩個方向:

後者依賴於硬件的發展,暫時無解。所以只能從前者下手,網絡 I/O 的優化又可以分爲兩個方向:

模型缺陷

Redis 的多線程網絡模型實際上並不是一個標準的 Multi-Reactors/Master-Workers模型。

Redis 的多線程方案中,I/O 線程任務僅僅是通過 socket 讀取客戶端請求命令並解析,卻沒有真正去執行命令。

所有客戶端命令最後還需要回到主線程去執行,因此對多核的利用率並不算高,而且每次主線程都必須在分配完任務之後忙輪詢等待所有 I/O 線程完成任務之後才能繼續執行其他邏輯。

在我看來,Redis 目前的多線程方案更像是一個折中的選擇:既保持了原系統的兼容性,又能利用多核提升 I/O 性能。

大家覺得有所幫助希望可以動動手指點贊、分享、收藏、留言呀。

也可加「碼哥」微信「MageByte1024」進入專屬讀者羣一起探討更多面試遇到的問題,碼哥知無不答。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/My7_KtzX_nV3A5NQDwijlw