如何通過緩存來提升系統性能

緩存

在系統中最消耗性能的地方就是對數據庫的訪問了，一般來說，增、刪、改操作不會出現什麼性能問題，除非索引太多，並且數據量有十分龐大的情況下，這三個操作纔會導致性能問題。一般可以限制單表索引的數量來提升性能，比如單表的索引數量不能超過 5 個。

絕大多數情況下，性能問題都出在查詢上，select 操作提供了非常豐富的語法，這些語法包括函數，子查詢，like 子句，where 子句等，這些查詢都是非常消耗性能的。大部分應用都是讀多寫少的應用，所以查詢慢的問題會被放大了，導致慢查詢成爲了系統性能的瓶頸，這是就需要用到緩存來提高系統的性能。

緩存爲什麼能提供系統性能？

緩存通過減少系統對數據庫的訪問量來提高系統性能。試想一下，如果有 100 個請求同時請求同一個數據，沒有加緩存之前，需要訪問 100 次數據庫，而加了緩存之後，可能只需訪問 1 次數據庫，剩下的 99 個請求的數據從緩存中取，大大的較少了數據庫的訪問量，雖然同樣需要訪問 100 次，但數據庫的讀取性能和緩存的讀取性能不在一個級別上，所以對系統性能提升顯著。爲什麼說可能需要訪問 1 次數據庫呢，這個和過期有關，後面會講。

更新模式

既然知道了緩存對系統性能提升顯著，那下面先來了解一下緩存如何更新吧。

Cache Aside（推薦）

這應該是最常用的更新模式了，這種模式大致流程如下：

讀取

如果緩存中沒有，則再從數據庫中讀取數據，得到數據之後，放入緩存。
如果緩存中有，取到後直接返回。

更新

先更新數據庫裏的數據，成功後，讓緩存失效。

爲什麼是讓緩存失效而不是更新緩存呢？

主要是因爲兩個併發寫操作導致髒數據。試想一下，有兩個線程 A 和 B，分別要將資源 A 的值修改爲 1 和 2，線程 A 先到達數據庫把數據更新爲 1，但還沒更新緩存，由於時間片用完了，此時線程 B 獲得了 CPU，並在這期間把數據庫資源 A 的值和緩存的值都更新爲 2，線程 B 結束後，線程 A 重新獲得 CPU，執行更新緩存，把資源 A 的值改爲 1，線程 A 結束。此時，數據庫中 A 的值爲 2，而緩存中 A 的值爲 1，數據不一致。所以讓緩存失效就不會有這個問題，保證緩存中的數據和數據庫的保持一致。

那是不是 Cache Aside 模式就不會有併發問題了呢？

不是的。比如，一個讀操作，沒有命中緩存，就去數據的讀取數據（A=1），此時一個寫操作，更新數據庫數據（A=2）並讓緩存失效，此時讀操作把讀取到的數據（A=1）寫到緩存中，導致髒數據。

這種情況理論上會出現，但現實情況中出現的幾率極低。要這種情況出現必須在一個讀操作發生時，有一個併發寫操作，並且既要讀操作要於寫操作寫入前讀取，又要後於寫操作寫入緩存。滿足這種條件的概率並不大。

基於出現上面所描述的問題，目前有兩種比較合理的解決方案：

通過 2PC 這種保證數據的一致性（複雜）；
通過降低併發時髒數據的概率，並設置合理的過期時間（簡單，但存在一定時間內的錯誤率，一般可以接受）。

Read/Write Through

在這種模式下，對於應用程序來說，所有的讀寫請求都是直接和緩存打交道，關於數據庫的數據完全由緩存服務來更新（更新同步爲同步操作）。

這種模式下流程就相當簡單了，完全就是對緩存的讀寫。

缺點：這種模式對緩存服務有強依賴性，要求緩存具備高可用性。所以應有沒有上一種普遍。

Write Behind Caching

其實這個模式就是 Read/Write Through 的一個變種，區別就在於前者是異步更新，後者是同步更新。

既然是異步更新數據庫，他的相應速度比 Read/Write Through 還要高，並且還能合併對同一個數據的多次操作。這個有點像 MySQL 的 buffer pool 的刷盤操作。

缺點：異步就代表數據不是強一致性的，還存在數據丟失的風險，實現邏輯也較爲複雜。

設計思路

無狀態的服務

在分佈式系統中，無狀態的服務有利於橫向擴展，所以緩存也應該獨立於業務服務在外，設計成一個獨立的服務，使業務服務變成無狀態的。很多公司都選擇是用 Redis 來搭建他們的緩存系統，取決於其高速的讀寫性能。

命中率

一個緩存服務的好壞主要看命中率，一般來說，命中率保存在 80% 以上已經算很高了，但我們不能爲了提高命中率而把數據庫的全部數據的寫到緩存了，這個是不符合緩存的設計理念，而且需要極大的內存空間。通常來說，應該只有小部分熱點數據寫到緩存。 緩存是通過犧牲強一致性來換取性能的，並不是所有的業務的適合使用緩存。

有效時間

緩存數據的有效時間不易過短，不易過長，不易過於集中。

過短，會增加數據庫訪問的次數。
過長容易不使用的數據一直停留在緩存中，浪費空間，並且一旦產生髒數據，過程的有效時間會導致髒數據遲遲無法失效，進而導致影響更多的業務。
過於集中，會導致緩存雪崩。

淘汰策略

當內存不足時，緩存系統就要按照淘汰策略，把不適合留在緩存的數據淘汰掉，騰出位置給新數據。下面就以 Redis 爲例，給出了淘汰策略：

noeviction: 不刪除策略, 達到最大內存限制時, 如果需要更多內存, 直接返回錯誤信息 (有極少數會例外, 如 DEL)。
allkeys-lru: 所有 key 通用，優先刪除最近最少使用 (less recently used ,LRU) 的 key。（推薦）
volatile-lru: 只限於設置了 expire 的部分，優先刪除最近最少使用 (less recently used ,LRU) 的 key。
allkeys-random: 所有 key 通用，隨機刪除一部分 key。
volatile-random: 只限於設置了 expire 的部分，隨機刪除一部分 key。
volatile-ttl: 只限於設置了 expire 的部分，優先刪除剩餘時間 (time to live,TTL) 短的 key。

可根據項目實際情況進行選擇。

小結

緩存是爲了加速數據的訪問，在數據庫之上的一直機制，並非所有業務都適合使用緩存，要根據具體情況選擇更新策略和淘汰策略。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/HkJPweCzaQGMHfqkqJgotg

緩存