一文看懂分級存儲管理(HSM)

譯者 | 布加迪

審校 | 孫淑娟

HSM 讓您能夠以一種安全、經濟高效的方式存儲數據,本文對它作了一番基本的介紹。  

如果您負責管理企業數據,就知道存儲有利有弊。一方面,能夠訪問大量數據對商業決策大有幫助。另一方面,存儲所有這些數據可能很費錢,而且管理起來非常混亂。

這時候分級存儲管理(HSM)就有了用武之地。HSM 是一種以安全、經濟高效的方式存儲數據的系統。本文簡要介紹了 HSM、定義、工作原理以及它爲貴組織帶來的一些好處。

HSM 是什麼?

分級存儲管理(HSM)是一種以安全、經濟高效的方式存儲數據的系統。HSM 背後的基本想法是將數據存儲在類型最合適的存儲介質上,這取決於訪問數據的頻次。

比如說,訪問頻繁的數據可以存儲在較昂貴、性能較高的存儲介質上,比如固態硬盤(SSD),而訪問不大頻繁的數據可以存儲在較便宜、性能較低的存儲介質上,比如普通硬盤(HDD)。

雖然 HSM 是一個由來已久的概念,但由於技術存儲和通信方法方面的進步,自問世以來已發生了巨大的變化。然而,儘管數據大小和訪問時間等方面今非昔比,但很多最初的概念今天仍然很受歡迎,只是在處理大數據時規模要大得多。

HSM 系統是如何工作的?

HSM 系統的工作原理是,根據數據需要訪問的頻次,在不同的存儲層之間自動移動數據。頻繁訪問的數據將存儲在快速、昂貴的存儲介質(比如 SSD)上,不常訪問的數據將被轉移到較慢、較便宜的存儲介質上。這確保了用戶總是能夠快速訪問所需的數據,同時又儘量降低存儲成本和用電量。

HSM 可與大多數計算機 CPU 上的緩存相媲美。與 CPU 緩存一樣,經常使用的數據存儲在小而快的 SRAM 內存中,不常使用的數據在需要加載新數據時轉移到較慢但較大的 DRAM 中。

HSM 組件和算法

HSM 系統通常由三個關鍵組件組成:數據遷移策略、數據管理算法和數據分層或緩存機制。數據遷移策略根據使用頻次或重要性等因素,定義了應該如何在不同的存儲設備之間移動數據。HSM 系統使用的算法可以根據數據訪問的頻次或數據大小等標準,幫助確定哪些數據應該存儲在哪個設備上。

其中一些算法包括最近最少使用置換算法,將最近沒有被訪問的數據移動到性能較低的存儲層。大小溫度置換算法是另一種常用的算法,它使用溫度閾值和大小閾值來確定何時遷移數據。啓發式閾值算法是一種較新的算法,利用機器學習技術更準確地預測何時應該遷移數據。

分層和緩存 HSM

關於分層還是緩存的爭論是 HSM 系統設計師在試圖確定利用較低性能存儲層的最佳方法時所面臨的問題。分層可以提供更好的長期性能,而緩存可以提供更好的短期性能。

無論您選擇對存儲進行分層還是緩存,這些機制都可以確保頻繁訪問的數據存儲在較快、較容易訪問的設備上,而不常訪問的數據存儲在較慢、較便宜的設備上。

HSM 的好處

主流的 HSM 解決方案

如今,市面上有許多不同的 HSM 解決方案。一些面向大數據的主要 HSM 解決方案包括如下:

請注意,上面這份清單並不完整,也不按特定的順序。目前市場上有許多不同的 HSM 解決方案,因此確保您的存儲工程師及其他數據專業人員花一些時間來比較幾款解決方案,以找到最適合貴公司需求的解決方案。

原文鏈接:

https://www.techrepublic.com/article/what-is-hierarchical-storage-management/

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/sGL7UwLv6i8i-EK0u7hTYA