HDFS 技術原理(下)

HDFS 體系結構

HDFS 體系結構概述:

HDFS 採用了主從(Master/Slave)結構模型,一個 HDFS 集羣包括一個名稱節點(NameNode)和若干個數據節點(DataNode)。名稱節點作爲中心服務器,負責管理文件系統的命名空間及客戶端對文件的訪問。集羣中的數據節點一般是一個節點運行一個數據節點進程,負責處理文件系統客戶端的讀 / 寫請求,在名稱節點的統一調度下進行數據塊的創建、刪除和複製等操作。每個數據節點的數據實際上是保存在本地 Linux 文件系統中的。

HDFS 命名空間管理:

通信協議:

客戶端:

HDFS 體系結構的侷限性:

HDFS 只設置唯一一個名稱節點,這樣做雖然大大簡化了系統設計,但也帶來了一些明顯的侷限性,具體如下:

  1. 命名空間的限制:名稱節點是保存在內存中的,因此,名稱節點能夠容納的對象(文件、塊)的個數會受到內存空間大小的限制。

  2. 性能的瓶頸:整個分佈式文件系統的吞吐量,受限於單個名稱節點的吞吐量。

  3. 隔離問題:由於集羣中只有一個名稱節點,只有一個命名空間,因此,無法對不同應用程序進行隔離。

  4. 集羣的可用性:一旦這個唯一的名稱節點發生故障,會導致整個集羣變得不可用。

HDFS 常用參數配置

1

2

3

HDFS 常用維護命令

4

5

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/QvQgb2kMorrXEbY8sBGKaQ