美團點評:常態、異地、多機房、單集羣 Hadoop 架構實踐

**

**

        在談到 Hadoop 時,都會提到雲計算這個概念,人們也時常混淆這兩個概念。其實 Hadoop 是 Apache 旗下的一款開源軟件,它實現了包括分佈式文件系統 HDFS 和 MapReduce 框架在內的雲計算軟件平臺的基礎架構,並且在其上整合了數據庫、雲計算管理、數據倉儲等一系列平臺。雲計算是一種基於互聯網的計算,在其中共享的資源、軟件和信息以一種按需的方式提供給計算機和設備。可見,Hadoop 不等於雲計算,Hadoop 是一種技術的實現,而云計算更偏重於業務的建設。更具體一點來講,Hadoop 這款產品的技術實現,體現了雲計算體系中的一部分功能的應用技術架構。

雲計算藉助 IaaS、PaaS、SaaS 等業務模式,把強大的計算能力提供給終端用戶。Hadoop 主要解決的是分佈存儲、分佈式計算的問題,是雲計算的 PaaS 層的解決方案之一,但不等同於 PaaS。

       分佈式數據處理技術一方面與分佈式存儲形式直接相關,另一方面也與業務數據的溫度類型(冷數據、熱數據)相關。目前主要的數據處理計算模型包括 MapReduce 計算模型、DAG 計算模型、BSP 計算模型等。

      大數據的實時處理是一個很有挑戰性的工作,數據流本身具有持續到達、速度快且規模巨大等特點,所以需要分佈式的流計算技術對數據流進行實時處理。Storm 是這種技術的開源實現代表。

下載鏈接:

美團點評常態、異地、多機房、單集羣 Hadoop 架構實踐

下載鏈接:

美團點評常態、異地、多機房、單集羣 Hadoop 架構實踐

金融級數據庫容災技術報告(2021)

數據庫發展研究報告(2021 年)

分佈式數據庫原理和架構設計

本號資料全部上傳至知識星球,加入全棧雲技術知識星球下載全部資料。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/e3UPbpFHSgmwIqba9XCncg