基於 Flink SQL 構建流批一體實時數倉
基於 Flink 構建流批一體的實時數倉是目前數據倉庫領域比較火的實踐方案。隨着 Flink 的不斷迭代,其提供的一系列技術特性使得用戶構建流批一體的應用變得越來越方便。本文主要分享基於 FinkSQL 構建實時數倉的基本架構以及相關的技術點,
希望本文對你有所幫助,以下是全文:
-
兩個前置知識
-
五個基本概念
-
兩個具體實現
-
兩種架構對比
-
一個綜合實操
流處理 VS 批處理
五個基本概念
維表 JOIN 與雙流 JOIN
兩種架構對比
傳統數倉
- 問題
- 兩條計算鏈路、造成重複工作、計算資源浪費
- 兩套數據模型,一致性難以保障
實時數倉
-
統一了基礎公共數據
-
保障了流批結果的一致性
-
提升了離線數倉的時效性
-
減少了組件和鏈路的維護成本
一個綜合實操
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/eeINhL3HXZazpgEqCnTuWw