基於 Flink SQL 構建流批一體實時數倉

基於 Flink 構建流批一體的實時數倉是目前數據倉庫領域比較火的實踐方案。隨着 Flink 的不斷迭代,其提供的一系列技術特性使得用戶構建流批一體的應用變得越來越方便。本文主要分享基於 FinkSQL 構建實時數倉的基本架構以及相關的技術點,

希望本文對你有所幫助,以下是全文:

流處理 VS 批處理

五個基本概念

維表 JOIN 與雙流 JOIN

兩種架構對比

傳統數倉

  1. 兩條計算鏈路、造成重複工作、計算資源浪費
  2. 兩套數據模型,一致性難以保障

實時數倉

一個綜合實操

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/eeINhL3HXZazpgEqCnTuWw