數據倉庫指標體系搭建實戰

指標體系

1. 痛點分析

 主要從業務、技術、產品三個視角來看:

2. 管理目標

3. 模型架構

業務線

業務板塊定義原則:業務邏輯層面進行抽象、物理組織架構層面進行細分,可根據實際業務情況進行層級分拆細化,層級分級建議進行最多進行三級分拆,一級細分可公司層面統一規範確定,二級及後續拆分可根據業務線實際業務進行拆分。

例如滴滴出行領域業務邏輯層面兩輪車和四輪車都屬於出行領域可抽象出行業務板塊 (level 一級),根據物理組織架構層面在進行細分普惠、網約車、出租車、順風車(level 二級),後續根據實際業務需求可在細分, 網約車可細分獨乘、合乘,普惠可細分單車、企業級。

規範定義

指面向業務分析,將業務過程或者維度進行抽象的集合。其中,業務過程可以概括爲一個個不拆分的行爲事件,在業務過程之下,可以定義指標;維度,是度量的環境,如乘客呼單事件,呼單類型是維度。爲了保障整個體系的生命力,數據域是需要抽象提煉,並且長期維護更新的,變動需執行變更流程。

指公司的業務活動事件,如呼單、支付都是業務過程。其中,業務過程不可拆分。

用來明確統計的時間範圍或者時間點,如最近 30 天、自然周、截止當日等。

是對修飾詞的一種抽象劃分。修飾類型從屬於某個業務域,如日誌域的訪問終端類型涵蓋 APP 端、PC 端等修飾詞。

指的是統計維度以外指標的業務場景限定抽象,修飾詞屬於一種修飾類型,如在日誌域的訪問終端類型下,有修飾詞 APP、PC 端等。

原子指標和度量含義相同,基於某一業務事件行爲下的度量,是業務定義中不可再拆分的指標**,**具有明確業務含義的名稱,如支付金額。

維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也可以稱爲實體對象。維度屬於一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、周、日等級別內容)。

維度屬性隸屬於一個維度,如地理維度裏面的國家名稱、國家 ID、省份名稱等都屬於維度屬性。

  1. 原子指標 
    基於某一業務事件行爲下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如呼單量、交易金額

  2. 派生指標  
    是 1 個原子指標 + 多個修飾詞(可選)+ 時間週期,是原子指標業務統計範圍的圈定。派生指標又分以下二種類型:

  3. 事務型指標:
    是指對業務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標。

  4. 存量型指標:

    是指對實體對象(如司機、乘客)某些狀態的統計,例如註冊司機總數、註冊乘客總數,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標,對應的時間週期一般爲 “歷史截止當前某個時間”。

  5. 衍生指標
    是在事務性指標和存量型指標的基礎上覆合成的。主要有比率型、比例型、統計型均值 

模型設計

主要採用維度建模方法進行構建,基礎業務明細事實表主要存儲維度屬性集合和度量 / 原子指標;分析業務彙總事實表按照指標類別 (去重指標、非去重指標) 分類存儲,非去重指標彙總事實表存儲統計維度集合、原子指標或派生指標,去重指標彙總事實表只存儲分析實體統計標籤集合。

指標體系在數倉物理實現層面主要是結合數倉模型分層架構進行指導建設,滴滴的指標數據主要存儲在 DWM 層,作爲指標的核心管理層。

維度管理

包括基礎信息和技術信息,由不同角色進行維護管理。

指標管理

包括基礎信息、技術信息和衍生信息,由不同角色進行維護管理。 

原子指標定義歸屬信息 + 基本信息 + 業務場景信息派生指標定義時間週期 + 修飾詞集合 + 原子指標修飾類型主要包含類型說明、統計算法說明、數據源 (可選) 

**5. 指標體系建設流程 **

建模流程

建模流程主要是從業務視角指導工程師對需求場景涉及的指標進行主題抽象,歸類,統一業務術語,減少溝通成本,同時避免後續的指標重複建設。

分析數據體系是模型架構中彙總事實表的物理集合,業務邏輯層面根據業務分析對象或場景進行指標體系抽象沉澱。滴滴出行主要是根據分析對象進行主題抽象的,例如司機主題、安全主題、體驗主題、城市主題等。指標分類主要是根據實際業務過程進行抽象分類,例如司機交易類指標、司機註冊類指標、司機增長類指標等。 基礎數據體系是模型架構中明細事實表和基礎維度表的物理集合,業務邏輯層面根據實際業務場景進行抽象例如司機合規、乘客註冊等,還原業務核心業務過程。

開發流程

開發流程是從技術視角指導工程師進行指標體系生產、運維及質量管控,也是數據產品或數據分析師和數倉研發溝通協調的橋樑。

6. 指標體系圖譜建設

指標體系圖譜概述

指標體系圖譜也可稱爲數據分析圖譜主要是 依據實際業務場景抽象業務分析實體,整合梳理實體涉及的業務分類、分析指標和維度的集合。建設方法:主要是通過業務思維、用戶視角去構建,把業務和數據緊密關聯起來,把指標結構化分類組織。 

建設目的:

指標體系圖譜模型

指標體系圖譜實例

指標體系產品化

指標體系涉及的產品集主要是依據其生命週期進行相應建設,通過產品工具打通數據流,實現指標體系統一化、自動化、規範化、流程化管理。因爲指標體系建設本質目標是服務業務,實現數據驅動業務價值,所以建設的核心原則是 “輕標準、重場景,從管控式到服務式”。通過工具、產品、技術和組織的融合提高用戶使用數據效率,加速業務創新迭代。

其中 和指標體系方法論強相關產品就是指標字典工具的落地,其產品的定位及價值:

工具設計流程 (方法論 -> 定義 -> 生產 -> 消費)

指標定義

結束語

文章整體介紹了指標體系建設方法論 & 實踐和工具產品的建設情況,指標字典和開發工具已實現流程打通,與數據消費產品的打通後續會通過 DataAPI 方式提供數據服務。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/c6zK8edaYBOs1x8ox5Te5w