美團酒旅數據治理實踐

一、背景

1. 爲什麼要做數據治理

隨着移動互聯網的興起,線下商業活動逐漸開始向線上化發展,數據的產生速度有了極大的提升。越來越多的公司開始認識到數據的重要性,並將其打造成爲公司的核心資產,從而驅動業務的發展。在數據相關的領域中,“數據治理” 這個話題近兩年尤爲火熱,很多公司特別是大型互聯網公司都在做一些數據治理的規劃和動作。

爲什麼要做數據治理?因爲在數據產生、採集、加工、存儲、應用到銷燬的全過程中,每個環節都可能會引入各種質量、效率或安全相關的問題。在公司早期的發展階段,這些數據問題對公司發展的影響並不是很大,公司對問題的容忍度相對也比較高。但是,隨着業務的發展,公司在利用數據資產創造價值的同時,對數據質量和穩定性要求也有所提升。此外,當數據積累得越來越多,公司對數據精細化運營程度的要求也隨之提高,會逐漸發現有很多問題需要治理。

2. 需要治理哪些問題

數據治理是一項需要長期被關注的複雜工程,這項工程通過建立一個滿足企業需求的數據決策體系,在數據資產管理過程中行使權力、管控和決策等活動,並涉及到組織、流程、管理制度和技術體系等多個方面。一般而言,數據治理的治理內容主要包括下面幾個部分:

3. 美團酒旅數據現狀

2014 年,美團酒旅業務成爲獨立的業務部門,到 2018 年,酒旅平臺已經成爲國內酒旅業務重要的在線預訂平臺之一。業務發展速度較快,數據增長速度也很快。在 2017 到 2018 兩年裏,生產任務數以每年超過一倍的速度在增長,數據量以每年兩倍多的速度在增長。如果不做治理的話,根據這種接近指數級的數據增長趨勢來預測,未來數據生產任務的複雜性及成本負擔都會變得非常之高。在 2019 年初,我們面臨着下面五種問題:

4. 治理目標

2019 年,美團酒旅數據團隊開始主動啓動數據治理工作,對數據生命週期全鏈路進行體系化數據治理,期望保障數據的長期向好,解決數據各個鏈路的問題,並保持數據體系的長期穩定。具體的目標包含以下幾個方面:

  1. 建立數據開發全鏈路的標準規範,提高數據質量,通過系統化手段管理指標口徑,保障數據一致性。

  2. 控制大數據成本,避免大數據機器成本膨脹對業務營收帶來的影響,合理控制數據的生命週期,避免數據重複建設,減少數據冗餘,及時歸檔和清理冷數據。

  3. 管理數據的使用安全,建立完善的數據安全審批流程和使用規範,確保數據被合理地使用,避免因用戶數據泄露帶來的安全風險和商業損失。

  4. 提高數據工程師的開發和運維效率,減少他們數據運營時間的投入,提高數據運營的自動化和系統化程度。

二、數據治理實踐

其實早在 2018 年以前,酒旅數據組就做過數據治理,當時只是從數倉建模、指標管理和應用上單點做了優化和流程規範。之後,基於上面提到的五個問題,我們又做了一個體系化的數據治理工作。下面將介紹一下美團酒旅數據團隊在數據治理各個方向上的具體實踐。

1. 數據治理策略

數據治理方案需要覆蓋數據生命週期的全鏈路,我們把數據治理的內容劃分爲幾大部分:組織、標準規範、技術、衡量指標。整體數據治理的實現路徑是以標準化的規範和組織保障爲前提,通過做技術體系整體保證數據治理策略的實現。同時,搭建數據治理的衡量體系,隨時觀測和監控數據治理的效果,保障數據治理長期向好的方向發展。

2. 標準化和組織保障

我們制定了一個全鏈路的數據標準,從數據採集、數倉開發、指標管理到數據生命週期管理,全鏈路建立標準,在標準化建立過程中聯合組建了業務部門的數據管理委員會。

2.1 標準化

數據標準化包括三個方面:一是標準制定;二是標準執行;三是在標準制定和執行過程中的組織保障,比如怎麼讓標準能在數據技術部門、業務部門和相關商業分析部門達成統一。

從標準制定上,我們制定了一套覆蓋數據生產到使用全鏈路的數據標準方法,從數據採集、數倉開發、指標管理到數據生命週期管理都建立了相應環節的標準化的研發規範,數據從接入到消亡整個生命週期全部實現了標準化。

2.2 組織保障

根據美團數據管理分散的現狀,專門建立一個職能全面的治理組織去監督執行數據治理工作的成本有點太高,在推動和執行上,阻力也會比較大。所以,在組織保障上,我們建立了委員會機制,通過聯合業務部門和技術部門中與數據最相關的團隊成立了數據管理委員會,再通過委員會去推動相關各方去協同數據治理的相關工作。

業務部門的數據接口團隊是數據產品組,數據技術體系是由數據開發組負責建設,所以我們以這兩個團隊作爲核心建立了業務數據管理委員會,並由這兩個團隊負責聯合業務部門和技術部門的相關團隊,一起完成數據治理各個環節工作和流程的保障。組織中各個團隊的職責分工如下:

數據管理委員會:負責數據治理策略、目標、流程和標準的制定,並推動所有相關團隊達成認知一致。業務數據產品組:負責數據標準、需求對接流程、指標統一管理、數據安全控制以及業務方各部門的協調推動工作。技術數據開發組:負責數據倉庫、數據產品、數據質量、數據安全和數據工具的技術實現,以及技術團隊各個部門的協調推動工作。

3. 技術系統

數據治理涉及的範圍非常廣,需要協作的團隊也很多,除了需要通過組織和流程來保障治理行動正常開展,我們也考慮通過技術系統化和自動化的方式進一步提效,讓系統代替人工。下面我們將從數據質量、數據成本、數據安全和運營效率等幾個方向,來逐一介紹技術實現方案。

3.1 數據質量

數據質量是影響數據價值最重要的因素,高質量的數據給帶來準確的數據分析,錯誤的數據會把業務引導到錯誤的方向。數據質量涉及範圍較廣,在數據鏈路的每一個環節都有可能出現數據質量問題,酒旅業務現階段的主要質量問題包括:

數據組的治理數據質量方案覆蓋了數據生命週期的各個環節,下面將介紹一下整體的技術架構。

3.1.1 統一數倉規範建模(One Model)

在業務發展初期,數據團隊集中精力在快速建設數倉來支持業務,數倉建模規範疏於管理。隨着業務的發展,數倉中的數據急劇增多,數據產品和下游應用快速增加,數據工程師和數據使用方也變得越來越多,數倉的問題日益突顯。業務數據倉庫從初期發展到現在主要暴露了 3 方面的問題:

數據團隊主要通過數倉規範化制定、數倉分層架構和數倉規範化系統來解決上述問題,下面是我們的具體解決方案。

制定標準 - 數倉規範

做好數倉規範化最基本的前提是要制定一系列標準化的規範,並推動組內同學執行。標準化的適用性、全面性和可執行性直接影響到規範的執行效果。數倉規範主要從 3 個方面制定數據標準化:

工具保障 - 數倉規範化開發系統 - Dataman

在執行數據規範化的過程中,我們發現團隊中每個人對規範的理解不一致,很可能造成數據規範不統一,審覈人在審覈上線任務時需要考慮規範的全部規則,審批需要投入的人力較多。在這樣的流程下,數據規範性無法從根源上進行控制,因此需要建設數據規範化的工具,通過系統保障規範的一致性。數據組使用的數據層規範化工具 - Dataman,主要包括 3 個功能模塊:標準化規範、配置化開發和規則化驗證。

3.1.2 統一指標邏輯管理(One Logic)

業務使用數據的第一步是搭建業務指標體系,業務的目標和策略的執行情況需要通過指標來分析,指標體系的合理性和指標數據的質量直接影響到業務決策,指標的重要性不言而喻。我們通過系統化地管理數據指標,從根源上解決指標口徑一致性問題,主要從以下 3 個方向入手:

指標定義規範化

此處主要從指標的生成和管理上做好規範,確保業務同學和研發人員對指標體系管理的認知一致,確保指標的新建、更改和使用都按照規範執行。我們通過下面 2 個方向來實現指標定義的規範統一。

指標管理系統化

物理數據表管理:數據表管理的信息主要包括表的基礎元數據信息、表類型(維表或事實表)、表的推薦度、描述信息和樣例數據等。數據表管理主要是面向數據開發同學,通過維護數據表信息,爲數據模型和指標管理提供數據基礎支持。

數據模型管理:是對物理數據表的模型構建,通過一個物理模型可以查詢到指標和相關的維度數據。數據模型可以是星型模型或寬表,星型模型中維護多個數據表的關聯方式、關聯字段、維度表包含字段和模型的 ER 圖等信息。

指標管理:主要包括 2 部分的內容,指標的業務信息和技術信息。

指標查詢智能化

在指標管理系統中創建指標時,我們系統化管理了指標與數倉物理模型的關聯關係和取數邏輯,通過數據物理模型獲得指標對應的字段和可以關聯的維度,以此把指標解析爲數據查詢 SQL 語句,通過數據查詢引擎執行生產的 SQL,智能化獲得指標數據。

在查詢解析過程中,經常出現指標綁定了多個底層數據表的情況,此時需要我們手動的選一個物理模型作爲指標生產的底層數據。但問題是,如果一個指標對應的模型太多,每次解析都需要手動指定,研發人員不確定選擇哪個模型的性能最好。另外,隨着物理模型的增多,大量舊的指標配置的關聯模型不是最優解,就需要手動優化更改。爲了解決這個問題,指標管理系統增加了智能解析模塊,在選擇智能模式查詢時,系統會根據指標管理模型的數據量、存儲性能和查詢次數等信息自動選取最優的物理模型。

3.1.3 統一數據服務(One Service)

數據倉庫對外提供數據的需求越來越多,除了管理層、分析師和產品運營同學使用數據產品和報表外,數據還需要提供到各個業務系統中使用。常用的提供數據的方式主要包括同步數據表、提供 SQL 和爲下游服務開發定製化 API 接口等方式,但存在以下幾個方面的問題:

從 2018 年開始,數據 BP 中心與分析系統中心合作建設了統一數據 API 服務平臺(Buffalo),通過開發可配置的數據接口服務平臺實現數據對外的靈活提供,並實現對數據服務的下游使用及性能的可監控。統一的數據服務平臺解決了幾個比較關鍵的問題:

3.1.4 統一用戶產品入口(One Portal)

如果不加控制,數據產品就會建設得越來越多。酒旅業務在 2018 年有超過 10 個數據相關產品的入口,用戶很難快速地找到自己想要查的數據產品和報表。不同產品面對的用戶不一樣,數據的使用場景和展示方式也各不相同,業務方在使用數據時不知道從哪裏能看到最全面的數據產品。

此外,也存在因爲適用場景不一樣,導致面向不同用戶的數據邏輯不同的情況,比如某些業務同學查看的 GMV 不包含民宿數據,但是商業分析團隊要看的 GMV 是包含民宿數據的。爲了能夠讓業務方能夠在一個數據產品門戶中找到更全面的數據,且這個產品門戶中多個產品的數據邏輯是一致的,我們將數據門戶按照使用用戶和應用場景劃分爲 3 類:

3.1.5 整體系統架構

整體的技術架構分爲三層,從統一數據建模到統一指標邏輯、統一數據服務和統一產品入口,整體保障了數據的質量,同時配合數據管理的組織保障體系和流程規範,將整體數據質量相關的架構搭建起來。

3.2 數據運營效率

數據工程師在日常工作中的主要工作包括兩大部分:數據開發和數據運營。我們在前面介紹了通過數據開發和指標管理相關的工具系統建設,開發效率得到了大幅提升。而數據運營是另一大類工作,他們的主要時間投入在數據使用諮詢和數據問題答疑,大概佔數據工程師日常工作 5%~10% 的時間。

數據工程師日常投入到運營的人力多的主要原因是信息不對稱和信息檢索能力弱,數據團隊建設了很多數據模型和數據產品,但是用戶不知道怎麼快速地找到和使用這些數據,問題主要體現在下面 3 個方面:

3.2.1 方案思路

數據團隊通過數據資產信息的系統化的方式建設易用的數據檢索產品,幫助用戶更快捷、更方便地找到數據,並指導用戶正確地使用數據,提高數據信息的易用性,以此減少數據工程師的數據答疑和運維時間。實現策略是通過用戶的問題分類,通過數據信息系統化的方式分類解答 80% 的問題,最後少量的問題透傳到研發人員再進行人工答疑。系統化方式主要分兩層,數據使用智能和數據答疑機器人。

3.2.2 數據使用指南系統

數據使用指南的定位是業務數據信息的知識白皮書,提供最新、最全、最準確的指標口徑、項目指標體系、數據表用法等信息,以簡潔、流暢的操作支持數據指南中的內容及時更新,降低業務方的數據答疑和數據使用成本。

數據使用指南通過把業務場景和數據使用場景打通,從業務場景分析到使用到的數據表、指標和數據產品打通,在系統中能夠快速找到數據表、指標定義、數據查詢 SQL、指標所在數據產品等信息,一站式解決數據查找、使用和分析的全部場景。主要功能包括指標信息和數據表信息及使用。

3.2.3 數據答疑機器人

用戶在使用數據時,經常諮詢數據工程師一些問題,比如想找的數據在哪個表?指標怎麼取?業務系統的一個字段怎麼在數倉裏面取到?很多問題會被重複問到,每次解答都需要研發人員花費一定的時間,而通過 Wiki 的方式維護效果較差,於是我們考慮用自動化答疑的方式,把數據工程師在日常答疑過程中積累問題和答案,通過一定的規則匹配,當再次被問到時系統可以自動地給出解答。

使用日常答疑中積累的諮詢問題和答案作爲基礎答疑知識庫,數據答疑機器人使用美團 AI 平臺的摩西機器人搭建,配合問題答疑的策略,實現對歷史已有問題和答案通過搜索匹配後發送給用戶,具體實現方式如下:

3.3 數據成本

大數據的主要成本構成有 3 大部分,計算資源、存儲資源和日誌採集資源,其中計算資源和存儲佔總成本超過 90%,我們的數據成本治理主要是針對大數據計算和存儲這兩個部分。

大數據成本優化方案

3.4 數據安全

數據資產對業務來說既是價值,也是風險。數據安全作爲業務部門 “事關生死” 的核心工作,在技術架構上會從數據產生到數據應用各個環節進行控制,保障數據應用事前有控制、事中有監控和事後有審計。數據安全控制從業務系統開始對用戶高敏感數據加密,在數倉進行分級和脫敏,在應用層做密文數據權限和密鑰權限的雙重保障,管控用戶相關的高敏感數據,按照三層系統控制加五個使用原則實現如下:

4. 衡量指標

業務部門在業務發展初級就會建立指標體系,並使用數據指標對各個業務過程做精細化的分析,衡量業務目標的達成情況和行動的執行程度。數據治理也需要一套成熟穩定的衡量指標體系,對數據體系做到長期、穩定和可量化的衡量。我們通過制定體系化的數據衡量指標體系,來及時監測數據治理過程中哪些部分做的好,哪些部分還有問題。

4.1 衡量指標建設

爲了能夠不重不漏地把指標都建立起來,我們從 2 個方面進行考慮:

4.2 衡量指標保障數據治理

根據 PDCA 原則,將數據治理作爲日常的運營項目做起來,底層依賴數據指標體系進行監控,之上從發現問題到提出優化方案,然後跟進處理,再到日常監控,構成一個完整的循環。

5. 治理效果總結

數據治理覆蓋了數據生命週期全鏈路,通過圍繞數據從產生到價值消亡全部生命週期,建立數據治理組織、制定治理衡量體系和建設治理技術系統來達到數據治理目標。經過體系化的數據治理,數據系統的治理、成本、安全和運營效率都有了比較大的改善。

三、未來規劃

數據治理分爲三個大階段:被動治理、主動治理、自動治理。

目前,美團酒旅業務數據治理處在第二階段和第三階段之間,雖然有整體治理計劃、技術架構和組織保障,但仍需要投入一定的人力去做。未來,數據治理會繼續朝着智能化的方向進行探索,真正把自動化治理工作做得更好。

四、作者簡介

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/gp-g70P8qCvpi1LavXvOUw