隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)已經(jīng)成為企業(yè)決策的關鍵因素,很多企業(yè)都選擇通過構建數(shù)據(jù)倉庫來管理數(shù)據(jù)并支撐數(shù)據(jù)應用,從而實現(xiàn)整合數(shù)據(jù)源、提高數(shù)據(jù)質量、數(shù)據(jù)支持決策制定、提高企業(yè)競爭力、降低運營成本等目的。
然而,對于很多已經(jīng)實施和將要實施數(shù)據(jù)倉庫建設的企業(yè)來說,耗費大量的技術和資源構建好的數(shù)據(jù)倉庫究竟是否貼合實際業(yè)務?能否真正支撐企業(yè)決策?
我們和市面上很多已構建和計劃構建數(shù)據(jù)倉庫的企業(yè)深入溝通交流后,總結了幾點當前數(shù)倉建設所面臨的主要問題:
01、技術層面構建的數(shù)據(jù)倉庫無法貼合實際業(yè)務。
數(shù)倉建設一般都是技術人員根據(jù)已有系統(tǒng)庫中的數(shù)據(jù)進行構建,花費大量人力財力精力構建出的數(shù)倉并不貼合實際業(yè)務,業(yè)務層無法直接使用數(shù)據(jù)倉庫,甚至完全不懂數(shù)據(jù)倉庫。
02、異常數(shù)據(jù)無法追蹤溯源。
數(shù)倉建設大多都是使用SQL腳本來生成各個層級的數(shù)據(jù),出現(xiàn)異常數(shù)據(jù)時只能通過一步步解讀SQL來確定異常問題,整個過程耗時耗力且只能請專業(yè)的技術人員來查看。
03、匯總層內容繁多無法聚焦重點數(shù)據(jù)。
常用的數(shù)倉建設在最終形成匯總層時總是將各個來源的數(shù)據(jù)匯聚為一張大寬表,其中混雜著維度數(shù)據(jù)、指標數(shù)據(jù)、日期時間數(shù)據(jù)、標記數(shù)據(jù)等,無法快速聚焦重點數(shù)據(jù),一眼望去全是數(shù)據(jù)卻抓不到重點。
04、業(yè)務變動時又需重新構建數(shù)據(jù)倉庫。
企業(yè)的組織架構、業(yè)績標準、指標定義往往是在不斷迭代更新的,不可能一成不變,在這些內容發(fā)生變動時,已構建好的數(shù)倉又要推倒重來,根據(jù)新的標準重新建設數(shù)據(jù)倉庫,整個過程周期長、難開發(fā),導致數(shù)據(jù)倉庫完全無法使用。
針對以上種種問題,我們美林數(shù)據(jù)深耕數(shù)據(jù)治理方案多年,總結出一套以業(yè)務為主導,輕量化構建數(shù)據(jù)倉庫的實施方法。
輕量化構建數(shù)據(jù)倉庫:以指標為牽引,通過維度表和事實表的關聯(lián)直接開發(fā)關鍵指標數(shù)據(jù),并將成果以匯總表的形式落庫形成數(shù)據(jù)倉庫。
01、梳理企業(yè)指標
從企業(yè)現(xiàn)有業(yè)務系統(tǒng)入手,梳理出各項業(yè)務流程、并明確每項業(yè)務流程中涉及的所有業(yè)務活動,再從業(yè)務活動中精確提取所產(chǎn)生的指標數(shù)據(jù),根據(jù)系統(tǒng)和流程確定指標體系和關鍵指標。也可以參考國資委數(shù)字化考核要求、一利五率要求等等,對于大多數(shù)企業(yè)來說,也會有基于自身發(fā)展提出的企業(yè)年度/月度經(jīng)營目標。我們可以從這些建設目標入手,梳理出這些目標的達成條件,明確目標達成過程中產(chǎn)生的指標數(shù)據(jù),再層層剖析關鍵指標和指標體系。例如在采購系統(tǒng)中,可以根據(jù)實際的采購業(yè)務流程梳理出每個節(jié)點的關鍵指標。
02、構建維度表,關聯(lián)事實表
在數(shù)據(jù)倉庫中,維度表是與事實表相對應的表。維度表是維度建模的基礎和靈魂。事實表緊緊圍繞業(yè)務過程進行設計,存儲度量數(shù)據(jù),如銷售額、數(shù)量、收入等,而維度表則圍繞業(yè)務過程所處的環(huán)境進行設計,維度表存儲描述度量數(shù)據(jù)的各個方面的信息,例如時間、地理位置、產(chǎn)品、客戶等。維度表主要包含一個主鍵和各種維度字段,維度字段稱為維度屬性。
例如,我們基于上一步中梳理好的關鍵指標構建“物料維度表”和“供應商維度表”。規(guī)范化各個維度屬性的命名規(guī)范,通過唯一值來關聯(lián)“采購庫存事實表”,將多個維度表和事實表相關聯(lián),在不創(chuàng)建大寬表的情況下將關鍵指標和規(guī)范維度屬性相關聯(lián),就算后續(xù)業(yè)務活動中指標數(shù)據(jù)或維度屬性發(fā)生了變化,也只需改動所關聯(lián)的數(shù)據(jù)表內字段,其余相關數(shù)據(jù)隨之調整,無需再重新構建匯總層數(shù)據(jù)。
指標都是匯總計算出來的,有聚合過程。
例如單筆訂單的金額不能是一個指標,統(tǒng)計一天的訂單金額才是指標。
指標需要維度進行多方面的描述分析,維度可以根據(jù)需要無限擴展。
根據(jù)原子-衍生-復合指標的計算順序,依次計算出規(guī)范化指標數(shù)值。
? 原子指標指的是基于業(yè)務過程的度量值,顧名思義是不可以在進行拆分的指標;
? 衍生指標是在原子指標的基礎上增加維度、時間限定、過濾條件創(chuàng)建而成的;
? 復合指標是在一個或多個衍生指標的基礎上,通過各種邏輯運算符合而成的。
例如,匯總每筆訂單的采購金額為原子指標,而在此基礎上匯總計算“每月”“已入庫”且“質量上等”的訂單采購金額為衍生指標,這樣的訂單金額與同等條件下的預算款相比就是節(jié)約成本數(shù)據(jù),我們將此定義為復合指標。
04、匯總模型,構建數(shù)倉
將構建完成的指標匯總落庫,生成一張基于實際業(yè)務活動的匯總事實表,表中僅保留指標、維度、統(tǒng)計周期字段數(shù)據(jù)。保證匯總層數(shù)據(jù)均是出自企業(yè)實際業(yè)務活動的關鍵指標,構建起真正服務于企業(yè)實際業(yè)務需求的數(shù)據(jù)倉庫。
從業(yè)務出發(fā)、以指標為牽引所構建起的數(shù)據(jù)倉庫具有這樣的特點:
? 面向分析維度進行設計,分析維度通常是業(yè)務經(jīng)常需要的看數(shù)據(jù)的角度。
? 指標模型可以構建公共匯總層,提供不同維度的統(tǒng)計指標,指標的口徑一致,并且標注詳細描述
? 以寬表的形式進行設計,比如相同維度和統(tǒng)計周期的指標可以放在一起,避免創(chuàng)建太多的表,在數(shù)據(jù)分析時也方便取用
? 維度允許存在一定冗余存儲到匯總表里,方便應用時不通過跨表關聯(lián),提高查詢效率
TempoEM指標平臺是集數(shù)據(jù)模型、指標管理、指標加工、應用服務、監(jiān)測預警于一體的全鏈路指標體系管理平臺。秉持“輕量化打造企業(yè)指標體系,助力業(yè)務增長”的設計理念,幫助企業(yè)構建口徑統(tǒng)一、自上而下、業(yè)務驅動的指標體系,有效衡量業(yè)務經(jīng)營和發(fā)展情況。
實現(xiàn)指標的全局規(guī)范化定義及全生命周期管理,形成指標單一可信來源,助力打造標準統(tǒng)一、指標資產(chǎn)化、服務化、閉環(huán)自優(yōu)化的智能指標體系,滿足用戶指標可視、可信、可用、可管、可追溯需求。
TempoEM指標平臺中可以實現(xiàn)“業(yè)務指標梳理 ? 規(guī)范化指標體系 ? 指標標準開發(fā) ? 數(shù)倉模型構建 ? 成果資產(chǎn)管理”全鏈路指標管理工作。同時配備有各個行業(yè)的業(yè)務專家咨詢團隊并提供內容豐富多樣的行業(yè)資產(chǎn)指標庫,賦能業(yè)務價值,提升組織運營效率,沉淀數(shù)據(jù)資產(chǎn),推動組織升級。以產(chǎn)品、技術、方法論和實施能力為支撐,助力業(yè)務人員所見即所得的輕量化建設企業(yè)指標體系,提供用戶落地指標標準,疏通指標數(shù)據(jù)和全面的指標洞察能力,助力業(yè)務增長。