為什么需要獨立的數據質量經理?

正如文章開頭提到的,數據質量是數據治理計劃的核心成果。所以,提高數據的整體質量是數據管理團隊、團隊和部門的關鍵問題。但有一個問題:協調。

如果你和不同部門的不同人討論數據質量,你總會得到不同的回應。例如,如果你問ETL開發人員如何衡量數據質量,他們可以依靠一組特定的參數或規則來確保他們輸入的數據符合要求。

假如源頭質量不好,他們不太可能報告,甚至不認為這是他們的擔憂。或者,如果他們與處理CRM系統的人交談,他們會注意數據的一致性,因為他們無法匹配系統中的沖突術語。簡而言之,每個人都從不同的角度看待數據質量0機價免預繳iphone13

由於大多數數據質量問題都是由於多個應用程序的集成和數據轉換,因此有一個獨立的數據質量經理或數據管理經理來提高整個組織的數據質量是非常重要的。

由於存在許多矛盾的意見,需要一個獨立的組織來調解和實施公司范圍內的數據質量改進,沒有偏見,而且基於重要性。主體可以是數據管理經理或組。

為了有效地解決數據質量問題,有必要確定優先級。應根據業務影響、流行程度和數據質量問題的複雜性,優先考慮這些問題。

數據質量改善生命周期。

每個人的個人數據質量問題對個人來說都非常重要。但是,要確定優先級,以免迷失在問題的海洋中。數據質量問題應優先考慮業務影響、普遍性和數據質量問題的複雜性。這可以有效地解決這些問題。

提高數據質量的長期測試策略如下:提高生命周期的數據質量。

1.定義

第一步是定義數據質量標准。這些標准將成為努力實現的基准。這一步可以設定目標,樹立如何提高數據質量,最終發展業務的願景。

例如,每次捕獲社會安全號碼時,都應捕獲九位數。或者,每次收集電子郵件地址時,請確保輸入兩次作為輔助確認步驟。

2.收集

接下來,為了定位數據質量問題,我們需要使用框架來記錄組織中的所有數據質量問題。有兩種方法可以成功地做到這一點。首先是在公司內部創建一個數據質量計劃。

一旦組織建立了廣泛的質量,就可以建立報告機制,用戶可以去那裏交換他們的數據質量問題。這一步的唯一目標是從所有來源收集數據質量問題,以便數據管理團隊列出必須解決的問題。

在捕獲數據質量問題時,必須記錄以下信息:

商業價值

問題所在

問題是什么

優先(從客戶的角度)

一旦在組織中建立了廣泛的數據質量,就可以建立報告機制,用戶可以到那裏交換數據質量。

3.優先

下一部分是開發一種幫助我們了解這些數據質量問題對業務的影響的機制。這是數據管理經理最重要的任務。他們必須考慮以下幾點:

商業價值

主要原因分析。

大致努力解決問題。

更換管理層

這一過程使治理團隊能夠有效地確定問題的優先級。這種優先級過程通常會導致瓶頸,因為很難做出一致的決定。

以國家代碼為例。不同的系統可能有不同的選擇。要做出決定,需要一個框架,其核心是數據管理委員會。委員會由組織中不同業務部門的所有領導組成。

數據管理經理提出問題時,需要提交委員會進行評估。他們將根據許多因素來權衡問題,包括成本/收益比和業務影響。

做出關鍵的數據質量決策時,需要改變業務流程。本質上會導致額外的工作和支出,因此需要在跨部門、公平、委員會層面做出決定。

4.分析

一旦確定了問題和優先級,負責批准和解決問題的人需要進一步分析根本原因。這個過程涉及到問題,比如每個問題的根源。問題的真正原因是什么?

使用國家代碼示例需要確定無效字段是如何導致數據質量問題的。問題的根源是用戶手動輸入代碼,還是公司無法控制數據?

5.改進

解決數據質量問題的關鍵方法有四種:

可直接使用源代碼並在那裏進行相關更改,手動修複問題。

ETL管道可以更改。因此,需要開發代碼來決定如何通過集成處理數據,也稱為ETL邏輯。

另一種選擇是改變特定的過程。例如,在國家代碼字段中選擇數據的過程將會改變。您可以添加下拉菜單,而不是要求用戶手動輸入國家/地區代碼,所以您別無選擇,只能選擇正確的代碼全球短信通訊收費

第四種方法稱為主數據和參考數據管理。當缺乏主數據時,明確定義的數據質量問題將非常明顯。例如,可能需要手動輸入客戶名字段,因為沒有正確的主數據,所以沒有其他方法。

一種常見的主數據管理解決方案是創建一個存儲所有主數據的地方,其他系統可以用密鑰引用這些數據。主數據管理需要大量資金,可能比較複雜,但是非常有效。

參考數據通常是可以參考主數據的列表。與主數據不同,它通常是相對靜態的。訪問控制和關系映射等參考數據也將有助於提高數據質量。

6.控制

這一過程的最後一步是編寫一組數據質量規則。這將確保如果這個問題再次發生,將創建通知或票證來解決這個問題。

這樣的通知可以更容易、更快地處理問題,而不必咨詢多個人並進行複雜的分析。

36


868