Categories of Data

Data Quality ကိုမလေ့လာခင်မှာ Master data, Reference data, Transactional data, Historical data နဲ့ Metadata စတဲ့ data အမျိုးအစားများကို ခွဲခြားပြီး သိထားဖို့ လိုပါတယ်။

Master Data

Master data ဆိုတာ customers, products, parts, employees, accounts, materials နဲ့ suppliers စတဲ့ business ရဲ့ အခြေခံ entities များကို ဆိုလိုပါတယ်။ Master data များကို အဓိက အားဖြင့်

  1. places – locations, geography, sites, areas, addresses, zones
  2. Parties – persons, organizations, vendors, prospects, customers, suppliers, patients, students, employees
  3. things – products, parts, assets, items, raw materials, finished goods, vehicles စတဲ့ အမျိုးအစားများနဲ့ ခွဲခြားထားနိုင်ပါတယ်။

Master data များဟာ transactional data မဟုတ်ပဲ business entities ဖြစ်ပြီး လုပ်ငန်းတစ်ခုအတွင်းရှိ business process များ၊ စနစ်များ၊ applications များမှ ချိတ်ဆက်အသုံးပြုဖို့ တည်ဆောက်ထားတာ ဖြစ်ပါတယ်။ ၎င်း master data များမှာ သက်ဆိုင်ရာ business entity ရဲ့ လိုအပ်တဲ့ အသေးစိတ် အချက်အလက်များ အားလုံးပါဝင်ပါတယ်။

Master data မှာ မှားယွင်းမှု ဖြစ်ရင် နေရာများစွာမှာ ထိခိုက်မှု ရှိနိုင်ပါတယ်။ ဥပမာအားဖြင့် customer ရဲ့ လိပ်စာ မှားခဲ့ရင် ဆက်သွယ်မရတာ၊ order, bill စတာတွေ ကို လိပ်စာမှားဆီ ပို့မိနိုင်တာတွေ၊ product dimension မှားခဲ့ရင် delivery ကြန့်ကြာတာတွေ၊ debtor account မှားခဲ့ရင် bill payment အချိန်မှီ မပေးနိုင်တာတွေ စတဲ့ အခက်အခဲများ ဖြစ်နိုင်ပါတယ်။ Master data မှာ မှားယွင်းမှုဟာ ကြီးရင် ကြီးသလို organization ရဲ့ revenue ကို ထိခိုက်နိုင်တဲ့ အထိ ဖြစ်နိုင်ပါတယ်။

Reference Data

Reference data က စနစ်တွေ၊ applications တွေ၊ data repositories တွေ business processes တွေနဲ့ report တွေအားလုံးမှာ တညီတည်း ချိတ်ဆက်အသုံးပြုနိုင်ဖို့ စနစ်တကျ သတ်မှတ်ထားတဲ့ data set ဖြစ်ပါတယ်၊ Reference data ကို master data နဲ့ transactional data တို့မှလည်း ချိတ်ဆက်အသုံးပြုပါတယ်။

Reference data ကို ဥပမာ ပြရမယ်ဆိုရင် county code, state abbreviations, area code, postal code, zip codes, industry code, currency code, status code, flag စတာတွေ ဖြစ်ပါတယ်။

Reference data ကို မိမိ လုပ်ငန်းတွင်းမှာ လိုအပ်ချက်အရ တည်ဆောက်နိုင်သလို ပြင်ပမှ အများသုံး သတ်မှတ်ချက်များကို လည်း ယူသုံးနိုင်ပါတယ်။ Internal data အနေနဲ့ ဆိုရင်တော့ customer status code တို့ account status code တို့လိုမျိုးပါ။ အဲဒီ status code တွေကို လုပ်ငန်းတစ်ခုလုံးမှာ သုံးနိုင်ပါတယ်။

အစိုးရ၊ နိုင်ငံတစ်ခုလုံး သို့မဟုတ် international အားလုံးအတွက် သီးသန့် သတ်မှတ်ထားတဲ့ reference data များကိုလည်း မိမိ လုပ်ငန်းတွေမှာ သုံးနိုင်ပါတယ်၊ အဲဒီ data set တွေကတော့ industry sector တစ်ခု အတွက် သီးသန့်သတ်မှတ်ထားတမျိုး ရှိနိုင်သလို industry sectors များစွာသုံးနိုင်ဖို့ သတ်မှတ်ထားတာလဲ ရှိနိုင်ပါတယ်။ ဥပမာအားဖြင့် currency Code တို့ country Code တို့လို မျိုးပါ။

Reference data ဟာ မကြာခဏ ပြောင်းလဲပြုပြင်ရန် မလိုတဲ့ data အမျိုးအစားလဲ ဖြစ်ပါတယ်။

Transactional Data

Transactional data က sales order, purchase စတဲ့ Business event ကို ဖော်ပြပြီး လုပ်ငန်းတွေမှာ အများဆုံးသော data ကို သိမ်းထားတဲ့ data set ဖြစ်ပါတယ်။ လုပ်ငန်းတွေရဲ့ နေ့စဉ် လုပ်ဆောင်ချက်များကို ၎င်းလုပ်ဆောင်တဲ့ အချိန်မှာ မှတ်သားထားပါတယ်။ Transactional data ကို business indicator လို့လဲ ခေါ်လို့ရနိုင်ပြီး သူရဲ့ လုပ်ဆောင်ချက်များဟာ maser data ပေါ်မှာ အပြည့်အဝမှီပါတယ်။ တနည်းပြောမယ်ဆိုရင် transaction data ဆိုတာ master data တွေပါဝင်တဲ့ action သို့ event တစ်ခုပါ။ ဉပမာအနေနဲ့ ဆိုရင် Customer တစ်ယောက် Account အသစ်တစ်ခု ဖွင့်တဲ့ event တစ်ခုမှာ Customer နဲ့ Account က master data ဖြစ်ပြီးတော့ Account ဖွင့်တဲ့ action က transactional data ဖြစ်ပါတယ်။

Transactional data တိုင်းမှာ action သို့ event ဖြစ်တဲ့အချိန်ကို မှတ်သားတဲ့ time dimension, master data နဲ့ reference data တို့ ပါလေ့ရှိပါတယ်။

ဒီလို Transactional data တွေဟာ master data နဲ့ reference data တို့နဲ့ ပေါင်းစပ်ထားတဲ့အတွက် သူနဲ့ ပေါင်းစပ်ထားတဲ့ master data နဲ့ reference data တို့ မမှန်ခဲ့ရင် transaction တွေကလည်း ဆက်လက်မှားပြီး မှန်ကန်တဲ့ report တွေ ထုတ်နိုင်မှာ မဟုတ်ပါဘူး။ ဉပမာဆိုရင် တကယ်လို့ customer ရဲ့ လိပ်စာဟာ လက်ရှိ လိပ်စာ မဟုတ်နေတာပဲ ဖြစ်ဖြစ် State code လွဲထားတာ ပဲ ဖြစ်ဖြစ် ဖြစ်နေခဲ့ရင် order တွေကို ပို့ဆောင်ပေးနိုင်တော့မှာ မဟုတ်ပါ။

Transactional data အများစုဟာ မကြာခဏ ပြောင်းလဲနေတဲ့ နေတတ်ပါတယ်။ Extremely volatile ဖြစ်တယ်လို့ ခေါ်ပါတယ်။

Historical Data

Transactional data များမှာ time dimension ပါဝင်တဲ့ အတွက် transaction ပြီးဆုံးပြီး အချိန်တစ်ခုမှာ ၎င်း data ကို historical data အနေနဲ့ သတ်မှတ်ပါတယ်။ အဲဒီလို သတ်မှတ်ပြီးတဲ့နောက်မှာ ၎င်း data များကို error ရှိချိန်မှ လွဲပြီး ပြန်မပြင်သင့်ပါ။ ဉပမာ အနေနဲ့ ဆိုရင် transaction တွေကို လချုပ် posting လုပ်ပြီး ပြန်မပြင်တော့ သလိုပါပဲ။ master data တွေမှာလဲ လက်ထပ်ပြီးနောက် surname ပြောင်းလဲတာမျိုးတွေ၊ လိပ်စာ အသစ်ပြောင်းတာမျိုးတွေ ဖြစ်ခဲ့ရင် မပြောင်းခင်ကာလ data တွေကို historical data အနေနဲ့ သတ်မှတ်ပါတယ်။

လုပ်ငန်းတွေမှာ လက်ရှိ (current) အချိန်မှာနဲ့ အနီးစပ်ဆုံးကာလ data များကို သာ အများဆုံး သုံးပါတယ်။ data သက်တမ်းကြာလာလေလေ သုံးစွဲတာ နည်းလာလေလေပါ။ ဒီအတွက်ကြောင့် တချို့ historical data များကို archived လုပ်ပြီး လိုအပ်ချိန်မှ ပြန်ထုတ်သုံးရပါတယ်။

Metadata

Metadata ဆိုတာ data အကြောင်းကို ပြောပြတဲ့ data ပါ။ Metadata ဟာ လုပ်ငန်းထဲမှာလည်ပတ်နေတဲ့ တခြား data များရဲ့ characters များ၊ business features များ ကို စနစ်တကျ ထိန်းသိမ်းထားပြီး ၎င်း data များကို အလွယ်ကူဆုံး ဆွဲထုတ်နိုင်ဖို့၊ နားလည်နိုင်ဖို့၊ အသုံးပြုနိုင်ဖို့နဲ့ ထိန်းသိမ်းနိုင်ဖို့ အထောက်အကူ ပြုပါတယ်။

အကြမ်းအားဖြင့် metadata ကို Technical metadata, Business metadata, Process metadata နဲ့ Audit Trail metadata ဆိုပြီး ခွဲခြားလို့ ရပါတယ်။

Technical metadata တွေက technical team များက process လုပ်တဲ့ databases နဲ့ file system စတဲ့ data repository တွေမှာ ရှိတဲ့ data များနှင့် ပတ်သက်ပြီး မှတ်သားထားတဲ့ document ပါ။ Technical metadata မှာ data layers တွေရဲ့ physical characteristics ဖြစ်တဲ့ table names, column or field names, allow values (သတ်မှတ်တန်ဖိုး), key information (primary keys သို့ foreign keys), field length, data type, table များ တစ်ခုနှင့် တစ်ခု ချိတ်ဆက်တဲ့ relationships, constraints (ကန့်သတ်ချက်များ), indexes နဲ့ validation rules စတာတွေ ကို မှတ်သားပါတယ်။

Business metadata တွေက technical နဲ့ မသက်ဆိုင်တဲ့ business ရဲ့ လုပ်ဆောင်ချက်များကို ထိန်းသိမ်းထားပါတယ်။ Business metadata တွေကို physical storage ရဲ့ လိုအပ်ချက်တွေ နဲ့ ထည့်စဉ်းစားဖို့ မလိုပါ။ Business metadata မှာ သိမ်းတဲ့ အချက်တွေကတော့ field definitions, business terms and rules, privacy and security level, report names and heading, group of responsible and accountable of data quality (data quality ရှိစေဖို့တာဝန်ယူမယ့် အဖွဲ့) စတာတွေပါ။

Process metadata က data တွေကို create လုပ်တာ၊ deliver လုပ်တာ စတဲ့ IT operations ကို ထိန်းသိမ်းထားပါတယ်။ ဉပမာအနေနဲ့ ပြောရရင် Extract, Transform and Load (ETL) process, run-time environment မှာ data ကို create, restore, access လုပ်တဲ့ start time (စချိန်), end time (ဆုံးချိန်), အသုံးပြု CPU seconds, source table read/ disk read, target table written/ disk write, target မှ ဖတ်တဲ့ rows အရေအတွက်၊ process လုပ်တဲ့ rows အရေအတွက်၊ target ကို ရိုက်ထည့်သော rows အရေအတွက် စတဲ့ execution log တွေကို မှတ်ပါတယ်။ ဒီလို မှတ်ထားတဲ့ အတွက် errors တစ်ခုခု ဖြစ်ခဲ့ရင် ပြဿနာကို အသေးစိတ် အဖြေရှာနိုင်မှာပါ။

Audit Trail metadata က process metadata အပြင် သီးသန့် ထပ်တည်ဆောက်လို့ရတဲ့ metadata တစ်မျိုးပါ။ သူ့ကို သိမ်းတဲ့ အချက်တွေက data ကို ဘယ်သူက ဘယ်အချိန်မှာ ဘယ်လို create လုပ်သွားလဲ၊ ပြင်သွားလဲ၊ ဖျက်သွားလဲ print ထုတ်ယူသွားလဲ ဆိုတဲ့ transaction log ကို မှတ်သားထားတာပါ။ Audit Trail metadata ကို အဓိက သုံးတာကတော့ security breaches (လုံခြုံရေး ချိုးဖောက်မှု) တွေကို tracking လုပ်ဖို့ပါ။ Audit trail metadata မှာ action တစ်ခုကို ဖြစ်စေတဲ့ ရက်စွဲနဲ့ အချိန် ကို မှတ်သားတဲ့ time stamp၊ user နဲ့ device ကို မှတ်သားတဲ့ information နဲ့ အတူ ပြလုပ်သွားတဲ့ action အသေးစိတ် ကို မှတ်ထားတဲ့ အတွက် လိုအပ်တဲ့ အချိန်မှာ အစ ပြန်ရှာလို့ ရနိုင်ပါတယ်။

Quality Impact enter image description here