Dirty Data ဆိုတာ data တွေ ညစ်ပတ်နေတယ်လို့ ပြောတာတော့ မဟုတ်ပါဘူး။ လိုအပ်တဲ့ data ရှိရမဲ့ data တွေအတိုင်း မမှန်ကန်နေတာကို ဆိုလိုတာပါ။ Organization တွေအနေနဲ့ သူ့လုပ်ငန်းအတွက် အသုံးပြုဖို့ အဆင်မပြေတဲ့ data တွေပါ။ ဒီနေ့ခေတ်မှာ လုပ်ငန်းတော်တော်များများမှာ Dirty Data ပြဿနာကို တွေ့နေရပါတယ်။
Duplicate ဖြစ်နေတဲ့ records တွေ၊ အသုံးလိုတဲ့ အချက်အလက်တွေ မပါတဲ့ records တွေဟာ Database တွေမှာ နေရာယူထားယုံသာမကပဲ ဒါတွေကိုထိန်းသိမ်း ပြန်ပြင်နေရတာနဲ့ အပို ကုန်ကျစရိတ်တွေဖြစ်လာနိုင်ပါတယ်။
လုပ်ငန်းတွေမှာ Dirty Data ဖြစ်လာစေတဲ့ အကြောင်းအများကြီးရှိပြီး ဖြေရှင်းဖို့လဲ ခက်ပါတယ်။ ဒီအတွက် Dirty Data မဖြစ်နိုင်အောင် ဘာကြောင့် data တွေ ထပ်နိုင်သလဲ၊ ဘယ်အချိန်မှာ မှားနိုင်သလဲ ဆိုတာမျိုးတွေကို အသေအချာ စဉ်းစားပြီး မှန်ကန်ရှင်းလင်းတဲ့ procedure တွေ ချပြီး လုပ်ဆောင်ရပါတယ်။ ဒီအတွက် Data Hygiene ဆိုတာကို လုပ်ငန်းတွေမှာ ပထမ ဉီးစားပေး လိုအပ်ချက်အနေနဲ့ ပြင်ဆင်လုပ်ကိုင်နိုင်မှသာ အောင်မြင်တဲ့ စနစ်တွေကို တည်ဆောက်နိုင်မှာ ဖြစ်ပါတယ်။
"Dirty Data" sounds bad. It sounds like something an organization would want to avoid. Dirty data is nearly universal problem for most organization.
Dirty data means duplicate records and records with no useful information that are just taking us space. The consequences of dirty data are serious: High Cost to use and maintain the data which translate lower income for the mission.
Dirty data has numerous causes and no easy solutions. An organization's best protections against dirty data are focus on the issue, vigilance, clear procedures, and through knowledge of the tools available to remedy the situation. The solution is making data hygiene a priority and recognizing data hygiene as a necessary, to gain a valuable part of system administration.