
Data Profiling – první krok na cestě ke kvalitním datům
ŠkoFIN patří k největším finančním společnostem na českém trhu a specializuje se na podporu prodeje značek Škoda, Volkswagen, Seat, Audi a koncernové ojeté vozy. Nabízí produkty v oblasti leasingu, úvěru i pojištění jak soukromým osobám, tak podnikatelům. Již od svého založení v roce 1992 přináší svým zákazníkům řešení šitá na míru v oblasti finančních služeb.
Výchozí situace:
V rámci zvyšování kvality dat ve svých systémech se společnost Škofin rozhodla provést jednorázový datový audit metodou data profilingu. Data profiling je zkoumání skutečných dat v databázi nebo souboru, jehož výsledkem jsou statistické údaje a další objektivní informace o datech.
Datová kvalita není absolutní pojem, je třeba ji poměřovat proti účelu a způsobu využití, kritičnosti dat a možnému dopadu při odchylkách od žádoucího stavu. Před rozhodnutím, zda jsou data kvalitní nebo ne, zda je možné spokojit se stávajícím stavem zpracování nebo je třeba dělat nějaká opatření, potřebujeme znát skutečnost, oproštěnou od emocí a úhlu pohledu daného pozicí, osobními zájmy nebo obavami. Proto byl pro realizaci data profilingu vybrán externí dodavatel, společnost Profinit. Cílem bylo provést audit v zákaznické databázi s necelým půl milionem záznamů, pořizovaných v průběhu patnácti let.
Řešení:
V rámci auditu bylo vytvořeno 22 procedur, které posloužily k otestování 12 oblastí dat. Zahrnovaly identifikátory, adresní údaje, jména a názvy, kontaktní data a další důležité informace. Byla zjišťována i míra a kvalita vyplňování řady nepovinných položek.
Pro provedení testů použil Profinit osvědčený nástroj Informatica Data Quality, který svými mnoha konfigurovatelnými komponentami pro jednotlivé testy celý audit výrazně urychlil.
Testy kontrolovaly:a
- Formát data
- Prázdné hodnoty
- Duplicity
- Křížové kontroly položek záznamu
- Kontroly existence záznamu a správnosti jeho údajů proti externím databázím
- Vliv stáří záznamu na počet odchylek
Přínosy řešení pro ŠkoFIN:
Projekt poskytl Škofinu nezávislý expertní pohled na kvalitu dat a posloužil k rozhodnutí o nejefektivnějších opatřeních pro zvýšení kvality informací. Jeho datové výstupy se interně využívají k opravám a standardizaci dat v databázi.
Výstupy datového auditu byly následující:
- závěrečná zpráva se zhodnocením stavu dat
- přehledy a statistiky o odchylkách
- soubory se záznamy, které nevyhověly podmínkám testu a byly určeny k následným opravám databáze
Statistiky byly prezentovány formou tabulek a přehledných grafů.
