🎯 Definicja
Data Remediation to proces naprawy błędnych danych. W przeciwieństwie do automatycznego czyszczenia (gdzie skrypt poprawia tysiące rekordów), remediacja często wymaga interwencji człowieka (Stewarda), który musi podjąć decyzję, jak poprawić konkretny rekord (np. zadzwonić do klienta i zapytać o poprawny adres). W Ataccama ONE odbywa się to w module ONE Data.
🔑 Kluczowe punkty
- Workflow: Wykrycie błędu (Monitoring) → Załadowanie do ONE Data → Ręczna korekta → Walidacja → Eksport do źródła.
- Interaktywność: Gdy Steward poprawia dane w tabeli, reguły DQ przeliczają się w czasie rzeczywistym (“On-the-fly validation”), pokazując czy rekord jest już zielony (poprawny).
- Zastosowanie: Błędy, których nie da się naprawić automatem (np. literówki w nazwach firm, których nie ma w słowniku).
📚 Szczegółowe wyjaśnienie
Proces w Ataccama ONE:
- Monitoring DQ wykrywa 500 rekordów “Invalid” w hurtowni.
- Data Steward klika “Load to ONE Data” (filtrując tylko te błędne).
- Otwiera tabelę w przeglądarce. Widzi podświetlone na czerwono komórki.
- Może użyć “Bulk Edit” (masowa zmiana) lub poprawiać ręcznie.
- Gdy naprawi, eksportuje czyste rekordy z powrotem do bazy (nadpisując te błędne) lub do tabeli stagingowej.
💡 Przykład zastosowania
Baza kontaktów VIP. Reguła wykryła, że dla klienta “Prezes XYZ” brakuje numeru telefonu. Automat tego nie wymyśli. Steward musi znaleźć wizytówkę, wpisać numer ręcznie w ONE Data. System od razu sprawdzi format (+48…). Jeśli OK, Steward zatwierdza zmianę.
📌 Źródła
- Ataccama ONE Data Documentation.
👽 Brudnopis
- To narzędzie typu “Data Stewardship” / “Data Curation”.
- Ważne jest zachowanie Audit Trail (kto i kiedy zmienił dane ręcznie), co ONE Data zapewnia.