🎯 Definicja
Monitoring Project w Ataccama ONE to kontener na Twoje automatyczne testy jakości danych. To tutaj mówisz systemowi: “Sprawdzaj tabelę Klienci codziennie o 2 w nocy. Jeśli liczba błędnych emaili przekroczy 1%, wyślij mi alert”.
🔑 Kluczowe punkty
- Reaktywność: Pozwala śledzić, jak jakość danych zmienia się w czasie (Trend Line).
- Zasób: Monitorujesz konkretne
Catalog Items(Tabele, Pliki). - Metody:
- DQ Rules: Sprawdź poprawność (np. “Email ma @”).
- Structure Checks: Czy schema się nie zmieniła? (np. “Czy kolumna ID nadal istnieje?”).
- Anomaly Detection: AI wykrywa dziwne skoki (np. “Dziś mamy o 50% mniej rekordów niż zwykle”).
📚 Szczegółowe wyjaśnienie
Proces:
- Tworzysz Projekt.
- Dodajesz Items (Tabele).
- Konfigurujesz Checks (Reguły).
- Publish: Musisz opublikować zmiany, żeby weszły w życie.
- Run: Uruchamiasz ręcznie lub z harmonogramu (Scheduler).
Wyniki widzisz na dashboardzie jako “DQ Score” (jakość ogólna) i listę “Issues”.
💡 Przykład zastosowania
Migracja danych. Tworzysz Monitoring Project na tabeli docelowej. Przed migracją: DQ Score = 0% (pusto). Po migracji: DQ Score = 95%. Widzisz, że 5% rekordów ma błędy walidacji. Poprawiasz skrypt migracyjny i uruchamiasz ponownie. Monitoring pokazuje wzrost jakości do 99%.
📌 Źródła
- Ataccama User Guide - Monitoring Projects.
👽 Brudnopis
- Ważne: Monitoring Project to nie to samo co Data Observability. Monitoring jest “Manualny” (Ty definiujesz reguły). Observability jest “Automatyczne” (System sam uczy się, co jest normą).