🎯 Definicja
Data Slice (Wycinek Danych) w Ataccama ONE to mechanizm wirtualnego podziału zbioru danych na mniejsze części w celu bardziej precyzyjnego monitorowania. Zamiast sprawdzać jakość całej tabeli (co może być kosztowne i powolne), definiujesz “plaster” – np. tylko dane z wczoraj lub tylko dane dla kraju “PL”.
🔑 Kluczowe punkty
- Optymalizacja kosztów: Nie skanujesz całej historii (10 lat), tylko ostatni dzień.
- Lepsze alerty: Możesz mieć inne reguły dla “PL” (wymagany PESEL) i inne dla “DE” (brak PESEL).
- Rodzaje:
- Dynamiczne: Np.
date = today() - 1. - Statyczne: Np.
country = 'USA'.
- Dynamiczne: Np.
📚 Szczegółowe wyjaśnienie
Gdy masz tabelę z 1 miliardem wierszy, uruchamianie pełnego DQ Checka codziennie jest nierealne.
Tworzysz Data Slice oparty na kolumnie daty (transaction_date).
Konfigurujesz Monitoring Project, aby uruchamiał się na tym Slice.
Codziennie system pobiera tylko nowe rekordy, sprawdza ich jakość i dodaje wynik do historycznego trendu. Dzięki temu masz ciągły monitoring bez “zabijania” bazy danych.
💡 Przykład zastosowania
Globalna tabela sprzedaży.
Chcesz monitorować jakość danych osobno dla każdego regionu, bo każdy region ma innego Data Stewarda.
Tworzysz Slices: Region=EMEA, Region=APAC, Region=AMER.
Steward z EMEA dostaje alerty tylko, gdy spadnie jakość w jego “kawałku” tortu, a nie gdy coś się zepsuje w USA.
📌 Źródła
- Ataccama ONE Documentation - Data Slices.
👽 Brudnopis
- Data Slice działa jak klauzula
WHEREw SQL. - Jest kluczowy dla dużych wolumenów danych (Big Data).