🎯 Definicja
Detection Rule (Reguła Wykrywania) to logika używana w Data Catalogu do automatycznego rozpoznawania, co znajduje się w kolumnie. Dzięki niej system “wie”, że kolumna klient_mail to tak naprawdę Email Address (Business Term), a kolumna usr_dob to Date of Birth.
🔑 Kluczowe punkty
- Cel: Automatyzacja mapowania słownika biznesowego (Glossary) na warstwę techniczną (Discovery).
- Metody: Condition Builder (GUI) lub Advanced Expression (kod/regex).
- Zastosowanie: Działa podczas skanowania/profilowania danych.
- Efekt: Automatyczne tagowanie kolumn (np. “To wrażliwe dane PII”).
📚 Szczegółowe wyjaśnienie
Reguł nie wykrywają “błędów” (jak DQ Rules), ale “znaczenie”. Typowe warunki:
- Nazwa kolumny:
Contains("pesel") - Format danych:
MatchesRegex("\d{11}") - Wartości: Ponad 90% wartości to 11 cyfr. Jeśli warunki są spełnione, system sugeruje Stewardowi: “Hej, ta kolumna to chyba PESEL, czy mam przypisać ten termin?“.
💡 Przykład zastosowania
Masz 500 tabel z danymi klientów.
Chcesz znaleźć wszystkie kolumny przechowujące karty kredytowe.
Tworzysz Regułę Wykrywania:
IF column_name LIKE '%card%' OR '%cc%' AND data matches Luhn Algorithm -> Suggest Term "Credit Card Number".
Uruchamiasz Discovery. System znajduje 50 kolumn w różnych tabelach, oznaczając je jako wrażliwe.
📌 Źródła
- Ataccama ONE Documentation - Detection Rules.
👽 Brudnopis
- Reguły te są kluczowe w Data Classification (np. RODO).
- Można łączyć logikę: Nazwa Kolumny + Próbka Danych (Data Sample) dają największą skuteczność.