🎯 Definicja
Scoring Records to mechanizm oceniania “jak bardzo zły” jest dany rekord.
Zamiast binarnego “Dobry/Zły”, dostajesz punkty (Score).
Np. Score = 0 (Idealny), Score = 100 (Literówka), Score = 1,000,000 (Brak ID).
🔑 Kluczowe punkty
- Priorytetyzacja: Pozwala odróżnić błahe błędy od krytycznych w raportach.
- Explanation Codes: Do każdego Score musi być kod wyjaśnienia (np.
INVALID_EMAIL), żeby analityk wiedział, skąd te punkty. - Agregacja: W raporcie widzisz “Średni Score” lub “Liczbę rekordów z Score > 1000”.
📚 Szczegółowe wyjaśnienie
Model punktacji w Ataccama często wygląda tak:
0: Valid.< 1,000: Drobna korekta (np. usunięcie spacji).< 10,000: Poważna korekta (np. zmianaW-wanaWarszawa).> 1,000,000: Błąd krytyczny (rekord odrzucony). Score nadajesz w logice reguły (Condition BuilderlubExpression).
💡 Przykład zastosowania
Masz milion klientów. 100 tysięcy ma błędy. Których naprawiać najpierw? Sortujesz po Score malejąco. Na górze widzisz rekordy bez Nazwiska i PESELu (Score 5 mln). To są “duchy”, które psują raporty. Na dole widzisz rekordy, gdzie w ulicy jest literówka “Ul.” zamiast “ul.” (Score 50). To może poczekać.
📌 Źródła
- Ataccama ONE DQ Scoring Guide.
👽 Brudnopis
- Pamiętaj o kolumnach technicznych:
sco_email(liczba) iexp_email(kod). To standard w Ataccama.