🎯 Definicja

Manual Profiling (Ręczne Profilowanie) to proces, w którym użytkownik “na żądanie” uruchamia analizę jakości danych dla wybranej tabeli lub pliku. W odróżnieniu od profilowania automatycznego (działającego w nocy dla całego systemu), tutaj to analityk decyduje: “Chcę sprawdzić tę tabelę TERAZ”.

🔑 Kluczowe punkty

  • Interaktywność: Wyniki dostajesz od razu (lub po chwili).
  • Elastyczność: Możesz profilować tylko to, co Cię interesuje (np. jedną nową tabelę z Excela).
  • Tryby:
    • Import Metadata: Tylko nazwy kolumn (błyskawiczne).
    • Data Sample: Analiza pierwszych 1000 wierszy (szybkie).
    • Full Profiling: Analiza każdego rekordu (wolne, ale dokładne).

📚 Szczegółowe wyjaśnienie

Po co profilować ręcznie? Często Analityk dostaje nowy plik CSV od klienta. Zanim wgra go do hurtowni, chce zobaczyć “co tam siedzi”. Manual Profiling pokaże:

  • Ile jest pustych wartości (Nulls)?
  • Czy daty są w dobrym formacie?
  • Czy są duplikaty w kolumnie ID? To pierwsza linia obrony przed “śmieciowymi danymi”.

💡 Przykład zastosowania

Dostajesz plik klienci_export.csv. Uruchamiasz “Full Profiling” w Ataccama ONE. Widzisz, że kolumna email jest pusta w 90% przypadków. Dzięki temu wiesz, że nie możesz użyć tego pliku do kampanii mailingowej – oszczędzasz czas i nerwy zespołu marketingu.

📌 Źródła

  • Ataccama Data Quality User Guide.

👽 Brudnopis

  • Ręczne profilowanie jest kluczowe w fazie “Exploratory Data Analysis” (EDA).