🎯 Definicja

Systematyczny proces inspekcji, czyszczenia, przekształcania i modelowania danych w celu odkrycia użytecznych informacji, formułowania wniosków i wspierania procesu decyzyjnego.

🔑 Kluczowe punkty

  • Typy: Opisowa (co się stało?), Diagnostyczna (dlaczego?), Predykcyjna (co się stanie?), Preskrypcyjna (co zrobić?).
  • Narzędzia: SQL, Python (Pandas), Excel, BI (Tableau, PowerBI).
  • Proces: Pytanie biznesowe Dane Czyszczenie Analiza Wizualizacja Decyzja.

📚 Szczegółowe wyjaśnienie

Analiza danych to most między “surowymi bajtami” a “decyzją biznesową”. Nie chodzi tylko o wykresy, ale o zrozumienie kontekstu. Współczesna analiza danych coraz częściej zaciera granice z Data Science, wykorzystując proste modele ML do prognozowania, ale jej trzonem pozostaje Business Intelligence (BI) i raportowanie.

Kluczowe kompetencje analityka:

  1. Zrozumienie biznesu (Domain knowledge).
  2. Twarde skille techniczne (SQL to podstawa).
  3. Komunikacja (Storytelling).

💡 Przykład zastosowania

Analiza churnu (odejść klientów):

  1. Pobranie danych o aktywności użytkowników z ostatniego roku (SQL).
  2. Sprawdzenie, czy istnieje korelacja między brakiem logowania przez 30 dni a rezygnacją z subskrypcji (Python/Excel).
  3. Stworzenie dashboardu alarmującego o klientach zagrożonych odejściem (PowerBI).

📌 Źródła

👽 Brudnopis

  • Descriptive vs Diagnostic vs Predictive vs Prescriptive.
  • Wizualizacja jest kluczem do zrozumienia (Jeden wykres > 1000 wierszy tabeli).
  • Garbage In, Garbage Out (GIGO) – jakość danych jest krytyczna.