🎯 Definicja
Systematyczny proces inspekcji, czyszczenia, przekształcania i modelowania danych w celu odkrycia użytecznych informacji, formułowania wniosków i wspierania procesu decyzyjnego.
🔑 Kluczowe punkty
- Typy: Opisowa (co się stało?), Diagnostyczna (dlaczego?), Predykcyjna (co się stanie?), Preskrypcyjna (co zrobić?).
- Narzędzia: SQL, Python (Pandas), Excel, BI (Tableau, PowerBI).
- Proces: Pytanie biznesowe → Dane → Czyszczenie → Analiza → Wizualizacja → Decyzja.
📚 Szczegółowe wyjaśnienie
Analiza danych to most między “surowymi bajtami” a “decyzją biznesową”. Nie chodzi tylko o wykresy, ale o zrozumienie kontekstu. Współczesna analiza danych coraz częściej zaciera granice z Data Science, wykorzystując proste modele ML do prognozowania, ale jej trzonem pozostaje Business Intelligence (BI) i raportowanie.
Kluczowe kompetencje analityka:
- Zrozumienie biznesu (Domain knowledge).
- Twarde skille techniczne (SQL to podstawa).
- Komunikacja (Storytelling).
💡 Przykład zastosowania
Analiza churnu (odejść klientów):
- Pobranie danych o aktywności użytkowników z ostatniego roku (SQL).
- Sprawdzenie, czy istnieje korelacja między brakiem logowania przez 30 dni a rezygnacją z subskrypcji (Python/Excel).
- Stworzenie dashboardu alarmującego o klientach zagrożonych odejściem (PowerBI).
📌 Źródła
👽 Brudnopis
- Descriptive vs Diagnostic vs Predictive vs Prescriptive.
- Wizualizacja jest kluczem do zrozumienia (Jeden wykres > 1000 wierszy tabeli).
- Garbage In, Garbage Out (GIGO) – jakość danych jest krytyczna.