🎯 Definicja
Zbiór najlepszych źródeł i map drogowych (Roadmaps) dla osób chcących zostać Inżynierami Danych. Dziedzina jest szeroka (SQL, Python, Chmura, Big Data), więc nawigacja jest kluczowa.
🔑 Kluczowe Obszary Nauki
- Fundamenty: SQL (zaawansowany), Python (Pandas/Scripting), Linux (Bash).
- Modelowanie: Dimensional Modeling (Kimball), Data Vault.
- Przetwarzanie: Spark, dbt, Flink.
- Infrastruktura: Docker, Kubernetes, Terraform.
- Chmura: AWS/Azure/GCP (jedna do wyboru na start).
📚 Polecane Źródła
- Data Engineering Roadmap (GitHub): Wizualna mapa co po kolei.
- “Fundamentals of Data Engineering” (Reis & Housley): Najważniejsza książka w branży.
- Seattle Data Guy: Blog i kanał YouTube o realiach pracy.
- Airbyte / Fishtown Analytics (dbt) Blogs: Świetne artykuły o nowoczesnym stosie (MDS).
💡 Jak zacząć?
Nie ucz się wszystkiego naraz. Zbuduj jeden projekt End-to-End:
- Pobierz dane z API (Python).
- Zapisz do bazy (Postgres).
- Przetwórz (dbt).
- Zwizualizuj (Streamlit/Metabase). To da Ci więcej niż 10 kursów teoretycznych.
📌 Źródła
👽 Brudnopis
- Najczęstszy błąd: Nauka narzędzi (Spark, Kafka) bez zrozumienia podstaw (Systemy plików, Sieci, SQL). Narzędzia się zmieniają, SQL jest wieczny.