🎯 Definicja

Zbiór najlepszych źródeł i map drogowych (Roadmaps) dla osób chcących zostać Inżynierami Danych. Dziedzina jest szeroka (SQL, Python, Chmura, Big Data), więc nawigacja jest kluczowa.

🔑 Kluczowe Obszary Nauki

  1. Fundamenty: SQL (zaawansowany), Python (Pandas/Scripting), Linux (Bash).
  2. Modelowanie: Dimensional Modeling (Kimball), Data Vault.
  3. Przetwarzanie: Spark, dbt, Flink.
  4. Infrastruktura: Docker, Kubernetes, Terraform.
  5. Chmura: AWS/Azure/GCP (jedna do wyboru na start).

📚 Polecane Źródła

  • Data Engineering Roadmap (GitHub): Wizualna mapa co po kolei.
  • “Fundamentals of Data Engineering” (Reis & Housley): Najważniejsza książka w branży.
  • Seattle Data Guy: Blog i kanał YouTube o realiach pracy.
  • Airbyte / Fishtown Analytics (dbt) Blogs: Świetne artykuły o nowoczesnym stosie (MDS).

💡 Jak zacząć?

Nie ucz się wszystkiego naraz. Zbuduj jeden projekt End-to-End:

  1. Pobierz dane z API (Python).
  2. Zapisz do bazy (Postgres).
  3. Przetwórz (dbt).
  4. Zwizualizuj (Streamlit/Metabase). To da Ci więcej niż 10 kursów teoretycznych.

📌 Źródła

👽 Brudnopis

  • Najczęstszy błąd: Nauka narzędzi (Spark, Kafka) bez zrozumienia podstaw (Systemy plików, Sieci, SQL). Narzędzia się zmieniają, SQL jest wieczny.