🎯 Definicja

Deep Learning (DL) to poddziedzina Uczenia Maszynowego (ML), która opiera się na Sztucznych Sieciach Neuronowych o wielu warstwach (stąd “Deep”). W przeciwieństwie do klasycznego ML, gdzie człowiek musiał wskazać cechy (Features), DL potrafi samo nauczyć się cech wprost z surowych danych (pikseli, dźwięku, tekstu).

🔑 Kluczowe punkty

  • Reprezentacja Danych: Sieć sama uczy się, że “kreska + kółko = oko”.
  • Skalowalność: Im więcej danych, tym model jest lepszy (klasyczny ML w pewnym momencie przestaje się uczyć).
  • Architektury: CNN (Obrazy), RNN/LSTM (Sekwencje), Transformery (Tekst - GPT).
  • Backpropagation: Algorytm wstecznej propagacji błędu, który pozwala sieci “korygować” swoje wagi.

📚 Szczegółowe wyjaśnienie

Wyobraź sobie sieć jako fabrykę z taśmą produkcyjną (Warstwy). Na wejściu wchodzi obrazek kota. Pierwsza warstwa widzi krawędzie. Druga widzi kształty (uszy, wąsy). Trzecia widzi “głowę kota”. Ostatnia mówi: “To jest kot na 99%“. Żaden programista nie zaprogramował “wykrywania wąsów”. Sieć sama do tego doszła, analizując miliony zdjęć kotów i minimalizując funkcję błędu.

💡 Przykład zastosowania

  • Computer Vision: Autonomiczne samochody, odblokowywanie telefonu twarzą.
  • NLP: Tłumacz Google, ChatGPT.
  • Audio: Rozpoznawanie mowy (Siri/Alexa).
  • Medycyna: Wykrywanie raka na zdjęciach RTG (często lepiej niż radiolodzy).

📌 Źródła

  • “Deep Learning” - Ian Goodfellow, Yoshua Bengio, Aaron Courville.
  • fast.ai courses.

👽 Brudnopis

  • Wymaga ogromnej mocy obliczeniowej (GPU).
  • “Black Box problem” - często trudno zrozumieć, dlaczego sieć podjęła taką decyzję (Explainable AI - XAI).