🎯 Definicja
Deep Learning (DL) to poddziedzina Uczenia Maszynowego (ML), która opiera się na Sztucznych Sieciach Neuronowych o wielu warstwach (stąd “Deep”). W przeciwieństwie do klasycznego ML, gdzie człowiek musiał wskazać cechy (Features), DL potrafi samo nauczyć się cech wprost z surowych danych (pikseli, dźwięku, tekstu).
🔑 Kluczowe punkty
- Reprezentacja Danych: Sieć sama uczy się, że “kreska + kółko = oko”.
- Skalowalność: Im więcej danych, tym model jest lepszy (klasyczny ML w pewnym momencie przestaje się uczyć).
- Architektury: CNN (Obrazy), RNN/LSTM (Sekwencje), Transformery (Tekst - GPT).
- Backpropagation: Algorytm wstecznej propagacji błędu, który pozwala sieci “korygować” swoje wagi.
📚 Szczegółowe wyjaśnienie
Wyobraź sobie sieć jako fabrykę z taśmą produkcyjną (Warstwy). Na wejściu wchodzi obrazek kota. Pierwsza warstwa widzi krawędzie. Druga widzi kształty (uszy, wąsy). Trzecia widzi “głowę kota”. Ostatnia mówi: “To jest kot na 99%“. Żaden programista nie zaprogramował “wykrywania wąsów”. Sieć sama do tego doszła, analizując miliony zdjęć kotów i minimalizując funkcję błędu.
💡 Przykład zastosowania
- Computer Vision: Autonomiczne samochody, odblokowywanie telefonu twarzą.
- NLP: Tłumacz Google, ChatGPT.
- Audio: Rozpoznawanie mowy (Siri/Alexa).
- Medycyna: Wykrywanie raka na zdjęciach RTG (często lepiej niż radiolodzy).
📌 Źródła
- “Deep Learning” - Ian Goodfellow, Yoshua Bengio, Aaron Courville.
- fast.ai courses.
👽 Brudnopis
- Wymaga ogromnej mocy obliczeniowej (GPU).
- “Black Box problem” - często trudno zrozumieć, dlaczego sieć podjęła taką decyzję (Explainable AI - XAI).