Sieci neuronowe - podstawy

Porównanie wszystkich modeli (graficznych)
- Czy ktoś porównał większość modeli graficznych i podzielił się wynikami?
- Gdzie znaleźć notatnik do porównania?
- Jakie 3 kryteria są używane do porównania?
Wypróbuj nowe modele
- Jak wybrać i wypróbować modele z wysokimi wynikami?
- Gdzie znajduje się plik train.ipynb?
- Jak wypróbować modele w TIMM?
- Jak porównać je pod względem strat?
- Dlaczego ten model jest naprawdę imponujący?
- Co może nam powiedzieć nazwa modelu?
- Dlaczego Jeremy trenuje tylko 3 epoki? 18:58
Uzyskiwanie kategorii modelu
- Jak uzyskać etykiety lub informacje o kategoriach z modelu?
- Reszty dowiedzieliśmy się z ostatniego wykładu.
Co znajduje się w modelu
- Jakie dwie rzeczy są przechowywane w modelu?
Jak wygląda architektura modelu?
Parametry modelu
- Jak powiększyć warstwę modelu?
- Jak sprawdzić parametry warstwy?
- Jak wyglądają parametry warstwy?
Pytania badawcze
- Jakie są wagi/liczby?
- Jak mogą dowiedzieć się czegoś ważnego?
- Gdzie jest notatnik na temat działania sieci neuronowej?
Tworzenie ogólnej funkcji kwadratowej
- Jak utworzyć ogólną funkcję, aby wyprowadzić dowolną określoną funkcję kwadratową, zmieniając 3 parametry?
- Jak wygenerować wynik z określonej funkcji kwadratowej, zmieniając 1 parametr?
- Dlaczego tworzymy taką ogólną (kwadratową) funkcję z wieloma nieznanymi parametrami, zamiast bezpośrednio pisać konkretną funkcję kwadratową o określonych współczynnikach?
Dopasowanie funkcji przez sprawne ręce i oczy
- Co oznacza dopasowanie funkcji (wyszukiwanie lepszych parametrów na podstawie zbioru danych)?
- Jak utworzyć losowy zbiór danych?
- Jak dopasować ogólną funkcję kwadratową do zbioru danych, zmieniając ręcznie 3 parametry za pomocą widżetów jupyter?
- Jakie są ograniczenia tego ręcznego/wizualnego podejścia?
- Gdzie jest ten notatnik?
Strata: lepsze dopasowanie funkcji bez dobrych oczu
- Dlaczego potrzebujemy funkcji straty?
- Co to jest błąd średniokwadratowy?
- W jaki sposób strata pomaga podejściu ręcznemu/wizualnemu być bardziej dokładnym i niezawodnym?
Automatyzacja wyszukiwania parametrów dla lepszej straty
- Skąd mamy wiedzieć, w jaki sposób i o ile zaktualizować parametry, aby poprawić stratę?
- Czy na Khanacademy można znaleźć wystarczająco dużo materiałów pochodnych?
- Co dokładnie musisz wiedzieć o instrumentach pochodnych według Jeremy’ego? 34:26
- Co to jest nachylenie lub gradient?
- Czy pytorch robi dla nas pochodną lub oblicza nachylenie / gradient?
- Jak utworzyć funkcję, aby wyprowadzić niewielką stratę na ogólnej funkcji kwadratowej? 35:02
- Co musisz wiedzieć o tensorze związanym z pochodnymi według Jeremy’ego? 36:02
- Jak utworzyć tensor rzędu 1 (listę do przechowywania liczb) do przechowywania parametrów funkcji kwadratowej? 36:49
- Jak poprosić pytorch o przygotowanie obliczeń gradientów dla tych parametrów? 37:10
- Jak faktycznie obliczyć gradienty dla każdego parametru w oparciu o stratę osiągniętą przez tę konkretną funkcję (3 określone parametry) w stosunku do całego zbioru danych? 37:38
- Innymi słowy, tym razem, gdy obliczamy stratę, możemy również łatwo uzyskać gradient dla każdego parametru.
- Co oznacza wartość gradientu dla każdego parametru? 38:34
- Jak zaktualizować parametry do nowych wartości za pomocą gradientów uzyskanych przez stratę? 39:18
- Jak zautomatyzować powyższy proces, aby znaleźć lepsze parametry w celu osiągnięcia lepszej straty? 41:05
- Dlaczego ta automatyzacja nazywa się zejściem gradientowym?
- notebook
Funkcje matematyczne
- Oprócz zbioru danych, funkcji straty, pochodnej, co jest również bardzo ważne w znajdowaniu/obliczaniu tych parametrów?
- Dlaczego nie możemy po prostu użyć do tego funkcji kwadratowych?
ReLu: Rektyfikowana funkcja liniowa
- Potężne modele w świecie rzeczywistym wymagają złożonych parametrów, a także złożonych funkcji, jak złożoną funkcję możemy wymyślić?
- Czy możliwe jest utworzenie nieskończenie złożonej funkcji poprzez dodanie niezwykle prostych funkcji?
- Jak może wyglądać taka niezwykle prosta funkcja?
- Co to jest rektyfikowana funkcja liniowa? Jak prosta ona jest? Co to jest funkcja liniowa i która jej część jest rektyfikowana?
- Jak wygląda wyprostowana funkcja liniowa na wykresie?
- Jak ręcznie dostosować 2 parametry funkcji za pomocą widżetu?
- Jak może wyglądać funkcja przy różnych parametrach? 44:46
Nieskończenie złożona funkcja
- Jak potężne może być dodawanie niezwykle prostych funkcji?
- Jak utworzyć podwójnie rektyfikowaną funkcję liniową (double relu) i ręcznie dostosować 4 parametry za pomocą widżetu?
- O ile bardziej elastycznie wygląda ta podwójna funkcja relu w porównaniu do pojedynczej wyprostowanej funkcji liniowej?
- Czy możesz sobie wyobrazić, jak złożona może być funkcja, gdy dodane zostaną miliony wyprostowanych funkcji liniowych?
2 okręgi do sowy
- Bardzo zwięzłe podsumowanie łączenia podstawowych pomysłów na głębokie uczenie się
Wykres porównujący wszystkie modele obrazów
- Czy można to zrobić za pomocą obliczeń brute force z prostym kodem?
- Czy Jeremy szuka najlepszych modeli na wykresie porównawczym modeli?
- Jaki jest niewłaściwy sposób korzystania z wykresu porównawczego przez studentów? 50:45
- W jaki sposób Jeremy korzysta z wykresu?
- W jaki sposób Jeremy decyduje, które modele wypróbować krok po kroku?
Czy mam wystarczająco dużo danych?
- Czy zbudowałeś już model i trenowałeś na własnym zestawie danych?
- Czy wynik jest wystarczająco dobry?
- Jaki błąd często popełnia branża DL w tej kwestii? 52:55
- Jaka jest sugestia Jeremy’ego?
- W jaki sposób i w czym może pomóc pół-nadzorowane uczenie się i rozszerzanie danych?
- Co z danymi etykietowanymi i nieetykietowanymi?
Interpretować gradienty w jednostce?
- O ile zmniejsza się strata, gdy parametr a wzrasta o jednostkę 1? 55:24
Szybkość uczenia się
- Dlaczego nie aktualizujemy wartości parametrów w dużych krokach?
- Dlaczego Jeremy rysuje funkcję kwadratową, aby odnieść się do modelu podczas powiększania bardzo blisko funkcji złożonej?
- Co by się stało, gdybyśmy aktualizowali parametry z dużymi wartościami? 57:19
- Czy duży spadek strat koniecznie wymaga dużego wzrostu wartości parametru zgodnie z kwadratową naturą?
- Czym jest współczynnik uczenia? Dlaczego potrzebujemy, aby był mały? Jak wybrać jego dobrą wartość? 58:07
- Co by się stało, gdyby współczynnik uczenia był zbyt duży?
- Co by się stało, gdyby był zbyt mały?
przerwa
Mnożenie macierzy
- Kiedy model wymaga milionów wyprostowanych funkcji liniowych, jak obliczyć je wystarczająco szybko?
- Co tak naprawdę jest potrzebne z algebry liniowej do wykonania DL 1:01:33
- Jak łatwo jest wykonać mnożenie macierzy? 1:01:51
- Co to jest zbiór danych i parametry w mnożeniu macierzy?
- Czy mnożenie macierzy wykonuje za ciebie część rektyfikowaną?
- W czym GPU jest dobre? 1:03:49
Budowanie modelu regresji w arkuszu kalkulacyjnym
- Wprowadzenie do konkursu Titanic na Kaggle 1:05:01
- Czym jest zbiór danych 1:05:18
- Co zrobić z plikiem train.csv?
- Jak nieco oczyścić zbiór danych?
- Jak przekształcić zbiór danych do mnożenia macierzy? 1:07:17
- Jak przygotować parametry do mnożenia macierzy? 1:08:50
- Co jest nie tak ze znacznie większą wartością kolumny “Fare” w porównaniu do innych kolumn? 1:09:35
- Co zrobić z wartościami “Fare” i analogicznie z wartościami “Age”?
- Co to jest normalizacja danych?
- Czy fastai wykonuje te wszystkie normalizacje za nas? Czy w przyszłości dowiemy się, jak fastai to robi?
- Dlaczego stosować log do wartości “Fare”? 1:10:59
- Dlaczego potrzebujemy równomiernie rozłożonych wartości?
- Jak wykonać mmult na zbiorze danych i parametrach w arkuszu kalkulacyjnym? 1:11:56
- Jak użyć mmult zamiast dodawania, aby dodać stałą?
- Jak wygląda wynik naszego modelu? 1:13:41
- Czy Jeremy po prostu używa regresji liniowej do modelu, nawet nie relu?
- Czy możemy rozwiązać regresję za pomocą zejścia gradientowego? Jak to zrobić?
Zbuduj sieć neuronową, dodając dwa modele regresji
- Co trzeba zrobić, aby przekształcić model regresji w sieć neuronową?
- Dlaczego nie sumujemy wyników dwóch funkcji liniowych?
- Dlaczego dodajemy wyniki dopiero po ich skorygowaniu?
- Jak wygląda predykcja modelu?
- Teraz musimy zaktualizować parametry dwóch funkcji liniowych, a nie tylko jednej.
Mnożenie macierzy przyspiesza uczenie
- Jak sprawić, by trening wykonywał mnożenie macierzy zamiast dodawania mnożeń liniowych w arkuszu kalkulacyjnym?
Uważaj! To rozdział 4
- Zapraszamy do wzięcia udziału w konkursie Titanic
- Dlaczego rozdział 4 odstraszył większość ludzi?
- Sposoby samodzielnego opracowania arkusza kalkulacyjnego
Utwórz zmienne zastępcze 3 klas
- Czy potrzebujemy tylko 2 kolumn/klas dla zmiennej fikcyjnej z 3 klasami?
Posmakuj NLP
- Czym zajmują się modele przetwarzania języka naturalnego?
- Jakie możliwości projektowe mają studenci nie mówiący po angielsku?
- Jakie zadania może wykonywać NLP? 1:25:57
Biblioteka fastai NLP vs biblioteka Hugging Face
- Czym różnią się te dwie biblioteki?
- Dlaczego w tym wykładzie używamy biblioteki transformer?
Praca domowa przygotowująca do następnej lekcji

Quartz 4

Explorer

Sieci neuronowe - podstawy

Graph View