Czym są CNN?
CNN są projektowane z myślą o przestrzennym przetwarzaniu informacji. Składają się z warstw konwolucyjnych, które przeszukują obraz w poszukiwaniu lokalnych wzorców, takich jak krawedzie, tekstury przy pomocy filtrów.
Filtry
Czym są filtry?
Budowanie osadzeń od podstaw
- Jak będzie wyglądać część 2? Dużo głębiej technicznie? Umiejętność czytania i wdrażania artykułów naukowych? Modele obejmują rzeczywiste sytuacje?
- Przegląd budowania sieci neuronowej od podstaw. Jak Pytorch tworzy sieć neuronową bez wysiłku? Jak Pytorch śledzi wagi modelu za pomocą
Module
? W jaki sposóbModule
przechowuje wagi za pomocąnn.Parameter
? Jak sprawdzić wagi z modelu za pomocąparameters()
?
- Możesz zbudować warstwę w Module z
nn.Linear
beznn.Parameter
, a Pytorch może również odczytać z niej wagi.
- Jak utworzyć funkcję
Embedding
i całą warstwęDotProductBias
w pytorch używająccreate_params
od zera? Po wytrenowaniu można sprawdzić wytrenowanemovie_bias
. Kształt uprzedzenia można sprawdzić za pomocąmodel.movie_bias.shape
.
- Pytania: Co robi
Tensor.normal_
?
Interpretacja embeddings
- Po treningu, co
movie_bias
może nam powiedzieć o każdym i wszystkich filmach? Co oznacza niski bias dla filmu? Co oznacza wysokie odchylenie dla filmu? Czyuser_bias
może nam powiedzieć, który użytkownik po prostu kocha filmy, nawet te kiepskie? To jest wizualizacjamovie_bias
- Co możemy zinterpretować lub zrobić z ogromną macierzą o kształcie
(num_users, 50)
? Jak zmniejszyć 50 ukrytych czynników do zaledwie 3 najważniejszych za pomocąpca
?
- Jak zinterpretować wykres PCA filmów ocenionych za pomocą tylko dwóch czynników PCA z 3 skompresowanych przez 50 czynników? W jaki sposób gust lub styl filmów jest skondensowany do dwóch czynników i wyświetlany i definiowany przez położenie dwuwymiarowego wykresu? Jest to wizualizacja movie_factors lub embeddings.
- W jaki sposób fastai ułatwia całą powyższą pracę za pomocą tylko jednej linii kodu?
- Jak fastai konstruuje wszystko pod maską
collab_learner
?
- Pytania: czy PCA jest przydatne w innych zastosowaniach? Gdzie znaleźć więcej informacji o PCA? Dlaczego warto wziąć udział w kursie Rachel’s Computational Linear Algebra?
- Jak użyć odległości osadzania, aby znaleźć podobieństwa filmów?
- Przejdź do szybkiej książki na temat boostrappingu modelu filtrowania opartego na współpracy
Deep learning for collaborative filtering
- Jak wykonać filtrowanie kolaboracyjne z głębokim uczeniem zamiast uzupełniania macierzy za pomocą powyższego iloczynu kropkowego? Jak zastosować architekturę modelu sieci neuronowej easist do tego przypadku filtrowania opartego na współpracy?
- W jaki sposób fastai używa reguł kciuka, aby zalecić liczbę ukrytych czynników dla użytkowników i filmów?
- W jaki sposób fastai wykorzystuje głębokie uczenie do budowania modelu filtrowania kolaboracyjnego na dwa sposoby?
Dlaczego wersje głębokiego uczenia nie są tak dobre jak wersja DotProduct? Czy to dlatego, że DotProduct jest bardziej dostosowany do problemu? W jaki sposób firmy łączą obie wersje, aby wykonać filtrowanie kolaboracyjne? Czy w przypadku dużej ilości metadanych należy zastosować do nich głębokie uczenie? Jak wykorzystać metadane w modelu? - Pytania: Czy mniejsza liczba użytkowników i filmów może przytłoczyć wszystkich innych? np. mała grupa entuzjastów anime ogląda wiele filmów anime i wystawia bardzo wysokie oceny. Szczegóły, jak sobie z nimi radzić, nie będą tutaj omawiane - Jak zastosować macierz osadzania w modelu NLP za pomocą demo arkusza kalkulacyjnego? Jaka jest istota sieci neuronowej?
- Jak zastosować osadzanie do tabelarycznego zbioru danych i modeli? Jak zrozumieć źródło
TabularModel
itabular_learner
? - Co dzieje się wewnątrz sieci neuronowej poprzez konkurs kaggle dotyczący przewidywania sprzedaży w sklepie i opublikowany na jego podstawie artykuł?
Convolutions
- Do tej pory przyjrzeliśmy się temu, co wchodzi jako dane wejściowe i co wychodzi z modelu jako dane wyjściowe. Przyjrzeliśmy się również środkowi jako mnożeniu macierzy. Czym są konwolucje (szczególny rodzaj mnożenia macierzy w środku)? W jaki sposób jest to bardzo przydatne w CV? Dlaczego MNIST jest jednym z najbardziej znanych zbiorów danych CV? W jaki sposób Jeremy stosuje artykuł Fergusa i Zeilera do MNIST przy użyciu Excela i splotu?
- Jak rozumieć konwolucję? Co robi filtr i jak pomaga wykrywać poziome i pionowe krawędzie? Jak określić rozmiar filtra lub jądra (3x3, 5x5 lub dowolny)? conv1 oznacza pierwszą warstwę konwolucyjną.
- przejście do drugiej warstwy konwolucyjnej. Dwa filtry dają nam dwa kanały na pierwszej warstwie konwolucyjnej. Na drugiej warstwie konwolucyjnej tworzymy jeden filtr macierzowy 3D, który ma dwa filtry macierzowe do filtrowania/przetwarzania dwóch kanałów z pierwszej warstwy konwolucyjnej i kondensowania wartości. Możemy również utworzyć drugi kanał dla drugiej warstwy konwolucyjnej przy użyciu innego filtra 3D.
- Jak określić dane wyjściowe i użyć SGD do trenowania modelu i optymalizacji filtrów?
- Co to jest maxpooling? Jaki jest problem z maxpoolingiem? Ile danych tracimy? Dlaczego jest to dobra rzecz? Co to jest gęsta warstwa i do czego służy?
- Jak dziś nieco inaczej wykonujemy splot? Co to jest splot stride-two i jak działa? (koniec z maxpoolingiem) Następnie wykonujemy wiele splotów stride-two, aż rozmiar zmniejszy się do 7x7, a następnie wykonujemy
average_pooling
(koniec z gęstą warstwą). Co oznacza siatka 7x7 i uśrednienie? Jaki jest problem takiego podejścia? Kiedy jest dobry moment na użycie maxpool? W jaki sposób fastai ułatwił nam wypróbowanie obu poolingów, wymyślając technikę zwanąconcat_pooling
do maxpool iaverage_pool
i łącząc je razem? - Jak rozumieć splot w kontekście mnożenia macierzy?
- Co to jest dropout i jak go zrozumieć za pomocą programu Excel? Co to jest maska dropout? Jaki jest jej efekt wizualny w programie Excel? Jak rozumieć dropout jako rozszerzenie danych dla aktywacji? Jak pomaga uniknąć nadmiernego dopasowania? Jaka jest historia dropout i środowiska akademickiego?
- Dlaczego Jeremy nie poświęca zbyt wiele czasu funkcjom aktywacji? Widzieliśmy wiele funkcji dotyczących metryk, strat i aktywacji.
- Co dalej przed fastai part2? O czym jest książka Radka meta learning? Jakie są rzeczy do zrobienia w Write, Help, Gather i Build?
- Członek społeczności fastai opublikował aktywację mish używaną przez wiele najnowocześniejszych modeli.
Jeremy AMA
- Jak nadążyć? Aby nadążyć, koncentrując się na poddziedzinie głębokiego uczenia się i koncentrując się na rzeczach, które niewiele się zmieniają, ponieważ fundamenty fastai nie zmieniły się zbytnio od 5 lat temu. Wszystko inne to tylko poprawki.
- Czy ogromne zbiory danych i obliczenia na GPU zastąpią nas małymi zbiorami danych i jednym procesorem graficznym? Zawsze istnieją mądrzejsze sposoby robienia rzeczy, np. zespół Fastai trenował na imagenet na standardowym GPU szybciej niż wszystkie firmy z ogromną ilością GPU. Wybierz obszary różnych dziedzin, w których mniejsze modele mogą pokonać aktualny stan wiedzy.
- Jak Jeremy uczy dzieci matematyki? Wszystkie dzieci mogą uczyć się algebry z dragonbox5+. Świetnie, Jeremy obiecał porozmawiać więcej o nauczaniu dzieci w późniejszym terminie.
- Plany na przyszłość
- Jak przekształcić model w biznes? Świetna wiadomość, Jeremy planuje stworzyć kurs na ten temat! Jaki jest początek biznesu? Jaki jest pierwszy krok? Jak stopniowo dowiedzieć się, czy Twój pomysł ma realną potrzebę ze strony ludzi?
- Jak Jeremy pozostaje tak wydajny w pracy? Skończyć coś ładnie, wytrwałość