# Pytorch_10_Proste sieci neuronowe_pytorch-custom-nn-modules4

W PyTorch nnpakiet określa zestaw modułów , które są w przybliżeniu równoważne dla warstwy sieci neuronowych. Moduł odbiera Tensory wejściowe i oblicza Tensory wyjściowe, ale może również utrzymywać stan wewnętrzny, taki jak Tensory zawierające parametry możliwe do nauczenia. nnPakiet definiuje także zestaw przydatnych funkcji straty, które są powszechnie stosowane podczas treningu sieci neuronowych.

https://github.com/jcjohnson/pytorch-examples#pytorch-custom-nn-modules


In [1]:
import torch

Odpalam karte graficzną GPU

In [2]:
device = torch.device('cpu') # obliczenia robie na CPU
#device = torch.device('cuda') # obliczenia robie na GPU

### Dane
- N to wielkość partii; 
- D_in jest wymiarem wejściowym; 
- H jest ukrytym wymiarem; 
- D_out jest wymiarem wyjściowym. 


## <span style="color:red">Przyjmuje 10 zmiennych wynikowych! Coś nowego!</span>

In [3]:
N, D_in, H, D_out = 64, 1000, 100, 10

Powyżej zostały określone parametry aby tensor zmiennych niezależnych i tensor wynikowy były odpowiednie 

x: 64 obserwacji i 1000 zmiennych

y: 64 obserwacji i 10 zmiennych

### Tworzy losowe dane wejściowe i wyjściowe 

In [4]:
x = torch.randn(N, D_in, device=device)
y = torch.randn(N, D_out, device=device)

### Model
Użyj pakietu nn, aby zdefiniować nasz model jako sekwencję warstw. nn.Sequential to moduł, który zawiera inne moduły i stosuje je kolejno, aby wygenerowały wynik. Każdy moduł liniowy oblicza dane wyjściowe za pomocą funkcji liniowej i przechowuje wewnętrzne tensory ze względu na swoją wagę i obciążenie. Po zbudowaniu modelu używamy metody .to (), aby przenieść go na żądane urządzenie. 

In [5]:
model = torch.nn.Sequential(
          torch.nn.Linear(D_in, H),
          torch.nn.ReLU(),
          torch.nn.Linear(H, D_out),
        ).to(device)

### Funkcja straty MSE
Pakiet nn zawiera również definicje popularnych funkcji utraty; w tym wypadku użyjemy błąd średniokwadratowy (MSE) w naszej funkcji strat. Ustawienie redukcji = „suma” oznacza, że obliczamy * sumę * błędów kwadratu zamiast ; ma to na celu zachowanie spójności z powyższymi przykładami, w których ręcznie obliczamy stratę, ale w praktyce bardziej powszechne jest stosowanie średniego kwadratu błędu jako straty, ustawiając redukcję = „elementwise_mean”. 

In [6]:
loss_fn = torch.nn.MSELoss(reduction='sum')

### Definiowanie nauki
Przekaz do przodu: oblicz przewidywane y przez przekazanie x do modelu. Obiekty modułowe 
przesłania operator __call__, aby można było wywoływać je jak funkcje. Gdy w ten sposób przekazujesz Tensor danych wejściowych do modułu i on generuje tensor danych wyjściowych.

In [10]:
learning_rate = 1e-4
for t in range(500):
  
   y_pred = model(x)
            
 
   loss = loss_fn(y_pred, y) # <=# Obliczenie i wydruku straty. Mijamy Tensory zawierające przewidywane i prawdziwe
   print(t, loss.item())     # <=# wartości y, a funkcja straty zwraca Tensor zawierający stratę.
       
  
   model.zero_grad()    #<= # Zeruj gradienty przed uruchomieniem przejścia do tyłu. 
   

   loss.backward()      #<== Przełożenie wsteczne: oblicz gradient gradientu w odniesieniu do wszystkich możliwych do nauczenia się
                                 # parametrów modelu. Wewnętrznie parametry każdego modułu są przechowywane
                                 # w Tensorach z requires_grad=True, więc to wywołanie obliczy gradienty
                                 # wszystkich możliwych do nauczenia parametrów w modelu.
  
   with torch.no_grad():              #<== Zaktualizuj ciężary za pomocą opadania gradientu. Każdy parametr jest tensorem, więc
     for param in model.parameters():         # możemy uzyskać dostęp do jego danych i gradientów tak jak wcześniej.
       param.data -= learning_rate * param.grad

0 2.2882903905063756e-10
1 2.2973681290672232e-10
2 2.2787620401754083e-10
3 2.2812059186083644e-10
4 2.283020023030602e-10
5 2.2761291462725097e-10
6 2.2798297971693415e-10
7 2.2767142338064872e-10
8 2.2622126394367115e-10
9 2.242103308569554e-10
10 2.2523546916453085e-10
11 2.2451354664276835e-10
12 2.2422907974828377e-10
13 2.2359579465724977e-10
14 2.2373677910358936e-10
15 2.231634321780973e-10
16 2.2116460052234999e-10
17 2.2014912115508878e-10
18 2.2033797009157752e-10
19 2.204263993554889e-10
20 2.1991661269815665e-10
21 2.1927233639917887e-10
22 2.193395326477443e-10
23 2.19265466894214e-10
24 2.1818984119459373e-10
25 2.1830562357827432e-10
26 2.1887808232534667e-10
27 2.1744041289739613e-10
28 2.1620673307243266e-10
29 2.1597018617924846e-10
30 2.170716939531303e-10
31 2.158057899048771e-10
32 2.1598170474312894e-10
33 2.1579039943819822e-10
34 2.152005657007905e-10
35 2.1527105098506638e-10
36 2.1452417620082542e-10
37 2.1511083192482516e-10
38 2.1541765593546813e-10
39 2.1

310 1.4091462718912595e-10
311 1.40318381913751e-10
312 1.4010903548467013e-10
313 1.3934303710883e-10
314 1.3811689292264617e-10
315 1.3743682580891203e-10
316 1.3692733058512374e-10
317 1.3744558269301876e-10
318 1.374697855549556e-10
319 1.3706866197615852e-10
320 1.3702231016488042e-10
321 1.3629423978311905e-10
322 1.361158546986374e-10
323 1.359352352903187e-10
324 1.358800016948436e-10
325 1.3590847891542523e-10
326 1.357105955390736e-10
327 1.353539780257762e-10
328 1.356287027132197e-10
329 1.3522766240114947e-10
330 1.3527111375477574e-10
331 1.3541821830553857e-10
332 1.3483973659855764e-10
333 1.3448771263302461e-10
334 1.3415298039110013e-10
335 1.3412214394659117e-10
336 1.3442583157718957e-10
337 1.3452636227206938e-10
338 1.345390188145501e-10
339 1.3452632063870595e-10
340 1.343686967247848e-10
341 1.3432122081269426e-10
342 1.3426404432692607e-10
343 1.3385575980962017e-10
344 1.3339057636230223e-10
345 1.3310064161942137e-10
346 1.3267088816437678e-10
347 1.323215981