In [1]:
import torch
import torch.nn as nn

## Generownie danych losowych
Zacznijmy od utworzenia przykładowych danych za pomocą torch.
W danych poniżej X przedstawiono liczbę godzin studiowanych i czas spędzony przez studentów na spaniu, 
podczas gdy y reprezentują oceny.
Tworze tensory X i y.


In [2]:
X = torch.tensor(([2, 9,2,5,6,2], [1, 5,3,7,6,4], [3, 6,4,9,7,1], [4, 6,14,19,8,2]), dtype=torch.float) # 3 X 2 tensor
y = torch.tensor(([92], [100], [89], [77]), dtype=torch.float) # 3 X 1 tensor
xPredicted = torch.tensor(([4, 8,9,2,3,2]), dtype=torch.float) # 1 X 2 tensor

In [3]:
y

tensor([[ 92.],
        [100.],
        [ 89.],
        [ 77.]])

In [4]:
X

tensor([[ 2.,  9.,  2.,  5.,  6.,  2.],
        [ 1.,  5.,  3.,  7.,  6.,  4.],
        [ 3.,  6.,  4.,  9.,  7.,  1.],
        [ 4.,  6., 14., 19.,  8.,  2.]])

### xPredicted
Zmienna xPredicted jest pojedynczym wejściem, dla którego chcemy przewidzieć ocenę z wykorzystaniem parametrów wyuczonych przez sieć neuronową. Pamiętaj, że sieć neuronowa chce nauczyć się mapowania między X i y, więc spróbuje zgadywać z tego, czego nauczyła się z danych treningowych.

In [5]:
xPredicted

tensor([4., 8., 9., 2., 3., 2.])

In [6]:
print(X.size())
print(y.size())
print(xPredicted.size())

torch.Size([4, 6])
torch.Size([4, 1])
torch.Size([6])


<div class="alert-success">
Sieć neuronowa do odpowiedniego działania potrzebuje poprawnie zdefiniowanych danych wejściowych. Istnieje wiele metod zapewnienia poprawności danych zależnie od ich charakteru oraz rodzaju sieci. Niezależnie od rodzaju sieci i problemu, który ma być rozwiązany, dane powinny spełniać podstawowe warunki, takie jak reprezentatywność, pełne oddanie problemu, odpowiednie przeskalowanie i normalizacja, eliminacja niedokładności pomiarów. Przeprowadzenie tych czynności jest niezbędne do poprawnego działania sieci.

Zauważ, że funkcja max zwraca zarówno tensor, jak i odpowiednie indeksy. Dlatego używamy _do przechwytywania wskaźników, których tutaj nie wykorzystamy, ponieważ interesują nas tylko maksymalne wartości do przeprowadzenia skalowania. Doskonale! Nasze dane są teraz w bardzo ładnym formacie, który nasza sieć neuronowa doceni później.

### Skalowanie i normalizacja
Dane przetwarzane przez sieć pochodzą najczęściej z obserwacji pewnych wartości w badanym modelu. Ich skala wartości zazwyczaj nie na bezpośrednie wprowadzenie na wejścia sieci. Istnieje kilka popularnych metod skalowania. Poniżej wymieniono najczęściej stosowane.

skalowanie względem wartości maksymalnej:
![image.png](attachment:image.png)


<div class="alert-success">
Skalowanie lub normalizacja danych to proces tworzenia danych modelu w standardowym formacie, dzięki czemu szkolenie jest ulepszone, dokładne i szybsze. Metoda skalowania danych w sieciach neuronowych jest podobna do normalizacji danych w dowolnym problemu uczenia maszynowego.

##### torch.max(X)
max po prostu wybiera największą wartość i ignoruje pozostałe, więc max jest operacją tożsamości dla tego jednego elementu. Dlatego gradient może przepływać przez nią tylko dla jednego elementu.

In [7]:
print('tensory przed skalowaniem')
print()
print(X)
print(y)

tensory przed skalowaniem

tensor([[ 2.,  9.,  2.,  5.,  6.,  2.],
        [ 1.,  5.,  3.,  7.,  6.,  4.],
        [ 3.,  6.,  4.,  9.,  7.,  1.],
        [ 4.,  6., 14., 19.,  8.,  2.]])
tensor([[ 92.],
        [100.],
        [ 89.],
        [ 77.]])


### Skalowanie względem wartości maksymalnej zmienych X
![image.png](attachment:image.png)

In [8]:
# scale units
X_max, _ = torch.max(X, 0)
X = torch.div(X, X_max)


print(X)

tensor([[0.5000, 1.0000, 0.1429, 0.2632, 0.7500, 0.5000],
        [0.2500, 0.5556, 0.2143, 0.3684, 0.7500, 1.0000],
        [0.7500, 0.6667, 0.2857, 0.4737, 0.8750, 0.2500],
        [1.0000, 0.6667, 1.0000, 1.0000, 1.0000, 0.5000]])


Skalowanie wartości y

In [9]:
xPredicted_max, _ = torch.max(xPredicted, 0)
xPredicted = torch.div(xPredicted, xPredicted_max)
y = y / 100  # max test score is 100
print(xPredicted)

tensor([0.4444, 0.8889, 1.0000, 0.2222, 0.3333, 0.2222])


In [10]:
print(xPredicted)
print()
print(xPredicted_max)

tensor([0.4444, 0.8889, 1.0000, 0.2222, 0.3333, 0.2222])

tensor(9.)


In [11]:
print('Tensory po przeskalowaniu:')
print()
print(y)
print()
print(X)

Tensory po przeskalowaniu:

tensor([[0.9200],
        [1.0000],
        [0.8900],
        [0.7700]])

tensor([[0.5000, 1.0000, 0.1429, 0.2632, 0.7500, 0.5000],
        [0.2500, 0.5556, 0.2143, 0.3684, 0.7500, 1.0000],
        [0.7500, 0.6667, 0.2857, 0.4737, 0.8750, 0.2500],
        [1.0000, 0.6667, 1.0000, 1.0000, 1.0000, 0.5000]])


## Model (wykres obliczeniowy)

Po zeskalowaniu danych w odpowiednim formacie wystarczy teraz zdefiniować model. 
Dla celów ilustracyjnych budujemy następującą sieć neuronową lub wykres obliczeniowy:
![image.png](attachment:image.png)

Po pierwsze, zdefiniowaliśmy nasz model za pomocą klasy, ponieważ jest to zalecany sposób na zbudowanie wykresu obliczeniowego. Nagłówek klasy zawiera nazwę klasy Neural Networki parametr, nn.Modulektóry zasadniczo wskazuje, że definiujemy naszą własną sieć neuronową.

In [12]:
class Neural_Network(nn.Module):
    def __init__(self, ):
        super(Neural_Network, self).__init__()
        # parameters
        # TODO: parameters can be parameterized instead of declaring them here
        self.inputSize = 6     # ---Tyle ile jest obserwacji
        self.outputSize = 1
        self.hiddenSize = 6    # ---Tyle ile jest obserwacji (czyli np 6 rekordów)
        
        # weights
        self.W1 = torch.randn(self.inputSize, self.hiddenSize) # 
        self.W2 = torch.randn(self.hiddenSize, self.outputSize) # 3 X 1 tensor
        
    def forward(self, X):
        self.z = torch.matmul(X, self.W1) # 3 X 3 ".dot" does not broadcast in PyTorch
        self.z2 = self.sigmoid(self.z) # activation function
        self.z3 = torch.matmul(self.z2, self.W2)
        o = self.sigmoid(self.z3) # final activation function
        return o
        
    def sigmoid(self, s):
        return 1 / (1 + torch.exp(-s))
    
    def sigmoidPrime(self, s):
        # derivative of sigmoid
        return s * (1 - s)
    
    def backward(self, X, y, o):
        self.o_error = y - o # error in output
        self.o_delta = self.o_error * self.sigmoidPrime(o) # derivative of sig to error
        self.z2_error = torch.matmul(self.o_delta, torch.t(self.W2))
        self.z2_delta = self.z2_error * self.sigmoidPrime(self.z2)
        self.W1 += torch.matmul(torch.t(X), self.z2_delta)
        self.W2 += torch.matmul(torch.t(self.z2), self.o_delta)
        
    def train(self, X, y):
        # forward + backward pass for training
        o = self.forward(X)
        self.backward(X, y, o)
        
    def saveWeights(self, model):
        # we will use the PyTorch internal storage functions
        torch.save(model, "NN")
        # you can reload model with all the weights and so forth with:
        # torch.load("NN")
        
    def predict(self):
        print ("Predicted data based on trained weights: ")
        print ("Input (scaled): \n" + str(xPredicted))
        print ("Output: \n" + str(self.forward(xPredicted)))      

### Inicjalizacja

Następnym krokiem jest zdefiniowanie inicjalizacji ( def __init__(self,)), które będą wykonywane po utworzeniu wystąpienia niestandardowej sieci neuronowej. Tutaj możesz zadeklarować parametry swojego modelu, ale zazwyczaj w tej sekcji zadeklarujesz strukturę swojej sieci - rozmiar ukrytych warstw i tak dalej. Ponieważ budujemy sieć neuronową od zera, wyraźnie zadeklarowaliśmy rozmiar macierzy wag: taką, która przechowuje parametry od wejściowej do ukrytej warstwy; i taki, który przechowuje parametr od warstwy ukrytej do wyjściowej. Obie macierze masy są inicjowane wartościami losowo wybranymi z rozkładu normalnego za pośrednictwem torch.randn(...). Pamiętaj, że nie używamy uprzedzeń tylko po to, aby maksymalnie uprościć sprawę.

### Funkcja forward (przekazywania)

Funkcja forward jest gdzie wszystko dzieje się magia (WARSTWA UKTYTA). W tym miejscu dane wchodzą i są wprowadzane do wykresu obliczeniowego (tj. Zbudowanej przez nas struktury sieci neuronowej). Ponieważ budujemy prostą sieć neuronową z jedną ukrytą warstwą, nasza funkcja przekazywania wygląda bardzo prosto:

Powyższa funkcja forward pobiera dane wejściowe, X a następnie wykonuje mnożenie macierzy ( torch.matmul(...)) z pierwszą macierzą wagi self.W1. Następnie wynik zastosowano funkcję aktywacyjnego sigmoid. Powstała macierz aktywacji jest następnie mnożona przez drugą macierz wagową self.W2. Następnie wykonywana jest kolejna aktywacja, która renderuje dane wyjściowe sieci neuronowej lub grafu obliczeniowego. Opisany powyżej proces jest po prostu tak zwany feedforward pass. Aby zoptymalizować wagi podczas treningu, potrzebujemy algorytmu propagacji wstecznej.

### Funkcja backward (wstecznej propagacji błędów)
Funkcja backward zawiera algorytm wstecznej propagacji błędów, w której celem jest przede wszystkim zminimalizować straty. Innymi słowy, wagi muszą zostać zaktualizowane w taki sposób, aby strata zmniejszała się podczas szkolenia sieci neuronowej. Cała ta magia jest możliwa dzięki algorytmowi spadku gradientu zadeklarowanemu w funkcji backward.

### Trening
Pozostało już tylko trenować sieć neuronową. Najpierw tworzymy instancję wykresu obliczeniowego, który właśnie zbudowaliśmy:

In [13]:
NN = Neural_Network()

Następnie trenujemy model do 1000 rund. Zauważ, że w PyTorch NN(X) automatycznie wywołuje funkcję forward, więc nie ma potrzeby jawnego wywoływania NN.forward(X).

Po uzyskaniu przewidywanego wyniku dla każdej rundy szkolenia, obliczamy stratę za pomocą następującego kodu:

In [14]:
torch.mean((y - NN(X))**2).detach().item()

0.4198129177093506

Następnym krokiem jest rozpoczęcie treningu (do przodu + do tyłu) przez NN.train(X, y). 
Po przeszkoleniu sieci neuronowej, możemy przechowywać model i moc przewidywana wartość pojedynczej instancji zadeklarowanej na początku xPredicted.

Poćwiczmy!

In [15]:
NN = Neural_Network()
for i in range(1000):  # trains the NN 1,000 times
    print ("#" + str(i) + " Loss: " + str(torch.mean((y - NN(X))**2).detach().item()))  # mean sum squared loss
    NN.train(X, y)
NN.saveWeights(NN)
NN.predict()

#0 Loss: 0.010882655158638954
#1 Loss: 0.010741556994616985
#2 Loss: 0.010618951171636581
#3 Loss: 0.010510974563658237
#4 Loss: 0.010414671152830124
#5 Loss: 0.0103277787566185
#6 Loss: 0.010248560458421707
#7 Loss: 0.010175621137022972
#8 Loss: 0.010107876732945442
#9 Loss: 0.010044464841485023
#10 Loss: 0.009984665550291538
#11 Loss: 0.009927908889949322
#12 Loss: 0.00987373385578394
#13 Loss: 0.00982174463570118
#14 Loss: 0.00977163203060627
#15 Loss: 0.009723127819597721
#16 Loss: 0.009676005691289902
#17 Loss: 0.009630080312490463
#18 Loss: 0.009585190564393997
#19 Loss: 0.009541215375065804
#20 Loss: 0.009498033672571182
#21 Loss: 0.00945555604994297
#22 Loss: 0.009413701482117176
#23 Loss: 0.00937238335609436
#24 Loss: 0.009331567212939262
#25 Loss: 0.009291188791394234
#26 Loss: 0.009251201525330544
#27 Loss: 0.00921158492565155
#28 Loss: 0.009172281250357628
#29 Loss: 0.00913328304886818
#30 Loss: 0.00909455120563507
#31 Loss: 0.00905609130859375
#32 Loss: 0.00901785213500261

#259 Loss: 0.0028613819740712643
#260 Loss: 0.0028431855607777834
#261 Loss: 0.0028250855393707752
#262 Loss: 0.0028070942498743534
#263 Loss: 0.0027891951613128185
#264 Loss: 0.0027714066673070192
#265 Loss: 0.002753716893494129
#266 Loss: 0.0027361311949789524
#267 Loss: 0.002718646079301834
#268 Loss: 0.0027012634091079235
#269 Loss: 0.0026839841157197952
#270 Loss: 0.002666810993105173
#271 Loss: 0.0026497358921915293
#272 Loss: 0.0026327641680836678
#273 Loss: 0.002615900244563818
#274 Loss: 0.0025991396978497505
#275 Loss: 0.002582480665296316
#276 Loss: 0.002565924311056733
#277 Loss: 0.002549470402300358
#278 Loss: 0.0025331187061965466
#279 Loss: 0.0025168797001242638
#280 Loss: 0.002500736154615879
#281 Loss: 0.002484698314219713
#282 Loss: 0.0024687645491212606
#283 Loss: 0.002452937653288245
#284 Loss: 0.0024372099433094263
#285 Loss: 0.0024215877056121826
#286 Loss: 0.0024060688447207212
#287 Loss: 0.0023906510323286057
#288 Loss: 0.0023753363639116287
#289 Loss: 0.0023601

#509 Loss: 0.000807995384093374
#510 Loss: 0.0008056641090661287
#511 Loss: 0.0008033564663492143
#512 Loss: 0.0008010637247934937
#513 Loss: 0.0007987947901710868
#514 Loss: 0.0007965419208630919
#515 Loss: 0.0007943089585751295
#516 Loss: 0.0007920936914160848
#517 Loss: 0.0007898975745774806
#518 Loss: 0.0007877154857851565
#519 Loss: 0.0007855581352487206
#520 Loss: 0.0007834142888896167
#521 Loss: 0.000781289825681597
#522 Loss: 0.0007791809039190412
#523 Loss: 0.0007770889205858111
#524 Loss: 0.0007750149234198034
#525 Loss: 0.0007729577482677996
#526 Loss: 0.0007709197234362364
#527 Loss: 0.0007688956684432924
#528 Loss: 0.0007668895414099097
#529 Loss: 0.0007648966275155544
#530 Loss: 0.0007629244355484843
#531 Loss: 0.0007609647582285106
#532 Loss: 0.0007590229506604373
#533 Loss: 0.0007570969173684716
#534 Loss: 0.0007551832241006196
#535 Loss: 0.0007532889721915126
#536 Loss: 0.0007514083408750594
#537 Loss: 0.00074954325100407
#538 Loss: 0.0007476916071027517
#539 Loss: 0.0

#757 Loss: 0.0005426996503956616
#758 Loss: 0.0005422423710115254
#759 Loss: 0.0005417841603048146
#760 Loss: 0.000541330489795655
#761 Loss: 0.0005408796714618802
#762 Loss: 0.0005404307157732546
#763 Loss: 0.0005399812944233418
#764 Loss: 0.0005395355983637273
#765 Loss: 0.0005390919977799058
#766 Loss: 0.0005386506672948599
#767 Loss: 0.0005382116069085896
#768 Loss: 0.0005377736524678767
#769 Loss: 0.0005373356398195028
#770 Loss: 0.000536902982275933
#771 Loss: 0.0005364710232242942
#772 Loss: 0.0005360402283258736
#773 Loss: 0.0005356128676794469
#774 Loss: 0.0005351869040168822
#775 Loss: 0.0005347611731849611
#776 Loss: 0.0005343389348126948
#777 Loss: 0.0005339162307791412
#778 Loss: 0.0005334988818503916
#779 Loss: 0.0005330781568773091
#780 Loss: 0.0005326648242771626
#781 Loss: 0.0005322517827153206
#782 Loss: 0.0005318386829458177
#783 Loss: 0.0005314269801601768
#784 Loss: 0.0005310183041729033
#785 Loss: 0.0005306101520545781
#786 Loss: 0.0005302056670188904
#787 Loss: 0

  "type " + obj.__name__ + ". It won't be checked "


Predicted data based on trained weights: 
Input (scaled): 
tensor([0.4444, 0.8889, 1.0000, 0.2222, 0.3333, 0.2222])
Output: 
tensor([0.8189])


Strata maleje, co oznacza, że ​​sieć neuronowa czegoś się uczy. Otóż ​​to. Gratulacje! Właśnie nauczyłeś się tworzyć i trenować sieć neuronową od zera za pomocą PyTorch. Jest tak wiele rzeczy, które możesz zrobić z płytką siecią, którą właśnie wdrożyliśmy. Możesz dodać więcej ukrytych warstw lub spróbować zastosować warunki uprzedzeń dla praktyki. Chciałbym zobaczyć, co stąd zbudujesz. Skontaktuj się ze mną na Twitterze, jeśli masz dodatkowe pytania lub zostaw swoje komentarze tutaj. Do następnego razu!