<a href="https://colab.research.google.com/github/kr7/IntelligensModszerekTantargy/blob/main/Neuralis_halozatok.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

from google.colab import widgets

**Adatok betöltése és megjelenítése**

In [None]:
data = np.loadtxt('https://archive.ics.uci.edu/ml/machine-learning-databases/semeion/semeion.data')

In [None]:
data

Az adatok megjelenítéséhez megismerjük a matplotlib.pyplot-beki imshow() függvényt. Nézzük meg, hogyan jelennek meg a következő numpy tömbök.

In [None]:
plt.imshow(np.array( [[0, 0, 0, 1],
                      [0, 0, 1, 0],
                      [0, 1, 0, 0],
                      [1, 0, 0, 0]]) )
plt.show()

In [None]:
plt.imshow(np.array( [[1, 0, 0, 0],
                      [1, 0, 0, 0],
                      [1, 0, 0, 0],
                      [1, 1, 1, 1]]) )
plt.show()

In [None]:
plt.imshow(np.array( [[0, 1, 0, 0],
                      [1, 1, 1, 1],
                      [0, 1, 0, 0],
                      [0, 1, 0, 0]]) )
plt.show()

A következő kód megjeleníti az adatbázis első példányát:

In [None]:
image_size = (16,16)
an_image = np.reshape(data[0,0:256], image_size )
plt.imshow(an_image)
plt.show()

Az előbbihez hasonlóan az adatbázis bármelyik példányát megjeleníthetjük. Ennél azonban elegánsabb megoldás egy interaktív widget segítségével néhány példányt megjeleníteni:

In [None]:
tb = widgets.TabBar([str(i) for i in range(10)], location='start')
for i in range(10):
  with tb.output_to(i):
    an_image = np.reshape(data[i*20,0:256], image_size )
    plt.imshow(an_image)
    plt.show()

In [None]:
tb = widgets.TabBar([str(i) for i in range(10)], location='start')
for i in range(10):
  with tb.output_to(i):
    an_image = np.reshape(data[60+i,0:256], image_size )
    plt.imshow(an_image)
    plt.show()

**Adatok előkészítése**

Felosztjuk az adatainkat tanító és teszt adatokra. Az utolsó 500 példány lesz a teszt adathalmaz, a többi a tanítóhalmaz.

In [None]:
train_data = data[:1093,0:256]
train_labels = data[:1093,256:266]
test_data = data[1093:,0:256]
test_labels = data[1093:,256:266]

Az eredeti adatbázisban a címkék ún. *one-hot encoding* formában adottak. Az, hogy tíz számjegy melyike látható egy képen, egy 10 hosszúságú vektorral adott, amelynek pontosan egyetlen eleme 1, a többi nulla. 

- Ha a képen '0' számjegy látható, a vektor nulladik eleme 1, a többi nulla; 
- ha a képen '1' számjegy látható, a vektor első eleme 1, a többi nulla;
- és így tovább.

Nekünk most arra lesz szükségünk, hogy az osztályok 0-tól 9-ig terjedő egész számokkal legyenek kódolva. Ezért definiálunk egy függvényt, amely az osztálycímkéket előállítja ebben az alakban.

In [None]:
def ordinary_labels(raw_labels):
  o_lab = []
  for i in range(len(raw_labels)):
    o_lab.append( np.argmax(raw_labels[i,:]) )
  return np.array(o_lab)

In [None]:
train_labels = ordinary_labels(train_labels)
test_labels = ordinary_labels(test_labels)

A köveketkezőkben egy neurális hálót definiálunk, amelynek 2 belső (rejtett) rétege van. A bemeneti réteg unit-jainak száma 256, mert egy-egy kép 16x16=256 pixelt tartalmaz. A kimeneti rétegben a 10 osztály mindegyikének egy-egy unit felel meg. Definiálnunk kell a neurális háló által elvégzett számítást leíró forward(...) függvényt is. 

In [None]:
# A modell definiálása

class DigitRecognizer(nn.Module):
    def __init__(self):
        super(DigitRecognizer, self).__init__()
        number_of_units_in_the_first_hidden_layer = 100
        number_of_units_in_the_second_hidden_layer = 50

        self.fc1 = nn.Linear(256, 
                             number_of_units_in_the_first_hidden_layer)
        
        self.fc2 = nn.Linear(number_of_units_in_the_first_hidden_layer, 
                             number_of_units_in_the_second_hidden_layer)
        
        self.out = nn.Linear(number_of_units_in_the_second_hidden_layer, 
                             10) 

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.out(x)
        return x

**A háló tanítása:**
- a tanítóadatoból létrehozunk egy tensor datasetet, amelyet egy DataLoader-en keresztül fogunk elérni,
- példányosítjuk a hálót,
- megadjuk a célfüggvényt,
- példányosítjuk az optimalizáló algoritmust,
- végül a tanítóadatokon végighaladva az egyes batchekre elvégezzük az optimalizációs algoritmus egy-egy lépését (for ciklus)

In [None]:
# a modell tanítása

train_dataset = torch.utils.data.TensorDataset(
  torch.Tensor(train_data), torch.LongTensor(train_labels) )
trainloader = torch.utils.data.DataLoader(train_dataset, shuffle=True, batch_size=1)

net = DigitRecognizer()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=1e-3)

running_loss = 0.0
running_n = 0

for epoch in range(100):  
  for inputs, targets in trainloader:
    optimizer.zero_grad()
    
    outputs = net(inputs)

    loss = criterion(outputs, targets)
    loss.backward()
    optimizer.step()

    running_loss += loss.item()
    running_n = running_n + 1


  print('epoch %d, loss: %.3f' % (epoch + 1, running_loss / running_n))
  running_loss = 0.0
  running_n = 0   

**A háló pontosságának mérése**

Megnézzük, hogy a tesztpéldányok közül hányat sikerül helyesen osztályozni.

In [None]:
test_dataset = torch.utils.data.TensorDataset( 
      torch.Tensor(test_data), torch.LongTensor(test_labels)
)
testloader = torch.utils.data.DataLoader(test_dataset, batch_size=1, shuffle=True)

correct = 0
total = 0

with torch.no_grad():
  for inputs, targets in testloader:
    outputs = net(inputs)
    _, predicted = torch.max(outputs.data, 1)
    total += targets.size(0)
    correct += (predicted == targets).sum().item()

print("Correct: %d"%(correct))

A tanítóalgoritmus paramétereinek (pl. epochok száma, tanulási ráta, batch méret) valamint a háló rejtett rétegeinek és a rétegenkénti unitok számának változtatásával próbáljon meg olyan hálót létrehozni, amely a korábbinál nagyobb pontossággal ismeri fel a kézzel írt számjegyeket. Megodásként küldje el e-mail-en a "modell definiálása" és "modell tanítása" című cellákat. Az oktató a modellt a korábbiakhoz hasonló, de azoktól valamelyest eltérő adatokon fogja kiértékelni. Az oktató általi kiértékelés eredménye alapján kerül sor a megoldások rangsorolására és pontozására.