# Neurális hálózat


A következő sorokban a neurális hálózatok legelső lépcsőfokát mutatjuk be, a multilayer perceptront (MLP, a magyar irodalmak is angolul hivatkoznak rá). Használatának ismertetésére a Python nyelvet és azon belül a Tensorflow backendet használó Keras API-t választottuk, mivel ma ezek a legelterjedtebb technológiák ezen a téren. Maga a tutoriál Jupyter Notebook segítségével készült.
Jelen példánkban az MLP egy több osztályos, klasszifikációs feladatot old meg.

A bevezetőben elhangzott fogalmak mélyebb megértésére a következő linkek szolgálnak:

Multilayer perceptron (MLP): <br>
https://en.wikipedia.org/wiki/Multilayer_perceptron <br>
https://skymind.ai/wiki/multilayer-perceptron

Python: <br>
https://www.python.org/ <br>
https://hu.wikipedia.org/wiki/Python_(programoz%C3%A1si_nyelv)

Tensorflow: <br>
https://www.tensorflow.org/ <br>
https://medium.com/tensorflow

Keras: <br>
https://keras.io/

Jupyter: <br>
https://jupyter.org/

# Egyéb importok és beállítások

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt

In [None]:
import os

In [None]:
os.environ['CUDA_VISIBLE_DEVICES'] = ""

# Importok az MLP felépítéséhez

In [None]:
from keras.models import Model

In [None]:
from keras.layers import Input, Dense

In [None]:
from keras.optimizers import Adam

In [None]:
from keras.utils.np_utils import to_categorical

Mélyebb megértést szolgáló linkek:

Adam optimizer:  <br>
https://algorithmia.com/blog/introduction-to-optimizers <br>
https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/

One-Hot vektor (to_categorical): <br>
https://en.wikipedia.org/wiki/One-hot <br>
https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/

# MNIST adathalmaz importálása és vizsgálata

Az MNIST egy kézzel írott számokat tartalmazó adathalmaz. 60000 tanító- és 10000 tesztadatot tartalmaz. Egy példány egy 28x28-as fekete-fehér képből (1-szer, 28-szor, 28-as tömb) és a hozzá tartozó címkéből (1 db szám 0-tól 9-ig) áll.

In [None]:
from keras.datasets import mnist

In [None]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

In [None]:
X_train.shape

In [None]:
y_train.shape

In [None]:
X_test.shape

In [None]:
y_test.shape

Kiválasztjuk a 21. és a 122. tanítóadatot és vizualizáljuk. (hasraütés szerűen) 

In [None]:
y_train[21]

In [None]:
plt.imshow(X_train[21], cmap='gray')

In [None]:
y_train[122]

In [None]:
plt.imshow(X_train[122], cmap='gray')

Mélyebb megértést szolgáló linkek:

MNIST: <br>
http://yann.lecun.com/exdb/mnist/ <br>
https://en.wikipedia.org/wiki/MNIST_database

# Adat előkészítése

In [None]:
X_train.max(), X_train.min()

In [None]:
X_train = X_train.astype('float32') / 255
X_test = X_test.astype('float32') / 255

In [None]:
X_train.max(), X_train.min()

Minden képet egy 784 (28x28) hosszú tömbbé (vektorrá) alakítunk, hogy át tudjuk adni a háló bemeneti rétegének.

In [None]:
X_train = X_train.reshape(X_train.shape[0], 784)
X_test = X_test.reshape(X_test.shape[0], 784)

In [None]:
X_train.shape, X_test.shape

Az előző részben ismertetett technikával One-Hot vektorokat csinálunk a címkékből.

In [None]:
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

In [None]:
y_train.shape, y_test.shape

In [None]:
y_train[122]

# Modell definiálása

In [None]:
ip = Input(shape=(784,), name="input")

In [None]:
x = Dense(units=512, name="hiddel_layer", activation="relu")(ip)

In [None]:
op = Dense(units=10, name="prediction", activation="softmax")(x)

In [None]:
model = Model(inputs=ip, outputs=op, name="full_model")

In [None]:
model.summary()

Mélyebb megértést szolgáló linkek:

Aktivációs függvények: <br>
https://gyires.inf.unideb.hu/GyBITT/19/ch02s02.html <br>
https://en.wikipedia.org/wiki/Activation_function <br>
https://medium.com/the-theory-of-everything/understanding-activation-functions-in-neural-networks-9491262884e0

Softmax: <br>
https://en.wikipedia.org/wiki/Softmax_function <br>
https://medium.com/data-science-bootcamp/understand-the-softmax-function-in-minutes-f3a59641e86d

In [None]:
learning_rate = 0.001

In [None]:
optimizer = Adam(learning_rate, amsgrad=True)

In [None]:
model.compile(loss="categorical_crossentropy", optimizer=optimizer, metrics=["accuracy"])

Mélyebb megértést szolgáló linkek:

Learning rate: <br>
https://towardsdatascience.com/understanding-learning-rates-and-how-it-improves-performance-in-deep-learning-d0d4059c1c10

Kereszt entrópia: <br>
https://en.wikipedia.org/wiki/Cross_entropy <br>
https://ml-cheatsheet.readthedocs.io/en/latest/loss_functions.html

# Modell tanítása

In [None]:
history = model.fit(X_train,
                   y_train,
                   batch_size=100,
                   epochs=5,
                   verbose=1,
                   validation_data=(X_test, y_test))

In [None]:
history.history

In [None]:
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.gca().legend(('loss','val_loss'))
plt.grid()

In [None]:
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.gca().legend(('acc','val_acc'))
plt.grid()

Mélyebb megértést szolgáló linkek:

Batch size és epoch: <br>
https://machinelearningmastery.com/difference-between-a-batch-and-an-epoch/

# Betanított modell használata

121. tesztadat ellenőrzése

In [None]:
origin = X_test[121].reshape(28, 28)

In [None]:
origin.shape

In [None]:
plt.imshow(origin, cmap='gray')

In [None]:
prediction = model.predict(X_test[121].reshape(1, -1), batch_size=1)

In [None]:
prediction

In [None]:
plt.bar(range(10), prediction[0])
plt.xticks(range(10), range(10))

In [None]:
prediction.argmax()

21. tesztadat ellenőrzése

In [None]:
origin = X_test[21].reshape(28, 28)

In [None]:
plt.imshow(origin, cmap='gray')

In [None]:
prediction = model.predict(X_test[21].reshape(1, -1), batch_size=1)

In [None]:
prediction

In [None]:
plt.bar(range(10), prediction[0])
plt.xticks(range(10), range(10))

In [None]:
prediction.argmax()

122. tesztadat ellenőrzése

In [None]:
origin = X_test[122].reshape(28, 28)

In [None]:
plt.imshow(origin, cmap='gray')

In [None]:
prediction = model.predict(X_test[122].reshape(1, -1), batch_size=1)

In [None]:
prediction

In [None]:
plt.bar(range(10), prediction[0])
plt.xticks(range(10), range(10))

In [None]:
prediction.argmax()