# Scikit-Learn course alapján
#### https://youtu.be/pqNCD_5r0IU?t=9151

In [None]:
import mnist
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
from PIL import Image
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
import os

In [None]:
xtrain = mnist.train_images()
ytrain = mnist.train_labels()

xtest = mnist.test_images()
ytest = mnist.test_labels()

In [None]:
xtrain = xtrain.reshape((-1, 28*28))
xtest = xtest.reshape((-1,28*28))

In [None]:
# Az osztályok címkéinek megszámlálása az adathalmazban
unique_classes, counts = np.unique(ytrain, return_counts=True)

# Kiíratás az egyes osztályokhoz tartozó minták számáról
for i, label in enumerate(unique_classes):
    print(f"Osztály {label}: {counts[i]} darab minta")

In [None]:
xtrain = np.array(xtrain/256)
xtest = np.array(xtest/256)

In [None]:
# Validációs adathalmaz létrehozása
xtrain, xval, ytrain, yval = train_test_split(xtrain, ytrain, test_size=0.2, random_state=42)

# MLP osztály inicializálása
clf = MLPClassifier(solver='adam', activation='relu', hidden_layer_sizes=(64, 64))

# Pontosságok tárolása
train_accuracy_list = []
val_accuracy_list = []

# Lépésenkénti tanítás és pontosságok nyomon követése
for i in range(100): # 100 iterációval
    clf.partial_fit(xtrain, ytrain, classes=np.unique(ytrain))
    ytrain_pred = clf.predict(xtrain)
    yval_pred = clf.predict(xval)
    
    train_accuracy = accuracy_score(ytrain, ytrain_pred)
    val_accuracy = accuracy_score(yval, yval_pred)
    
    train_accuracy_list.append(train_accuracy)
    val_accuracy_list.append(val_accuracy)

# Pontosságok megjelenítése
plt.plot(train_accuracy_list, label='Tanító adathalmaz')
plt.plot(val_accuracy_list, label='Validációs adathalmaz')
plt.xlabel('Iterációk')
plt.ylabel('Pontosság')
plt.legend()
plt.show()


In [None]:
prediction = clf.predict(xtest)

In [None]:
acc = confusion_matrix(ytest, prediction)

In [None]:
def accuracy(cm):
    diag = cm.trace()
    elements = cm.sum()
    return diag/elements

print(accuracy(acc))

In [None]:
def image_to_bin(img):
    data = list(img.getdata())
    for i in range(len(data)):
        data[i] = 255 - data[i]
    data = np.array(data)/256.0
    return data

# Gimpben rajzolt számjegyek

### Itt sokkal pontosabbak az eredmények, valószínűleg ezek jobban hasonlítanak a betanított számjegyekhez.

In [None]:
image_folder = "drawn_digits"
images = []
predictions = []

# Képek beolvasása és osztályozás végrehajtása
for filename in os.listdir(image_folder):
    if filename.endswith(".png"):
        file_path = os.path.join(image_folder, filename)
        image = Image.open(file_path)
        binimg = image_to_bin(image)
        p = clf.predict([binimg])
        images.append(image)
        predictions.append(p)

fig, axes = plt.subplots(2, 5, figsize=(10, 4))

for i, ax in enumerate(axes.flat):
    ax.imshow(images[i], cmap='gray')
    ax.set_title("Prediction: {}".format(predictions[i]))

plt.tight_layout()
plt.show()

# Kézzel írott számjegyek

In [None]:
image_folder = "handwritten_digits"
images = []
predictions = []

# Képek beolvasása és osztályozás végrehajtása
for filename in os.listdir(image_folder):
    if filename.endswith(".png"):
        file_path = os.path.join(image_folder, filename)
        image = Image.open(file_path)
        binimg = image_to_bin(image)
        p = clf.predict([binimg])
        images.append(image)
        predictions.append(p)

fig, axes = plt.subplots(2, 5, figsize=(10, 4))

for i, ax in enumerate(axes.flat):
    ax.imshow(images[i], cmap='gray')
    ax.set_title("Prediction: {}".format(predictions[i]))

plt.tight_layout()
plt.show()