Η εργασία υλοποιεί ταξινόμηση των χειρόγραφων ψηφίων MNIST (0-9) χρησιμοποιώντας βαθιά νευρωνικά δίκτυα με TensorFlow.
Φόρτωσα το dataset MNIST και προεπεξεργάστηκα τις εικόνες σε διανύσματα 784 χαρακτηριστικών και τις ετικέτες σε one-hot encoding. Κατασκεύασα και εκπαίδευσα διάφορα μοντέλα με διαφορετικές υπερπαραμέτρους (αριθμός επιπέδων, νευρώνες ανά επίπεδο, συνάρτηση ενεργοποίησης, learning rate). Τελική βελτίωση έγινε με την προσθήκη Dropout για αποφυγή υπερπροσαρμογής (overfitting).
Μοντέλο και Τελική Ακρίβεια
2 επίπεδα, 128 νευρώνες, ReLU 94.29%
3 επίπεδα, 256 νευρώνες, ReLU 95.42%
2 επίπεδα, 512 νευρώνες, tanh 92.57%
2 κρυφά επίπεδα με 256 νευρώνες, ενεργοποίηση ReLU. Dropout 0.3 μετά από κάθε κρυφό επίπεδο. Optimizer: SGD με learning rate 0.001. Εκπαίδευση 10 εποχών. Ακρίβεια στο test set περίπου 94.5%.
Η χρήση του Dropout μείωσε το overfitting και βελτίωσε την απόδοση του μοντέλου.