In [None]:
#2η άσκηση

#Ο κώδικας δοκιμάστηκε και τα αποτελέσματα έχουν αποθηκευτεί. Γενικά, η εκτέλεσή του είναι χρονοβόρα. 
#Σημειώνεται πως για να έχουμε μεγάλα ποσοστά ακρίβειας απαιτείται εκπαίδευση για περισσότερες εποχές.
#Έτσι, οι περίοδοι εκαπάιδευσης είναι ενδεικτικές και επιλέχθηκαν για τον περιορισμό, σε λογικά πλαίσια, του χρόνου εκτέλεσης του κώδικα.   
from __future__ import absolute_import, division, print_function, unicode_literals # legacy compatibility

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets, layers, models, applications
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from keras.utils import to_categorical

# helper functions

#Συνάρτηση για τη δημιουργία μοντέλου Softmax
def create_sft():
  softmax = Sequential([
      Flatten(input_shape=(32, 32 ,3)),
      Dense(200, activation='softmax')
  ])
  return softmax

#Συνάρτηση για τη δημιουργία μοντέλου MLP
def create_mlp():
  mlp = Sequential([
    Flatten(input_shape=(32, 32 ,3)),
    Dense(512, activation='relu'),
    Dense(200, activation='softmax')
  ])
  return mlp

#Συνάρτηση για τη δημιουργία μοντέλου LeNet
def create_lenet():
  lenet = models.Sequential()
  lenet.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3))) 
  lenet.add(layers.MaxPooling2D((2, 2)))
  lenet.add(layers.Conv2D(32, (3, 3), activation='relu'))
  lenet.add(layers.MaxPooling2D((2, 2)))
  lenet.add(layers.Flatten())
  lenet.add(layers.Dense(512, activation='relu'))
  lenet.add(layers.Dense(200, activation='softmax'))
  return lenet

#Συνάρτηση για τη δημιουργία μοντέλου CNN1
def create_cnn1():
  cnn1 = models.Sequential()
  cnn1.add(layers.Conv2D(16, (5, 5), activation='relu', input_shape=(32, 32, 3))) 
  cnn1.add(layers.MaxPooling2D((2, 2)))
  cnn1.add(layers.Conv2D(16, (3, 3), activation='relu'))
  cnn1.add(layers.MaxPooling2D((2, 2)))
  cnn1.add(layers.Conv2D(32, (3, 3), activation='relu'))
  cnn1.add(layers.Flatten())
  cnn1.add(layers.Dense(200, activation='softmax'))
  return cnn1

#Συνάρτηση για τη δημιουργία μοντέλου CNN2
def create_cnn2():
  cnn2 = models.Sequential()
  cnn2.add(layers.Conv2D(16, (5, 5), activation='relu', input_shape=(32, 32, 3))) 
  cnn2.add(layers.MaxPooling2D((2, 2)))
  cnn2.add(layers.Conv2D(32, (3, 3), activation='relu'))
  cnn2.add(layers.MaxPooling2D((2, 2)))
  cnn2.add(layers.Conv2D(64, (3, 3), activation='relu'))
  cnn2.add(layers.MaxPooling2D((2, 2)))
  cnn2.add(layers.Flatten())
  cnn2.add(layers.Dense(200, activation='softmax'))
  return cnn2

#Με την παρακάτω μέθοδο κάνουμε plot τα διαγράμματα της ακρίβειας εκπαίδευσης (accuracy) και της ακρίβειας επικύρωσης (val_accuracy) σε συνάρτηση με τον αριθμό των εποχών.
def plot_acc(title,acc,val_acc):
  fig1,ax1=plt.subplots()
  ax1.plot(acc, label='accuracy')
  ax1.plot(val_acc, label = 'val_accuracy')
  ax1.set_title(title)
  ax1.set_xlabel('Epoch')
  ax1.set_ylabel('Accuracy')
  ax1.legend(loc='best')
  plt.show()

#Δοκιμάζουμε τα μοντέλα για δοθέν dataset και δεδομένο batch size.  
#Η συνάρτηση επιστρέφει μία τούπλα δύο στοιχείων. Το 1ο, συνιστά μια λίστα με τις τιμές της ακρίβειας εκπαίδευσης που πετυχαίνει μοντέλο για τους διαφορετικούς optimizers.
#Το 2ο, κατ'αναλογία, περιέχει τιμές της ακρίβειας επικύρωσης.
def check_classes(x_train,y_train,x_test,y_test,batch_size):
  model_acc=[]
  model_val_acc=[]
  model=create_sft()
  model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:Softmax,","Optimizer:adam") 
  model_adam=model.fit(x_train, y_train, epochs=10, batch_size=batch_size, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adam.history['accuracy'][-1])
  model_val_acc.append(model_adam.history['val_accuracy'][-1])
  model=create_mlp()
  model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:MLP,","Optimizer:adam") 
  model_adam=model.fit(x_train, y_train, epochs=10, batch_size=batch_size, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adam.history['accuracy'][-1])
  model_val_acc.append(model_adam.history['val_accuracy'][-1])
  model=create_lenet()
  model.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:LeNet,","Optimizer:nadam") 
  model_nadam=model.fit(x_train, y_train, epochs=10, batch_size=batch_size, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_nadam.history['accuracy'][-1])
  model_val_acc.append(model_nadam.history['val_accuracy'][-1])
  model=create_cnn1()
  model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:CNN1,","Optimizer:adam") 
  model_adam=model.fit(x_train, y_train, epochs=10, batch_size=batch_size, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adam.history['accuracy'][-1])
  model_val_acc.append(model_adam.history['val_accuracy'][-1])
  model=create_cnn2()
  model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:CNN2,","Optimizer:adam") 
  model_adam=model.fit(x_train, y_train, epochs=10, batch_size=batch_size, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adam.history['accuracy'][-1])
  model_val_acc.append(model_adam.history['val_accuracy'][-1])
  return (model_acc,model_val_acc) 

#Δοκιμάζουμε όλους τους optimizers για ένα μοντέλο. Ο τύπος του τελευταίου καθορίζεται από το string model_name.
#Η συνάρτηση επιστρέφει μία τούπλα δύο στοιχείων. Το 1ο, συνιστά μια λίστα με τις τιμές της ακρίβειας εκπαίδευσης που πετυχαίνει μοντέλο για τους διαφορετικούς optimizers.
#Το 2ο, κατ'αναλογία, περιέχει τιμές της ακρίβειας επικύρωσης.
def check_opt(model_name,x_train,y_train,x_test,y_test):
  model_acc=[]
  model_val_acc=[]
  model = choose(model_name) 
  model.compile(optimizer='sgd',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:sgd") 
  model_sgd=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_sgd.history['accuracy'][-1])
  model_val_acc.append(model_sgd.history['val_accuracy'][-1])
  model=choose(model_name)
  model.compile(optimizer='RMSprop',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:RMSprop") 
  model_rms=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_rms.history['accuracy'][-1])
  model_val_acc.append(model_rms.history['val_accuracy'][-1])
  model=choose(model_name)
  model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:adam") 
  model_adam=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adam.history['accuracy'][-1])
  model_val_acc.append(model_adam.history['val_accuracy'][-1])
  model=choose(model_name)
  model.compile(optimizer='adadelta',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:adadelta") 
  model_adadelta=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adadelta.history['accuracy'][-1])
  model_val_acc.append(model_adadelta.history['val_accuracy'][-1])
  model = choose(model_name) 
  model.compile(optimizer='adagrad',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:adagrad") 
  model_adagrad=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adagrad.history['accuracy'][-1])
  model_val_acc.append(model_adagrad.history['val_accuracy'][-1])
  model = choose(model_name) 
  model.compile(optimizer='adamax',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:adamax") 
  model_adamax=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_adamax.history['accuracy'][-1])
  model_val_acc.append(model_adamax.history['val_accuracy'][-1])
  model=choose(model_name) 
  model.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:nadam") 
  model_nadam=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_nadam.history['accuracy'][-1])
  model_val_acc.append(model_nadam.history['val_accuracy'][-1])
  model=choose(model_name) 
  model.compile(optimizer='Ftrl',loss='sparse_categorical_crossentropy',metrics='accuracy')
  print("Model:%s," %(model_name),"Optimizer:Ftrl") 
  model_ftrl=model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) 
  test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
  print(test_acc,'\n')
  model_acc.append(model_ftrl.history['accuracy'][-1])
  model_val_acc.append(model_ftrl.history['val_accuracy'][-1])
  return (model_acc,model_val_acc) 

#Κατασκευή του ζητούμενου μοντέλου, όπως αυτό καθορίζεται από την παράμετρο model_name.
def choose(model_name):
  if (model_name=='Softmax'):
    model=create_sft()
  elif (model_name=='MLP'):
    model=create_mlp()
  elif (model_name=='LeNet'):
    model=create_lenet()
  elif (model_name=='CNN1'):
    model=create_cnn1()
  else:
    model=create_cnn2()
  return model

#Σχεδιασμός γραφικών παραστάσεων στο ίδιο διάγραμμα.
def plot_all(title,sft,mlp,lenet,cnn1,cnn2,x,flag):
  fig1,ax1=plt.subplots()
  x_ticks=np.arange(0,len(x))
  x_labels=map(str,x)
  ax1.xaxis.set_ticks(x_ticks)
  ax1.xaxis.set_ticklabels(x_labels)
  ax1.plot(x_ticks, sft, label='Softmax')
  ax1.plot(x_ticks, mlp,  label= 'MLP')
  ax1.plot(x_ticks, lenet, label='LeNet')
  ax1.plot(x_ticks, cnn1, label= 'CNN1')
  ax1.plot(x_ticks, cnn2, label='CNN2')
  ax1.set_title(title)
  if (flag==0):
    ax1.set_xlabel('Number of Classes')
  else:
    ax1.set_xlabel('Batch Size')
  ax1.set_ylabel('Accuracy')
  ax1.legend(loc='upper right')
  plt.show()

#Απεικόνιση, σε ραβδόγραμμα, των μετρικών acc και val_acc για συγκεκριμένο μοντέλο.
def plot_pairs(title,acc,val_acc,x):
  fig,ax=plt.subplots()
  index=np.arange(len(x))
  bar_width=0.3
  rects1=plt.bar(index,acc,bar_width,color='b',label='accuracy')
  rects2=plt.bar(index+bar_width,val_acc,bar_width,color='tab:orange',label='val_accuracy')
  plt.title(title)
  plt.xlabel('Optimizers')
  plt.ylabel('Accuracy')
  plt.xticks(index+bar_width,x)
  plt.legend(loc='upper center')
  plt.show()

# Κώδικας από το notebook της άσκησης.
# select from from_list elements with index in index_list
def select_from_list(from_list, index_list):
  filtered_list= [from_list[i] for i in index_list]
  return(filtered_list)

# append in filtered_list the index of each element of unfilterd_list if it exists in in target_list
def get_ds_index(unfiliterd_list, target_list):
  index = 0
  filtered_list=[]
  for i_ in unfiliterd_list:
    if i_[0] in target_list:
      filtered_list.append(index)
    index += 1
  return(filtered_list)

# select a url for a unique subset of CIFAR-100 with 20, 40, 60, or 80 classes
def select_classes_number(classes_number = 20):
  cifar100_20_classes_url = "https://pastebin.com/raw/nzE1n98V"
  cifar100_40_classes_url = "https://pastebin.com/raw/zGX4mCNP"
  cifar100_60_classes_url = "https://pastebin.com/raw/nsDTd3Qn"
  cifar100_80_classes_url = "https://pastebin.com/raw/SNbXz700"
  if classes_number == 20:
    return cifar100_20_classes_url
  elif classes_number == 40:
    return cifar100_40_classes_url
  elif classes_number == 60:
    return cifar100_60_classes_url
  elif classes_number == 80:
    return cifar100_80_classes_url
  else:
    return -1

#Επιλογή και φόρτωση δεδομένων από το CIFAR100. 
def feed_data(class_num):
  (x_train_all, y_train_all), (x_test_all, y_test_all) = tf.keras.datasets.cifar100.load_data(label_mode='fine')
  team_seed = 26
  cifar100_classes_url = select_classes_number(class_num)
  team_classes = pd.read_csv(cifar100_classes_url, sep=',', header=None)
  CIFAR100_LABELS_LIST = pd.read_csv('https://pastebin.com/raw/qgDaNggt', sep=',', header=None).astype(str).values.tolist()[0]

  our_index = team_classes.iloc[team_seed,:].values.tolist()
  our_classes = select_from_list(CIFAR100_LABELS_LIST, our_index)
  train_index = get_ds_index(y_train_all, our_index)
  test_index = get_ds_index(y_test_all, our_index)

  x_train_ds = np.asarray(select_from_list(x_train_all, train_index))
  y_train_ds = np.asarray(select_from_list(y_train_all, train_index))
  x_test_ds = np.asarray(select_from_list(x_test_all, test_index))
  y_test_ds = np.asarray(select_from_list(y_test_all, test_index))

  # get (train) dataset dimensions
  data_size, img_rows, img_cols, img_channels = x_train_ds.shape

  # set validation set percentage (wrt the training set size)
  validation_percentage = 0.15
  val_size = round(validation_percentage * data_size)

  # Reserve val_size samples for validation and normalize all values
  x_val = x_train_ds[-val_size:]/255
  y_val = y_train_ds[-val_size:]
  x_train = x_train_ds[:-val_size]/255
  y_train = y_train_ds[:-val_size]
  x_test = x_test_ds/255
  y_test = y_test_ds
  return (x_train,y_train,x_test,y_test)

# get class label from class index
def class_label_from_index(fine_category):
  return(CIFAR100_LABELS_LIST[fine_category.item(0)])

#Επιλογή δεδομένων για 20 κλάσεις.
total=feed_data(20)
x_train=total[0]
y_train=total[1]
x_test=total[2]
y_test=total[3]

#1.1.1
##Χρησιμοποιούμε τις μεθόδους που ορίστηκαν πιο πάνω, ώστε να μπορούμε να κάνουμε δοκιμές με διαφορετικές παραμετροποιήσεις.
#Softmax
softmax = create_sft()
print('Softmax summary:')
softmax.summary()
#MLP
mlp = create_mlp()
print('\n')
print('MLP summary:')
mlp.summary()
#LeNet
lenet = create_lenet()
print('\n')
print('LeNet summary:')
lenet.summary()
#CNN1
cnn1 = create_cnn1()
print('\n')
print('CNN1 summary:')
cnn1.summary()
#CNN2
cnn2 = create_cnn2()
print('\n')
print('CNN2 summary:')
cnn2.summary()
#1.1.2: Δοκιμάζουμε διαφορετικές τιμές για κάθε παράμετρο. Για τον optimizer επιλέγουμε μεταξύ των:sgd,RMSprop,adam,adadelta,adagrad,adamax,nadam,ftrl. 
####### Αντίστοιχα, για τη συνάρτηση απωλειών έχουμε τις περιπτώσεις: sparse_categorical_crossentropy,poisson,kullback_leibler_divergence. Τέλος, ως μετρική χρησιμοποιούμε την accuracy. 
####### Σημειώνεται πως οι συναρτήσεις BinaryCrossentropy και CategoricalCrossentropy δεν βρίσκουν εφαρμογή στο dataset μας, καθώς έχουμε πολλές κατηγορίες (παραπάνω από 2) τύπου int. 
####### Ως αποτέλεσμα, οι ανάλογες μετρικές δεν μπορούν να χρησιμοποιηθούν.
####### Τέλος, επιλέγουμε την μετρική accuracy, επειδή εκφράζει το συνολικό ποσοστό των πετυχημένων προβλέψεών μας. Η συμπεριφορά αυτή θεωρήθηκε προτιμότερη από, λόγου χάρη, αυτή της sparse_top_k_categorical_accuracy,που
####### μας δείχνει αν η εκτίμησή μας είναι εντός των k πιο πιθανών. Επιλέγουμε παραμετροποιήσεις που δίνουν τη μεγαλύτερη ακρίβεια εκπαίδευσης με το πέρας των εποχών.     
####### Ο κώδικας που εκτελέσαμε για να ελέγξουμε την ακρίβεια των μοντέλων παρουσιάζεται παρακάτω. Δίνεται ως σχόλιο, αφού η εκτέλεση του απαιτεί χρόνο.
####### Η συνάρτηση create_model μπορεί να είναι μία από τις create_sft(),create_mlp(),create_lenet(),create_cnn1() και create_cnn2(), ανάλογα με το υπό εξέταση μοντέλο.

'''
opt=['sgd','RMSprop','adam','adadelta','adagrad','adamax','nadam','ftrl']
losses=['sparse_categorical_crossentropy','poisson','kullback_leibler_divergence']
met=['accuracy']

for o in opt:
  for l in losses:
    for m in met:
      print(o,l,m)
      model=create_model()
      model.compile(optimizer=o,loss=l,metrics=m)
      model.fit(x_train, y_train, epochs=5)
'''
#Παρατηρούμε πως οι επιμέρους αρχιτεκτονικές διαφέρουν μόνο ως προς τον optimizer.
print('\n')
print('Ερώτημα 1\n')
print('Βήμα 1.2\n')
print("Model:Softmax, Optimizer:adam") 
softmax.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy') #επιλεγμένη αρχιτεκτονική για Softmax
sft_adam=softmax.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = softmax.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
softmax = create_sft() #Νέο μοντέλο για την 2η δοκιμή.
print("Model:Softmax, Optimizer:adamax") 
softmax.compile(optimizer='adamax',loss='sparse_categorical_crossentropy',metrics='accuracy')
sft_adamax=softmax.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = softmax.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')

print("Model:MLP, Optimizer:nadam") 
mlp.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
mlp_nadam=mlp.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = mlp.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
mlp = create_mlp() #Νέο μοντέλο για την 2η δοκιμή.
print("Model:MLP, Optimizer:adam") 
mlp.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
mlp_adam=mlp.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test)) #επιλεγμένη αρχιτεκτονική για MLP
test_loss, test_acc = mlp.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')

print("Model:LeNet, Optimizer:nadam") 
lenet.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
lenet_nadam=lenet.fit(x_train, y_train, epochs=10,validation_data=(x_test, y_test)) #επιλεγμένη αρχιτεκτονική για LeNet
test_loss, test_acc = lenet.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
lenet = create_lenet() #Νέο μοντέλο για την 2η δοκιμή.
print("Model:LeNet, Optimizer:RMSprop") 
lenet.compile(optimizer='RMSprop',loss='sparse_categorical_crossentropy',metrics='accuracy')
lenet_rms=lenet.fit(x_train, y_train, epochs=10,validation_data=(x_test, y_test))
test_loss, test_acc = lenet.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')

print("Model:CNN1, Optimizer:nadam") 
cnn1.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
cnn1_nadam=cnn1.fit(x_train, y_train, epochs=15,validation_data=(x_test, y_test))
test_loss, test_acc = cnn1.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
cnn1 = create_cnn1() #Νέο μοντέλο για την 2η δοκιμή.
print("Model:CNN1, Optimizer:adam") 
cnn1.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
cnn1_adam=cnn1.fit(x_train, y_train, epochs=15,validation_data=(x_test, y_test)) #επιλεγμένη αρχιτεκτονική για CNN1
test_loss, test_acc = cnn1.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')

print("Model:CNN2, Optimizer:nadam") 
cnn2.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
cnn2_nadam=cnn2.fit(x_train, y_train, epochs=15,validation_data=(x_test, y_test))
test_loss, test_acc = cnn2.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
cnn2 = create_cnn2() #Νέο μοντέλο για την 2η δοκιμή.
print("Model:CNN2, Optimizer:adam") 
cnn2.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
cnn2_adam=cnn2.fit(x_train, y_train, epochs=15,validation_data=(x_test, y_test)) #επιλεγμένη αρχιτεκτονική για CNN2
test_loss, test_acc = cnn2.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')

#1.2.1
#Διαγράμματα για το μοντέλο Softmax
print('Βήμα 2.1\n')
plot_acc('Softmax(adam)',sft_adam.history['accuracy'],sft_adam.history['val_accuracy'])
plot_acc('Softmax(adamax)',sft_adamax.history['accuracy'],sft_adamax.history['val_accuracy'])
#Διαγράμματα για το μοντέλο MLP
plot_acc('MLP(nadam)',mlp_nadam.history['accuracy'],mlp_nadam.history['val_accuracy'])
plot_acc('MLP(adam)',mlp_adam.history['accuracy'],mlp_adam.history['val_accuracy'])
#Διαγράμματα για το μοντέλο LeNet
plot_acc('LeNet(nadam)',lenet_nadam.history['accuracy'],lenet_nadam.history['val_accuracy'])
plot_acc('LeNet(RMSprop)',lenet_rms.history['accuracy'],lenet_rms.history['val_accuracy'])
#Διαγράμματα για το μοντέλο CNN1
plot_acc('CNN1(nadam)',cnn1_nadam.history['accuracy'],cnn1_nadam.history['val_accuracy'])
plot_acc('CNN1(adam)',cnn1_adam.history['accuracy'],cnn1_adam.history['val_accuracy'])
#Διαγράμματα για το μοντέλο CNN2
plot_acc('CNN2(nadam)',cnn2_nadam.history['accuracy'],cnn2_nadam.history['val_accuracy'])
plot_acc('CNN2(adam)',cnn2_adam.history['accuracy'],cnn2_adam.history['val_accuracy'])

#1.2.2
### Επιλέγουμε τα ζητούμενα μοντέλα με βάση τα στοιχεία του 1.2.1. Επιδιώκουμε να έχουμε μεγάλη ακρίβεια εκπαίδευσης και, ταυτόχρονα, μικρή απόκλιση μεταξύ accuracy και val_accuracy.
### Έτσι, παίρνουμε τις αρχιτεκτονικές: (Softmax,adam),(MLP,adam),(LeNet,nadam),(CNN1,adam) και (CNN2,adam). Οι επιλογές μας σημειώνονται με σχόλια στο κομμάτι κώδικα του ερωτήματος 1.2.1.
### Εφεξής, χρησιμοποιούμε μόνο τις συγκεκριμένες αρχιτεκτονικές.
### Τα ζητούμενα διαγράμματα σχεδιάστηκαν προηγουμένως, ωστόσο τα επαναφέρουμε στο τρέχον ερώτημα:
print('Βήμα 2.2\n')
plot_acc('Softmax',sft_adam.history['accuracy'],sft_adam.history['val_accuracy'])
plot_acc('MLP',mlp_adam.history['accuracy'],mlp_adam.history['val_accuracy'])
plot_acc('LeNet',lenet_nadam.history['accuracy'],lenet_nadam.history['val_accuracy'])
plot_acc('CNN1',cnn1_adam.history['accuracy'],cnn1_adam.history['val_accuracy'])
plot_acc('CNN2',cnn2_adam.history['accuracy'],cnn2_adam.history['val_accuracy'])

#1.2.3
#Αριθμός κλάσεων
### Αλλάζουμε τον αριθμό των κλάσεων (20,40,60,80) και τρέχουμε, κάθε φορά, τον κώδικα για τα επιλεγμένα μοντέλα του προηγούμενου ερωτήματος. 
### Για κάθε τέτοιο μοντέλο συγκεντρώνουμε, μέσω της συνάρτησης check_classes, τις τιμές των accuracy και val_accuracy μετά το τέλος των εποχών. 
### Έπειτα, κάνουμε τη γραφική παράσταση των παραμέτρων αυτών σε σχέση με τον αριθμό των κλάσεων. 
### Σημειώνεται πως, χάριν συντομίας, στο βήμα αυτό ο αριθμός των εποχών τίθεται ίσος με 10.
print('Βήμα 2.3\n')
sft_acc_ls=[]
mlp_acc_ls=[]
lenet_acc_ls=[]
cnn1_acc_ls=[]
cnn2_acc_ls=[]
sft_val_acc_ls=[]
mlp_val_acc_ls=[]
lenet_val_acc_ls=[]
cnn1_val_acc_ls=[]
cnn2_val_acc_ls=[]
classes=[20,40,60,80]
print('Επίδραση αριθμού κλάσεων\n')
for i in classes:
  total=feed_data(i)
  x_train=total[0]
  y_train=total[1]
  x_test=total[2]
  y_test=total[3]
  print("Number of Classes:%s\n" %(i)) 
  tup=check_classes(x_train,y_train,x_test,y_test,32)
  sft_acc_ls.append(tup[0][0])
  mlp_acc_ls.append(tup[0][1])
  lenet_acc_ls.append(tup[0][2])
  cnn1_acc_ls.append(tup[0][3])
  cnn2_acc_ls.append(tup[0][4])
  sft_val_acc_ls.append(tup[1][0])
  mlp_val_acc_ls.append(tup[1][1])
  lenet_val_acc_ls.append(tup[1][2])
  cnn1_val_acc_ls.append(tup[1][3])
  cnn2_val_acc_ls.append(tup[1][4])

plot_all('Accuracy',sft_acc_ls,mlp_acc_ls,lenet_acc_ls,cnn1_acc_ls,cnn2_acc_ls,classes,0)
plot_all('Validation Accuracy',sft_val_acc_ls,mlp_val_acc_ls,lenet_val_acc_ls,cnn1_val_acc_ls,cnn2_val_acc_ls,classes,0)
### Παρατηρούμε πως, για μεγαλύτερο αριθμό κλάσεων, η ακρίβεια των μοντέλων μειώνεται, αφού, για διφορούμενες εικόνες, υπάρχουν, πλέον, περισσότερες επιλογές ταξινόμησης.

#Αλγόριθμος Βελτιστοποίησης
total=feed_data(20)
x_train=total[0]
y_train=total[1]
x_test=total[2]
y_test=total[3]
opt=['SGD','RMS','Adam','Adad.','Adag.','Adamax','Nadam','Ftrl']
print('Επίδραση optimizer\n')
sft_tup=check_opt('Softmax',x_train,y_train,x_test,y_test) #έλεγχος optimizers για Softmax
mlp_tup=check_opt('MLP',x_train,y_train,x_test,y_test) #έλεγχος optimizers για MLP
lenet_tup=check_opt('LeNet',x_train,y_train,x_test,y_test) #έλεγχος optimizers για LeNet
cnn1_tup=check_opt('CNN1',x_train,y_train,x_test,y_test) #έλεγχος optimizers για CNN1
cnn2_tup=check_opt('CNN2',x_train,y_train,x_test,y_test) #έλεγχος optimizers για CNN2
plot_pairs('Softmax',sft_tup[0],sft_tup[1],opt) #για κάθε μοντέλο, κάνουμε plot, σε κοινό ραβδόγραμμα, τις ποσότητες acc και val_acc 
plot_pairs('MLP',mlp_tup[0],mlp_tup[1],opt)
plot_pairs('LeNet',lenet_tup[0],lenet_tup[1],opt)
plot_pairs('CNN1',cnn1_tup[0],cnn1_tup[1],opt)
plot_pairs('CNN2',cnn2_tup[1],cnn2_tup[1],opt)
## Τα διαγράμματα που προκύπτουν μαρτυρούν πως η επιλογή optimizer επηρεάζει σε μεγάλο βαθμό την απόδοση του μοντέλου.

#Batch Size
#Θεωρούμε ενδεικτικές τιμές batch_size=(32,64,128,256) και ελέγχουμε, όπως στο προηγούμενο βήμα, τη συμπεριφορά των αρχιτεκτονικών για κάθε περίπτωση.
sft_acc_ls=[]
mlp_acc_ls=[]
lenet_acc_ls=[]
cnn1_acc_ls=[]
cnn2_acc_ls=[]
sft_val_acc_ls=[]
mlp_val_acc_ls=[]
lenet_val_acc_ls=[]
cnn1_val_acc_ls=[]
cnn2_val_acc_ls=[]
batch_size=[32,64,128,256]
print('Επίδραση batch size\n')
for size in batch_size:
  total=feed_data(20)
  x_train=total[0]
  y_train=total[1]
  x_test=total[2]
  y_test=total[3]
  print("Batch Size:%s\n" %(size)) 
  tup=check_classes(x_train,y_train,x_test,y_test,size)
  sft_acc_ls.append(tup[0][0])
  mlp_acc_ls.append(tup[0][1])
  lenet_acc_ls.append(tup[0][2])
  cnn1_acc_ls.append(tup[0][3])
  cnn2_acc_ls.append(tup[0][4])
  sft_val_acc_ls.append(tup[1][0])
  mlp_val_acc_ls.append(tup[1][1])
  lenet_val_acc_ls.append(tup[1][2])
  cnn1_val_acc_ls.append(tup[1][3])
  cnn2_val_acc_ls.append(tup[1][4])
plot_all('Accuracy',sft_acc_ls,mlp_acc_ls,lenet_acc_ls,cnn1_acc_ls,cnn2_acc_ls,batch_size,1)
plot_all('Validation Accuracy',sft_val_acc_ls,mlp_val_acc_ls,lenet_val_acc_ls,cnn1_val_acc_ls,cnn2_val_acc_ls,batch_size,1)
#Η ακρίβεια των μοντέλων φθίνει όσο αυξάνουμε το batch_size. Ειδικότερα, ο αριθμός των δειγμάτων ανά εποχή μειώνεται (steps_per_epoch=len(x_train)/batch_size) και, συνεπώς, το ίδιο συμβαίνει και για το learning rate.

#1.3
## Παρατηρούμε ότι, σε κάθε περίπτωση, η ακρίβεια επικύρωσης (val_accuracy) είναι μειωμένη σε σχέση με την ακρίβεια εκπαίδευσης (accuracy). Το γεγονός αυτό είναι απόρροια της υπερεκπαίδευσης των μόντελων με το υπάρχον dataset.

#2.1.1
#Early Stopping
#Ορίζουμε τις παραμέτρους για early stopping ανάλογα με την καταγεγραμμένη ακρίβεια κάθε μοντέλου. 
#Παρακολούθουμε την πορεία των απωλειών του test set, θεωρώντας πως, για να υπάρξει βελτίωση, πρέπει να σημειωθεί πτώση τουλάχιστον κατά min_delta από την προηγούμενη εποχή.
#Αναμένουμε κάτι τέτοιο να συμβεί εντός ενός συγκεκριμένου αριθμού περιόδων (patience), διαφορετικά σταματάμε την εκπαίδευση του μοντέλου. Η default τιμή του min_delta είναι 0.
sft_callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=1)
print('Ερώτημα 2\n')
print('Βήμα 1.1\n')
print('Early Stopping\n')
softmax=create_sft()
softmax.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
print("Model:Softmax, Optimizer:adam") 
sft_adam=softmax.fit(x_train, y_train, epochs=20, callbacks=[sft_callback], validation_data=(x_test, y_test)) 
test_loss, test_acc = softmax.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('Softmax',sft_adam.history['accuracy'],sft_adam.history['val_accuracy'])

mlp_callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=1)
mlp=create_mlp()
mlp.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
print("Model:MLP, Optimizer:adam")
mlp_adam=mlp.fit(x_train, y_train, epochs=20, callbacks=[mlp_callback], validation_data=(x_test, y_test)) 
test_loss, test_acc = mlp.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('MLP',mlp_adam.history['accuracy'],mlp_adam.history['val_accuracy'])

lenet_callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', min_delta=0.05, patience=1)
lenet=create_lenet()
lenet.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy')
print("Model:LeNet, Optimizer:nadam")
lenet_nadam=lenet.fit(x_train, y_train, epochs=10, callbacks=[lenet_callback], validation_data=(x_test, y_test)) 
test_loss, test_acc = lenet.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('LeNet',lenet_nadam.history['accuracy'],lenet_nadam.history['val_accuracy'])

cnn1_callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', min_delta=0.1, patience=1)
cnn1=create_cnn1()
cnn1.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
print("Model:CNN1, Optimizer:adam")
cnn1_adam=cnn1.fit(x_train, y_train, epochs=15, callbacks=[cnn1_callback], validation_data=(x_test, y_test)) 
test_loss, test_acc = cnn1.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN1',cnn1_adam.history['accuracy'],cnn1_adam.history['val_accuracy'])

cnn2_callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', min_delta=0.1, patience=1)
cnn2=create_cnn2()
cnn2.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy')
print("Model:CNN2, Optimizer:adam")
cnn2_adam=cnn2.fit(x_train, y_train, epochs=15, callbacks=[cnn2_callback], validation_data=(x_test, y_test)) 
test_loss, test_acc = cnn2.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN2',cnn2_adam.history['accuracy'],cnn2_adam.history['val_accuracy'])
##Βλέπουμε πως η μέθοδος μπορεί να περιορίσει το φαινόμενο του overtraining.
##Ωστόσο δεν είναι πρακτική, αφού, αφενός, διακόπτει την εκπαίδευση του δικτύου σε πρώιμα στάδια και, αφετέρου, πρέπει κάθε φορά να τροποποιείται κατάλληλα με βάση τα χαρακτηριστικά της εκάστοτε αρχιτεκτονικής.

#Dropout: Μηδενισμός, κατά τρόπο τυχαίο, ενός ποσοστού των βαρών του δικτύου.
## Επιλέγουμε την παράμετρο rate με σκοπό να μειώσουμε τη διαφορά accuracy-val_accuracy, και, παράλληλα, να διατηρήσουμε ακέραιο, όσο γίνεται, το ποσοστό της ακρίβειας εκπαίδευσης.
softmax=create_sft()
softmax.add(layers.Dropout(0.15))
print('Dropout\n')
print("Model:Softmax, Optimizer:adam") 
softmax.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy') 
sft_adam=softmax.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = softmax.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('Softmax',sft_adam.history['accuracy'],sft_adam.history['val_accuracy'])

mlp=create_mlp()
mlp.add(layers.Dropout(0.08))
print("Model:MLP, Optimizer:adam") 
mlp.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy') 
mlp_adam=mlp.fit(x_train, y_train, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = mlp.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('MLP',mlp_adam.history['accuracy'],mlp_adam.history['val_accuracy'])

lenet=create_lenet()
lenet.add(layers.Dropout(0.2))
print("Model:LeNet, Optimizer:nadam") 
lenet.compile(optimizer='nadam',loss='sparse_categorical_crossentropy',metrics='accuracy') 
lenet_nadam=lenet.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))
test_loss, test_acc = lenet.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('LeNet',lenet_nadam.history['accuracy'],lenet_nadam.history['val_accuracy'])

cnn1=create_cnn1()
cnn1.add(layers.Dropout(0.1))
print("Model:CNN1, Optimizer:adam") 
cnn1.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy') 
cnn1_adam=cnn1.fit(x_train, y_train, epochs=15, validation_data=(x_test, y_test))
test_loss, test_acc = cnn1.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN1',cnn1_adam.history['accuracy'],cnn1_adam.history['val_accuracy'])

cnn2=create_cnn2()
cnn2.add(layers.Dropout(0.1))
print("Model:CNN2, Optimizer:adam") 
cnn2.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics='accuracy') 
cnn2_adam=cnn2.fit(x_train, y_train, epochs=15, validation_data=(x_test, y_test))
test_loss, test_acc = cnn2.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN2',cnn2_adam.history['accuracy'],cnn2_adam.history['val_accuracy'])
#Η διαδικασία αυτή είναι προτιμότερη από το Early Stopping, επειδή δεν διακόπτεται η εκπαίδευση του μοντέλου.
#Βλέπουμε πως, πλέον, το overfitting έχει περιοριστεί, αφού οι τιμές που λαμβάνουν οι μετρικές acc και val_acc είναι παρεμφερείς.

#Data augmentation: Μετασχηματισμός των εικόνων του dataset.
#Πρέπει, αρχικά, να αναπαραστήσουμε τις ετικέτες σε μορφή one_hot. Τώρα, χρησιμοποιούμε τη συνάρτηση απωλειών categorical_loss.
y_train = keras.utils.to_categorical(y_train, 200)
y_test = keras.utils.to_categorical(y_test, 200)

#Δημιουργία generator.
train_datagen = ImageDataGenerator(
    rotation_range=45,
    width_shift_range=0.2,
    height_shift_range=0.1,
    horizontal_flip=True)

#Εφαρμογή generator στο training set.
train_data=train_datagen.flow(x_train, y_train)
train_datagen.fit(x_train)

#Δημιουργία και εκπαίδευση μοντέλων με τα νέα δεδομένα.
softmax=create_sft()
print('Image Augmentation\n')
print("Model:Softmax, Optimizer:adam")
softmax.compile(optimizer='adam',loss='categorical_crossentropy',metrics='accuracy')
sft_adam=softmax.fit_generator(train_data, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = softmax.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('Softmax',sft_adam.history['accuracy'],sft_adam.history['val_accuracy'])

mlp=create_mlp()
print("Model:MLP, Optimizer:adam")
mlp.compile(optimizer='adam',loss='categorical_crossentropy',metrics='accuracy')
mlp_adam=mlp.fit_generator(train_data, epochs=20, validation_data=(x_test, y_test))
test_loss, test_acc = mlp.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('MLP',mlp_adam.history['accuracy'],mlp_adam.history['val_accuracy'])

lenet=create_lenet()
print("Model:LeNet, Optimizer:nadam")
lenet.compile(optimizer='nadam',loss='categorical_crossentropy',metrics='accuracy')
lenet_nadam=lenet.fit_generator(train_data, epochs=10, validation_data=(x_test, y_test))
test_loss, test_acc = lenet.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('LeNet',lenet_nadam.history['accuracy'],lenet_nadam.history['val_accuracy'])

cnn1=create_cnn1()
print("Model:CNN1, Optimizer:adam")
cnn1.compile(optimizer='adam',loss='categorical_crossentropy',metrics='accuracy')
cnn1_adam=cnn1.fit_generator(train_data, epochs=15, validation_data=(x_test, y_test))
test_loss, test_acc = cnn1.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN1',cnn1_adam.history['accuracy'],cnn1_adam.history['val_accuracy'])

cnn2=create_cnn2()
print("Model:CNN2, Optimizer:adam")
cnn2.compile(optimizer='adam',loss='categorical_crossentropy',metrics='accuracy')
cnn2_adam=cnn2.fit_generator(train_data, epochs=15, validation_data=(x_test, y_test))
test_loss, test_acc = cnn2.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('CNN2',cnn2_adam.history['accuracy'],cnn2_adam.history['val_accuracy'])
#Το φαινόμενο του overfitting έχει εξαλειφθεί. 
#Μπορούμε να αντισταθμίσουμε την μειωμένη ακρίβεια εκπαίδευσης, εισάγοντας μεγαλύτερο αριθμό εποχών.

#2.2
## Οι προβλέψεις που αφορούν το test set παρουσιάζονται βελτιωμένες. Όμως, συγκρίνοντας τις διαφορετικές μεθόδους, παρατηρούμε πως είναι προτιμότερο να εφαρμόσουμε image augmentation.
## Αφενός, δεν έχουμε καθόλου overfitting, και, αφετέρου, η ακρίβεια του training set μπορεί να διατηρηθεί σε επιθυμητές τιμές παρατείνοντας τον χρόνο εκπάιδευσης. 

#Ερώτημα 3
## Χρησιμοποιούμε το μοντέλο MobileNetV2 από τη βιβλιοθήκη keras.applications. 
## Σκοπός μας είναι να εκπαιδεύσουμε τα τελευταία επίπεδα του δικτύου και το classification head που θα εισάγουμε. 
dimensions=(32, 32, 3)
base_model = tf.keras.applications.MobileNetV2(input_shape=dimensions,include_top=False,weights='imagenet')
#Πάγωνουμε τη συνελικτική βάση. Εξαιρείται το τελευταίο συνελικτικό τα στάδιο.
for layer in base_model.layers:
  if layer.name == 'Conv_1':
    break
  layer.trainable = False
print('Base model summary:')
base_model.summary()
#Δημιουργία του τελικού μοντέλου.
model=Sequential()
model.add(base_model)
#Προσθήκη του classification head, όπως αυτό ορίζεται στο μοντέλο CNN2.
model.add(layers.Flatten())
model.add(layers.Dense(200, activation='softmax'))
model.compile(optimizer='adam',loss='categorical_crossentropy',metrics='accuracy')
#Εκπαίδευση του μοντέλου με image augmentation.
print('\n')
print('Ερώτημα 3\n')
print('Transfer learning')
history=model.fit_generator(train_data, epochs=15, validation_data=(x_test, y_test))
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(test_acc,'\n')
plot_acc('Transfer Learning',history.history['accuracy'],history.history['val_accuracy'])