In [None]:
# Necessary for Google Colab
# Uncomment before first run, and then comment all again

# Potrebno za Google Colab
# Odkomentarisati komande ispod pre prvog pokretanja, a zatim ponovo zakomentarisati

#! git clone https://github.com/AAnzel/Master_rad.git
#! mkdir ../data
#! mv Master_rad/data/UniProt\ cist ../data/


In [None]:
import os
import sys
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sn
from sklearn import preprocessing as prep
from sklearn import model_selection as ms
from sklearn import linear_model as lm
from sklearn import metrics as met
from sklearn.utils import class_weight as cw
from imblearn.over_sampling import SMOTE, ADASYN
from imblearn.under_sampling import RandomUnderSampler

from keras.models import Sequential
from keras.layers import Dense, BatchNormalization, Activation
from keras.callbacks import EarlyStopping
from keras import losses, optimizers, initializers, regularizers, activations
from keras import metrics as ker_met
from keras import backend as K
from keras.wrappers.scikit_learn import KerasClassifier
from keras.callbacks import EarlyStopping, ModelCheckpoint, Callback
from timeit import default_timer as timer
from datetime import timedelta

%matplotlib inline
#plt.style.use ('dark_background')

SMALL_SIZE = 14
MEDIUM_SIZE = 16
BIGGER_SIZE = 18

plt.rc('font', size=SMALL_SIZE)          # controls default text sizes
plt.rc('axes', titlesize=SMALL_SIZE)     # fontsize of the axes title
plt.rc('axes', labelsize=MEDIUM_SIZE)    # fontsize of the x and y labels
plt.rc('xtick', labelsize=SMALL_SIZE)    # fontsize of the tick labels
plt.rc('ytick', labelsize=SMALL_SIZE)    # fontsize of the tick labels
plt.rc('legend', fontsize=SMALL_SIZE)    # legend fontsize
plt.rc('figure', titlesize=BIGGER_SIZE)  # fontsize of the figure title


## 1. Importing and visualizing data

In [None]:
# Krecemo sa ucitavanjem podataka i vizualizacijom istih
sve_putanja_ulaza = os.path.join ('..', '..', 'data', 'UniProt cist', 'SVE_FINALNO.csv')
df_sve = pd.read_csv (sve_putanja_ulaza, sep = '\t', index_col = 0)
df_sve

In [None]:
# Izdvajanje poslednje kolone, koja predstavlja klasu kojoj protein pripada i izbacivanje iste iz DataFrame-a
y = df_sve['Klasa'].values
df_sve = df_sve.drop (labels = ['Klasa'], axis = 1)


In [None]:
# Prvo da vizualizujemo u kakvom su odnosu klase

fig = plt.figure (figsize = (8, 10))
plt.title ('Balansiranost klasa')
plt.xticks (ticks = range (2), labels = ['Negativna', 'Pozitivna'])
plt.bar ([0, 1], [sum(y == 0), sum (y == 1)], color = 'red')
plt.grid (linewidth = 0.3)
plt.show()


In [None]:
# Vizualizacija podataka pomocu matrice korelacije
kolone = df_sve.columns.values

fig = plt.figure (figsize = (20, 20))
plt.title ('Matrica korelacije podataka')
plt.xticks (ticks = range (len (kolone)), labels = kolone, rotation = 90)
plt.yticks (ticks = range (len (kolone)), labels = kolone)
plt.imshow (df_sve.corr(), cmap = 'magma')
plt.colorbar()
plt.show()

# Vidimo da nije velika korelisanost podataka ni u jednom delu, sto je jako dobro


# 2. Preparing data for machine learning models
## 2.1 Training-Test split

In [None]:
# Deljenje podataka na skupove za trening, validaciju i test, 2:1 odnos svuda
# Bitan parametar predstavlja i stratifikacija po klasi, tako da imamo ujednaceno deljenje na skupove (tj. balansiranost klasa po skupovima)
X = df_sve.values

x_trening_valid, x_test, y_trening_valid, y_test = ms.train_test_split (X, y, train_size = 0.67, test_size = 0.33, stratify = y, random_state = 7)
x_trening, x_valid, y_trening, y_valid = ms.train_test_split (x_trening_valid, y_trening_valid, train_size = 0.67, test_size = 0.33, stratify = y_trening_valid, random_state = 7)

# Standardizacija podataka
skaler_1 = prep.StandardScaler()
skaler_1.fit (x_trening)
x_trening = skaler_1.transform (x_trening)
x_valid = skaler_1.transform (x_valid)

skaler_2 = prep.StandardScaler()
skaler_2.fit (x_trening_valid)
x_trening_valid = skaler_2.transform (x_trening_valid)
x_test = skaler_2.transform (x_test)

print ('Broj proteina u x_trening skupu podataka: ', x_trening.shape)
print ('Broj proteina u y_trening skupu podataka: ', y_trening.shape)
print ('Broj proteina u x_test skupu podataka: ', x_test.shape)
print ('Broj proteina u y_test skupu podataka: ', y_test.shape)

# Vizualizacija podele na trening, validacioni i test skup i balansiranosti klasa

fig, (ax1, ax2, ax3, ax4) = plt.subplots (1, 4, figsize = (25, 10))
plt.suptitle ('Kolicina podataka i balansiranost klasa')

ax1.set_title ('Kolicina podataka u trening, validacionom i test skupu')
ax1.set_xticks (ticks = range (3))
ax1.set_xticklabels (labels = ['Trening', 'Validacija', 'Test'])
ax1.bar ([0, 1, 2], [x_trening.shape[0], x_valid.shape[0], x_test.shape[0]], color = 'green')
ax1.grid (linewidth = 0.3)

ax2.set_title ('Klase trening skupa')
ax2.set_xticks (ticks = range (2))
ax2.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax2.bar ([0, 1], [sum(y_trening == 0), sum (y_trening == 1)], color = ['blue', 'red'])
ax2.grid (linewidth = 0.3)

ax3.set_title ('Klase validacionog skupa')
ax3.set_xticks (ticks = range (2))
ax3.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax3.bar ([0, 1], [sum(y_valid == 0), sum (y_valid == 1)], color = ['blue', 'red'])
ax3.grid (linewidth = 0.3)

ax4.set_title ('Klase test skupa')
ax4.set_xticks (ticks = range (2))
ax4.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax4.bar ([0, 1], [sum(y_test == 0), sum (y_test == 1)], color = ['blue', 'red'])
ax4.grid (linewidth = 0.3)

plt.show()


## 2.2 Balancing data with random undersampling

In [None]:
# Balansiranje podataka podsempliranjem (nasumicnim podsemplerom) i cuvanje novih podataka (radi se samo za trening skup!)
# Prvo balansiram deo koji ce se koristiti za ucenje, tj. samo trening skup

print ('Broj pozitivnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 1))
print ('Broj negativnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 0))

pod_sempler_1 = RandomUnderSampler(random_state = 7)
x_trening_pod, y_trening_pod = pod_sempler_1.fit_sample (x_trening, y_trening)

print ('Izgled x_trening skupa nakon podsempliranja:', x_trening_pod.shape)
print ('Izgled y_trening skupa nakon podsempliranja:', y_trening_pod.shape)

print ('Broj pozitivnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_pod == 1))
print ('Broj negativnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_pod == 0))

# Balansiranje dela za evaluaciju mreze, tj. trening_valid skupa

print ('\nBroj pozitivnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 1))
print ('Broj negativnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 0))

pod_sempler_2 = RandomUnderSampler(random_state = 7)
x_trening_valid_pod, y_trening_valid_pod = pod_sempler_2.fit_sample (x_trening_valid, y_trening_valid)

print ('Izgled x_trening_valid skupa nakon podsempliranja:', x_trening_valid_pod.shape)
print ('Izgled y_trening_valid skupa nakon podsempliranja:', y_trening_valid_pod.shape)

print ('Broj pozitivnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_pod == 1))
print ('Broj negativnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_pod == 0))


## 2.3 Balancing data with SMOTE oversampling

In [None]:
# Balansiranje podataka nadsempliranjem (SMOTE algoritmom, a ne nasumicnim nadsemplerom) i cuvanje novih podataka (radi se samo za trening skup!)
# Izabran je SMOTE algoritam jer je on koristi algoritam K najblizih suseda za generisanje novih podataka, samim tim daje relevantnije nove informacije
# Prvo balansiram deo koji ce se koristiti za ucenje, tj. samo trening skup

print ('Broj pozitivnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 1))
print ('Broj negativnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 0))

nad_sempler_smote_1 = SMOTE(random_state = 7, n_jobs = -1)
x_trening_nad_smote, y_trening_nad_smote = nad_sempler_smote_1.fit_sample (x_trening, y_trening)

print ('Izgled x_trening skupa nakon nadsempliranja:', x_trening_nad_smote.shape)
print ('Izgled y_trening skupa nakon nadsempliranja:', y_trening_nad_smote.shape)

print ('Broj pozitivnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_nad_smote == 1))
print ('Broj negativnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_nad_smote == 0))

# Balansiranje dela za evaluaciju mreze, tj. trening_valid skupa

print ('\nBroj pozitivnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 1))
print ('Broj negativnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 0))

nad_sempler_smote_2 = SMOTE(random_state = 7, n_jobs = -1)
x_trening_valid_nad_smote, y_trening_valid_nad_smote = nad_sempler_smote_2.fit_sample (x_trening_valid, y_trening_valid)

print ('Izgled x_trening_valid skupa nakon nadsempliranja:', x_trening_valid_nad_smote.shape)
print ('Izgled y_trening_valid skupa nakon nadsempliranja:', y_trening_valid_nad_smote.shape)

print ('Broj pozitivnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_nad_smote == 1))
print ('Broj negativnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_nad_smote == 0))


## 2.4 Balancing data with ADASYN oversampling

In [None]:
# Balansiranje podataka nadsempliranjem (ADASYN algoritmom, a ne nasumicnim nadsemplerom) i cuvanje novih podataka (radi se samo za trening skup!)
# ADASYN predstavlja poboljsanje SMOTE algoritma koji kreira 'realnije' podatke
# Prvo balansiram deo koji ce se koristiti za ucenje, tj. samo trening skup

print ('Broj pozitivnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 1))
print ('Broj negativnih proteina trening skupa, pre balansiranja: ', sum(y_trening == 0))

nad_sempler_adasyn_1 = ADASYN(random_state = 7, n_jobs = -1)
x_trening_nad_adasyn, y_trening_nad_adasyn = nad_sempler_adasyn_1.fit_sample (x_trening, y_trening)

print ('Izgled x_trening skupa nakon nadsempliranja:', x_trening_nad_adasyn.shape)
print ('Izgled y_trening skupa nakon nadsempliranja:', y_trening_nad_adasyn.shape)

print ('Broj pozitivnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_nad_adasyn == 1))
print ('Broj negativnih proteina trening skupa, nakon balansiranja: ', sum(y_trening_nad_adasyn == 0))

# Balansiranje dela za evaluaciju mreze, tj. trening_valid skupa

print ('\nBroj pozitivnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 1))
print ('Broj negativnih proteina trening_valid skupa, pre balansiranja: ', sum(y_trening_valid == 0))

nad_sempler_adasyn_2 = ADASYN(random_state = 7, n_jobs = -1)
x_trening_valid_nad_adasyn, y_trening_valid_nad_adasyn = nad_sempler_adasyn_2.fit_sample (x_trening_valid, y_trening_valid)

print ('Izgled x_trening_valid skupa nakon nadsempliranja:', x_trening_valid_nad_adasyn.shape)
print ('Izgled y_trening_valid skupa nakon nadsempliranja:', y_trening_valid_nad_adasyn.shape)

print ('Broj pozitivnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_nad_adasyn == 1))
print ('Broj negativnih proteina trening_valid skupa, nakon balansiranja: ', sum(y_trening_valid_nad_adasyn == 0))


In [None]:
# Vizualizacija polaznih podataka trening i trening_valid skupa, zatim podataka nakon podsempliranja i nakon nadsempliranja

fig, (ax1, ax2, ax3, ax4) = plt.subplots (1, 4, sharey = True, figsize = (25, 10))
plt.suptitle ('Balansiranost klasa trening skupa pre i posle obrade')

ax1.set_title ('Klase pre obrade')
ax1.set_xticks (ticks = range (2))
ax1.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax1.bar ([0, 1], [sum(y_trening == 0), sum (y_trening == 1)], color = ['blue', 'red'])
ax1.grid (linewidth = 0.3)

ax2.set_title ('Klase nakon nasumicnog podsempliranja')
ax2.set_xticks (ticks = range (2))
ax2.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax2.bar ([0, 1], [sum(y_trening_pod == 0), sum (y_trening_pod == 1)], color = ['blue', 'red'])
ax2.grid (linewidth = 0.3)

ax3.set_title ('Klase nakon SMOTE nadsempliranja')
ax3.set_xticks (ticks = range (2))
ax3.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax3.bar ([0, 1], [sum(y_trening_nad_smote == 0), sum (y_trening_nad_smote == 1)], color = ['blue', 'red'])
ax3.grid (linewidth = 0.3)

ax4.set_title ('Klase nakon ADASYN nadsempliranja')
ax4.set_xticks (ticks = range (2))
ax4.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax4.bar ([0, 1], [sum(y_trening_nad_adasyn == 0), sum (y_trening_nad_adasyn == 1)], color = ['blue', 'red'])
ax4.grid (linewidth = 0.3)

plt.show()


In [None]:
# Sad validacioni

fig, (ax1, ax2, ax3, ax4) = plt.subplots (1, 4, sharey = True, figsize = (25, 10))
plt.suptitle ('Balansiranost klasa trening_valid skupa pre i posle obrade')

ax1.set_title ('Klase pre obrade')
ax1.set_xticks (ticks = range (2))
ax1.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax1.bar ([0, 1], [sum(y_trening_valid == 0), sum (y_trening_valid == 1)], color = ['blue', 'red'])
ax1.grid (linewidth = 0.3)

ax2.set_title ('Klase nakon nasumicnog podsempliranja')
ax2.set_xticks (ticks = range (2))
ax2.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax2.bar ([0, 1], [sum(y_trening_valid_pod == 0), sum (y_trening_valid_pod == 1)], color = ['blue', 'red'])
ax2.grid (linewidth = 0.3)

ax3.set_title ('Klase nakon SMOTE nadsempliranja')
ax3.set_xticks (ticks = range (2))
ax3.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax3.bar ([0, 1], [sum(y_trening_valid_nad_smote == 0), sum (y_trening_valid_nad_smote == 1)], color = ['blue', 'red'])
ax3.grid (linewidth = 0.3)

ax4.set_title ('Klase nakon ADASYN nadsempliranja')
ax4.set_xticks (ticks = range (2))
ax4.set_xticklabels (labels = ['Negativna', 'Pozitivna'])
ax4.bar ([0, 1], [sum(y_trening_valid_nad_adasyn == 0), sum (y_trening_valid_nad_adasyn == 1)], color = ['blue', 'red'])
ax4.grid (linewidth = 0.3)

plt.show()


In [None]:
# Funkcija za lepo iscrtavanje matrice konfuzije
# Preuzeta i modifikovana za potrebe rada sa zvanicnog sajta biblioteke SciKit-Learn:
# https://scikit-learn.org/0.21/auto_examples/model_selection/plot_confusion_matrix.html
def nacrtaj_matricu_konfuzije (y_test, y_procena, ime_modela):
    
    #plt.style.use ('dark_background')
    mat_konf = met.confusion_matrix(y_test, y_procena)
    
    # Kreiranje normalizovane verzije matrice konfuzije
    norm_mat_konf = mat_konf.astype('float') / mat_konf.sum(axis=1)[:, np.newaxis]
    
    klase = np.unique (np.hstack ((y_test, y_procena)))
    
    # Kreiranje grafika za svaku od matrica
    fig, (ax_1, ax_2) = plt.subplots (1, 2, figsize = (20, 10))
    plt.suptitle ('Matrice konfuzije za model: ' + ime_modela)
    
    slika_1 = ax_1.imshow (mat_konf, interpolation = 'nearest', cmap = 'Reds')
    ax_1.figure.colorbar (slika_1, ax = ax_1, shrink = 0.8)
    
    slika_2 = ax_2.imshow (norm_mat_konf, interpolation = 'nearest', cmap = 'Reds')
    ax_2.figure.colorbar (slika_2, ax = ax_2, shrink = 0.8)
    
    ax_1.set (xticks = np.arange (mat_konf.shape[1]),
              yticks = np.arange (mat_konf.shape[0]),
              xticklabels = klase,
              yticklabels = klase,
              title = 'Matrica konfuzije bez normalizacije',
              ylabel = 'Stvarne vrednosti',
              xlabel = 'Procenjene vrednosti')
    
    ax_2.set (xticks = np.arange (norm_mat_konf.shape[1]),
              yticks = np.arange (norm_mat_konf.shape[0]),
              xticklabels = klase,
              yticklabels = klase,
              title = 'Normalizovana matrica konfuzije',
              ylabel = 'Stvarne vrednosti',
              xlabel = 'Procenjene vrednosti')
    
    # Potrebno zbog baga u trenutnoj verziji Matplotlib-a 3.1.1, izbrisati nakon nadogradnje
    # Bag: https://github.com/matplotlib/matplotlib/issues/15154
    ################################################################
    ax_1.set_ylim (mat_konf.shape[0] - 0.5, -0.5)
    ax_2.set_ylim (norm_mat_konf.shape[0] - 0.5, -0.5)
    ################################################################
    
    plt.setp (ax_1.get_xticklabels(), rotation = 45, ha = "right", rotation_mode = "anchor")
    plt.setp (ax_2.get_xticklabels(), rotation = 45, ha = "right", rotation_mode = "anchor")
    
    tekst = [['Stvarno negativni\n','Lazno pozitivni\n'], ['Lazno negativni\n', 'Stvarno pozitivni\n']]
    
    for i in range (mat_konf.shape[0]):
        for j in range(mat_konf.shape[1]):
            ax_1.text (j, i, str (tekst[i][j]) + format(mat_konf[i, j], 'g'), horizontalalignment = 'center', verticalalignment = 'center', bbox = dict (facecolor = 'gray', alpha = 0.9))
            ax_2.text (j, i, str (tekst[i][j]) + format(norm_mat_konf[i, j], 'g'), horizontalalignment = 'center', verticalalignment = 'center', bbox = dict (facecolor = 'gray', alpha = 0.9))
    
    fig.tight_layout()
    
    return ax_1, ax_2

# Funkcija za iscrtavanje grafika ucenja mreze (tacnost i greska) nad razlicitim skupovima
def nacrtaj_ucenje (istorija, ime_modela):
    
    tacnost = istorija.history ['binary_accuracy']
    val_tacnost = istorija.history ['val_binary_accuracy']
    greska = istorija.history ['loss']
    val_greska = istorija.history ['val_loss']
    
    fig, (ax1, ax2) = plt.subplots (1, 2, figsize = (20, 10))
    plt.suptitle ('Grafici tacnosti i greske za model: ' + ime_modela)
    
    ax1.set_title ('Grafik tacnosti modela u zavisnosti od epohe')
    ax1.set_xlabel ('Epoha')
    ax1.set_ylabel ('Binarna Tacnost')
    ax1.plot (istorija.epoch, tacnost, c = 'r', label = 'Trening')
    ax1.plot (istorija.epoch, val_tacnost, c = 'g', label = 'Validacija')
    ax1.grid (linewidth = 0.3)
    ax1.legend()
    
    ax2.set_title ('Grafik greske modela u zavisnosti od epohe')
    ax2.set_xlabel ('Epoha')
    ax2.set_ylabel ('Greska')
    ax2.plot (istorija.epoch, greska, c = 'r', label = 'Trening')
    ax2.plot (istorija.epoch, val_greska, c = 'g', label = 'Validacija')
    ax2.grid (linewidth = 0.3)
    ax2.legend()
    
    plt.show()


# 3. Using Fully Connected Neural Networks to classify proteins with differently balanced data sets
Different NNs and differently balanced data sets are used in following order:
* 3.1. Source data set without implementing any balancing technique
    * 3.1.1 NN with default value for class_weight parameter and 1 hidden layer
    * 3.1.2 NN with default value for class_weight parameter and 2 hidden layers
    * 3.1.3 NN with calculated value for class_weight parameter and 1 hidden layer
    * 3.1.4 NN with calculated value for class_weight parameter and 2 hidden layers
* 3.2. Data set balanced with random undersampling
    * 3.2.1 NN with 1 hidden layer
    * 3.2.2 NN with 2 hidden layers
* 3.3. Data set balanced with SMOTE oversampling
    * 3.3.1 NN with 1 hidden layer
    * 3.3.2 NN with 2 hidden layers
* 3.4. Data set balanced with ADASYN oversampling
    * 3.4.1 NN with 1 hidden layer
    * 3.4.2 NN with 2 hidden layers

class_weight parameter (when used) is set to 'balanced' value. Documentation says this means:
* The “balanced” mode uses the values of y to automatically adjust weights inversely proportional to class frequencies in the input data as n_samples / (n_classes * np.bincount(y))

This is only done for source data set.



In [None]:
# Definisanje parametara svih mreza
dim_ulaza = len (kolone)
dim_izlaza = 1

#########################################################################################################
# Vrednosti koje sam prvobitno koristio

# inicijalizatori = ['uniform', 'normal', 'lecun_normal', 'lecun_uniform', 'he_normal', 'he_uniform', 'glorot_normal', 'glorot_uniform']
# optimizatori = ['SGD', 'RMSprop', 'Adagrad', 'Adadelta', 'Adam', 'Adamax', 'Nadam']
# vel_grupa = [32, 64]
#########################################################################################################

# Nove vrednosti, nakon odluke da se varira arhitektura

inicijalizatori = ['he_normal', 'he_uniform', 'glorot_normal', 'glorot_uniform']
optimizatori = ['RMSprop', 'Nadam']
vel_grupa = [32]
br_neurona_1 = [30, 25, 20] # Za potencijalni prvi skriveni sloj
br_neurona_2 = [18, 15, 13] # Za potencijalni drugi skriveni sloj
br_neurona_3 = [10, 8, 5] # Za potencijalni treci skriveni sloj

kolbekovi = [EarlyStopping (monitor = 'val_loss', patience = 13, restore_best_weights = True)]

epohe = 200


In [None]:
# Sa jednim skrivenim slojem
def napravi_mrezu_1 (optimizer, kernel_initializer, br_neur_1):
	
    K.clear_session()
    mreza = Sequential()
    mreza.add (Dense (units = br_neur_1, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = dim_izlaza))
    mreza.add (BatchNormalization())
    mreza.add (Activation('sigmoid'))

    mreza.compile (optimizer = optimizer, loss = losses.binary_crossentropy, metrics = [ker_met.binary_accuracy
])
    
    return mreza

# Sa dva skrivena sloja
def napravi_mrezu_2 (optimizer, kernel_initializer, br_neur_1, br_neur_2):
	
    K.clear_session()
    mreza = Sequential()
    mreza.add (Dense (units = br_neur_1, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = br_neur_2, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = dim_izlaza))
    mreza.add (BatchNormalization())
    mreza.add (Activation('sigmoid'))

    mreza.compile (optimizer = optimizer, loss = losses.binary_crossentropy, metrics = [ker_met.binary_accuracy])
    
    return mreza

# Sa tri skrivena sloja
def napravi_mrezu_3 (optimizer, kernel_initializer, br_neur_1, br_neur_2, br_neur_3):
	
    K.clear_session()
    mreza = Sequential()
    mreza.add (Dense (units = br_neur_1, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = br_neur_2, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = br_neur_3, input_dim = dim_ulaza, kernel_initializer = kernel_initializer))
    mreza.add (BatchNormalization())
    mreza.add (Activation('relu'))
    mreza.add (Dense (units = dim_izlaza))
    mreza.add (BatchNormalization())
    mreza.add (Activation('sigmoid'))

    mreza.compile (optimizer = optimizer, loss = losses.binary_crossentropy, metrics = [ker_met.binary_accuracy])
    
    return mreza
  

In [None]:
# Helper functions for finding best hyperparameter values
# Pomocne funkcije za nalazenje optimalnih parametara prateci f1 meru

def nadji_najbolje_parametre (X_TREN, Y_TREN, X_VAL, Y_VAL, X_TEST, Y_TEST, BR_SLOJA, TEZINA_KLASA = None):
  
  najb_f1 = 0
  i = 0
  poc_vreme = timer()
  
  if BR_SLOJA == 1:
    
    najb_par = {'opt' : '', 'kern_ini' : '', 'batch_size' : 0, 'br_n_1' : 0}
    ukupno_prolaza = len(br_neurona_1) * len(optimizatori) * len(inicijalizatori) * len(vel_grupa)
    print ('Ukupan broj prolaza:', ukupno_prolaza)
    
    for br_n_1 in br_neurona_1:
      for op in optimizatori:
        for inic in inicijalizatori:
          for v_g in vel_grupa:

            mreza = napravi_mrezu_1 (optimizer = op, kernel_initializer = inic, br_neur_1 = br_n_1)
            mreza.fit (X_TREN, Y_TREN, validation_data = (X_VAL, Y_VAL), epochs = epohe, batch_size = v_g, callbacks = kolbekovi, class_weight = TEZINA_KLASA, verbose = 0)

            y_procena = mreza.predict(X_TEST)
            y_procena_zaok = np.rint (y_procena)
            izvestaj = met.classification_report (Y_TEST, y_procena_zaok, output_dict = True)

            if izvestaj['1']['f1-score'] > najb_f1:
              najb_f1 = izvestaj['1']['f1-score']
              najb_par['opt'] = op
              najb_par['kern_ini'] = inic
              najb_par['batch_size'] = v_g
              najb_par['br_n_1'] = br_n_1
              print ('Novi f1 skor:', najb_f1)
            
            i += 1
            if (ukupno_prolaza // 4 == i) or (ukupno_prolaza // 2 == i) or (3 * ukupno_prolaza // 4 == i):
              print ('Prolaz:', i)

  elif BR_SLOJA == 2:
    
    najb_par = {'opt' : '', 'kern_ini' : '', 'batch_size' : 0, 'br_n_1' : 0, 'br_n_2' : 0}
    ukupno_prolaza = len(br_neurona_1) * len(br_neurona_2) * len(optimizatori) * len(inicijalizatori) * len(vel_grupa)
    print ('Ukupan broj prolaza:', ukupno_prolaza)
    
    for br_n_1 in br_neurona_1:
      for br_n_2 in br_neurona_2:
        for op in optimizatori:
          for inic in inicijalizatori:
            for v_g in vel_grupa:
              
              mreza = napravi_mrezu_2 (optimizer = op, kernel_initializer = inic, br_neur_1 = br_n_1, br_neur_2 = br_n_2)
              mreza.fit (X_TREN, Y_TREN, validation_data = (X_VAL, Y_VAL), epochs = epohe, batch_size = v_g, callbacks = kolbekovi, class_weight = TEZINA_KLASA, verbose = 0)

              y_procena = mreza.predict(X_TEST)
              y_procena_zaok = np.rint (y_procena)
              izvestaj = met.classification_report (Y_TEST, y_procena_zaok, output_dict = True)

              if izvestaj['1']['f1-score'] > najb_f1:
                najb_f1 = izvestaj['1']['f1-score']
                najb_par['opt'] = op
                najb_par['kern_ini'] = inic
                najb_par['batch_size'] = v_g
                najb_par['br_n_1'] = br_n_1
                najb_par['br_n_2'] = br_n_2
                print ('Novi f1 skor:', najb_f1)

              i += 1
              if (ukupno_prolaza // 4 == i) or (ukupno_prolaza // 2 == i) or (3 * ukupno_prolaza // 4 == i):
                print ('Prolaz:', i)
  
  else:
    
    najb_par = {'opt' : '', 'kern_ini' : '', 'batch_size' : 0, 'br_n_1' : 0, 'br_n_2' : 0, 'br_n_3' : 0}
    ukupno_prolaza = len(br_neurona_1) * len(br_neurona_2) * len(br_neurona_3) * len(optimizatori) * len(inicijalizatori) * len(vel_grupa)
    print ('Ukupan broj prolaza:', ukupno_prolaza)
    
    for br_n_1 in br_neurona_1:
      for br_n_2 in br_neurona_2:
        for br_n_3 in br_neurona_3:
          for op in optimizatori:
            for inic in inicijalizatori:
              for v_g in vel_grupa:

                mreza = napravi_mrezu_3 (optimizer = op, kernel_initializer = inic, br_neur_1 = br_n_1, br_neur_2 = br_n_2, br_neur_3 = br_n_3)
                mreza.fit (X_TREN, Y_TREN, validation_data = (X_VAL, Y_VAL), epochs = epohe, batch_size = v_g, callbacks = kolbekovi, class_weight = TEZINA_KLASA, verbose = 0)

                y_procena = mreza.predict(X_TEST)
                y_procena_zaok = np.rint (y_procena)
                izvestaj = met.classification_report (Y_TEST, y_procena_zaok, output_dict = True)

                if izvestaj['1']['f1-score'] > najb_f1:
                  najb_f1 = izvestaj['1']['f1-score']
                  najb_par['opt'] = op
                  najb_par['kern_ini'] = inic
                  najb_par['batch_size'] = v_g
                  najb_par['br_n_1'] = br_n_1
                  najb_par['br_n_2'] = br_n_2
                  najb_par['br_n_3'] = br_n_3
                  print ('Novi f1 skor:', najb_f1)

                i += 1
                if (ukupno_prolaza // 4 == i) or (ukupno_prolaza // 2 == i) or (3 * ukupno_prolaza // 4 == i):
                  print ('Prolaz:', i)
  
  kraj_vreme = timer()
  print ('Proteklo vreme:', timedelta(seconds = kraj_vreme - poc_vreme))
  
  print ('Najbolji parametri:\n', najb_par)
  return najb_par


## 3.1. Source data set without implementing any balancing technique

### 3.1.1 NN with default value for class_weight parameter and 1 hidden layer


In [None]:
# Zakomentarisani delovi u nastavku se odnose na primenu ugradjenih funkcija unakrsne validacije
# za nalazenje optimalnih parametara. Usled duzine ovog procesa, on je napusten. Ipak, kod je 
# ostavljen kao alternativna verzija resavanja
# Treniranje mreze sa jednim skrivenim slojem
# Vreme izvrsavanja ~ 50 min., 30 min. za drugi slucaj
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_1, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1 + br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 1)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur = mreza_2.best_params_['br_neur_1']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona:', najb_br_neur)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur = najb_parametri['br_n_1']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nebal = napravi_mrezu_1 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur)
mreza_nebal.summary()


In [None]:
istorija = mreza_nebal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)

In [None]:
y_procena = mreza_nebal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije nebalansirane potpuno povezane mreze sa jednim skrivenim slojem:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza nebalansirana sa jednim skrivenim slojem- ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


### 3.1.2 NN with default value for class_weight parameter and 2 hidden layers


In [None]:
# Treniranje mreze sa dva skrivena sloja
# Vreme izvrsavanja ~ 2h 48 min., 2h
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_2, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 =  br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''
najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 2)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
'''
najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nebal = napravi_mrezu_2 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2)
mreza_nebal.summary()


In [None]:
istorija = mreza_nebal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)

In [None]:
y_procena = mreza_nebal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije nebalansirane potpuno povezane mreze sa dva skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza nebalansirana sa dva skrivena sloja- ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


In [None]:
# Treniranje mreze sa tri skrivena sloja

'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_3, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 =  br_neurona_2, br_neur_3 =  br_neurona_3, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

#najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 3)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']
najb_br_neur_3 = mreza_2.best_params_['br_neur_3']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
print ('Broj neurona treceg sloja:', najb_br_neur_3)


najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']
najb_br_neur_3 = najb_parametri['br_n_3']
'''

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
#mreza_nebal = napravi_mrezu_3 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2, br_neur_3 = najb_br_neur_3)
#mreza_nebal.summary()


In [None]:
#istorija = mreza_nebal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)

In [None]:
'''
y_procena = mreza_nebal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije nebalansirane potpuno povezane mreze sa tri skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))
'''

In [None]:
'''
ime = 'Mreza nebalansirana sa tri skrivena sloja- ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2) + ', ' + str(najb_br_neur_3))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()
'''

In [None]:
#nacrtaj_ucenje (istorija, ime)


### 3.1.3 NN with calculated value for class_weight parameter and 1 hidden layer


In [None]:
# Racunanje tezina klasa
# Treniranje mreze sa jednim skrivenim slojem
# Vreme izvrsavanja ~ 50 min., 36 min.
tezine_klasa = cw.compute_class_weight('balanced', np.unique(y_trening_valid), y_trening_valid)
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_1, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1 + br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 1, tezine_klasa)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur = mreza_2.best_params_['br_neur_1']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona:', najb_br_neur)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur = najb_parametri['br_n_1']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_bal = napravi_mrezu_1 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur)
mreza_bal.summary()


In [None]:
istorija = mreza_bal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_bal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije balansirane potpuno povezane mreze sa jednim skrivenim slojem:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza balansirana sa jednim skrivenim slojem - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


### 3.1.4 NN with calculated value for class_weight parameter and 2 hidden layers


In [None]:
# Mreza sa dva skrivena sloja
# Vreme izvrsavanja ~ 2h 42 min., 2h
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_2, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 2, tezine_klasa)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_bal = napravi_mrezu_2 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2)
mreza_bal.summary()


In [None]:
istorija = mreza_bal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_bal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije balansirane potpuno povezane mreze sa dva skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza balansirana sa dva skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


In [None]:
# Mreza sa tri skrivena sloja
# Vreme izvrsavanja ~ 100 min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_3, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, br_neur_3 = br_neurona_3, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening, y_trening, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa)
'''

#najb_parametri =  nadji_najbolje_parametre (x_trening, y_trening, x_valid, y_valid, x_test, y_test, 3, tezine_klasa)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']
najb_br_neur_3 = mreza_2.best_params_['br_neur_3']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
print ('Broj neurona treceg sloja:', najb_br_neur_3)


najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']
najb_br_neur_3 = najb_parametri['br_n_3']
'''

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
#mreza_bal = napravi_mrezu_3 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2, br_neur_3 = najb_br_neur_3)
#mreza_bal.summary()


In [None]:
#istorija = mreza_bal.fit (x_trening, y_trening, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, class_weight = tezine_klasa, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
'''
y_procena = mreza_bal.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije balansirane potpuno povezane mreze sa tri skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))
'''

In [None]:
'''
ime = 'Mreza balansirana sa tri skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2) + ', ' + str(najb_br_neur_3))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()
'''

In [None]:
#nacrtaj_ucenje (istorija, ime)


## 3.2.  Data set balanced with random undersampling

### 3.2.1 NN with 1 hidden layer


In [None]:
# Ovde se obavlja GridSearch bez scoring parametra (koristi se scoring samog modela)
# To je potrebno jer je broj podataka mali te dolazi do nedefinisane f1 mere
# Vreme izvrsavanja ~ 14 min., 12 min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_1, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1 + br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_pod, y_trening_pod, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_pod, y_trening_pod, x_valid, y_valid, x_test, y_test, 1)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur = mreza_2.best_params_['br_neur_1']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona:', najb_br_neur)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur = najb_parametri['br_n_1']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_pod = napravi_mrezu_1 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur)
mreza_pod.summary()


In [None]:
istorija = mreza_pod.fit (x_trening_pod, y_trening_pod, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_pod.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije podsemplirane potpuno povezane sa jednim skrivenim slojem mreze:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza podsempliranje sa jednim skrivenim slojem - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


### 3.2.2 NN with 2 hidden layers


In [None]:
# Mreza sa dva skrivena sloja
# Vreme izvrsavanja ~ 46 min., 40min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_2, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_pod, y_trening_pod, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_pod, y_trening_pod, x_valid, y_valid, x_test, y_test, 2)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_pod = napravi_mrezu_2 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2)
mreza_pod.summary()


In [None]:
istorija = mreza_pod.fit (x_trening_pod, y_trening_pod, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_pod.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije podsemplirane potpuno povezane sa dva skrivena sloja mreze:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza podsempliranje sa dva skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


In [None]:
# Mreza sa tri skrivena sloja
# Vreme izvrsavanja ~ 30 min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_3, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, br_neur_3 = br_neurona_3, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV(estimator = mreza_1, param_grid = parametri, n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_pod, y_trening_pod, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

#najb_parametri =  nadji_najbolje_parametre (x_trening_pod, y_trening_pod, x_valid, y_valid, x_test, y_test, 3)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']
najb_br_neur_3 = mreza_2.best_params_['br_neur_3']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
print ('Broj neurona treceg sloja:', najb_br_neur_3)


najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']
najb_br_neur_3 = najb_parametri['br_n_3']
'''

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
#mreza_pod = napravi_mrezu_3 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2, br_neur_3 = najb_br_neur_3)
#mreza_pod.summary()


In [None]:
#istorija = mreza_pod.fit (x_trening_pod, y_trening_pod, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
'''
y_procena = mreza_pod.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije podsemplirane potpuno povezane sa tri skrivena sloja mreze:\n', met.classification_report (y_test, y_procena_zaok))
'''

In [None]:
'''
ime = 'Mreza podsempliranje sa tri skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2) + ', ' + str(najb_br_neur_3))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()
'''


In [None]:
#nacrtaj_ucenje (istorija, ime)


## 3.3. Data set balanced with SMOTE oversampling

### 3.3.1 NN with 1 hidden layer

In [None]:
# Mreza sa jednim skrivenim slojem
# Vreme izvrsavanja ~ 46 min., 35 min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_1, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1 + br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_smote, y_trening_nad_smote, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_nad_smote, y_trening_nad_smote, x_valid, y_valid, x_test, y_test, 1)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur = mreza_2.best_params_['br_neur_1']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona:', najb_br_neur)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur = najb_parametri['br_n_1']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nad_smote = napravi_mrezu_1 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur)
mreza_nad_smote.summary()


In [None]:
istorija = mreza_nad_smote.fit (x_trening_nad_smote, y_trening_nad_smote, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_nad_smote.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije SMOTE nadsemplirane potpuno povezane mreze sa jednim skrivenim slojem:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza SMOTE nadsempliranje sa jednim skrivenim slojem - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


### 3.3.2  NN with 2 hidden layers


In [None]:
# Mreza sa dva skrivena sloja
# Vreme izvrsavanja ~ 2h 40 min., 2h
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_2, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_smote, y_trening_nad_smote, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_nad_smote, y_trening_nad_smote, x_valid, y_valid, x_test, y_test, 2)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nad_smote = napravi_mrezu_2 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2)
mreza_nad_smote.summary()


In [None]:
istorija = mreza_nad_smote.fit (x_trening_nad_smote, y_trening_nad_smote, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_nad_smote.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije SMOTE nadsemplirane potpuno povezane mreze sa dva skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza SMOTE nadsempliranje sa dva skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


In [None]:
# Mreza sa tri skrivena sloja
# Vreme izvrsavanja ~  min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_3, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, br_neur_3 = br_neurona_3, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_smote, y_trening_nad_smote, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

#najb_parametri =  nadji_najbolje_parametre (x_trening_nad_smote, y_trening_nad_smote, x_valid, y_valid, x_test, y_test, 3)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']
najb_br_neur_3 = mreza_2.best_params_['br_neur_3']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
print ('Broj neurona treceg sloja:', najb_br_neur_3)


najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']
najb_br_neur_3 = najb_parametri['br_n_3']
'''

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
#mreza_nad_smote = napravi_mrezu_3 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2, br_neur_3 = najb_br_neur_3)
#mreza_nad_smote.summary()


In [None]:
#istorija = mreza_nad_smote.fit (x_trening_nad_smote, y_trening_nad_smote, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
'''
y_procena = mreza_nad_smote.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije SMOTE nadsemplirane potpuno povezane mreze sa tri skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))
'''

In [None]:
'''
ime = 'Mreza SMOTE nadsempliranje sa tri skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2) + ', ' + str(najb_br_neur_3))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()
'''

In [None]:
#nacrtaj_ucenje (istorija, ime)


## 3.4 Data set balanced with SMOTE oversampling

### 3.4.1 NN with 1 hidden layer

In [None]:
# Mreza sa jednim skrivenim slojem
# Vreme izvrsavanja ~ 50 min., 35 min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_1, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1 + br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_nad_adasyn, y_trening_nad_adasyn, x_valid, y_valid, x_test, y_test, 1)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur = mreza_2.best_params_['br_neur_1']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona:', najb_br_neur)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur = najb_parametri['br_n_1']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nad_adasyn = napravi_mrezu_1 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur)
mreza_nad_adasyn.summary()


In [None]:
istorija = mreza_nad_adasyn.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_nad_adasyn.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije ADASYN nadsemplirane potpuno povezane mreze sa jednim skrivenim slojem:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza ADASYN nadsempliranje sa jednim skrivenim slojem - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


### 3.4.2  NN with 2 hidden layers


In [None]:
# Mreza sa dva skrivena sloja
# Vreme izvrsavanja ~ 3h, 2h
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_2, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

najb_parametri =  nadji_najbolje_parametre (x_trening_nad_adasyn, y_trening_nad_adasyn, x_valid, y_valid, x_test, y_test, 2)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
'''

najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']


In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
mreza_nad_adasyn = napravi_mrezu_2 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2)
mreza_nad_adasyn.summary()


In [None]:
istorija = mreza_nad_adasyn.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
y_procena = mreza_nad_adasyn.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije ADASYN nadsemplirane potpuno povezane mreze sa dva skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))

In [None]:
ime = 'Mreza ADASYN nadsempliranje sa dva skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()


In [None]:
nacrtaj_ucenje (istorija, ime)


In [None]:
# Mreza sa tri skrivena sloja
# Vreme izvrsavanja ~  min.
'''
mreza_1 = KerasClassifier (build_fn = napravi_mrezu_3, verbose=0)

parametri = dict (br_neur_1 = br_neurona_1, br_neur_2 = br_neurona_2, br_neur_3 = br_neurona_3, optimizer = optimizatori, kernel_initializer = inicijalizatori, batch_size = vel_grupa)

mreza_2 = ms.GridSearchCV (estimator = mreza_1, param_grid = parametri, scoring = 'f1', n_jobs = 1, cv = 2, verbose = 1)
mreza_2.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, validation_data = (x_valid, y_valid), epochs = epohe, callbacks = kolbekovi)
'''

#najb_parametri =  nadji_najbolje_parametre (x_trening_nad_adasyn, y_trening_nad_adasyn, x_valid, y_valid, x_test, y_test, 3)


In [None]:
'''
najb_opt = mreza_2.best_params_['optimizer']
najb_inic = mreza_2.best_params_['kernel_initializer']
najb_vel = mreza_2.best_params_['batch_size']
najb_br_neur_1 = mreza_2.best_params_['br_neur_1']
najb_br_neur_2 = mreza_2.best_params_['br_neur_2']
najb_br_neur_3 = mreza_2.best_params_['br_neur_3']

print ('Najbolji parametri mreze su:')
print ('Kernel initializer:', najb_inic)
print ('Optimizer:', najb_opt)
print ('Batch size:', najb_vel)
print ('Broj neurona prvog sloja:', najb_br_neur_1)
print ('Broj neurona drugog sloja:', najb_br_neur_2)
print ('Broj neurona treceg sloja:', najb_br_neur_3)


najb_opt = najb_parametri['opt']
najb_inic = najb_parametri['kern_ini']
najb_vel = najb_parametri['batch_size']
najb_br_neur_1 = najb_parametri['br_n_1']
najb_br_neur_2 = najb_parametri['br_n_2']
najb_br_neur_3 = najb_parametri['br_n_3']
'''

In [None]:
# Kreiranje finalne mreze, evaluacija i iscrtavanje
#mreza_nad_adasyn = napravi_mrezu_3 (optimizer = najb_opt, kernel_initializer = najb_inic, br_neur_1 = najb_br_neur_1, br_neur_2 = najb_br_neur_2, br_neur_3 = najb_br_neur_3)
#mreza_nad_adasyn.summary()


In [None]:
#istorija = mreza_nad_adasyn.fit (x_trening_nad_adasyn, y_trening_nad_adasyn, batch_size = najb_vel, epochs = epohe, callbacks = kolbekovi, validation_data = (x_valid, y_valid), verbose = 1)


In [None]:
'''
y_procena = mreza_nad_adasyn.predict(x_test)
y_procena_zaok = np.rint (y_procena)

print ('Izvestaj klasifikacije ADASYN nadsemplirane potpuno povezane mreze sa tri skrivena sloja:\n', met.classification_report (y_test, y_procena_zaok))
'''

In [None]:
'''
ime = 'Mreza ADASYN nadsempliranje sa tri skrivena sloja - ' + str (najb_inic + ', ' + najb_opt + ', ' + str(najb_vel) + ', ' + str(najb_br_neur_1) + ', ' + str(najb_br_neur_2) + ', ' + str(najb_br_neur_3))
nacrtaj_matricu_konfuzije (y_test, y_procena_zaok.flatten(), ime)
plt.show()
'''

In [None]:
#nacrtaj_ucenje (istorija, ime)
