# Proyecto IMT3120
## Implementación de Clasificador de Imágenes desde Cero

#### Nombre: Roberto Benatuil Valera

Este proyecto tendrá como finalidad implementar una red neuronal convolucional para clasificar imágenes. Se buscará implementar las los tipos de capas necesarias, considerando las convolucionales, de pooling, de reshaping y de activación, así como las funciones mismas de activación y de cálculo de pérdida. Cada capa tendrá sus debidos algoritmos de propagación de señales y de gradiente. 

Al finalizar el modelo, se entrenará con la colección de imágenes del Canadian Institute For Advanced Research, CIFAR10, con el objetivo de comparar su rendimiento con el estado del arte, y analizar su funcionamiento. En este mismo proceso, se realizarán iteraciones y experimentos con diferentes valores de hiperparámetros, entre ellos la tasa de aprendizaje y el tipo y cantidad de capas, así como su tamaño.

### Experimentos a realizar

Para probar la CNN, se realizarán algunos experimentos, con el fin de analizar su rendimiento y el efecto que los hiperparámetros producen sobre este. Primero, se variará la cantidad de capas convolucionales, cada una con una capa de activación ReLU, con el fin de medir la variación de rendimiento respecto a la eficiencia o rapidez de ejecución.

También, se hará otra serie de experimentos en el que se variará la tasa de aprendizaje, que corresponde al nivel de actualización de los parámetros según su gradiente, por cada iteración. Esto, con el fin de medir la velocidad de convergencia y el comportamiento de la curva de error, para encontrar el punto en el que presenta mayor eficiencia.

Por último, se intentará hacer una combinación de los resultados anteriores para encontrar el punto de mayor rendimiento.

### Archivos relevantes:

`activation.py`: aquí se definen las funciones de activación disponibles.

`aux_functions.py`: se definen funciones auxiliares, como pooling, correlación y convolución.

`loss_functs.py`: se definen las funciones de pérdida.

`nn_layers.py`: se definen las clases de capas de la red neuronal.

`nn_class.py`: se define la clase principal de la CNN.

`optimization.py`: se crea el optimizador ADAM.

### Implementación y testeo

In [1]:
from keras.datasets import cifar10
from nn_class import ConvNeuralNet
from aux_functions import preprocess
from sklearn.model_selection import train_test_split

#### Carga de datos

In [2]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

(x_train, other1, y_train, other2) = train_test_split(x_train, y_train, test_size=0.95, random_state=42, stratify=y_train)
(x_test, other1, y_test, other2) = train_test_split(x_test, y_test, test_size=0.95, random_state=42, stratify=y_test)

print(len(x_train), len(x_test))

x_train, y_train, x_test, y_test, x_val, y_val = preprocess(x_train, y_train, x_test, y_test)

x_test = x_test / 255

2500 500


#### Experimento 1

learning_rate = 0.1

1 capa convolucional

In [3]:
layers = [
    ('conv', {'kernel_size': 3, 'depth': 3}),
    ('maxpool', {'kernel_size': 2}),
    ('activation', {'activation': 'relu'}),
    ('reshape', {'output_shape': 'flatten'}),
    ('dense', {'neurons': 10}),
    ('activation', {'activation': 'softmax'})
]

loss = 'cross_entropy'
lr = 0.1

input_shape = (3, 32, 32)

model1 = ConvNeuralNet(layers, loss, lr, input_shape, name='model1')

Setting layers: 100%|██████████| 6/6 [00:00<00:00, 3000.22it/s]


In [7]:
LOAD = True
if LOAD:
    model1.load()

In [8]:
model1.fit(x_train, y_train, epochs=20, patience=5, validation_data=(x_val, y_val))
model1.save()

Epoch 1:   0%|          | 0/2000 [00:00<?, ?it/s]

Epoch 1: 100%|██████████| 2000/2000 [00:11<00:00, 172.21it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 247.12it/s]


Epoch 1 train error: 1.9775203252540166, validation error: 2.296474364418621



Epoch 2: 100%|██████████| 2000/2000 [00:12<00:00, 166.17it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 236.96it/s]


Epoch 2 train error: 1.9377569697434405, validation error: 2.2728725097230336



Epoch 3: 100%|██████████| 2000/2000 [00:11<00:00, 170.57it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 212.97it/s]


Epoch 3 train error: 1.8900365363348677, validation error: 2.3557832793196822



Epoch 4: 100%|██████████| 2000/2000 [00:13<00:00, 150.40it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 227.87it/s]


Epoch 4 train error: 1.8945391384209864, validation error: 2.4004524425379508



Epoch 5: 100%|██████████| 2000/2000 [00:14<00:00, 139.37it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 169.17it/s]


Epoch 5 train error: 1.8829931355885001, validation error: 2.3692897021426598



Epoch 6: 100%|██████████| 2000/2000 [00:13<00:00, 149.35it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 175.53it/s]


Epoch 6 train error: 1.840966848216205, validation error: 2.5089849844100747



Epoch 7: 100%|██████████| 2000/2000 [00:13<00:00, 144.91it/s]
Validation: 100%|██████████| 500/500 [00:02<00:00, 223.62it/s]

Epoch 7 train error: 1.8288689376916454, validation error: 2.446564812410445

Early stopping on epoch 7





In [9]:
model1.check_precision(x_test, y_test)

Testing: 100%|██████████| 500/500 [00:02<00:00, 227.87it/s]


0.1

#### Experimento 2

learning_rate = 0.1
2 capas convolucionales

In [10]:
layers = [
    ('conv', {'kernel_size': 3, 'depth': 3}),
    ('maxpool', {'kernel_size': 2}),
    ('activation', {'activation': 'relu'}),
    ('conv', {'kernel_size': 2, 'depth': 3}),
    ('maxpool', {'kernel_size': 2}),
    ('activation', {'activation': 'relu'}),
    ('reshape', {'output_shape': 'flatten'}),
    ('dense', {'neurons': 10}),
    ('activation', {'activation': 'softmax'})
]

loss = 'cross_entropy'
lr = 0.1

input_shape = (3, 32, 32)

model2 = ConvNeuralNet(layers, loss, lr, input_shape, name='model2')

Setting layers: 100%|██████████| 9/9 [00:00<00:00, 4508.93it/s]


In [11]:
LOAD = False
if LOAD:
    model2.load()

In [12]:
model2.fit(x_train, y_train, epochs=20, patience=5, validation_data=(x_val, y_val))
model2.save()

Epoch 1: 100%|██████████| 2000/2000 [00:23<00:00, 85.36it/s]
Validation: 100%|██████████| 500/500 [00:04<00:00, 106.95it/s]


Epoch 1 train error: 2.8132263132812954, validation error: 2.1911701436067474



Epoch 2: 100%|██████████| 2000/2000 [00:26<00:00, 74.41it/s]
Validation: 100%|██████████| 500/500 [00:05<00:00, 89.29it/s] 


Epoch 2 train error: 2.1521722875860405, validation error: 2.1439352430686966



Epoch 3: 100%|██████████| 2000/2000 [00:25<00:00, 77.41it/s]
Validation: 100%|██████████| 500/500 [00:05<00:00, 87.74it/s] 


Epoch 3 train error: 2.1168333802385555, validation error: 2.178851220095354



Epoch 4: 100%|██████████| 2000/2000 [00:26<00:00, 74.73it/s]
Validation: 100%|██████████| 500/500 [00:05<00:00, 87.13it/s]


Epoch 4 train error: 2.106187659981477, validation error: 2.1394491307342514



Epoch 5: 100%|██████████| 2000/2000 [00:29<00:00, 67.98it/s]
Validation: 100%|██████████| 500/500 [00:05<00:00, 88.06it/s] 


Epoch 5 train error: 2.077516968513714, validation error: 2.273611392642506



Epoch 6: 100%|██████████| 2000/2000 [00:24<00:00, 81.41it/s]
Validation: 100%|██████████| 500/500 [00:04<00:00, 102.51it/s]


Epoch 6 train error: 2.0973461446205115, validation error: 2.153042799668795



Epoch 7: 100%|██████████| 2000/2000 [00:26<00:00, 74.94it/s]
Validation: 100%|██████████| 500/500 [00:06<00:00, 76.72it/s] 


Epoch 7 train error: 2.0697279942531304, validation error: 2.18787551993399



Epoch 8: 100%|██████████| 2000/2000 [00:26<00:00, 76.52it/s]
Validation: 100%|██████████| 500/500 [00:05<00:00, 98.65it/s] 


Epoch 8 train error: 2.0765750375586314, validation error: 2.216037362769548



Epoch 9: 100%|██████████| 2000/2000 [00:37<00:00, 53.32it/s]
Validation: 100%|██████████| 500/500 [00:06<00:00, 77.77it/s]

Epoch 9 train error: 2.0452007739742513, validation error: 2.182639170924021

Early stopping on epoch 9





In [None]:
model2.check_precision(x_test, y_test)

#### Experimento 3

learning_rate = 0.5

1 capa convolucional

In [None]:
layers = [
    ('conv', {'kernel_size': 3, 'depth': 3}),
    ('maxpool', {'kernel_size': 2}),
    ('activation', {'activation': 'relu'}),
    ('reshape', {'output_shape': 'flatten'}),
    ('dense', {'neurons': 10}),
    ('activation', {'activation': 'softmax'})
]

loss = 'cross_entropy'
lr = 0.5

input_shape = (3, 32, 32)

model3 = ConvNeuralNet(layers, loss, lr, input_shape, name='model3')

In [None]:
LOAD = False
if LOAD:
    model3.load()

In [None]:
model3.fit(x_train, y_train, epochs=20, patience=5, validation_data=(x_val, y_val))
model3.save()

In [None]:
model3.check_precision(x_test, y_test)

#### Experimento 4

learning_rate = 0.01

1 capa convolucional

In [None]:
layers = [
    ('conv', {'kernel_size': 3, 'depth': 3}),
    ('maxpool', {'kernel_size': 2}),
    ('activation', {'activation': 'relu'}),
    ('reshape', {'output_shape': 'flatten'}),
    ('dense', {'neurons': 10}),
    ('activation', {'activation': 'softmax'})
]

loss = 'cross_entropy'
lr = 0.01

input_shape = (3, 32, 32)

model4 = ConvNeuralNet(layers, loss, lr, input_shape, name='model4')

In [None]:
LOAD = False
if LOAD:
    model4.load()

In [None]:
model4.fit(x_train, y_train, epochs=20, patience=5, validation_data=(x_val, y_val))
model4.save()

In [None]:
model4.check_precision(x_test, y_test)

### Análisis de resultados

Al contrario de como se esperaba, la red neuronal convolucional no presenta un buen rendimiento. Algunas de las posibles razones pueden ser las siguientes:

- Tasa de aprendizaje con mal valor: Una tasa de aprendizaje mala puede ocasionar que el algoritmo de descenso no se comporte de buena manera, es decir, que salte el óptimo y diverja

- No se utilizó DropOut: esta técnica permite una regularización de los pesos y evita que el algoritmo quede en mínimos locales. La clase está implementada pero no se utilizó

- Utilización de algoritmo ADAM: Este algoritmo hace algo similar a lo anterior, y se implementó mas no se aplicó directamente.

Se buscará seguir estudiando el comportamiento de la CNN para su correcto funcionamiento a futuro.

Repo de GitHub: https://github.com/rbenatuilv/CNN-from-scratch