# Proyecto IMT3120
## Implementación de Clasificador de Imágenes desde Cero

#### Nombre: Roberto Benatuil Valera

Este proyecto tendrá como finalidad implementar una red neuronal convolucional para clasificar imágenes. Se buscará implementar las los tipos de capas necesarias, considerando las convolucionales, de pooling, de reshaping y de activación, así como las funciones mismas de activación y de cálculo de pérdida. Cada capa tendrá sus debidos algoritmos de propagación de señales y de gradiente. 

Al finalizar el modelo, se entrenará con la colección de imágenes del Canadian Institute For Advanced Research, CIFAR10, con el objetivo de comparar su rendimiento con el estado del arte, y analizar su funcionamiento. En este mismo proceso, se realizarán iteraciones y experimentos con diferentes valores de hiperparámetros, entre ellos la tasa de aprendizaje y el tipo y cantidad de capas, así como su tamaño.

### Experimentos a realizar

Para probar la CNN, se realizarán algunos experimentos, con el fin de analizar su rendimiento y el efecto que los hiperparámetros producen sobre este. Primero, se variará la cantidad de capas convolucionales, cada una con una capa de activación ReLU, con el fin de medir la variación de rendimiento respecto a la eficiencia o rapidez de ejecución.

También, se hará otra serie de experimentos en el que se variará la tasa de aprendizaje, que corresponde al nivel de actualización de los parámetros según su gradiente, por cada iteración. Esto, con el fin de medir la velocidad de convergencia y el comportamiento de la curva de error, para encontrar el punto en el que presenta mayor eficiencia.

Por último, se intentará hacer una combinación de los resultados anteriores para encontrar el punto de mayor rendimiento.

### Por hacer:

<ul>

<li> TODO: Implementar backward propagation de todos los tipos de layers </li>
<li> TODO: Implementar las funciones de convolución, correlación y max pooling </li>
<li> TODO: Implementar los experimentos de manera clara (solo hay un bosquejo)</li>
<li> TODO: Hacer y perfeccionar las funciones de fit y predict de la CNN</li>

</ul>


### Archivos relevantes:

`activation.py`: aquí se definen las funciones de activación disponibles.

`aux_functions.py`: se definen funciones auxiliares, como pooling, correlación y convolución.

`loss_functs.py`: se definen las funciones de pérdida.

`nn_layers.py`: se definen las clases de capas de la red neuronal.

`nn_class.py`: se define la clase principal de la CNN.

### Implementación y testeo

In [3]:
from keras.datasets import cifar10
from nn_class import ConvNeuralNet
import numpy as np

In [4]:
################## CONFIG EXAMPLE ##################

layers = [
    ('conv',
        {
            'input_shape': (3, 32, 32),
            'kernel_size': 3,
            'depth': 5
        }
    ),
    ('maxpool',
        {
            'kernel_size': 2
        }
    ),
    ('activation',
        {
            'activation': 'relu'
        }
    ),
    ('reshape',
        {
            'input_shape': (5, 15, 15),
            'output_shape': ((5 * 15 * 15), 1)
        }
    ),
    ('dense',
        {
            'input_shape': ((5 * 15 * 15), 1),
            'neurons': 10
        }
    ),
    ('activation',
        {
            'activation': 'softmax'
        }
    )
]

loss = 'cross_entropy'
lr = 0.02

################## WORK IN PROGRESS ##################

model = ConvNeuralNet(layers, loss, lr)

In [5]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

In [16]:
x_train_channels = x_train.transpose(0, 3, 1, 2)
x_test_channels = x_test.transpose(0, 3, 1, 2)

y_train_encoded = np.zeros((y_train.size, y_train.max() + 1))
y_train_encoded[np.arange(y_train.size), y_train.flatten()] = 1

y_test_encoded = np.zeros((y_test.size, y_test.max() + 1))
y_test_encoded[np.arange(y_test.size), y_test.flatten()] = 1

y_train_encoded = y_train_encoded.reshape(len(y_train_encoded), 10, 1)
y_test_encoded = y_test_encoded.reshape(len(y_test_encoded), 10, 1)

x_train_channels = x_train_channels / 255
x_test_channels = x_test_channels / 255

#### Ejemplo de funcionamiento

Ojo: no se recomienda usar fit(), ya que no está optimizado, por lo que se demora un tiempo considerable. Para demostración del funcionamiento de forward propagation se muestra un ejemplo de predict()

In [18]:
example = x_train_channels[0]
pred = model.predict(example)

print(pred)
sum(pred[0])

[[9.23134354e-05 4.67722664e-03 9.95230457e-01 1.54064536e-17
  4.25181057e-48 3.27132184e-09 4.59198329e-28 1.65388754e-11
  2.56074537e-63 5.26000173e-26]]


1.0