## Redes neuronales convolucionales

En esta clase vamos a crear una red neuronal convolucional simple. 

Vamos a implementar algunas arquitecturas simples y entrenaremos con el conjunto de datos CIFAR-10.

Primero vamos a importar los modulos necesarios:

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import Image
from matplotlib import pyplot


# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.constraints import maxnorm
from keras.optimizers import SGD
from keras.layers import Activation
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.layers.normalization import BatchNormalization
from keras.utils import np_utils


Using TensorFlow backend.


## Cargar la base de datos

Usaremos la base de datos CIFAR-10, la cual conciste en 60000 imágenes a color de 32x32. La base de datos está compuestas de 50000 imágenes de entrenamiento y 10000 de test.
Es una colección de imágenes que contiene 10 clases diferentes. Las 10 clases diferentes representan aviones, automóviles, pájaros, gatos, venados, perros, ranas, caballos, barcos y camiones.

A continuación se ve un ejemplo de algunas imágenes de la base de datos:


In [2]:
from keras.datasets import cifar10

Definimos las variables que vamos a utilizar:



In [3]:
batch_size = 32  
num_classes = 10 
epochs = 10 

Cargamos la base de datos

In [None]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data() 

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
  3350528/170498071 [..............................] - ETA: 6:47

Visualizamos algunas de las imágenes de la base de datos para familiarizarnos con la misma:

In [None]:
print('Train: X=%s, y=%s' % (x_train.shape, y_train.shape))
print('Test: X=%s, y=%s' % (x_test.shape, y_test.shape))

for i in range(9):
    pyplot.subplot(330 + 1 + i)
    pyplot.imshow(x_train[i])
pyplot.show()

Los valores de los pixeles están en un rango de entre 0 y 255 para cada canal (rojo, verde y azul). Es una buena práctica normalizar los valores. 

Debido a que los valores son conocidos, podemos normalizar fácilmente el rango a valores entre 0 y 1 dividiendo cada valor por la observación máxima que es 255.

Tenga en cuenta que los datos se cargan como enteros, por lo que debemos convertirlos en valores de punto flotante para realizar la división.



In [None]:
y_train = np_utils.to_categorical(y_train, num_classes)
y_test = np_utils.to_categorical(y_test, num_classes)
x_train =
x_test = 
x_train  /= 
x_test /= 

Estudie el siguiente modelo, indicando que capas componen la red:

In [None]:
def define_model():
	model = Sequential()
	model.add(Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same', input_shape=(32, 32, 3)))
	model.add(Conv2D(32, (3, 3), activation='relu', kernel_initializer='he_uniform', padding='same'))
	model.add(MaxPooling2D((2, 2)))
	model.add(Flatten())
	model.add(Dense(128, activation='relu', kernel_initializer='he_uniform'))
	model.add(Dense(10, activation='softmax'))
	# compile model
	opt = SGD(lr=0.001, momentum=0.9)
	model.compile(optimizer=opt, loss='categorical_crossentropy', metrics=['accuracy'])
	return model

cnn_n = define_model()
cnn_n.summary()
 



In [None]:
Entrene el modelo

In [None]:
#Fit model
 
cnn = cnn_n.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_data=(x_test,y_test),shuffle=True)

En cnn.history queda el registro histórico de qué sucedió con la accuracy y loss durante el entrenamiento para ambos conjuntos.

In [None]:
# Plots for training and testing process: loss and accuracy
 
plt.figure(0)
plt.plot(cnn.history['acc'],'r')
plt.plot(cnn.history['val_acc'],'g')
plt.xticks(np.arange(0, epochs + 1, 2.0))
plt.rcParams['figure.figsize'] = (8, 6)
plt.xlabel("Num of Epochs")
plt.ylabel("Accuracy")
plt.title(" Accuracy ")
plt.legend(['train','validation'])
 
 
plt.figure(1)
plt.plot(cnn.history['loss'],'r')
plt.plot(cnn.history['val_loss'],'g')
plt.xticks(np.arange(0, epochs + 1, 2.0))
plt.rcParams['figure.figsize'] = (8, 6)
plt.xlabel("Num of Epochs")
plt.ylabel("Loss")
plt.title(" Loss   ")
plt.legend(['train','validation'])
 
 
plt.show()

#### Ahora deberá mejorar el rendimiento de la red, para ello deberá experimentar con diferentes arquitecturas,  hiperparámetros, funciones de pérdida (loss) y optimizadores,

Cosas que se pueden probar:
    * Tamaño del filtro
    * Número de filtros
    * Tamaño del batch
    * Arquitectura de la red: 
          - probar hacer una red más profunda. 
          - probar alguna de las siguientes arquitecturas: 
          
            [conv-relu-pool]xN -> [affine]xM -> [softmax or SVM]
            [conv-relu-conv-relu-pool]xN -> [affine]xM -> [softmax or SVM]
            [batchnorm-relu-conv]xN -> [affine]xM -> [softmax or SVM]
   



In [None]:
# Completar
def define_model():

    


Entrene el modelo, definiendo los páramentros adecuados:
    

In [None]:
# Completar

Grafique el registro histórico de qué sucedió con la accuracy y loss durante el entrenamiento para ambos conjuntos.

In [None]:
# Completar