![imagenes](logo.png)

### Redes Neuronales de Convolución - CNN

In [None]:
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
plt.rcParams["figure.figsize"] = (7, 7)

### Convoluciones

La convolución es una operación entre matrices donde una matriz pequeña (*kernel o filtro*) se aplica de forma iterativa a los distintos trozos de una matriz más grande (una imagen).

En primer lugar vamos a ver de forma práctica el ejemplo de convolución visto en la teoría. Para ello creamos una imagen con dos troz verticales, uno blanco y otro negro.

In [None]:
img_size = 64 # 64x64 pixeles
img_borde_vertical = np.zeros((img_size,img_size))

img_borde_vertical[:, :int(img_size/2)] = 1

plt.imshow(img_borde_vertical, cmap="gray")
plt.title("Imagen original");

Ahora vamos a aplicarle un filtro de detección de bordes verticales (filtro Sobel vertical) y ver el output. Para ello usaremos la función de scipy `convolve2d` que realiza la convolución.

In [None]:
from scipy import signal

filtro_sobel_vertical = np.array([[1, 0, -1],
                                  [1, 0, -1],
                                  [1, 0,-1]])

output_convolucion = signal.convolve2d(img_borde_vertical, filtro_sobel_vertical, mode="valid")
plt.imshow(output_convolucion, cmap='gray')
plt.title("Output de la convolución con filtro vertical");

Vemos que efectivamente, ha detectado el borde de separación entre la zona blanca y la negra

Ahora vamos a cargar una imagen de prueba que tiene `scipy`

In [None]:
from scipy import misc
img_original = misc.ascent()

plt.imshow(img_original, cmap='gray')
plt.title("Imagen Original");

Vamos a aplicar el mismo filtro de detección de bordes verticales a la foto:

In [None]:
output_convolucion = signal.convolve2d(img_original, filtro_sobel_vertical)
plt.imshow(np.absolute(output_convolucion), cmap='gray')
plt.title("Output de la convolución con filtro vertical");

Podemos usar la misma técnica y cambiar el kernel para detectar bordes horizontales

In [None]:
filtro_sobel_horizontal = np.array([[-1,-1,-1],
                                    [0, 0, 0],
                                    [1, 1,1]])

output_convolucion = signal.convolve2d(img_original, filtro_sobel_horizontal)
plt.imshow(np.absolute(output_convolucion), cmap='gray')
plt.title("Output de la convolución con filtro horizontal");

### Redes Neuronales de Convolución - CNN

### Cargamos los datos

En este caso vamos a usar un dataset nuevo, el [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist), que es un dataset más moderno que el dataset de dígitos MNIST, que hoy en día se considera un dataset demasiado "facil", y que puede ser resuelto con modelos que no están relacionados con la vision artificial (como los SVMs).

En concreto el dataset Fashion MNIST consiste en 60,000 fotos (28x28 pixeles como el dataset de dígitos) de prendas de ropa y su objetivo es clasificar las imágenes respecto al tipo de ropa mostrado (10 tipos distintos de artículos)

![imagenes](im44.png)

In [None]:
from keras.datasets import fashion_mnist

(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

In [None]:
x_train.shape

In [None]:
x_train[0]

Hay 10 clases objetivo

In [None]:
y_train[:10]

podemos usar `np.bincount` para contar cuantas observaciones hay de cada clase de prenda

In [None]:
np.bincount(y_train)

Vemos que las clases están balanceadas

Convertimos la variable objetivo a vectores one hot

In [None]:
from keras.utils import to_categorical

y_train_one_hot = to_categorical(y_train)
y_test_one_hot = to_categorical(y_test)

In [None]:
y_train_one_hot[:10]

In [None]:
plt.rcParams["figure.figsize"] = (4, 4)

In [None]:
def dibujar_imagen(i):
    plt.imshow(x_train[i], cmap="gray")
    plt.title("Clase de prenda: {}".format(y_train[i]))
    
dibujar_imagen(0)

En primer lugar, vamos a usar una red Densa y la vamos a evaluar

In [None]:
from keras.models import Sequential
from keras.layers import Dense, Dropout

Aplanamos las imágenes

In [5]:
x_train_plano = x_train.reshape(x_train.shape[0],28*28)
x_test_plano = x_test.reshape(x_test.shape[0],28*28)

In [None]:
x_train_plano[0].shape

In [None]:
modelo_denso = Sequential()
modelo_denso.add(Dense(128, activation="relu", input_shape=(784,)))
modelo_denso.add(Dropout(0.2))
modelo_denso.add(Dense(256, activation="relu"))
modelo_denso.add(Dropout(0.2))
modelo_denso.add(Dense(128, activation="relu"))
modelo_denso.add(Dropout(0.2))
modelo_denso.add(Dense(np.unique(y_train).shape[0], activation="softmax"))

modelo_denso.compile(optimizer="adam", loss="categorical_crossentropy", 
               metrics=["accuracy"])

modelo_denso.summary()

In [None]:
modelo_denso.fit(x_train_plano, y_train_one_hot, epochs=50, batch_size=1000, verbose=1)

In [None]:
modelo_denso.evaluate(x_test_plano, y_test_one_hot)

Ahora vamos a usar una red de convolución (CNN)

In [None]:
img_rows, img_cols = 28, 28

x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
input_shape = (img_rows, img_cols, 1)

In [None]:
x_train[0].shape

In [None]:
x_train.shape

In [None]:
from keras.layers import Conv2D, Flatten, MaxPooling2D

batch_size = 256
num_classes = 10
epochs = 50

input_shape = (28, 28, 1)

modelo_cnn = Sequential()
modelo_cnn.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))
modelo_cnn.add(MaxPooling2D(pool_size=(2, 2)))
modelo_cnn.add(Dropout(0.25))
modelo_cnn.add(Flatten())
modelo_cnn.add(Dense(32, activation='relu'))
modelo_cnn.add(Dropout(0.5))
modelo_cnn.add(Dense(num_classes, activation='softmax'))
modelo_cnn.summary()

In [8]:
modelo_cnn.compile(loss="categorical_crossentropy",
              optimizer="adam",
              metrics=['accuracy'])


modelo_cnn.fit(x_train, y_train_one_hot, epochs=50, batch_size=1000, verbose=1);

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


In [None]:
modelo_cnn.evaluate(x_test, y_test_one_hot, verbose=0)

Generalmente se concatenan múltiples capas convolucionales en una red de convolución CNN

In [None]:
from keras.layers import BatchNormalization
from keras.callbacks import EarlyStopping

batch_size = 128
num_classes = 10
epochs = 100
filter_pixel=3
noise = 1
droprate=0.25

model = Sequential()
model.add(Conv2D(64, kernel_size=(filter_pixel, filter_pixel), padding="same",
                 activation='relu',
                 input_shape=input_shape)) 
model.add(BatchNormalization())
model.add(Dropout(droprate))


model.add(Conv2D(64, kernel_size=(filter_pixel, filter_pixel), activation='relu',padding="same"))#1
model.add(BatchNormalization())
model.add(MaxPooling2D())
model.add(Dropout(droprate))


model.add(Conv2D(64, kernel_size=(filter_pixel, filter_pixel), activation='relu',padding="same"))
model.add(BatchNormalization())
model.add(MaxPooling2D())
model.add(Dropout(droprate))


model.add(Flatten())
model.add(Dense(500,use_bias=False, activation="relu")) 
model.add(BatchNormalization())
model.add(Dropout(droprate))      

model.add(Dense(10, activation="softmax"))

model.summary()

In [11]:
callbacks = [
    EarlyStopping(
        monitor='val_accuracy', 
        patience=10,
        mode='max',
        verbose=1)
]


model.compile(loss="categorical_crossentropy",
              optimizer="adam",
              metrics=['accuracy'])

history = model.fit(x_train, y_train_one_hot,
          batch_size=batch_size,
          epochs=1,
          verbose=1,
          validation_data=(x_test, y_test_one_hot), 
          shuffle=True,callbacks=callbacks)

Train on 60000 samples, validate on 10000 samples
Epoch 1/1


In [None]:
model.evaluate(x_test, y_test_one_hot, verbose=1)