# Entrenador de Gatos y Perros
Alan Badillo Salas (badillo.soft@hotmail.com)

Este mini-proyecto tiene la intención de crear una red neuronal de tipo CNN, para aprender a determinar si una imagen corresponde a un gato o a un perro.

Para más información sobre las redes CNN visita: https://medium.freecodecamp.org/an-intuitive-guide-to-convolutional-neural-networks-260c2de0a050

Lo primero que debemos hacer es descargar el archivo zip que contiene 10,000 imágenes de gatos y perros en una resolución de 32x32 pixeles a color. Cada imagen tiene como nombre su identificador. El archivo de imágenes lo puede descargar de http://badillosoft.com/train_cat_dog.zip.

Una vez descargado el archivo debemos descomprimirlo y todas las imágenes se encontrarán la carpeta `train_cat_dog`.

## Importaciones

In [20]:
from keras.models import Sequential
from keras.preprocessing.image import ImageDataGenerator
from keras.layers import Conv2D, MaxPooling2D, Flatten, Activation, Dense, Dropout, BatchNormalization
from keras import optimizers, regularizers
import numpy as np
import pandas as pd

print("Se han importado las librerías necesarias para el análisis")

Se han importado las librerías necesarias para el análisis


Primero hay que cargar el `DataFrame` con los id's de las imágenes y sus etiquetas para utilizarlos en el proceso de aprendizaje.

In [21]:
train_cat_dog = pd.read_csv("http://badillosoft.com/train_cat_dog.csv")

print(train_cat_dog.info())
print(train_cat_dog.head())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 3 columns):
Unnamed: 0    10000 non-null int64
id            10000 non-null int64
label         10000 non-null object
dtypes: int64(2), object(1)
memory usage: 234.4+ KB
None
   Unnamed: 0  id label
0           9  10   cat
1          17  18   cat
2          21  22   cat
3          26  27   cat
4          27  28   dog


Definimos un generador de datos para que tome el `DataFrame` de pandas que contiene los id's de las imágenes y sus etiquetas (`train_cat_dog`). Observa que el generador de datos define que el 20% de ellos serán utilizados para la validación.

In [22]:
datagen = ImageDataGenerator(rescale=1./255., validation_split=0.2)

print(datagen)

<keras.preprocessing.image.ImageDataGenerator object at 0x129187a50>


Creamos el generador de entrenamiento, esto se refiere a un generador que va a cargar las imágenes desde nuestra carpeta basado en el `DataFrame` (`train_cat_dog`) para proveer el `x_train` y el `y_train`.

In [23]:
train_generator = datagen.flow_from_dataframe(
    dataframe=train_cat_dog,           # Dataframe de pandas con los id's de las imágnes y las etiquetas
    directory="./train_cat_dog",       # La ruta a la carpeta que contiene las imágenes de entrenamiento
    x_col="id",                        # La columna del dataframe para formar x_train, y_train
    y_col="label",                     # La columna del dataframe para formar x_test, y_test
    has_ext=False,                     # Indica si la columna x ya tiene la extensión de la imagen
    subset="training",                 # Indica el tipo de generador (training o validation)
    batch_size=32,                     # Indica el tamaño del bloque para las épocas
    seed=42,                           # Indica la semilla aleatoria
    shuffle=True,                      # Indica si las imágenes se cargarán aleatoriamente
    class_mode="categorical",          # Indica el tipo de aprendizaje (en este caso categoríco)
    target_size=(32, 32)               # Indica la resolución de las imágenes
)

Found 8000 images belonging to 2 classes.


De forma similar vamos a crear un generador de imágenes para las validaciones, esto creará los `x_test` y los `y_test`.

In [24]:
test_generator = datagen.flow_from_dataframe(
    dataframe=train_cat_dog,           # Dataframe de pandas con los id's de las imágnes y las etiquetas
    directory="./train_cat_dog",       # La ruta a la carpeta que contiene las imágenes de entrenamiento
    x_col="id",                        # La columna del dataframe para formar x_train, y_train
    y_col="label",                     # La columna del dataframe para formar x_test, y_test
    has_ext=False,                     # Indica si la columna x ya tiene la extensión de la imagen
    subset="validation",               # Indica el tipo de generador (training o validation)
    batch_size=32,                     # Indica el tamaño del bloque para las épocas
    seed=42,                           # Indica la semilla aleatoria
    shuffle=True,                      # Indica si las imágenes se cargarán aleatoriamente
    class_mode="categorical",          # Indica el tipo de aprendizaje (en este caso categoríco)
    target_size=(32, 32)               # Indica la resolución de las imágenes
)

Found 2000 images belonging to 2 classes.


Con los generadores anteriores, ya podemos alimentar nuestra red CNN. Por lo que, primero debemos crear la CNN como sigue.

In [29]:
model = Sequential()

# Capas Convolutivas (El filtro/kernel)
model.add(Conv2D(32, (3, 3), padding="same", input_shape=(32, 32, 3)))
model.add(Activation("relu"))

#model.add(Conv2D(32, (3, 3)))
#model.add(Activation("relu"))

# Capas Pooling (El reductor)
model.add(MaxPooling2D(pool_size=(2, 2)))

# Capa Dropout (La pérdida)
#model.add(Dropout(0.25))

#model.add(Conv2D(64, (3, 3), padding='same'))
#model.add(Activation('relu'))

#model.add(Conv2D(64, (3, 3)))
#model.add(Activation('relu'))

#model.add(MaxPooling2D(pool_size=(2, 2)))

#model.add(Dropout(0.25))

# Capa Flatten (El aplanador)
model.add(Flatten())

# Capas de Clasificación (El aprendizaje)
model.add(Dense(2, activation="softmax"))

model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

print(model.summary())

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_8 (Conv2D)            (None, 32, 32, 32)        896       
_________________________________________________________________
activation_8 (Activation)    (None, 32, 32, 32)        0         
_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 16, 16, 32)        0         
_________________________________________________________________
flatten_4 (Flatten)          (None, 8192)              0         
_________________________________________________________________
dense_4 (Dense)              (None, 2)                 16386     
Total params: 17,282
Trainable params: 17,282
Non-trainable params: 0
_________________________________________________________________
None


Ya que tenemos el modelo, podemos entrenarlo con los generadores `train_generator` y `test_generator`.

In [30]:
# Calculamos los tamaños de salto para los kernels
STEP_TRAIN = train_generator.n // train_generator.batch_size
STEP_TEST = test_generator.n // test_generator.batch_size

model.fit_generator(
    generator=train_generator,      # Indica quién genera las imágenes de entranamiento
    steps_per_epoch=STEP_TRAIN,     # Indica cuántos pasos se realizarán por época
    validation_data=test_generator, # Indica el generador de imágenes para la validación
    validation_steps=STEP_TEST,     # Indica cuántos pasos se realizarán para la validación
    epochs=10                       # Indica las épocas de entrenamiento
)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x119758190>

Ahora la red CNN ya está entrenada, por lo que medimos su desempeño con las imágenes de validación (`test_generator`)

In [32]:
metrics = model.evaluate_generator(generator=test_generator, steps=STEP_TEST)

print(metrics)

[0.5733478805883144, 0.7149390243902439]
