<a href="https://colab.research.google.com/github/yerkogallardo/perros_gatos_CNN/blob/main/Taller_perros_gatos_CNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Taller 2 de Redes Neuronales** 🧠💪🏼⚡

### **Parte práctica**

Esto es un Notebook de desarrollo, es una de las herramientas que los científicos de datos usamos de forma cotidiana para trabajar un modelo de Machine Learning o una Red Neuronal.  En este caso, es un notebook en la plataforma Google Colab, que nos permite sin necesidad de instalar nada en nuestro computador trabajar con Python y las librerias con las que vamos a realizar este taller.

### **Instrucciones:**

En este notebook encontrarás todo el código para montar una red neuronal capaz de clasificar entre 🐕‍🦺 y 🐈.

En cada celda de código tendrás una parte para que puedas rellenar código y algunas donde podrás cambiar a tu gusto.

Para que el entrenamiento de la red sea mucho más rápido te recomiendo activar la aceleración por GPU, esto lo podrás hacer en la opción de **Editar** - **Configuración de notebook** y ahí cambiar **Aceleracion de hardware** de None a GPU.

In [None]:
# Importanción de las librerias necesarias.

import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

import tensorflow as tf
import tensorflow_datasets as tfds
import keras
from keras.models import Sequential
from keras.layers import Dense, Conv2D , MaxPool2D , Flatten , Dropout 
from keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.optimizers import Adam
from keras.callbacks import EarlyStopping
from sklearn.metrics import classification_report,confusion_matrix
import cv2
from skimage import io
import os

In [None]:
# Agregamos la fuente de datos para descargar el dataset

setattr(tfds.image_classification.cats_vs_dogs, 
        '_URL',"https://download.microsoft.com/download/3/E/1/3E1C3F21-ECDB-4869-8368-6DEBA77B919F/kagglecatsanddogs_5340.zip")

In [None]:
# Descarga del set de datos con perros y gatos con su etiqueta

datos, metadatos = tfds.load('cats_vs_dogs', as_supervised=True, with_info=True)


In [None]:
tfds.show_examples(datos['train'], metadatos)  ## Mostramos ejemplos del set de datos con imagenes de perros y gatos junto con su etiqueta

In [None]:
## Creación del diccionario en el cual guardaremos las imagenes procesadas con su etiqueta para el entrenamiento.

datos_entrenamiento = []

In [None]:
## En esta parte realizamos el procesamiento de las imagenes las cuales deben ser modificadas 
## tanto en tamaño como sus colores para que la red las pueda procesar de mejor manera.

for i, (imagen, etiqueta) in enumerate(datos['train']):
  imagen = cv2.resize(imagen.numpy(), (100, 100))  # Cambio de tamaño
  imagen = cv2.cvtColor(imagen, cv2.COLOR_BGR2GRAY) # Modifiación de color
  imagen = imagen.reshape(100, 100, 1) # Guardamos la imagen con su tamaño y canal de color
  datos_entrenamiento.append([imagen, etiqueta])

In [None]:
len(datos_entrenamiento) # Cantidad de datos en total

23262

In [None]:
## Preparación de variables X (entradas) e y (etiquetas) separadas

X = [] #imagenes de entrada (pixeles)
y = [] #etiquetas (perro o gato)

for imagen, etiqueta in datos_entrenamiento:
  X.append(imagen)
  y.append(etiqueta)

In [None]:
X[0] # Veamos el primer elemento nuestro arreglo en el set de imagenes en pixeles

In [None]:
y[0] # Veamos el primer elemento nuestro arreglo en el set de etiquetas

In [None]:
# Normalizacón de los datos
X = np.array(X).astype(float) / 255
y = np.array(y)

In [None]:
X.shape

In [None]:
## Para generar el set de entrenamiento y validación debemos considerar del total de datos 80% para entrenamiento y 20% para el test.

round(len(X) * 0.80) # Tomamos el 80% de los datos que serían aproximadamente 18610 

In [None]:
len(X) - round(len(X) * 0.80) # El 20% restante

In [None]:
## Creación de los set de datos de entrenamiento y validación

X_entrenamiento = X[:]  # Reemplaza dentro del parentesis de corchete y después de los dos puntos el valor de 18610
X_validacion = X[:] # Reemplaza dentro del parentesis de corchete y antes de los dos puntos el valor de 18610

y_entrenamiento = y[:]  # Reemplaza dentro del parentesis de corchete y después de los dos puntos el valor de 18610
y_validacion = y[:]  # Reemplaza dentro del parentesis de corchete y antes de los dos puntos el valor de 18610

In [None]:
# Generación de transforamciones de imagenes para el aprendizaje convolucional de la red

datagen = ImageDataGenerator(
        featurewise_center = False,  # establecer la media de entrada en 0 sobre el conjunto de datos
        samplewise_center = False,  # establecer la media de cada muestra en 0
        featurewise_std_normalization = False,  # dividir inputs por std del dataset
        samplewise_std_normalization = False,  # dividir cada input por std
        zca_whitening = False,  # apply ZCA whitening
        rotation_range = 30,  # rotación aleatoria de imagenes según rangos de 0 a 180 grados
        zoom_range = 0.2, # zoom o acercamiento aleatorio de imagen 
        width_shift_range=0.1,  # cambio aleatorio de las imágenes horizontalmente
        height_shift_range=0.1,  # cambio aleatorio de las imágenes verticalmente
        horizontal_flip = True,  # giro aleatorio de imagen
        vertical_flip = False)  # giro aleatorio de imagen


datagen.fit(X_entrenamiento)

In [None]:
## Definición de capas en red neuronal

## Capa de entrada
model = Sequential()
model.add(Conv2D(32,3,padding="same", activation="relu", input_shape=(100,100,1)))
model.add(MaxPool2D())

## Capas convolucionales ocultas
## Capa convolucional de 32 filtros y kernel de 3
model.add(Conv2D(32, 3, padding="same", activation="relu"))
model.add(MaxPool2D())

## Agrega una capa convolucional de 64 filtros y un kernel de tamaño 3  


model.add(Dropout(0.4))

## Capa de salida
model.add(Flatten())
model.add(Dense(128,activation="relu"))
model.add(Dense(2, activation="softmax"))

model.summary()

In [None]:
opt = Adam(learning_rate=0.000001)

model.compile(optimizer = opt, 
              loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), 
              metrics = ['accuracy'])

In [None]:
## Realizamos el entrenamiento de la red neuronal, puedes cambiar las épocas en la variable epoca
## Pero te recordamos que mientras mas épocas entrenes más se va a demorar la red neuronal en generar el modelo

epocas =  ## escribe la cantidad de épocas que quieres entrenar
es = EarlyStopping(monitor='val_loss', mode='min', verbose=1, patience=10)

history = model.fit(X_entrenamiento,
                    y_entrenamiento,
                    epochs = epocas,
                    validation_data = (X_validacion, y_validacion), callbacks=[es])

In [None]:
## Revisamos utilizando gráficos el desempeño del modelo y su pérdida.

acc = history.history['accuracy']
val_acc = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs_range = range(epocas)

plt.figure(figsize=(15, 15))
plt.subplot(2, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(2, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

In [None]:
## Veamos como nos va con la red neuronal, para eso desplegamos las métricas del modelo.

predict_x=model.predict(X_validacion)
classes_x=np.argmax(predict_x,axis=1)
print(classification_report(y_validacion, classes_x, target_names = ['cats (Class 0)','dog (Class 1)']))

## Función para predicción

In [None]:
from google.colab.patches import cv2_imshow ## Agregamos esta librería para procesar imagenes de predicción.

In [None]:
## Creamos una función para realizar predicciones

def clasificador(imagen):
  # Obtiene la imagen y la transforma para mostrarla junto con su resultado.
  img_source = cv2.imread(imagen)
  img_source = cv2.resize(img_source,(224, 224))
  cv2_imshow(img_source)

  # Procesamiento de imagen para evaluar en el modelo.
  imagen = cv2.imread(imagen)
  imagen = cv2.resize(imagen, (100, 100))
  imagen = cv2.cvtColor(imagen, cv2.COLOR_BGR2GRAY)
  imagen = imagen.reshape(1, 100, 100, 1)

  # Realización de la predicción.
  pred_mod = modelo.predict(imagen) 

  # En esta parte realizamos el tratamiento del resultado del modelo.
  classes_x=np.argmax(pred_mod,axis=1)
  pred_val = (modelo.predict(imagen) > 0.5).astype("int32")
  
  if classes_x == 0:
    pred_class ='Gato 😺'
  else:
    pred_class ='Perro 🐶'

  # Entrega de resultados.
  print(pred_mod)
  print(pred_val)
  print(pred_class)

## Ahora vamos a hacer pruebas

In [None]:
## Importamos librerias para hacer las pruebas

from google.colab import files
from IPython. display import Image

In [None]:
uploaded = files.upload()
nombre_archivo = next(iter(uploaded))
clasificador(nombre_archivo)

In [None]:
uploaded = files.upload()
nombre_archivo = next(iter(uploaded))
clasificador(nombre_archivo)

In [None]:
uploaded = files.upload()
nombre_archivo = next(iter(uploaded))
clasificador(nombre_archivo)

In [None]:
uploaded = files.upload()
nombre_archivo = next(iter(uploaded))
clasificador(nombre_archivo)