# Clonamos el repositorio para obtener los dataSet

In [None]:
!git clone https://github.com/joanby/machinelearning-az.git

# Damos acceso a nuestro Drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Test it

In [None]:
!ls '/content/drive/My Drive' 

# Google colab tools

In [None]:
from google.colab import files # Para manejar los archivos y, por ejemplo, exportar a su navegador
import glob # Para manejar los archivos y, por ejemplo, exportar a su navegador
from google.colab import drive # Montar tu Google drive

# Instalar dependendias

In [None]:
!pip install sklearn

# Instalar Theano

In [None]:
!pip install --upgrade --no-deps git+git://github.com/Theano/Theano.git

# Instalar Tensorflow y Keras


In [None]:
!pip install keras
!pip install tensorflow

# Redes Neuronales Convolucionales

# Cómo importar las librerías


In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

In [None]:
# En este caso, tanto las variables dependientes como las independientes no estan representadas por columnas de un csv. Las entradas de la ANN (VI) estarán representadas por los píxeles conseguidos luego de aplanar lo procesado por las capas de la CNN
# Tendremos imágenes en carpetas listas para ser usadas como train/test de perros y gatos, ya etiquetadas
# Si queremos reconocer objetos, sea el problema que sea, debemos agregar una carpeta con un número elevado de fotos de ese objeto, así con cada objeto que querramos reconocer
# Intentar que las fotos que se usen para entrenar el reconocimiento de cada objeto sean de la misma cantidad. Esto evitará que la CNN tienda a predecir sólo el objeto con más imágenes cargadas
# Nosotros tenemos 4000/1000 de perros y gatos para entrenar/testear, dandonos un total de 10000 imágenes

# Parte 1 - Construir el modelo de CNN

In [None]:
# De preprocesado como tal, no debemos hacer nada, ya que las librerias que luego vamos a usar nos permiten configurar la entrada de píxeles aplanados a la CNN
# Ver los pasos para construit CNN

# Importar las librerías y paquetes

In [2]:
from keras.models import Sequential # para crear/inicializar NN secuencial junto con los pesos aleatorios
from keras.layers import Conv2D # para convolución, que filtrará las imáganes creando mapas de características (3D para tratar con videos o imágenes volumétricas)
from keras.layers import MaxPooling2D # para pooling, que disminuye las dimensiones de los mapas de características y resume la información que contiene cada uno de ellos(3D para tratar con videos o imágenes volumétricas)
from keras.layers import Flatten # para aplanar las matrices y convertirlas en un vector que se utiliza como entrada de la ANN
from keras.layers import Dense # para añadir una capa de ANN tradicional

# Inicializar la CNN

In [3]:
classifier = Sequential()

# Paso 1 - Convolución

In [4]:
# Convolución: Aplicamos a la imagen filtros para obtener de ella mapas de caracteristicas (detectores de rasgos)
classifier.add(Conv2D(filters = 32,kernel_size = (3, 3), 
                      input_shape = (64, 64, 3), activation = "relu")) # Usamos Conv2D para añadir una capa de convolución
# filters: cantidad de mapas de características a obtener (detectores de rasgos/filtros a aplicar a la imagen) (podemos probar con 64, 128 o cualquier otra potencia de 2, pero primero asegurarnos de que nuestro PC aguanta y si podemos obtener buenos resultados), kernel_size: tamaño de los detectores de rasgos/filtros en píxeles (resta en n-1 píxeles del filtro la dimensión de la imagen, usamos 3x3 ya que las imágenes de entrada no son tan grandes), strides y padding: se usan para delimitar si los filtros se aplicaran sobre el pixel central o no (generalmente se deja, aplicando el filtro sobre el píxel central)
# input_shape: en este caso aclaramos los tamaños de píxeles de las imágenes de entrada (filas, columnas) y sus canales (1 si es blanco y negro, 3 si es a color). Intentar entrenar la CNN con imáganes pequeñas para no pasarse con coste computacional, y decidir si es importante o no mantener el color de la imágen para identificar objetos (ya que con escala de grises ahorramos más recursos), activation: función de activación a utilizar en la capa de convolución, generalmente usaremos ReLu para eliminar la linealidad en la identificación de rasgos, los cuales generalmente no son lineales
# Si las imágenes son mayores a lo que se busca en entrada podemos aplicar interpolación, lo que ajusta la imagen a las dimensiones requeridas sin perder la proporción. Alternativamente, también se puede aplicar recorte (cropping) para seleccionar una porción central o específica de la imagen. Si las imágenes son menores, podemos aplicar  interpolación (escalado hacia arriba), lo cual puede llevar a una pérdida de calidad o pixelación

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


# Paso 2 - Max Pooling

In [5]:
# Max Pooling: Resumimos la información extraida por los filtros (mapas de características) en imáganes de menores dimensiones según el promedio o valor máximo de píxeles por ventana (pool_size). 
classifier.add(MaxPooling2D(pool_size = (2,2))) # pool_size: tamaño de ventana que se le aplica, si lo hacemos de 2x2, balance entre pérdida de información y reducir costos computacionales (con 3x3 y 4x4 se reduce aún más el tamaño de la imagen (pérdida de información con imáganes pequeñas), sirviéndonos para procesar imágenes con mayor resolución), nos quedan los mapas de la mitad de filas y columnas que en el paso anterior (+1 para impares)
# strides: númnero de enteros que tiene que correr de un lado a otro, podemos usar para no superponer el análisis de los mismos píxeles, si no se especifica se ajusta al tamaño de ventana, saltenado el análisis de píxeles de manera que nunca se posicione 2 veces sobre el mismo píxel

# Una segunda capa de convolución y max pooling

In [None]:
classifier.add(Conv2D(filters = 32,kernel_size = (3, 3), activation = "relu"))

In [None]:
classifier.add(MaxPooling2D(pool_size = (2,2)))

# Paso 3 - Flattening

In [6]:
# Flattening: Transformo los mapas de características (matriz de píxeles) ya procesados por las operaciones de convolución y pooling en un gran vector único, para usarlo como entrada de la ANN (Capa Full-Conect). Aplicamos las operaciones de Convolución y Pooling para que la ANN no tenga miles de entradas para analizar, resumiendo/simplificando la información de la imagen en los mapas
classifier.add(Flatten()) # genera el vector de entrada de la red neuronal
# Si aplanaramos directamente la imágen (sin aplicar convolución y pooling) no tendríamos tampoco reconocido en el vector las características/rasgos distintivos de la imagen, por lo que el algoritmo no aprendería a reconocer rasgos comunes de objetos, sino que se limitaría a identificar un mismo rango de color de pixeles aplicable para reconocer un mismo tipo de objeto. Osea que con esas operaciones también extraería más información de la imagen.

# Paso 4 - Full Connection

In [7]:
# Utilizo una ANN para procesar los datos del vector aplanado
classifier.add(Dense(units = 128, activation = "relu")) # capa oculta con activación relu, para ver si una neurona se activa o no en consideración con la información que brinda para predecir (recomendación: promedio de número de nodos de entrada y de capa de salida (potencia de 2 si es muy grande), pensar que el vector posee muchos valores)
classifier.add(Dense(units = 1, activation = "sigmoid")) # capa de salida con activación sigmoid, para que nos brinde probabilidades de pertenencia a las clases (clasificaciónn binaria, por eso también un nodo o valor de salida; si fuera múltiple deberíamos aplicar Softmax y Entropía Cruzada y poner tantas neuronas como categorías tenga)

# Compilar la CNN

In [8]:
classifier.compile(optimizer = "adam", loss = "binary_crossentropy", metrics = ["accuracy"]) # arrancamos la CNN, e indicarle la función de costes y el proceso de propagación hacia atras
# optimizer: GD, GDE, adam; loss: Error Cuadrado Medio, etc, pero en problemas de clasificación solemos usar clasificadores relacionadas con la Reg Logística (entropía cruzada, en este caso binaria); metrics: métrica de precisión (podemos agregar todas las que querramos en los corchetes)

# Parte 2 - Ajustar la CNN a las imágenes para entrenar (perros y gatos)

In [10]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator # para importar/cargar/preprocesar imágenes cuando tratemos con CNN, evitando el sobreajuste sobre los datos de train (espera que ya separemos en carpetas las imagenes usadas para train y para test)
# Necesitaremos muchas imágenes para entrenar a la red y luego usaremos la técnica de limpieza 'aumento de imágen': iremos seleccionando aleatoriamente algunas de ellas para hacerle modificaciones/transformaciones, evitando caer en el sobreajuste de la red sobre los datos de entrenamiento
# El aplicado de esta técnica nos 'enriquece' o 'aumenta artificialmente' el tamaño del dataset, pasando de usar en el entrenamiento 8000 imágenes a casi 100000 de las mismas (que no se almacenan, sino que se generan cuando entrenamos al modelo)

In [None]:
# Preprocesado para las imágenes del conjunto de entrenamiento (reescalamos valores de píxeles y le aplicamos variaciones a las imágenes para que las reconozca con modificaciones incluidas)
train_datagen = ImageDataGenerator(
        rescale=1./255, # reescalado de los píxeles (pasamos de 0-255 a 0-1, normalizando y permitiendo a la ANN ser más eficaz)
        shear_range=0.2, # rango de modificación (imágenes serán distorsionadas aleatoriamente a lo largo de una dirección, desplazando parte del contenido de la imagen en esa dirección). Podemos aumentar los rangos para preparar el reconocimiento de la red ante cambios más bruscos en las entradas
        zoom_range=0.2, # rango de zoom (aplica un zoom aleatorio a las imágenes dentro del rango especificado. En este caso, el rango es 0.2, lo que significa que el zoom puede variar hasta un 20% del tamaño original de la imagen)
        horizontal_flip=True) # si permitimos flips horizontales

# Preprocesado para las imáganes del conjunto de entrenamiento (solo le aplicamos reescalado de píxeles)
test_datagen = ImageDataGenerator(rescale=1./255) # (pasamos de 0-255 a 0-1, normalizando y permitiendo a la ANN ser más eficaz)

In [None]:
# En nuestro problema particular, vamos a intentar entrenar una CNN para que sepa diferenciar entre imágenes de perros y gatos. Pero podemos reemplazar los set de imágenes por otras que querramos usar para entrenar/identificar objetos.
training_dataset = train_datagen.flow_from_directory('dataset/training_set', # set de train
                                                    target_size=(64, 64), # tamaño en el que cargo las imáganes (mantener igual que en CNN)
                                                    batch_size=32, # cantidad de imágenes que serán procesadas por la CNN antes de actualizar pesos 
                                                    class_mode='binary') # método de clasificación

In [None]:
testing_dataset = test_datagen.flow_from_directory('dataset/test_set', # set de test
                                                target_size=(64, 64), # tamaño en el que cargo las imágenes (mantener igual que en CNN)
                                                batch_size=32, # cantidad de imágenes que serán procesadas por la CNN antes de actualizar pesos
                                                class_mode='binary') # método de clasificación

# Elaborar una matriz de confusión

In [None]:
classifier.fit_generator(training_dataset,
                        steps_per_epoch=8000,
                        epochs=25,
                        validation_data=testing_dataset,
                        validation_steps=2000)