## Redes neuronales convolucionales

In [None]:
## Importar librerías: Instalar tensorflow, por si acaso

import keras
from keras.models import Sequential
from keras.layers import Convolution2D
from keras.layers import MaxPooling2D
from keras.layers import Flatten
from keras.layers import Dense

### Contrucción del modelo para la CNN

In [14]:
## Inicializar la CNN (Crear la matriz inicial)
classifier = Sequential()

In [15]:
## Convolución

# 32: 32 matrices que sacará el proceso de convolución. 
# 3 y 3: dimensiones de la matriz del filtro. 
# Input shape: 64, 64, 3: resolución de filas por columnas por colores. (3 colores básicos en este caso)
# activation: función de activación (criterio/esquema).

classifier.add(Convolution2D(32, 3, 3, input_shape = (64, 64, 3), activation = "relu"))

In [16]:
## Max Pooling y Flattening

# 2, 2: dimensión de las porciones que se van a tomar de las matrices de convolución
# Flatten: transformar estas matrices en vectores
classifier.add(MaxPooling2D(pool_size = (2,2)))
classifier.add(Flatten())

In [17]:
# Full connection

# Crear las capas ocultas. 
# La primera capa se hace con Relu: 128 es una potencia de 2. 128 es la cantidad de neuronas de la primera capa oculta.
# el 128 se saca multiplicando la cantidad de matrices de entrada por el número de capas de salida.
# Peso inicial igualitario: 100% dividido para el número de entradas. 

# La segunda capa tiene la función sigmoide de activación. 

classifier.add(Dense(units = 128, activation = "relu"))
classifier.add(Dense(units = 1, activation = "sigmoid"))

In [18]:
# Compilación neuronal

# Adam: función de optimización para ajustar los pesos de la red.
# función de pérdida: entropía binaria. (Tiende a cero o uno)
# metrics: métrica utilizada para evaluar el rendimiento del modelo.

classifier.compile(optimizer = "adam",  # El optimizador Adam se usa para ajustar los pesos de la red de manera eficiente.
                   loss = "binary_crossentropy",  # La función de pérdida de entropía cruzada binaria se utiliza para problemas de clasificación binaria. Esta función mide la disimilitud entre las predicciones del modelo y las etiquetas reales, donde los resultados son 0 o 1.
                   metrics = ["accuracy"])  # La precisión es la métrica seleccionada para evaluar el rendimiento del modelo durante el entrenamiento y la evaluación. Indica el porcentaje de predicciones correctas.


#### Hasta aquí está armada la arquitectura de la CNN. Comenzamos con el entrenamiento en la segunda parte: 

In [19]:
# Importación de librerías e inicialización del batch size. 

from tensorflow.keras.preprocessing.image import ImageDataGenerator
batch_size = 32 ## 50% del input shape. 

In [20]:
# Creación de generadores de datos para el entrenamiento y la validación

# Generador de datos para el conjunto de entrenamiento
train_datagen = ImageDataGenerator(
    rescale=1./255,  # Escala los valores de los píxeles de 0-255 a 0-1. Esto es necesario para normalizar las imágenes, facilitando el entrenamiento del modelo.
    shear_range=0.2,  # Aplica transformaciones de corte (shear) a las imágenes. Esta transformación distorsiona las imágenes a lo largo del eje x o y, lo que ayuda a aumentar la diversidad del conjunto de datos.
    zoom_range=0.2,  # Aplica un rango de zoom aleatorio a las imágenes. Esto significa que algunas imágenes se acercarán y otras se alejarán, ayudando a la red a generalizar mejor.
    horizontal_flip=True  # Invierte horizontalmente las imágenes aleatoriamente. Esto aumenta la diversidad del conjunto de datos y ayuda a la red a aprender características independientes de la orientación horizontal.
)

# Generador de datos para el conjunto de prueba/validación
test_datagen = ImageDataGenerator(
    rescale=1./255  # Escala los valores de los píxeles de 0-255 a 0-1. A diferencia del conjunto de entrenamiento, aquí solo se aplica la normalización sin aumentación de datos, ya que queremos evaluar el rendimiento del modelo en datos que no se han visto afectados por transformaciones.
)

In [21]:
train_dataset = train_datagen.flow_from_directory(
    'dataset/training_set',  # Ruta del conjunto de entrenamiento
    target_size=(64, 64),  # Todas las imágenes serán redimensionadas a 64x64
    batch_size=batch_size,
    class_mode='binary'  # Ya que usamos clasificación binaria
)

Found 85 images belonging to 2 classes.


In [22]:
test_dataset = test_datagen.flow_from_directory(
    'dataset/test_set',  # Ruta del conjunto de prueba
    target_size=(64, 64),  # Todas las imágenes serán redimensionadas a 150x150
    batch_size=batch_size,
    class_mode='binary'
)

Found 79 images belonging to 2 classes.


In [27]:
# Entrenar el modelo

classifier.fit(
    train_dataset,
    steps_per_epoch=2,
    epochs=25,
    validation_data=test_dataset,
    validation_steps=20
)

Epoch 1/25
Epoch 2/25
Epoch 3/25
Epoch 4/25
Epoch 5/25
Epoch 6/25
Epoch 7/25
Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25
Epoch 18/25
Epoch 19/25
Epoch 20/25
Epoch 21/25
Epoch 22/25
Epoch 23/25
Epoch 24/25
Epoch 25/25


<keras.src.callbacks.History at 0x2911864bc50>