# Entrenamiento de CNN para Clasificaci√≥n de Enfermedades en Plantas

Este notebook implementa una red neuronal convolucional (CNN) para clasificar enfermedades en hojas de plantas usando el dataset PlantVillage.


In [None]:
# Importaciones necesarias
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
import numpy as np
from pathlib import Path
import matplotlib.pyplot as plt
import os


## 1. Definici√≥n de rutas y constantes


In [None]:
# Rutas y constantes
DATASET_PATH = Path('../dataset/raw/plant_diseases')
MODEL_PATH = Path('../models/modelo_hojas.h5')

# Par√°metros de la imagen (seg√∫n RF-02)
IMG_SIZE = (224, 224)  # target_size
COLOR_MODE = 'rgb'  # color_mode
BATCH_SIZE = 32
EPOCHS = 10  # Cantidad peque√±a para demostraci√≥n

# Divisi√≥n del dataset
TRAIN_SPLIT = 0.8  # 80% entrenamiento, 20% validaci√≥n

print(f"üìÅ Dataset: {DATASET_PATH}")
print(f"üíæ Modelo se guardar√° en: {MODEL_PATH}")
print(f"üñºÔ∏è  Tama√±o de imagen: {IMG_SIZE}")
print(f"üé® Modo de color: {COLOR_MODE}")


## 2. Generaci√≥n de Data Generators con ImageDataGenerator


In [None]:
# Verificar que el dataset existe
if not DATASET_PATH.exists():
    raise FileNotFoundError(f"El dataset no se encuentra en {DATASET_PATH}")

# Data Generator para entrenamiento con aumento de datos
train_datagen = ImageDataGenerator(
    rescale=1./255,  # Normalizaci√≥n (valores entre 0 y 1)
    rotation_range=20,  # Rotaci√≥n aleatoria hasta 20 grados
    width_shift_range=0.2,  # Desplazamiento horizontal
    height_shift_range=0.2,  # Desplazamiento vertical
    zoom_range=0.2,  # Zoom aleatorio
    horizontal_flip=True,  # Volteo horizontal
    validation_split=TRAIN_SPLIT  # Divisi√≥n entrenamiento/validaci√≥n
)

# Data Generator para validaci√≥n (solo normalizaci√≥n, sin aumento)
val_datagen = ImageDataGenerator(
    rescale=1./255,  # Normalizaci√≥n
    validation_split=TRAIN_SPLIT
)

print("‚úÖ Data Generators configurados")


In [None]:
# Generadores de datos para entrenamiento y validaci√≥n
train_generator = train_datagen.flow_from_directory(
    DATASET_PATH,
    target_size=IMG_SIZE,  # Redimensionar a 224x224
    color_mode=COLOR_MODE,  # RGB
    batch_size=BATCH_SIZE,
    class_mode='categorical',  # Para clasificaci√≥n multiclase
    subset='training',  # Subconjunto de entrenamiento
    shuffle=True
)

val_generator = val_datagen.flow_from_directory(
    DATASET_PATH,
    target_size=IMG_SIZE,
    color_mode=COLOR_MODE,
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    subset='validation',  # Subconjunto de validaci√≥n
    shuffle=False
)

# Obtener n√∫mero de clases
NUM_CLASSES = len(train_generator.class_indices)
CLASS_NAMES = list(train_generator.class_indices.keys())

print(f"‚úÖ Generadores creados")
print(f"üìä N√∫mero de clases: {NUM_CLASSES}")
print(f"üìà Im√°genes de entrenamiento: {train_generator.samples}")
print(f"üìâ Im√°genes de validaci√≥n: {val_generator.samples}")
print(f"\nüìã Primeras 10 clases: {CLASS_NAMES[:10]}")


## 3. Definici√≥n de la Arquitectura CNN


In [None]:
# Crear modelo Sequential
model = Sequential([
    # Primer bloque convolucional
    Conv2D(32, (3, 3), activation='relu', input_shape=(IMG_SIZE[0], IMG_SIZE[1], 3)),
    MaxPooling2D(2, 2),
    
    # Segundo bloque convolucional
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),
    
    # Tercer bloque convolucional (opcional, para mejorar rendimiento)
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),
    
    # Aplanar las caracter√≠sticas
    Flatten(),
    
    # Primera capa densa
    Dense(512, activation='relu'),
    Dropout(0.5),  # Regularizaci√≥n para evitar overfitting
    
    # Segunda capa densa
    Dense(256, activation='relu'),
    Dropout(0.5),
    
    # Capa de salida con Softmax para clasificaci√≥n multiclase
    Dense(NUM_CLASSES, activation='softmax')
])

print("‚úÖ Modelo CNN creado")


## 4. Visualizaci√≥n del Resumen del Modelo


In [None]:
model.summary()

# 5. Compilaci√≥n del Modelo


In [None]:
# Compilar el modelo
model.compile(
    optimizer=Adam(learning_rate=0.001),  # Optimizador adam
    loss='categorical_crossentropy',  # Funci√≥n de p√©rdida para clasificaci√≥n multiclase
    metrics=['accuracy']  # M√©trica de precisi√≥n
)

print("‚úÖ Modelo compilado")
print(f"   Optimizador: Adam")
print(f"   Funci√≥n de p√©rdida: categorical_crossentropy")
print(f"   M√©trica: accuracy")


## 6. Entrenamiento del Modelo


In [None]:
# Calcular steps por √©poca
steps_per_epoch = train_generator.samples // BATCH_SIZE
validation_steps = val_generator.samples // BATCH_SIZE

print(f"üîÑ Iniciando entrenamiento...")
print(f"   √âpocas: {EPOCHS}")
print(f"   Steps por √©poca: {steps_per_epoch}")
print(f"   Validation steps: {validation_steps}")

# Entrenar el modelo
history = model.fit(
    train_generator,
    steps_per_epoch=steps_per_epoch,
    epochs=EPOCHS,
    validation_data=val_generator,
    validation_steps=validation_steps,
    verbose=1
)

print("‚úÖ Entrenamiento completado")


## 7. Visualizaci√≥n de Resultados del Entrenamiento


In [None]:
# Graficar accuracy y loss
fig, axes = plt.subplots(1, 2, figsize=(12, 4))

# Accuracy
axes[0].plot(history.history['accuracy'], label='Train Accuracy')
axes[0].plot(history.history['val_accuracy'], label='Validation Accuracy')
axes[0].set_title('Model Accuracy')
axes[0].set_xlabel('Epoch')
axes[0].set_ylabel('Accuracy')
axes[0].legend()
axes[0].grid(True)

# Loss
axes[1].plot(history.history['loss'], label='Train Loss')
axes[1].plot(history.history['val_loss'], label='Validation Loss')
axes[1].set_title('Model Loss')
axes[1].set_xlabel('Epoch')
axes[1].set_ylabel('Loss')
axes[1].legend()
axes[1].grid(True)

plt.tight_layout()
plt.show()

# Mostrar m√©tricas finales
print(f"\nüìä M√©tricas finales:")
print(f"   Train Accuracy: {history.history['accuracy'][-1]:.4f}")
print(f"   Validation Accuracy: {history.history['val_accuracy'][-1]:.4f}")
print(f"   Train Loss: {history.history['loss'][-1]:.4f}")
print(f"   Validation Loss: {history.history['val_loss'][-1]:.4f}")


In [None]:
# Asegurar que el directorio models existe
MODEL_PATH.parent.mkdir(parents=True, exist_ok=True)

# Guardar el modelo
model.save(MODEL_PATH)

print(f"‚úÖ Modelo guardado en: {MODEL_PATH}")
print(f"üì¶ Tama√±o del archivo: {MODEL_PATH.stat().st_size / (1024*1024):.2f} MB")

# Guardar tambi√©n los nombres de las clases para uso futuro
import json
class_indices_path = MODEL_PATH.parent / 'class_indices.json'
with open(class_indices_path, 'w') as f:
    json.dump(train_generator.class_indices, f, indent=2)

print(f"‚úÖ √çndices de clases guardados en: {class_indices_path}")


## 9. Resumen y Pr√≥ximos Pasos


In [None]:
print("‚úÖ Entrenamiento completado exitosamente")
print("\nüìù Pr√≥ximos pasos:")
print("  1. El modelo est√° guardado en models/modelo_hojas.h5")
print("  2. Los √≠ndices de clases est√°n en models/class_indices.json")
print("  3. Integrar el modelo en el backend (app/utils.py y backend/main.py)")
print("  4. Probar el endpoint /predict desde el frontend")
print("\nüí° Nota: Si el accuracy es bajo, considera:")
print("  - Aumentar el n√∫mero de √©pocas")
print("  - Ajustar el learning rate")
print("  - Agregar m√°s capas convolucionales")
print("  - Usar transfer learning (ResNet, VGG, etc.)")
