In [1]:
# Instalamos las librerías necesarias
!pip install pymongo tensorflow opencv-python matplotlib seaborn

# Importamos las librerías
import os
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras import models, layers
import matplotlib.pyplot as plt
import cv2
from sklearn.metrics import confusion_matrix
import seaborn as sns
from pymongo import MongoClient
import io
from PIL import Image
from google.colab import drive

# Montamos Google Drive
drive.mount('/content/drive', force_remount=True)

# Conexión a MongoDB Atlas
MONGO_URI = "mongodb+srv://ncoronado1006:Nelly2025@cluster0.txkst.mongodb.net/AgriZen?retryWrites=true&w=majority&appName=Cluster0"  # Asegúrate de que la contraseña sea correcta
client = MongoClient(MONGO_URI)
db = client['AgriZen']

# Definimos constantes globales
IMAGE_SIZE = (256, 256)
BATCH_SIZE = 32

# Verificamos la conexión a MongoDB
print("Conexión exitosa:", db.list_collection_names())

Collecting pymongo
  Downloading pymongo-4.12.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (22 kB)
Collecting dnspython<3.0.0,>=1.16.0 (from pymongo)
  Downloading dnspython-2.7.0-py3-none-any.whl.metadata (5.8 kB)
Downloading pymongo-4.12.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.4 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.4/1.4 MB[0m [31m18.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading dnspython-2.7.0-py3-none-any.whl (313 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m313.6/313.6 kB[0m [31m17.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: dnspython, pymongo
Successfully installed dnspython-2.7.0 pymongo-4.12.0
Mounted at /content/drive
Conexión exitosa: ['Trozas', 'Datasets', 'Clases', 'Detecciones', 'Entrenamientos', 'Imágenes', 'Plagas', 'Configuraciones', 'Plantaciones', 'Validaciones', 'Modelos', 'Usuarios']


In [2]:
# Directorio con imágenes en Google Drive
img_dir = "/content/drive/MyDrive/DATASET/data"

# Verificamos que el directorio exista
if not os.path.exists(img_dir):
    raise FileNotFoundError(f"El directorio {img_dir} no existe. Asegúrate de que 'data' esté en DATASET.")

# Subir imágenes a MongoDB
for class_name in ['Blight', 'Common_Rust', 'Gray_Leaf_Spot', 'Healthy']:
    class_dir = os.path.join(img_dir, class_name)
    if not os.path.exists(class_dir):
        print(f"Advertencia: Directorio {class_dir} no encontrado. Saltando esta clase.")
        continue

    print(f"Procesando clase: {class_name}")
    for img_file in os.listdir(class_dir):
        img_path = os.path.join(class_dir, img_file)
        img = cv2.imread(img_path)
        if img is None:
            print(f"Error al cargar {img_path}")
            continue
        _, img_encoded = cv2.imencode('.jpg', img)
        img_bytes = img_encoded.tobytes()

        # Insertar imagen
        imagen_id = db['Imágenes'].insert_one({
            'ruta_imagen': img_bytes,
            'fecha_subida': '2025-04-08',
            'plantacion_id': 'plantacion_test',
            'estado': 'procesada'
        }).inserted_id

        # Insertar plaga relacionada
        # Guardamos el nombre sin guiones para que coincida con lo esperado después
        plaga_name = class_name.replace('_', ' ')
        plaga_id = db['Plagas'].insert_one({
            'nombre': plaga_name,
            'descripcion': f"Plaga tipo {plaga_name}",
            'nivel_daño': 'Moderado',
            'tratamiento_recomendado': 'Consultar experto'
        }).inserted_id

        # Insertar detección
        db['Detecciones'].insert_one({
            'imagen_id': imagen_id,
            'plaga_id': plaga_id,
            'confianza': 0.95,
            'fecha_deteccion': '2025-04-08',
            'estado': 'completado'
        })

print("Imágenes subidas a MongoDB con éxito.")

Procesando clase: Blight
Procesando clase: Common_Rust
Procesando clase: Gray_Leaf_Spot
Procesando clase: Healthy
Imágenes subidas a MongoDB con éxito.


In [5]:
# Función para cargar imágenes y etiquetas desde MongoDB
def load_data_from_mongo():
    images = []
    labels = []
    collection = db['Imágenes']

    for doc in collection.find():
        img_data = doc['ruta_imagen']
        img = Image.open(io.BytesIO(img_data))
        img = img.resize(IMAGE_SIZE)
        img_array = np.array(img)
        images.append(img_array)

        deteccion = db['Detecciones'].find_one({'imagen_id': doc['_id']})
        if deteccion:
            plaga = db['Plagas'].find_one({'_id': deteccion['plaga_id']})
            labels.append(plaga['nombre'])

    return np.array(images), np.array(labels)

# Cargar los datos
images, labels = load_data_from_mongo()
class_names = sorted(list(set(labels)))
label_to_index = {name: idx for idx, name in enumerate(class_names)}
labels = np.array([label_to_index[label] for label in labels])

# Crear dataset de TensorFlow
dataset = tf.data.Dataset.from_tensor_slices((images, labels))
dataset = dataset.shuffle(buffer_size=1000).batch(BATCH_SIZE).prefetch(tf.data.AUTOTUNE)

# Dividir en entrenamiento, validación y prueba
def split_dataset(ds, train_split=0.8, val_split=0.1, test_split=0.1):
    ds_size = len(list(ds))
    if ds_size == 0:
        raise ValueError("El dataset está vacío. Asegúrate de haber subido imágenes a MongoDB.")
    train_size = int(train_split * ds_size)
    val_size = int(val_split * ds_size)
    train_ds = ds.take(train_size)
    val_ds = ds.skip(train_size).take(val_size)
    test_ds = ds.skip(train_size + val_size)
    return train_ds, val_ds, test_ds

train_ds, val_ds, test_ds = split_dataset(dataset)

print(f"Clases detectadas: {class_names}")
print(f"Tamaño del dataset de entrenamiento: {len(list(train_ds))}")
print(f"Tamaño del dataset de validación: {len(list(val_ds))}")
print(f"Tamaño del dataset de prueba: {len(list(test_ds))}")

Clases detectadas: [np.str_('Blight'), np.str_('Common Rust'), np.str_('Gray Leaf Spot'), np.str_('Healthy')]
Tamaño del dataset de entrenamiento: 157
Tamaño del dataset de validación: 19
Tamaño del dataset de prueba: 21


In [None]:
# Preprocesamiento de imágenes
resize_and_rescale = tf.keras.Sequential([
    layers.Resizing(IMAGE_SIZE[0], IMAGE_SIZE[1]),
    layers.Rescaling(1.0/255)
])

# Definir el modelo
n_classes = len(class_names)
input_shape = (BATCH_SIZE, IMAGE_SIZE[0], IMAGE_SIZE[1], 3)
model = models.Sequential([
    resize_and_rescale,
    layers.Conv2D(32, (3,3), activation='relu', input_shape=input_shape[1:]),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(64, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(64, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(64, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(64, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(64, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(n_classes, activation='softmax')
])

# Compilar el modelo
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['accuracy']
)

# Callback para guardar el mejor modelo
callback = tf.keras.callbacks.ModelCheckpoint(
    filepath='/content/best_model.h5',
    monitor='val_loss',
    mode='min',
    save_best_only=True,
    verbose=1
)

# Entrenar el modelo
history = model.fit(
    train_ds,
    epochs=70,
    batch_size=BATCH_SIZE,
    verbose=1,
    validation_data=val_ds,
    callbacks=[callback]
)

# Guardar el modelo en MongoDB
with open('/content/best_model.h5', 'rb') as f:
    model_data = f.read()
    db['Modelos'].insert_one({
        'nombre': 'Modelo_Deteccion_Plagas',
        'version': '1.0',
        'ruta_modelo': model_data,
        'fecha_entrenamiento': '2025-04-08',
        'accuracy': float(history.history['accuracy'][-1])
    })

print("Modelo entrenado y guardado en MongoDB.")

Epoch 1/70


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4s/step - accuracy: 0.7473 - loss: 0.6376
Epoch 1: val_loss improved from inf to 0.11061, saving model to /content/best_model.h5




[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m687s[0m 4s/step - accuracy: 0.7478 - loss: 0.6365 - val_accuracy: 0.9720 - val_loss: 0.1106
Epoch 2/70
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4s/step - accuracy: 0.9454 - loss: 0.2286
Epoch 2: val_loss improved from 0.11061 to 0.04320, saving model to /content/best_model.h5




[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m733s[0m 4s/step - accuracy: 0.9454 - loss: 0.2284 - val_accuracy: 0.9901 - val_loss: 0.0432
Epoch 3/70
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4s/step - accuracy: 0.9697 - loss: 0.1364
Epoch 3: val_loss did not improve from 0.04320
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m667s[0m 4s/step - accuracy: 0.9697 - loss: 0.1363 - val_accuracy: 0.9424 - val_loss: 0.2233
Epoch 4/70
[1m 95/157[0m [32m━━━━━━━━━━━━[0m[37m━━━━━━━━[0m [1m4:11[0m 4s/step - accuracy: 0.9552 - loss: 0.1707

In [None]:
# Cargar el modelo
model = tf.keras.models.load_model('/content/best_model.h5')

# Evaluar en el dataset de prueba
scores = model.evaluate(test_ds)
print(f"Pérdida en prueba: {scores[0]}, Precisión en prueba: {scores[1]}")

# Función de predicción
def predict(model, img):
    img_array = tf.keras.preprocessing.image.img_to_array(img)
    img_array = tf.expand_dims(img_array, 0)
    predictions = model.predict(img_array)
    predicted_class = class_names[np.argmax(predictions[0])]
    confidence = round(100 * np.max(predictions[0]), 2)
    return predicted_class, confidence

# Visualizar predicciones
plt.figure(figsize=(15, 15))
for images, labels in test_ds.take(1):
    for i in range(min(12, len(images))):
        ax = plt.subplot(3, 4, i+1)
        plt.imshow(images[i].numpy().astype("uint8"))
        pred_class, confidence = predict(model, images[i].numpy())
        actual_class = class_names[labels[i]]
        plt.title(f"Real: {actual_class}\nPred: {pred_class}\nConf: {confidence}%")
        plt.axis("off")
plt.show()

# Matriz de confusión
actual = []
predicted = []
for images, labels in test_ds:
    for i in range(len(images)):
        pred_class, _ = predict(model, images[i].numpy())
        actual.append(class_names[labels[i]])
        predicted.append(pred_class)

cm = confusion_matrix(actual, predicted)
df_cm = pd.DataFrame(cm, index=class_names, columns=class_names)
plt.figure(figsize=(10, 7))
sns.heatmap(df_cm, annot=True, fmt="d", cmap="YlGnBu")
plt.ylabel("Predicho")
plt.xlabel("Real")
plt.title("Matriz de Confusión")
plt.show()