#Librerias

In [None]:
!pip install mlflow



In [None]:
# Cálculo numérico y manipulación de datos
import numpy as np
import pandas as pd

# Aprendizaje automático y deep learning
import tensorflow as tf
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
import matplotlib.pyplot as plt

# Procesamiento de imágenes
import cv2

# Manejo de archivos Excel
import openpyxl

# Sistema y gestión de archivos
import os
import sys

# MLOps - Tracking
import mlflow
import mlflow.tensorflow
from datetime import datetime

# Cloud Storage
from google.cloud import storage

#Libreria de la API
from openai import OpenAI

# Conectar con google drive

In [None]:
# conectar con Google Drive para acceder a archivos desde Colab
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
path="/content/drive/MyDrive/analitica 3/Aplicaciones_de_operaciones" ### ruta del repositorio en drive
os.chdir(path) ### volver la carpeta del repositorio directorio de trabajo
sys.path.append(path) ### agregarla al path, poder leer archivos de funciones propios como paquetes

In [None]:
import _funciones as fn #Llamar el archivo de funciones de este proyecto

#Despliegue

In [None]:
#Definición de rutas
path_imagenes="/content/drive/MyDrive/analitica 3/Aplicaciones_de_operaciones/Data/despliegue"
path_modelo="/content/drive/MyDrive/analitica 3/Aplicaciones_de_operaciones/Salidas/skin_cancer_model.h5"
path_resultados="/content/drive/MyDrive/analitica 3/Aplicaciones_de_operaciones/Salidas/Salida_despliegue"

In [None]:
## Definir umbrales personalizados para clasificación
umbral_inferior = 0.08
umbral_superior = 0.95

## Integración MLOPS y Modelos LLM

Haciendo uso de MLOPS, se permite mantener una trazabilidad de cada ejecución o actualización de los datos sin que se sobrescriban, conservando así un historial completo. Esto facilita un monitoreo adecuado del modelo seleccionado, permitiendo evaluar si su comportamiento es correcto o presenta fallos gracias al historial (documentos de excel) que se van guardando en la carpeta Salidas -> Salidas_despliegue.

Ademas, se usa la herramienta de LLM para generar recomendaciones según el paciente: si tiene cancer, no tiene cancer o aun no esta identificado

In [None]:
# Inicializar MLflow
mlflow.set_experiment("skin_cancer_deployment")
deployment_id = f"deploy_{datetime.now().strftime('%Y%m%d_%H%M%S')}"

with mlflow.start_run(run_name=deployment_id):

    # Log de parámetros
    mlflow.log_params({
        "umbral_inferior": umbral_inferior,
        "umbral_superior": umbral_superior,
        "deployment_id": deployment_id
    })

    # Cargar imágenes
    x, _, files = fn.load_images(path_imagenes)
    x = np.array(x).astype('float32') / 255.0

    # Log de métricas de datos
    mlflow.log_metrics({
        "total_images": len(files),
        "data_shape_height": x.shape[1],
        "data_shape_width": x.shape[2]
    })

    # Cargar modelo entrenado
    modelo = tf.keras.models.load_model(path_modelo)

    # Predicciones
    probabilidades = modelo.predict(x)

    # Clasificaciones basadas en umbrales
    clasificaciones = [
        'Cáncer' if prob > umbral_superior else
        'Normal' if prob < umbral_inferior else
        'No_identificado'
        for prob in probabilidades.flatten()
    ]

    # Log de métricas de predicción
    mlflow.log_metrics({
        "predictions_cancer": clasificaciones.count('Cáncer'),
        "predictions_normal": clasificaciones.count('Normal'),
        "predictions_uncertain": clasificaciones.count('No_identificado'),
        "avg_probability": float(np.mean(probabilidades))
    })

    # Inicializar cliente de OpenAI
    client = OpenAI(api_key="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")  #

    # Prompts por clase
    prompts = {
        "Normal": "¿Qué recomendaciones breves (máximo 2 frases de no mas de 12 palabras) se le pueden dar a una persona que no presenta signos de cáncer de piel para mantener su salud dermatológica?",
        "Cáncer": "Una persona ha sido clasificada con cáncer de piel según un análisis con red neuronal. ¿Qué pasos médicos iniciales debería seguir esta persona? Responde en menos de 23 palabras.",
        "No_identificado": "Una persona obtuvo una clasificación incierta en un examen para cáncer de piel. ¿Qué debe hacer para obtener atención médica adecuada y un diagnóstico preciso? Da una recomendación corta de no mas de 23 palabras para entregar al paciente."
    }

    # Generar recomendaciones
    recomendaciones = {}
    for clase, prompt in prompts.items():
        respuesta = client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": prompt}]
        )
        recomendaciones[clase] = respuesta.choices[0].message.content

    # Organizar resultados
    resultados = pd.DataFrame({
        "Nombre_archivo": files,
        "Clasificación_predicciones": clasificaciones,
        "Probabilidad": probabilidades.flatten(),
        "Deployment_ID": deployment_id
    })

    # Añadir recomendaciones
    resultados["Recomendaciones"] = resultados["Clasificación_predicciones"].apply(lambda c: recomendaciones[c])

    # Exportar a Excel
    excel_path = f"{path_resultados}/resultados_{deployment_id}.xlsx"
    resultados.to_excel(excel_path, index=False)

    # Log en MLflow
    mlflow.log_artifact(excel_path, "results")

    # Imprimir resumen
    print(f"\n=== DESPLIEGUE COMPLETADO ===")
    print(f"Deployment ID: {deployment_id}")
    print(f"Total imágenes: {len(files)}")
    print(f"Cáncer: {clasificaciones.count('Cáncer')}")
    print(f"Normal: {clasificaciones.count('Normal')}")
    print(f"Incierto: {clasificaciones.count('No_identificado')}")
    print(f"Resultados guardados: {excel_path}")
    print(f"MLflow Run: {mlflow.active_run().info.run_id}")

2025/06/03 22:44:15 INFO mlflow.tracking.fluent: Experiment with name 'skin_cancer_deployment' does not exist. Creating a new experiment.
100%|██████████| 400/400 [00:09<00:00, 44.41it/s] 


[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 395ms/step

=== DESPLIEGUE COMPLETADO ===
Deployment ID: deploy_20250603_224415
Total imágenes: 400
Cáncer: 56
Normal: 121
Incierto: 223
Resultados guardados: /content/drive/MyDrive/analitica 3/Aplicaciones_de_operaciones/Salidas/Salida_despliegue/resultados_deploy_20250603_224415.xlsx
MLflow Run: c5bab68518a5406c841c533688a6d273
