<a href="https://colab.research.google.com/github/valeromora/TAM_2025-1/blob/main/Parcial2/Dashboard_Parcial2_TAM_2025_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Dashboard Interactivo - Parcial 2 TAM 2025-1

Este dashboard tiene como objetivo ilustrar de forma **interactiva y visual** los principales conceptos y resultados obtenidos en el desarrollo del taller de Teor√≠a de Aprendizaje de M√°quina (TAM), espec√≠ficamente sobre:

- **Reducci√≥n de dimensionalidad** con PCA y UMAP.
- **Modelos de clasificaci√≥n supervisada** aplicados al conjunto de datos **USPS**, incluyendo m√©todos cl√°sicos, probabil√≠sticos y de aprendizaje profundo.
- **Comparaci√≥n de desempe√±o** entre modelos utilizando m√©tricas, visualizaciones y reportes.

## Contenido del Dashboard

1. **Visualizaci√≥n del espacio latente**:
   - Proyecciones de los datos USPS en 2D usando PCA y UMAP.
   - Im√°genes originales superpuestas para an√°lisis visual.
   - Exploraci√≥n del efecto del n√∫mero de vecinos en UMAP.

2. **Clasificadores evaluados**:
   - Modelos tradicionales: SVC, SGD, KNN, Random Forest, entre otros.
   - Modelos probabil√≠sticos: Gaussian Naive Bayes, Gaussian Process Classifier.
   - Modelos de Deep Learning (CNN).
   
3. **M√©tricas de desempe√±o**:
   - Accuracy, precisi√≥n, sensibilidad, F1-score.
   - Curvas ROC por modelo.
   - Matrices de confusi√≥n interactivas.

4. **Comparaci√≥n interactiva**:
   - Selecci√≥n din√°mica de modelos para comparaci√≥n.
   - Visualizaci√≥n paralela de resultados.
   - Interpretaci√≥n basada en desempe√±o y complejidad del modelo.

Este dashboard busca no solo presentar los resultados, sino tambi√©n fomentar la **interpretaci√≥n cr√≠tica de los modelos** y la exploraci√≥n visual de su comportamiento en espacios reducidos de representaci√≥n.

---


###Instalciones de librerias y Creaci√≥n de las p√°ginas

In [None]:
# ==============================================================================
# CELDA 1: CONFIGURACI√ìN AUTOM√ÅTICA DEL ENTORNO
# ==============================================================================
# Cualquiera que ejecute esta celda tendr√° el entorno listo.

# 1. Instalamos las librer√≠as necesarias en modo silencioso (-q)
print("‚öôÔ∏è Instalando librer√≠as...")

#Para construir el dashboard interactivo
!pip install streamlit -q

#Para reducci√≥n de dimensionalidad no lineal
!pip install umap-learn -q

#Para visualizaciones m√°s interactivas y limpias que matplotlib
!pip install plot -q

# 2. Creamos la estructura de carpetas necesaria.
!mkdir -p pages
print("üìÅ Estructura de carpetas creada.")

# 3. Descargamos el archivo de datos directamente al lugar correcto.
# Usamos el enlace que verificado.
DATA_URL = "https://github.com/Leandro2402-bit/TAM/raw/refs/heads/main/usps.h5"

print(f"üåç Descargando archivo de datos desde GitHub...")
# Usamos wget para descargar el archivo y guardarlo en la carpeta 'pages'
!wget -q -O pages/usps.h5 {DATA_URL}

# Verificaci√≥n final
import os
if os.path.exists('pages/usps.h5'):
    print("‚úÖ ¬°√âxito! Entorno listo. El archivo usps.h5 ha sido descargado en la carpeta 'pages'.")
else:
    print("‚ùå Error: La descarga del archivo fall√≥. Verifica la URL.")

###Presentaci√≥n del Dashboard

In [None]:
# Guarda este c√≥digo como un archivo Python llamado "0_Home.py"
%%writefile 0_Home.py

# üìå Importa Streamlit
import streamlit as st

# ‚öôÔ∏è Configura la p√°gina del dashboard:
# - T√≠tulo en la pesta√±a del navegador
# - Dise√±o en ancho completo
st.set_page_config(page_title="Parcial 2 - TAM 2025-1", layout="wide")

# üìù Agrega un bloque de texto con Markdown (para dar formato visual al contenido)
st.markdown("""
# üéì Parcial 2 - Teor√≠a de Aprendizaje de M√°quina 2025-1
### üë®‚Äçüè´ Profesor: Andr√©s Marino √Ålvarez Meza, Ph.D.
#### üèõ Universidad Nacional de Colombia - Sede Manizales

---

Bienvenido al dashboard interactivo desarrollado como parte del **Parcial 2 del curso de TAM**.
Este entorno ha sido dise√±ado para presentar de forma clara e intuitiva los principales resultados y conceptos trabajados por el grupo.

---

## üß≠ Navegaci√≥n del Dashboard

Este proyecto est√° dividido en **3 m√≥dulos** principales:

### üìÑ P√°gina 1: Introducci√≥n Te√≥rica
Presenta los fundamentos, f√≥rmulas matem√°ticas y aplicaciones de los modelos usados:
PCA, UMAP, GaussianNB, SGDClassifier, Logistic Regression, LDA, KNN, SVC, RandomForest, GPC, Deep Learning.

---

### üåÄ P√°gina 2: Reducci√≥n de Dimensionalidad
Visualizaci√≥n del dataset **USPS** proyectado con **PCA** y **UMAP**, incluyendo ejemplos visuales e interpretaci√≥n de la estructura latente.

---

### üìä P√°gina 3: Clasificaci√≥n
Comparaci√≥n de modelos supervisados aplicados al dataset USPS. Se presentan m√©tricas, curvas ROC y matrices de confusi√≥n.

---


üìå Usa el men√∫ de la izquierda para navegar entre los m√≥dulos.
""")


###P√°gina para el Modulo 1: Introducci√≥n Te√≥rica (Punto a)

In [None]:
# Guarda este c√≥digo como un archivo Python llamado "1_Modelos.py"
%%writefile pages/1_Modelos.py

import streamlit as st

# üõ† Configura la p√°gina
st.set_page_config(page_title="Modelos de Aprendizaje", layout="wide")

# üéØ T√≠tulo de la p√°gina
st.title("üìÑ Introducci√≥n te√≥rica a los modelos de aprendizaje")

st.markdown("""
Selecciona un modelo del men√∫ desplegable para ver su descripci√≥n, formulaci√≥n matem√°tica y aplicaciones.
""")

# üîΩ Lista de modelos
modelos = [
    "PCA",
    "UMAP",
    "GaussianNB",
    "SGDClassifier",
    "LogisticRegression",
    "LinearDiscriminantAnalysis",
    "KNeighborsClassifier",
    "SVC",
    "RandomForestClassifier",
    "GaussianProcessClassifier",
    "Deep Learning (CNN)"
]

# ‚¨áÔ∏è Selector de modelo
modelo = st.selectbox("üîé Selecciona un modelo para explorar:", modelos)

# üìò Informaci√≥n de cada modelo
if modelo == "PCA":
    st.subheader("üìä PCA - An√°lisis de Componentes Principales")
    st.latex(r'''
    \text{Maximiza la varianza:} \quad \max_{\mathbf{w}} \ \mathbf{w}^\top S \mathbf{w}
    ''')
    st.markdown("""
    - **Objetivo**: Reducir la dimensionalidad de los datos conservando la mayor varianza posible.
    - **Aplicaciones**: Compresi√≥n de datos, visualizaci√≥n, preprocesamiento antes de clasificaci√≥n.
    """)

elif modelo == "UMAP":
    st.subheader("üåÄ UMAP - Uniform Manifold Approximation and Projection")
    st.latex(r'''
    \text{Minimiza:} \quad C = \sum_{(i,j)} w_{ij} \log \frac{w_{ij}}{v_{ij}}
    ''')
    st.markdown("""
    - **Objetivo**: Aproximar la estructura topol√≥gica de un espacio de alta dimensi√≥n en un espacio de baja dimensi√≥n.
    - **Fundamento**: Combina teor√≠a de grafos (simplicial complexes) con medidas de proximidad probabil√≠sticas.
    - **Aplicaciones**: Visualizaci√≥n de embeddings, reducci√≥n de dimensionalidad no lineal, exploraci√≥n de datos complejos.
    """)

elif modelo == "GaussianNB":
    st.subheader("üìà Gaussian Naive Bayes")
    st.latex(r'''
    P(y|x) \propto P(y) \prod_{i=1}^{n} P(x_i | y), \quad P(x_i|y) = \mathcal{N}(\mu_{iy}, \sigma_{iy}^2)
    ''')
    st.markdown("""
    - **Supuesto clave**: Independencia entre caracter√≠sticas dado la clase.
    - **Aplicaciones**: Texto, clasificaci√≥n r√°pida de datos continuos.
    """)

elif modelo == "SGDClassifier":
    st.subheader("‚öôÔ∏è SGDClassifier - Descenso de Gradiente Estoc√°stico")
    st.latex(r'''
    \min_{\mathbf{w}} \ \frac{1}{n} \sum_{i=1}^{n} \mathcal{L}(y_i, \mathbf{w}^\top x_i) + \lambda R(\mathbf{w})
    ''')
    st.markdown("""
    - **Usa**: funciones de p√©rdida como hinge (SVM) o log-loss (regresi√≥n log√≠stica).
    - **Aplicaciones**: Grandes vol√∫menes de datos en l√≠nea (streaming), NLP.
    """)

elif modelo == "LogisticRegression":
    st.subheader("üìâ Regresi√≥n Log√≠stica")
    st.latex(r'''
    P(y=1|x) = \frac{1}{1 + e^{-\mathbf{w}^\top x}}, \quad
    \min_{\mathbf{w}} \ -\sum y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i)
    ''')
    st.markdown("""
    - **Modelo lineal probabil√≠stico** para clasificaci√≥n binaria o multiclase.
    - **Aplicaciones**: Medicina, predicci√≥n de riesgo, an√°lisis de comportamiento.
    """)

elif modelo == "LinearDiscriminantAnalysis":
    st.subheader("üìê LDA - An√°lisis Discriminante Lineal")
    st.latex(r'''
    \text{Maximiza:} \quad J(w) = \frac{w^\top S_B w}{w^\top S_W w}
    ''')
    st.markdown("""
    - **Objetivo**: Proyectar los datos para maximizar la separaci√≥n entre clases.
    - **Aplicaciones**: Reducci√≥n supervisada de dimensionalidad, clasificaci√≥n.
    """)

elif modelo == "KNeighborsClassifier":
    st.subheader("üë• K-Nearest Neighbors (KNN)")
    st.latex(r'''
    \hat{y}(x) = \text{modo}\left( \{ y_i : x_i \in \mathcal{N}_k(x) \} \right)
    ''')
    st.markdown("""
    - **Clasifica** una muestra seg√∫n la mayor√≠a de sus \( k \) vecinos m√°s cercanos.
    - **No requiere entrenamiento expl√≠cito**, solo distancia y memoria.
    - **Aplicaciones**: Reconocimiento de escritura, sistemas de recomendaci√≥n, biometr√≠a.
    """)

elif modelo == "SVC":
    st.subheader("‚úÇÔ∏è SVC - Support Vector Classifier")
    st.latex(r'''
    \min_{\mathbf{w}, b} \ \frac{1}{2} \|\mathbf{w}\|^2 + C \sum \xi_i \quad
    \text{s.a.} \ y_i(\mathbf{w}^\top x_i + b) \geq 1 - \xi_i
    ''')
    st.markdown("""
    - **Encuentra** el hiperplano que maximiza el margen entre clases.
    - **Aplicaciones**: Visi√≥n por computador, reconocimiento de texto, bioinform√°tica.
    """)

elif modelo == "RandomForestClassifier":
    st.subheader("üå≥ Random Forest Classifier")
    st.latex(r'''
    G = 1 - \sum_{k=1}^{K} p_k^2 \quad \text{(√çndice Gini por nodo)}
    ''')
    st.markdown("""
    - **Ensamble** de √°rboles de decisi√≥n entrenados sobre subconjuntos aleatorios del dataset (bagging).
    - Cada √°rbol minimiza la **impureza** (como el √≠ndice Gini o la entrop√≠a).
    - **Aplicaciones**: Clasificaci√≥n robusta en datos ruidosos, biometr√≠a, bioinform√°tica.
    """)

elif modelo == "GaussianProcessClassifier":
    st.subheader("üåê Gaussian Process Classifier")
    st.latex(r'''
    f(x) \sim \mathcal{GP}(0, k(x, x')) \quad \Rightarrow \quad P(y=1|x) = \sigma(f(x))
    ''')
    st.markdown("""
    - **Modelo bayesiano no param√©trico** que define una distribuci√≥n sobre funciones.
    - **Aplicaciones**: Clasificaci√≥n con incertidumbre, problemas con pocos datos.
    """)

elif modelo == "Deep Learning (CNN)":
    st.subheader("üß† Deep Learning - Redes Convolucionales (CNN)")
    st.latex(r'''
    \min_{\theta} \ \mathcal{L}(y, \hat{y}) = - \sum y_i \log(\hat{y}_i)
    ''')
    st.markdown("""
    - **Aprende filtros convolucionales** para extraer patrones espaciales en im√°genes.
    - **Aplicaciones**: Visi√≥n por computador, reconocimiento facial, veh√≠culos aut√≥nomos.
    """)

###P√°gina 2: Reducci√≥n de Dimensionalidad (Punto b)

In [None]:
# Guarda este c√≥digo como un archivo Python llamado "pages/2_Reduccion_Dimensionalidad.py"
%%writefile pages/2_Reduccion_Dimensionalidad.py

# üìå Importaciones necesarias
import streamlit as st
import h5py
import numpy as np
import pandas as pd
import plotly.express as px
from pathlib import Path
from sklearn.decomposition import PCA
import umap

# ‚öôÔ∏è Configuraci√≥n de la p√°gina
st.set_page_config(page_title="Reducci√≥n de Dimensionalidad", layout="wide")

# üìù T√≠tulo y descripci√≥n
st.markdown("""
# üåÄ Reducci√≥n de Dimensionalidad - Dataset USPS
### An√°lisis comparativo entre PCA y UMAP

Esta p√°gina presenta la proyecci√≥n del dataset USPS en espacios de menor dimensi√≥n usando **PCA** y **UMAP**,
incluyendo visualizaciones interactivas y an√°lisis del impacto de hiperpar√°metros.
""")

# üîÑ Funci√≥n para cargar datos (con cache para optimizar)
@st.cache_data
def load_usps_data():
    """Carga el dataset USPS desde un archivo h5 de forma segura."""
    try:
        script_dir = Path(__file__).parent
        path = script_dir / 'usps.h5'
        with h5py.File(path, 'r') as hf:
            train = hf.get('train')
            X_tr, y_tr = train.get('data')[:], train.get('target')[:]
            test = hf.get('test')
            X_te, y_te = test.get('data')[:], test.get('target')[:]
        X = np.concatenate((X_tr, X_te), axis=0)
        y = np.concatenate((y_tr, y_te), axis=0)
        return X, y
    except Exception as e:
        st.error(f"‚ùå Ocurri√≥ un error al cargar los datos: {e}")
        return None, None

# üîÑ Funciones de Proyecci√≥n (con cache para optimizar)
@st.cache_data
def apply_pca(_X):
    pca = PCA(n_components=2)
    X_pca = pca.fit_transform(_X)
    return X_pca, pca.explained_variance_ratio_

@st.cache_data
def apply_umap(_X, n_neighbors, min_dist):
    umap_reducer = umap.UMAP(n_neighbors=n_neighbors, min_dist=min_dist, random_state=42)
    X_umap = umap_reducer.fit_transform(_X)
    return X_umap

# üìä Funci√≥n para crear visualizaci√≥n interactiva
def create_interactive_plot(X_2d, y, title, method):
    """Crea gr√°fico interactivo con Plotly"""
    df = pd.DataFrame(X_2d, columns=['Componente 1', 'Componente 2'])
    df['D√≠gito'] = y.astype(str)

    fig = px.scatter(
        df, x='Componente 1', y='Componente 2', color='D√≠gito',
        title=title,
        labels={'Componente 1': f'{method} Comp. 1', 'Componente 2': f'{method} Comp. 2'}
    )
    st.plotly_chart(fig, use_container_width=True)

# üéØ Funci√≥n principal
def main():
    X, y = load_usps_data()
    if X is None:
        st.stop()

    st.markdown("---")

    # --- Pesta√±as para una navegaci√≥n m√°s limpia ---
    tab1, tab2 = st.tabs(["üî¥ An√°lisis PCA", "üîµ An√°lisis UMAP"])

    with tab1:
        st.header("An√°lisis de Componentes Principales (PCA)")

        with st.spinner('Calculando proyecci√≥n PCA... (esto solo ocurre la primera vez)'):
            X_pca, explained_variance = apply_pca(X)

        col1, col2 = st.columns([3, 1])
        with col1:
            st.write("Visualizaci√≥n de la proyecci√≥n con PCA:")
            create_interactive_plot(X_pca, y, "Proyecci√≥n del Dataset USPS con PCA", "PCA")
        with col2:
            st.markdown("#### üìä Varianza Explicada")
            # ==> CORREGIDO: Se convierte el valor a un float est√°ndar de Python
            total_variance = float(sum(explained_variance))
            st.write(f"**Total:** {total_variance:.2%}")
            st.progress(total_variance)
            st.info(f"Los dos primeros componentes principales capturan el {total_variance:.2%} de la varianza total de los datos.")

    with tab2:
        st.header("Uniform Manifold Approximation and Projection (UMAP)")
        st.write("Explora c√≥mo los hiperpar√°metros de UMAP afectan la estructura latente.")

        subcol1, subcol2 = st.columns(2)
        n_neighbors = subcol1.select_slider("N√∫mero de vecinos (n_neighbors)", options=[5, 15, 30, 50, 100], value=15)
        min_dist = subcol2.select_slider("Distancia m√≠nima (min_dist)", options=[0.0, 0.1, 0.25, 0.5], value=0.1)

        with st.spinner('Calculando proyecci√≥n UMAP... (esto puede tardar un momento)'):
            X_umap = apply_umap(X, n_neighbors=n_neighbors, min_dist=min_dist)

        st.write("Visualizaci√≥n de la proyecci√≥n con UMAP:")
        create_interactive_plot(X_umap, y, f"Proyecci√≥n con UMAP (Vecinos={n_neighbors})", "UMAP")

    st.markdown("---")
    st.header("üí° Conclusi√≥n")
    st.write("Como se puede observar, **UMAP** genera una separaci√≥n mucho m√°s clara y definida entre las clases (d√≠gitos) en comparaci√≥n con **PCA**. Esto lo convierte en una t√©cnica superior para la visualizaci√≥n de datos y como paso previo para algoritmos de clasificaci√≥n, ya que revela la estructura de 'clusters' de forma m√°s efectiva.")


if __name__ == "__main__":
    main()

###P√°gina 3: Clasificaci√≥n (Punto c)

In [None]:
# Guarda este c√≥digo como un archivo Python llamado "3_Clasificacion.py"
%%writefile pages/3_Clasificacion.py

# üìå Importa las librer√≠as necesarias
import streamlit as st
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import label_binarize
from sklearn.metrics import classification_report, roc_curve, auc
from umap import UMAP

# Modelos de clasificaci√≥n
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.neural_network import MLPClassifier

# Importar el dataset de d√≠gitos (similar a USPS)
from sklearn.datasets import load_digits

# ‚öôÔ∏è Configuraci√≥n inicial de la p√°gina del dashboard
st.set_page_config(page_title="Resultados de Clasificaci√≥n", layout="wide")

# üìù T√≠tulo y descripci√≥n de la p√°gina
st.markdown("""
# üìä P√°gina 3: Clasificaci√≥n de D√≠gitos
En esta secci√≥n se presentan los resultados de aplicar tres modelos de clasificaci√≥n sobre los datos del dataset USPS, previamente proyectados a un espacio de menor dimensi√≥n con UMAP.

**Selecciona un modelo del men√∫ desplegable para ver su reporte de desempe√±o y su curva ROC multiclase.**
""")

# --- Carga y Preparaci√≥n de Datos ---
@st.cache_data
def load_and_prepare_data():
    """
    Carga el dataset, aplica UMAP para reducir la dimensionalidad y lo divide
    en conjuntos de entrenamiento y prueba.
    """
    digits = load_digits()
    X, y = digits.data, digits.target
    umap_reducer = UMAP(n_components=2, random_state=42)
    X_proj = umap_reducer.fit_transform(X)
    X_train, X_test, y_train, y_test = train_test_split(
        X_proj, y, test_size=0.3, random_state=42, stratify=y
    )
    y_train_bin = label_binarize(y_train, classes=np.unique(y))
    y_test_bin = label_binarize(y_test, classes=np.unique(y))
    n_classes = y_test_bin.shape[1]
    return X_train, X_test, y_train, y_test, y_test_bin, n_classes

# --- Entrenamiento de Modelos ---
@st.cache_resource
def train_model(_model, X_train, y_train):
    """
    Entrena un modelo de clasificaci√≥n y lo guarda en cache.
    """
    _model.fit(X_train, y_train)
    return _model

# --- Visualizaci√≥n de Resultados ---
def plot_roc_curve(y_test_bin, y_score, n_classes, model_name):
    """
    Calcula y grafica la curva ROC para un entorno multiclase.
    """
    fpr = dict()
    tpr = dict()
    roc_auc = dict()
    for i in range(n_classes):
        fpr[i], tpr[i], _ = roc_curve(y_test_bin[:, i], y_score[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])

    fig, ax = plt.subplots(figsize=(10, 8))
    ax.plot([0, 1], [0, 1], 'k--', label='Clasificador Aleatorio')
    for i in range(n_classes):
        ax.plot(fpr[i], tpr[i], label=f'Clase {i} (AUC = {roc_auc[i]:.2f})')

    ax.set_xlabel('Tasa de Falsos Positivos (FPR)')
    ax.set_ylabel('Tasa de Verdaderos Positivos (TPR)')
    ax.set_title(f'Curva ROC Multiclase - {model_name}')
    ax.legend(loc='lower right')
    ax.grid(True)
    return fig

# --- L√≥gica Principal del Dashboard ---
X_train, X_test, y_train, y_test, y_test_bin, n_classes = load_and_prepare_data()

model_option = st.selectbox(
    "Selecciona el modelo de clasificaci√≥n:",
    ("K-Nearest Neighbors (KNN)", "Regresi√≥n Log√≠stica", "Red Neuronal (MLP)")
)

if model_option == "K-Nearest Neighbors (KNN)":
    model = KNeighborsClassifier(n_neighbors=5)
    model_name = "KNN"
elif model_option == "Regresi√≥n Log√≠stica":
    model = LogisticRegression(max_iter=1000, multi_class='ovr')
    model_name = "Logistic Regression"
else:
    model = MLPClassifier(hidden_layer_sizes=(100,), max_iter=500, random_state=42)
    model_name = "MLP"

trained_model = train_model(model, X_train, y_train)
y_pred = trained_model.predict(X_test)
y_score = trained_model.predict_proba(X_test)

st.header(f"Resultados para {model_name}")
col1, col2 = st.columns(2)

with col1:
    st.subheader("Reporte de Clasificaci√≥n")
    report = classification_report(y_test, y_pred)
    st.text(report)

    # === INICIO DE SECCI√ìN NUEVA: EXPLICACI√ìN DEL REPORTE ===
    with st.expander("¬øC√≥mo interpretar este reporte?"):
        st.markdown("""
        El reporte de clasificaci√≥n muestra qu√© tan bien funciona el modelo para cada clase (cada d√≠gito del 0 al 9).

        - **Precisi√≥n (Precision):** De todas las veces que el modelo predijo una clase, ¬øqu√© porcentaje fue correcto?
          Una alta precisi√≥n indica pocas predicciones incorrectas para esa clase (pocos falsos positivos).

        - **Exhaustividad (Recall / Sensibilidad):** De todas las muestras que realmente pertenecen a una clase, ¬øqu√© porcentaje logr√≥ identificar el modelo?
          Un alto recall indica que el modelo "encontr√≥" la mayor√≠a de las muestras de esa clase (pocos falsos negativos).

        - **Puntuaci√≥n F1 (F1-Score):** Es una media arm√≥nica entre precisi√≥n y recall. Un F1-score alto indica un buen balance entre ambas m√©tricas. Es especialmente √∫til cuando hay un desequilibrio entre las clases.

        - **Soporte (Support):** Es simplemente el n√∫mero de muestras reales de cada clase en el conjunto de prueba. Ayuda a dar contexto a las otras m√©tricas.

        - **Accuracy (Exactitud):** Es el porcentaje total de predicciones correctas sobre el total de muestras.
        """)
    # === FIN DE SECCI√ìN NUEVA ===

with col2:
    st.subheader("Curva ROC")
    roc_fig = plot_roc_curve(y_test_bin, y_score, n_classes, model_name)
    st.pyplot(roc_fig)

    # === INICIO DE SECCI√ìN NUEVA: EXPLICACI√ìN DE LA CURVA ROC ===
    with st.expander("¬øC√≥mo interpretar esta gr√°fica?"):
        st.markdown("""
        La **Curva ROC** (Receiver Operating Characteristic) ilustra el rendimiento de un modelo de clasificaci√≥n en todos los umbrales de decisi√≥n.

        - **Eje Y (Tasa de Verdaderos Positivos - TPR):** Mide qu√© tan bueno es el modelo para identificar correctamente los casos positivos (similar al Recall). Un valor m√°s alto es mejor.

        - **Eje X (Tasa de Falsos Positivos - FPR):** Mide con qu√© frecuencia el modelo clasifica incorrectamente un caso negativo como positivo. Un valor m√°s bajo es mejor.

        **Claves para la interpretaci√≥n:**

        - **El clasificador ideal** tendr√≠a una curva que sube r√°pidamente hacia la esquina superior izquierda (TPR=1, FPR=0).
        - **La l√≠nea punteada diagonal (`k--`)** representa un clasificador que adivina al azar. Cualquier curva por encima de esta l√≠nea es mejor que el azar.
        - **Cada l√≠nea de color** representa el rendimiento del modelo para una de las clases (d√≠gitos del 0 al 9) de forma "uno contra el resto".
        - **AUC (Area Under the Curve):** Es el √°rea bajo la curva. Un valor cercano a 1.0 indica un excelente rendimiento, mientras que un valor cercano a 0.5 corresponde a un clasificador aleatorio.
        """)
    # === FIN DE SECCI√ìN NUEVA ===

####DESCARGAR Y CONFIGURAR CLOUDFLARED

In [None]:
# Descarga el ejecutable de Cloudflared (cliente para t√∫neles seguros de Cloudflare)
!wget https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64

# Otorga permisos de ejecuci√≥n al archivo descargado
!chmod +x cloudflared-linux-amd64

# Mueve el ejecutable a una ruta del sistema para poder ejecutarlo desde cualquier parte
!mv cloudflared-linux-amd64 /usr/local/bin/cloudflared

# --- EJECUTAR EL DASHBOARD DE STREAMLIT ---

# Lanza Streamlit en segundo plano y guarda los logs en un archivo
# Aseg√∫rate de que '0_Home.py' sea el archivo principal de tu dashboard
!streamlit run 0_Home.py &>/content/logs.txt &

# --- CREAR UN T√öNEL CLOUDFLARE AL PUERTO 8501 ---

# Expone el puerto 8501 (por defecto de Streamlit) usando un t√∫nel seguro
# El resultado se redirecciona al archivo cloudflared.log
!cloudflared tunnel --url http://localhost:8501 > /content/cloudflared.log 2>&1 &

# --- ESPERAR QUE SE GENERE LA URL P√öBLICA ---

import time
time.sleep(5)  # Da tiempo para que Cloudflare genere y escriba la URL en el archivo log

# --- EXTRAER LA URL P√öBLICA DESDE EL LOG ---

import re
found_context = False  # Bandera para detectar si ya estamos en el punto relevante del log

# Abre y lee l√≠nea por l√≠nea el archivo de log generado por Cloudflare
with open('/content/cloudflared.log') as f:
    for line in f:
        # Detecta el mensaje que indica que el t√∫nel fue creado exitosamente
        if "Your quick Tunnel has been created" in line:
            found_context = True

        # Si estamos en el contexto correcto, busca una URL en la l√≠nea actual
        if found_context:
            match = re.search(r'https?://\S+', line)  # Expresi√≥n regular para detectar URL
            if match:
                url = match.group(0)  # Extrae la URL
                print(f'Tu aplicaci√≥n est√° disponible en: {url}')  # Muestra la URL al usuario
                break  # Finaliza el bucle despu√©s de encontrar la URL

###Ciclo para finalizar la ejecuci√≥n del Dashboard

In [None]:
import os  # Importa el m√≥dulo 'os' para ejecutar comandos del sistema operativo

# Solicita al usuario que ingrese una opci√≥n para terminar la ejecuci√≥n
res = input("Digite (1) para finalizar la ejecuci√≥n del Dashboard: ")

# Verifica si el usuario digit√≥ "1" (se usa upper() para evitar problemas con min√∫sculas)
if res.upper() == "1":
    os.system("pkill streamlit")  # Ejecuta un comando del sistema que mata el proceso de Streamlit
    print("El proceso de Streamlit ha sido finalizado.")  # Muestra un mensaje de confirmaci√≥n