<a href="https://colab.research.google.com/github/Julian27R/Analitica_de_Datos/blob/main/Dashboard_DataChallenge.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

#**Dasboard Data-challenge**

###**Por:**
*   **Julián Felipe Gutiérrez Ramírez**
*   **Felipe Idárraga Quintero**

**Fecha de presentación 19/07/2025**

---

#**1. Descarga de Modelos Entrenados (Logistic Regression, Random Forest) e imagenes**

In [None]:
import gdown, pathlib, textwrap

files = {
    "categoricas_vs_resultado.png":      "1YnB_ySKFJYy_JSPsxWvOnbyTji0slu-X",
    "distribucion_resultado.png":        "17Itasm7NfPrgHG4n7dKfO0Hubdeo2F-I",
    "distribucion_variables_numericas.png":"1crPz1d8lHjMckgqNGpDoT4HQg-qVB-4L",
    "matrices_confusion.png":            "1NJ4dNfD9QgYqHtO7p5sMsbUadGYq-nFx",
    "matriz_correlacion.png":            "1RC3F1HppODuQVQ-KozEaf6rDh-lrWT5U",
    "logreg_model.pkl":                  "1rDw4bxGrVBsOXzJ--e9eiJOFyPFjeo-_",
    "rf_model.pkl":                      "1EG4AsDcnLL0XRhQbp9N_nRZMTOZkXZ0e"
}

for fname, fid in files.items():
    url = f"https://drive.google.com/uc?id={fid}"
    if not pathlib.Path(fname).exists():
        gdown.download(url, fname, quiet=False)


Downloading...
From: https://drive.google.com/uc?id=1YnB_ySKFJYy_JSPsxWvOnbyTji0slu-X
To: /content/categoricas_vs_resultado.png
100%|██████████| 267k/267k [00:00<00:00, 26.8MB/s]
Downloading...
From: https://drive.google.com/uc?id=17Itasm7NfPrgHG4n7dKfO0Hubdeo2F-I
To: /content/distribucion_resultado.png
100%|██████████| 17.0k/17.0k [00:00<00:00, 5.18MB/s]
Downloading...
From: https://drive.google.com/uc?id=1crPz1d8lHjMckgqNGpDoT4HQg-qVB-4L
To: /content/distribucion_variables_numericas.png
100%|██████████| 236k/236k [00:00<00:00, 68.6MB/s]
Downloading...
From: https://drive.google.com/uc?id=1NJ4dNfD9QgYqHtO7p5sMsbUadGYq-nFx
To: /content/matrices_confusion.png
100%|██████████| 20.4k/20.4k [00:00<00:00, 26.1MB/s]
Downloading...
From: https://drive.google.com/uc?id=1RC3F1HppODuQVQ-KozEaf6rDh-lrWT5U
To: /content/matriz_correlacion.png
100%|██████████| 134k/134k [00:00<00:00, 67.9MB/s]
Downloading...
From: https://drive.google.com/uc?id=1rDw4bxGrVBsOXzJ--e9eiJOFyPFjeo-_
To: /content/logreg_m

#**2.  Instalación de Dependencias para la App Web (Streamlit y Pyngrok)**

In [None]:
!pip -q install --upgrade streamlit pyngrok

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.3/44.3 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m9.9/9.9 MB[0m [31m65.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.9/6.9 MB[0m [31m91.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.1/79.1 kB[0m [31m5.5 MB/s[0m eta [36m0:00:00[0m
[?25h

#**3. Definición de app.py: Interfaz Streamlit**

In [None]:
%%writefile app.py
import streamlit as st
import pandas as pd
import joblib
from PIL import Image
from pathlib import Path

# ---------- Config & título ----------
st.set_page_config(page_title="Informe CDT", layout="wide")
st.title("📊 Informe Interactivo - Predicción de Contratación de CDT")

st.markdown(
"""
Este informe presenta los resultados del proyecto de Machine Learning aplicado a una base de datos de telemercadeo bancario.
El objetivo fue predecir si un cliente aceptará la contratación de un depósito a término (CDT).

Se utilizó un enfoque de clasificación supervisada, combinando análisis exploratorio, modelado y visualizaciones para una interpretación clara de los resultados.
"""
)

# ---------- Helper para carga segura ----------
# ---------- Helper para carga segura ----------
def safe_image(path: str, caption: str):
    p = Path(path)
    if p.exists():
        st.image(Image.open(p),
                 caption=caption,
                 use_container_width=True)   # ← aquí el cambio
    else:
        st.warning(f"⚠️ No se encontró **{p.name}**")


# ---------- Distribución variable objetivo ----------
st.header("🎯 Distribución de la variable objetivo")
safe_image("distribucion_resultado.png", "Distribución de clases 'si' y 'no'")

# ---------- Variables numéricas ----------
st.header("📈 Distribución de variables numéricas")
safe_image("distribucion_variables_numericas.png", "Histograma de variables numéricas")

# ---------- Variables categóricas ----------
st.header("📚 Análisis de variables categóricas vs. resultado")
safe_image("categoricas_vs_resultado.png",
           "Distribución de variables categóricas respecto a la variable objetivo")

# ---------- Matriz de correlación ----------
st.header("🔍 Correlación de variables numéricas con 'resultado'")
st.markdown(
"""
Las siguientes variables mostraron correlación moderada con la variable objetivo:

* **contactos_previos** (+0.27)
* **personas_empleadas** (−0.46)
* **tasa_credito_hipotecario** (−0.43)
* **tasa_empleo** (−0.42)

Variables macroeconómicas con tendencia negativa están asociadas a una mayor aceptación del CDT.
"""
)
safe_image("matriz_correlacion.png", "Matriz de correlación")

# ---------- Modelos ajustados ----------
st.header("🤖 Evaluación de Modelos Ajustados")
safe_image("matrices_confusion.png",
           "Matrices de confusión - Logistic Regression vs Random Forest")

st.markdown(
"""
| Modelo               | Accuracy | Precision (si) | Recall (si) | F1-score (si) |
|----------------------|---------:|---------------:|------------:|--------------:|
| Logistic Regression  | **0.77** | 0.74 | 0.57 | 0.65 |
| Random Forest        | **0.79** | 0.78 | 0.58 | 0.66 |

El modelo **Random Forest** tuvo el mejor rendimiento final, con un F1-score superior y mayor estabilidad frente al desbalance de clases.
"""
)

# ---------- Conclusiones ----------
st.header("✅ Conclusiones")
st.markdown(
"""
* El modelo Random Forest demostró ser más efectivo para predecir la contratación del CDT.
* La variable `contactos_previos` fue la más influyente de manera positiva.
* Las condiciones macroeconómicas parecen influir indirectamente en la aceptación del producto.
* El desbalance de clases sugiere que debe usarse F1-score como métrica principal.

**Nota:** Esta interfaz fue creada con Streamlit para facilitar la comprensión visual e interactiva de los hallazgos.
"""
)

st.success("Gracias por visitar este informe. Puedes reutilizar el modelo para nuevas predicciones si cargas tus datos y modelos entrenados.")

Writing app.py


#**4.  Iniciar Streamlit en segundo plano (modo servidor)**

In [None]:
# Ejecuta Streamlit en background
!streamlit run app.py &> streamlit.log &

import time, subprocess, textwrap, os
time.sleep(5)   # ⏳ Dale tiempo a que Streamlit levante el servidor


#**5. Crear túnel público con ngrok para acceder al dashboard**

In [None]:
from pyngrok import ngrok

#30AuCFa1I7vACIoztgkBn5Fp0nJ_2qkD1vN3fsWcEatGfeReU ---> Token Pipe
#"2xbQ2LIhhqTUCyRMtyHaqy9cZym_inbfFpBVWsG79Gzdy7EA" --> Token mio

ngrok.set_auth_token("2xbQ2LIhhqTUCyRMtyHaqy9cZym_inbfFpBVWsG79Gzdy7EA")  # ← ⚠️ cámbialo si lo revocas
public_url = ngrok.connect(8501)  # ⚠️ SOLO el puerto → 8501
print(f"🚀 Tu dashboard está disponible en: {public_url}")


🚀 Tu dashboard está disponible en: NgrokTunnel: "https://e6acef5f341d.ngrok-free.app" -> "http://localhost:8501"
