<a href="https://colab.research.google.com/github/valeromora/TAM_2025-1/blob/main/Parcial1/Parcial1_punto3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Dashboard

# **Instalación de librerías**

In [1]:
#instalación de librerías
!pip install streamlit -q

##Crear carpeta pages para trabajar Multiapp en Streamlit

In [2]:
!mkdir pages

mkdir: cannot create directory ‘pages’: File exists


In [3]:
#cargar datos desde drive acceso libre
#https://drive.google.com/file/d/1hW3JT6TnBFSm8Gp4Z0U_WZ5t0dSNudb9/view?usp=sharing

from google.colab import drive
drive.mount('/content/drive')
!unzip -o "/content/drive/My Drive/archive.zip"

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Archive:  /content/drive/My Drive/archive.zip
  inflating: AmesHousing.csv         


# **Página principal**

In [4]:
%%writefile 0_👋_Hello.py

import streamlit as st

st.set_page_config(
    page_title="Inicio - Ames Housing",
    page_icon="🏠",
)

st.title("🏠 Análisis de Ames Housing")

st.sidebar.success("Selecciona una opción en el menú lateral")

st.markdown(
    """
    Bienvenido al dashboard interactivo del proyecto **Ames Housing**.

    Aquí podrás:

    🔍 **Explorar visualmente el dataset** de precios de viviendas en Ames, Iowa.

    📈 **Comparar el rendimiento de modelos de regresión** entrenados para predecir el precio de venta de las propiedades.

    ### ¿Qué hacer ahora?
    - Usa la barra lateral 👈 para navegar entre las páginas disponibles:
      - **Exploración de Datos**
      - **Comparación de Modelos**
    """
)

Overwriting 0_👋_Hello.py


# **Páginas**

## **1. Exploración de datos**

In [5]:
%%writefile 1_📊_Exploración_Datos.py

import streamlit as st
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

st.set_page_config(page_title="Exploración de Datos", page_icon="📊")

st.markdown("# 📊 Exploración del Dataset Ames Housing")
st.sidebar.header("Filtros")

@st.cache_data
def cargar_datos():
    return pd.read_csv("/content/AmesHousing.csv")

df = cargar_datos()

# Filtros en sidebar
precio_min, precio_max = st.sidebar.slider(
    "Rango de Precio de Venta (SalePrice)",
    int(df["SalePrice"].min()), int(df["SalePrice"].max()),
    (int(df["SalePrice"].min()), int(df["SalePrice"].max()))
)

anyo_min, anyo_max = st.sidebar.slider(
    "Rango de Año de Construcción (Year Built)",
    int(df["Year Built"].min()), int(df["Year Built"].max()),
    (int(df["Year Built"].min()), int(df["Year Built"].max()))
)

# Filtrar el dataframe según sliders
df_filtrado = df[
    (df["SalePrice"] >= precio_min) & (df["SalePrice"] <= precio_max) &
    (df["Year Built"] >= anyo_min) & (df["Year Built"] <= anyo_max)
]

st.markdown(f"### Vista previa del dataset filtrado ({len(df_filtrado)} registros)")
st.dataframe(df_filtrado.head())

# Pestañas para distintos gráficos
tab1, tab2, tab3 = st.tabs(["Histograma", "Relaciones", "Boxplots"])

with tab1:
    st.markdown("#### Histograma de SalePrice")
    fig, ax = plt.subplots(figsize=(10,4))
    sns.histplot(df_filtrado["SalePrice"], kde=True, ax=ax)
    st.pyplot(fig)

with tab2:
    st.markdown("#### Gráficos de dispersión")
    # Elección variable X
    x_var = st.selectbox("Variable para eje X", options=["Yr Sold", "Year Built", "Gr Liv Area", "Overall Qual"])
    fig, ax = plt.subplots(figsize=(10,4))
    sns.scatterplot(data=df_filtrado, x=x_var, y="SalePrice", ax=ax)
    st.pyplot(fig)

with tab3:
    st.markdown("#### Boxplots de calidad")
    cual_boxplot = st.selectbox("Selecciona la variable categórica", options=["Bsmt Qual", "Exter Qual"])
    fig, ax = plt.subplots(figsize=(10,4))
    sns.boxplot(data=df_filtrado, x=cual_boxplot, y="SalePrice", ax=ax)
    st.pyplot(fig)

# Estadísticas generales (del filtrado)
st.markdown("## 📋 Estadísticas generales del dataset filtrado")
st.write(df_filtrado.describe())

# Opción para descargar el dataset filtrado
csv = df_filtrado.to_csv(index=False).encode("utf-8")
st.download_button(
    label="Descargar datos filtrados en CSV",
    data=csv,
    file_name="ameshousing_filtrado.csv",
    mime="text/csv"
)


Writing 1_📊_Exploración_Datos.py


In [6]:
!mv 1_📊_Exploración_Datos.py pages/

## **2. Comparación modelos**

In [20]:
%%writefile 2_📊_Comparacion_Modelos.py

import streamlit as st
import json
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, mean_absolute_percentage_error

st.title("📊 Comparación de Modelos")

st.sidebar.header("Seleccionar modelos a comparar")
modelos_disponibles = ["Kernel Ridge", "Gaussian Process Regressor", "Random Forest Regressor"]
modelos_seleccionados = st.sidebar.multiselect("Modelos", modelos_disponibles, default=modelos_disponibles)

# Aquí simulamos que cargas resultados guardados en JSON (puedes ajustar rutas)
def cargar_resultados_json(ruta):
    with open(ruta, "r") as f:
        data = json.load(f)
    return data

# Ejemplo: cargar predicciones y métricas desde JSON (adaptar a tu formato)
resultados = {}
if "Kernel Ridge" in modelos_seleccionados:
    resultados["Kernel Ridge"] = cargar_resultados_json("results_kernelridge.json")
if "Gaussian Process Regressor" in modelos_seleccionados:
    resultados["Gaussian Process Regressor"] = cargar_resultados_json("results_gpr.json")
if "Random Forest Regressor" in modelos_seleccionados:
    resultados["Random Forest Regressor"] = cargar_resultados_json("results_rforest.json")

# Mostrar tabla comparativa de métricas
import pandas as pd

metricas = ["mae", "mse", "r2", "mape"]
tabla = []
for nombre, lista_resultados in resultados.items():
    res = lista_resultados[0]  # tomar el primer resultado
    fila = {
        "Modelo": nombre,
        "MAE": res.get("mae", np.nan),
        "MSE": res.get("mse", np.nan),
        "R2": res.get("r2", np.nan),
        "MAPE": res.get("mape", np.nan)
    }
    tabla.append(fila)

df_metricas = pd.DataFrame(tabla).set_index("Modelo")
st.markdown("### Métricas de desempeño")
st.dataframe(df_metricas.style.format("{:.4f}"))

# Graficar comparativo y_true vs y_pred
st.markdown("### Comparación visual: Valores reales vs predichos")

for nombre, lista_resultados in resultados.items():
    res = lista_resultados[0]
    y_true = np.array(res["y_true"])
    y_pred = np.array(res["y_pred"])
    fig, ax = plt.subplots()
    ax.scatter(y_true, y_pred, alpha=0.5, label=nombre)
    ax.plot([y_true.min(), y_true.max()], [y_true.min(), y_true.max()], 'r--')
    ax.set_xlabel("Valores reales")
    ax.set_ylabel("Predicciones")
    ax.set_title(f"{nombre}: Real vs Predicho")
    ax.legend()
    st.pyplot(fig)


Writing 2_📊_Comparacion_Modelos.py


In [21]:
!mv 2_📊_Comparacion_Modelos.py pages/

# **Inicialización del Dashboard a partir de túnel local**

In [22]:
!wget https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64
!chmod +x cloudflared-linux-amd64
!mv cloudflared-linux-amd64 /usr/local/bin/cloudflared

#Ejecutar Streamlit
!streamlit run 0_👋_Hello.py &>/content/logs.txt & #Cambiar 0_👋_Hello.py por el nombre de tu archivo principal

#Exponer el puerto 8501 con Cloudflare Tunnel
!cloudflared tunnel --url http://localhost:8501 > /content/cloudflared.log 2>&1 &

#Leer la URL pública generada por Cloudflare
import time
time.sleep(5)  # Esperar que se genere la URL

import re
found_context = False  # Indicador para saber si estamos en la sección correcta

with open('/content/cloudflared.log') as f:
    for line in f:
        #Detecta el inicio del contexto que nos interesa
        if "Your quick Tunnel has been created" in line:
            found_context = True

        #Busca una URL si ya se encontró el contexto relevante
        if found_context:
            match = re.search(r'https?://\S+', line)
            if match:
                url = match.group(0)  #Extrae la URL encontrada
                print(f'Tu aplicación está disponible en: {url}')
                break  #Termina el bucle después de encontrar la URL

--2025-05-25 03:57:50--  https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64
Resolving github.com (github.com)... 140.82.116.3
Connecting to github.com (github.com)|140.82.116.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://github.com/cloudflare/cloudflared/releases/download/2025.5.0/cloudflared-linux-amd64 [following]
--2025-05-25 03:57:50--  https://github.com/cloudflare/cloudflared/releases/download/2025.5.0/cloudflared-linux-amd64
Reusing existing connection to github.com:443.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/106867604/797840ed-70cb-47b8-a6fe-ecb4b3385c94?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250525%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250525T035750Z&X-Amz-Expires=300&X-Amz-Signature=649a9625fb446e29473315ea9d3d4a1190ad953f00cc4969288fadf2742e3e96&X-Amz-S

# **Finalización de ejecución del Dashboard**

In [8]:
import os

res = input("Digite (1) para finalizar la ejecución del Dashboard: ")

if res.upper() == "1":
    os.system("pkill streamlit")  # Termina el proceso de Streamlit
    print("El proceso de Streamlit ha sido finalizado.")


Digite (1) para finalizar la ejecución del Dashboard: 1
El proceso de Streamlit ha sido finalizado.
