<a href="https://colab.research.google.com/github/Enzo1193/aprendizajedemaquina/blob/main/Dashboard.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# 1. Instalar streamlit y pyngrok
!pip install streamlit pyngrok -q

# 2. Guardar el script del dashboard completo
code = """
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

st.set_page_config(layout="wide")
st.title("Análisis del Precio de Viviendas - AmesHousing")

# Paso 1: Subir archivo
uploaded_file = st.file_uploader("Sube tu archivo AmesHousing.csv", type=["csv"])

if uploaded_file is not None:
    df = pd.read_csv(uploaded_file)

    st.subheader("Vista general del dataset")
    st.write(df.head())
    st.write("Tamaño del dataset:", df.shape)

    # Valores nulos
    missing = df.isnull().sum()
    missing = missing[missing > 0].sort_values(ascending=False)

    st.subheader("Columnas con valores nulos")
    st.write(missing)

    # Histograma del precio de venta
    st.subheader("Distribución de SalePrice")
    fig, ax = plt.subplots()
    sns.histplot(df['SalePrice'], kde=True, ax=ax)
    st.pyplot(fig)

    # Correlación
    st.subheader("Matriz de correlación (variables numéricas)")
    corr = df.corr(numeric_only=True)
    fig, ax = plt.subplots(figsize=(12, 10))
    sns.heatmap(corr, annot=False, cmap="coolwarm", ax=ax)
    st.pyplot(fig)

    # Justificación de hiperparámetros
    st.subheader("📌 Justificación de los Hiperparámetros, Rejillas y Score a Minimizar")
    st.markdown(\"""
En este trabajo se probaron múltiples algoritmos de regresión con el objetivo de predecir el precio de venta de viviendas (`SalePrice`).
Para cada uno, se establecieron rangos de búsqueda de hiperparámetros basados en literatura, experiencia previa y consideraciones computacionales:

- **`LinearRegression`**: No requiere ajuste de hiperparámetros.
- **`Lasso`, `ElasticNet`**: `alpha`, `l1_ratio`, `max_iter`.
- **`KernelRidge`**: `alpha`, `kernel`, `degree`.
- **`SGDRegressor`**: `alpha`, `penalty`, `learning_rate`.
- **`BayesianRidge`**: `alpha_1`, `alpha_2`, `lambda_1`, `lambda_2`.
- **`GaussianProcessRegressor`**: `alpha`.
- **`RandomForestRegressor`**: `n_estimators`, `max_depth`, `min_samples_split`, `min_samples_leaf`.
- **`SVR`**: `C`, `epsilon`, `kernel`, `degree`.

### Score a Minimizar

Se utilizó principalmente el **`MAE (Mean Absolute Error)`**, robusto a valores atípicos y más interpretable en unidades monetarias.
\""")
else:
    st.warning("Por favor, sube un archivo CSV para comenzar el análisis.")
"""


with open("streamlit_app.py", "w") as f:
    f.write(code)

# 3. Ejecutar streamlit en segundo plano y abrir túnel ngrok
import threading
import os
from pyngrok import ngrok

# Desactivar CORS
os.environ["STREAMLIT_SERVER_ENABLECORS"] = "false"

# Cerrar túneles activos previos para evitar error de límite
for tunnel in ngrok.get_tunnels():
    ngrok.disconnect(tunnel.public_url)

# Crear túnel
public_url = ngrok.connect(8501, "http")
print(f"Tu dashboard está disponible en: {public_url}")

# Ejecutar Streamlit en hilo separado
def run():
    os.system("streamlit run streamlit_app.py")

thread = threading.Thread(target=run)
thread.start()


Tu dashboard está disponible en: NgrokTunnel: "https://6871-34-80-69-54.ngrok-free.app" -> "http://localhost:8501"
