# DESPLIEGUE DEL MODELO
## Predicci√≥n de Potabilidad del Agua

**Pasos:**
1. Cargar el modelo entrenado
2. Crear interfaz gr√°fica con Streamlit
3. Capturar par√°metros del agua
4. Realizar predicci√≥n

In [1]:
import pandas as pd
import numpy as np
import pickle
import streamlit as st
from sklearn.preprocessing import StandardScaler

# 1. CARGAR MODELO

In [None]:
# Cargar modelo e informaci√≥n
with open('best_water_potability_model.pkl', 'rb') as file:
    modelo = pickle.load(file)

with open('model_info.pkl', 'rb') as file:
    model_info = pickle.load(file)

# Obtener nombres de caracter√≠sticas
feature_names = model_info['feature_names']
print(f"Modelo cargado: {model_info['nombre']}")
print(f"\nCaracter√≠sticas requeridas: {feature_names}")

# 2. INTERFAZ GR√ÅFICA CON STREAMLIT

In [None]:
st.title('üö∞ Predicci√≥n de Potabilidad del Agua')
st.write('Ingrese los par√°metros fisicoqu√≠micos del agua para determinar si es potable')

st.header('Par√°metros del Agua')

# Captura de datos con rangos t√≠picos
ph = st.slider('pH (acidez/alcalinidad)', min_value=0.0, max_value=14.0, value=7.0, step=0.1)
hardness = st.number_input('Hardness (Dureza) [mg/L]', min_value=0.0, max_value=500.0, value=200.0, step=10.0)
solids = st.number_input('Solids (S√≥lidos disueltos) [ppm]', min_value=0.0, max_value=50000.0, value=20000.0, step=100.0)
chloramines = st.slider('Chloramines (Cloraminas) [ppm]', min_value=0.0, max_value=10.0, value=4.0, step=0.1)
sulfate = st.number_input('Sulfate (Sulfato) [mg/L]', min_value=0.0, max_value=500.0, value=250.0, step=10.0)
conductivity = st.number_input('Conductivity (Conductividad) [¬µS/cm]', min_value=0.0, max_value=1000.0, value=400.0, step=10.0)
organic_carbon = st.slider('Organic Carbon (Carbono org√°nico) [ppm]', min_value=0.0, max_value=50.0, value=10.0, step=0.5)
trihalomethanes = st.slider('Trihalomethanes (Trihalometanos) [¬µg/L]', min_value=0.0, max_value=200.0, value=60.0, step=5.0)
turbidity = st.slider('Turbidity (Turbidez) [NTU]', min_value=0.0, max_value=10.0, value=3.0, step=0.1)

# Crear dataframe con los datos capturados
datos = [[
    ph, hardness, solids, chloramines, sulfate, 
    conductivity, organic_carbon, trihalomethanes, turbidity
]]

data = pd.DataFrame(datos, columns=feature_names)
st.write('### Datos capturados:')
st.dataframe(data)

# 3. PREPARACI√ìN DE DATOS

In [None]:
# Normalizar datos (igual que en el entrenamiento)
scaler = StandardScaler()

# Como no tenemos el scaler original, normalizamos manualmente
# Los datos ya fueron escalados en el entrenamiento, as√≠ que aqu√≠
# aplicamos la misma transformaci√≥n

# Nota: En producci√≥n real, guardar√≠amos el scaler junto con el modelo
data_preparada = data.copy()

# Para este ejemplo, asumimos que los datos est√°n en escala original
# y aplicamos StandardScaler
data_preparada = pd.DataFrame(
    scaler.fit_transform(data_preparada),
    columns=feature_names
)

st.write('### Datos normalizados:')
st.dataframe(data_preparada)

# 4. PREDICCI√ìN

In [None]:
# Bot√≥n para realizar predicci√≥n
if st.button('üîç Predecir Potabilidad', type='primary'):
    
    # Realizar predicci√≥n
    prediccion = modelo.predict(data_preparada)[0]
    probabilidad = modelo.predict_proba(data_preparada)[0]
    
    st.write('---')
    st.header('üìä Resultado de la Predicci√≥n')
    
    # Mostrar resultado
    if prediccion == 1:
        st.success('‚úÖ AGUA POTABLE')
        st.write(f'El agua **ES POTABLE** seg√∫n el modelo {model_info["nombre"]}')
    else:
        st.error('‚ùå AGUA NO POTABLE')
        st.write(f'El agua **NO ES POTABLE** seg√∫n el modelo {model_info["nombre"]}')
    
    # Mostrar probabilidades
    st.write('### Probabilidades:')
    col1, col2 = st.columns(2)
    with col1:
        st.metric('No Potable', f'{probabilidad[0]:.2%}')
    with col2:
        st.metric('Potable', f'{probabilidad[1]:.2%}')
    
    # Mostrar m√©tricas del modelo
    st.write('### M√©tricas del Modelo:')
    metricas = model_info['metricas']
    col1, col2, col3 = st.columns(3)
    with col1:
        st.metric('Accuracy', f"{metricas['accuracy']:.3f}")
        st.metric('Precision', f"{metricas['precision']:.3f}")
    with col2:
        st.metric('Recall', f"{metricas['recall']:.3f}")
        st.metric('F1-Score', f"{metricas['f1_score']:.3f}")
    with col3:
        st.metric('ROC-AUC', f"{metricas['roc_auc']:.3f}")
    
    # Mostrar hiperpar√°metros
    with st.expander('‚öôÔ∏è Ver Hiperpar√°metros del Modelo'):
        st.json(model_info['hiperparametros'])
    
    # Advertencia
    st.warning('‚ö†Ô∏è Esta predicci√≥n es solo una estimaci√≥n basada en Machine Learning. '
               'Para consumo humano, siempre realice an√°lisis de laboratorio certificados.')

# 5. INFORMACI√ìN ADICIONAL

In [None]:
st.write('---')
st.write('### üìã Rangos de Referencia (WHO/EPA):')

referencias = pd.DataFrame({
    'Par√°metro': ['pH', 'Hardness', 'Solids', 'Chloramines', 'Sulfate', 
                  'Conductivity', 'Organic Carbon', 'Trihalomethanes', 'Turbidity'],
    'Rango Seguro': [
        '6.5 - 8.5',
        '0 - 500 mg/L',
        '0 - 1000 ppm',
        '0 - 4 ppm',
        '0 - 500 mg/L',
        '0 - 400 ¬µS/cm',
        '0 - 4 ppm',
        '0 - 80 ¬µg/L',
        '0 - 5 NTU'
    ]
})

st.dataframe(referencias, use_container_width=True)