In [93]:
#Instalaci√≥n
!pip install streamlit



In [109]:
%%writefile app.py
import streamlit as st
import pandas as pd
import joblib
import pandas as pd
import numpy as np
from sklearn.base import BaseEstimator, TransformerMixin
from sklearn.impute import KNNImputer

st.set_page_config(page_title="Predicci√≥n APGAR2", page_icon="üçº")

st.title("Predicci√≥n de APGAR2")
st.write("Sube un archivo CSV con los datos para predecir APGAR2.")

import pandas as pd
import numpy as np
import joblib
from sklearn.base import BaseEstimator, TransformerMixin
from sklearn.impute import KNNImputer
from sklearn.pipeline import Pipeline

class APGARCleaner(BaseEstimator, TransformerMixin):
    def __init__(self):
        self.sexo_moda_ = None
        self.imputer_ = None
        self.valid_indices_ = None

    def _normalizar_tipo_parto(self, df):
        """Normaliza todos los tipos de TIPO PARTO a versiones sin tildes"""
        if 'TIPO PARTO' in df.columns:
            df['TIPO PARTO'] = df['TIPO PARTO'].replace({
                'ESPONTANEO': 'ESPONTANEO',
                'ESPONT√ÉNEO': 'ESPONTANEO',
                'ESPONT√ÅNEO': 'ESPONTANEO',
                'CESAREA': 'CESAREA',
                'CES√ÉREA': 'CESAREA',
                'CES√ÅREA': 'CESAREA',
                'INSTRUMENTADO': 'INSTRUMENTADO'
            })
        return df

    def fit(self, X, y=None):
        # CLAVE: Resetear √≠ndices desde el inicio para evitar problemas
        df_clean = X.copy().reset_index(drop=True)
        original_length = len(df_clean)

        # Remover duplicados MANTENIENDO el seguimiento de √≠ndices
        df_clean = df_clean.drop_duplicates().reset_index(drop=True)

        relevant_columns = [
            'SEXO', 'PESO (Gramos)', 'TALLA (CentImetros)', 'TIEMPO DE GESTACION',
            'NUMERO CONSULTAS PRENATALES', 'TIPO PARTO', 'MULTIPLICIDAD EMBARAZO',
            'APGAR1', 'EDAD MADRE', 'NUMERO HIJOS NACIDOS VIVOS', 'NUMERO EMBARAZOS'
        ]
        existing_columns = [col for col in relevant_columns if col in df_clean.columns]
        df_clean = df_clean[existing_columns].copy()

        # Si existe APGAR2, remover filas donde sea null
        if 'APGAR2' in X.columns:
            df_clean = df_clean.dropna(subset=['APGAR2']).reset_index(drop=True)

        # Remover filas con valores cr√≠ticos faltantes
        critical_cols = ['APGAR1', 'TIEMPO DE GESTACION']
        existing_critical = [col for col in critical_cols if col in df_clean.columns]
        if existing_critical:
            df_clean = df_clean.dropna(subset=existing_critical, how='any').reset_index(drop=True)

        # Guardar los √≠ndices v√°lidos (ya reseteados)
        self.valid_indices_ = df_clean.index.copy()

        # NORMALIZAR TIPO PARTO
        df_clean = self._normalizar_tipo_parto(df_clean)

        # Procesar SEXO
        if 'SEXO' in df_clean.columns:
            df_clean['SEXO'] = df_clean['SEXO'].replace('INDETERMINADO', np.nan)
            if df_clean['SEXO'].isnull().any():
                self.sexo_moda_ = df_clean['SEXO'].mode()[0] if len(df_clean['SEXO'].mode()) > 0 else 'FEMENINO'

        # Configurar imputador
        imputation_cols = ['TIEMPO DE GESTACION', 'PESO (Gramos)', 'TALLA (CentImetros)']
        existing_imputation_cols = [col for col in imputation_cols if col in df_clean.columns]

        if existing_imputation_cols:
            self.imputer_ = KNNImputer(n_neighbors=5)
            if df_clean[existing_imputation_cols].isnull().any().any():
                self.imputer_.fit(df_clean[existing_imputation_cols])

        print(f"Fit completado: {original_length} ‚Üí {len(df_clean)} filas")
        return self

    def transform(self, X):
        # CLAVE: Resetear √≠ndices desde el inicio
        df_clean = X.copy().reset_index(drop=True)
        original_length = len(df_clean)

        # IMPORTANTE: NO remover duplicados en transform para preservar longitud
        # Solo limpiar datos sin cambiar el n√∫mero de filas
        # df_clean = df_clean.drop_duplicates().reset_index(drop=True)

        relevant_columns = [
            'SEXO', 'PESO (Gramos)', 'TALLA (CentImetros)', 'TIEMPO DE GESTACION',
            'NUMERO CONSULTAS PRENATALES', 'TIPO PARTO', 'MULTIPLICIDAD EMBARAZO',
            'APGAR1', 'EDAD MADRE', 'NUMERO HIJOS NACIDOS VIVOS', 'NUMERO EMBARAZOS'
        ]
        existing_columns = [col for col in relevant_columns if col in df_clean.columns]
        df_clean = df_clean[existing_columns].copy()

        # NORMALIZAR TIPO PARTO
        df_clean = self._normalizar_tipo_parto(df_clean)

        # Procesar SEXO
        if 'SEXO' in df_clean.columns:
            df_clean['SEXO'] = df_clean['SEXO'].replace('INDETERMINADO', np.nan)
            if hasattr(self, 'sexo_moda_') and self.sexo_moda_ is not None:
                df_clean['SEXO'] = df_clean['SEXO'].fillna(self.sexo_moda_)
            df_clean['SEXO'] = df_clean['SEXO'].fillna('FEMENINO')

        # Imputaci√≥n con KNN
        imputation_cols = ['TIEMPO DE GESTACION', 'PESO (Gramos)', 'TALLA (CentImetros)']
        existing_imputation_cols = [col for col in imputation_cols if col in df_clean.columns]

        if existing_imputation_cols and hasattr(self, 'imputer_') and self.imputer_ is not None:
            if df_clean[existing_imputation_cols].isnull().any().any():
                try:
                    imputed_values = self.imputer_.transform(df_clean[existing_imputation_cols])
                    df_clean[existing_imputation_cols] = imputed_values
                except Exception as e:
                    print(f"Warning: KNN imputation failed: {e}")
                    # Fallback a mediana/defaults
                    pass

            # Fallback para valores a√∫n faltantes
            for col in existing_imputation_cols:
                if df_clean[col].isnull().any():
                    defaults = {
                        'TIEMPO DE GESTACION': 38,
                        'PESO (Gramos)': 3200,
                        'TALLA (CentImetros)': 50
                    }
                    median_val = df_clean[col].median()
                    if pd.isna(median_val):
                        median_val = defaults.get(col, 0)
                    df_clean[col] = df_clean[col].fillna(median_val)

        # Valores por defecto para columnas num√©ricas
        numeric_defaults = {
            'NUMERO CONSULTAS PRENATALES': 6,
            'APGAR1': 8,
            'EDAD MADRE': 25,
            'NUMERO HIJOS NACIDOS VIVOS': 1,
            'NUMERO EMBARAZOS': 1
        }

        for col, default_val in numeric_defaults.items():
            if col in df_clean.columns and df_clean[col].isnull().any():
                df_clean[col] = df_clean[col].fillna(default_val)

        # Valores por defecto para columnas categ√≥ricas
        categorical_defaults = {
            'TIPO PARTO': 'ESPONTANEO',
            'MULTIPLICIDAD EMBARAZO': 'SIMPLE'
        }

        for col, default_val in categorical_defaults.items():
            if col in df_clean.columns and df_clean[col].isnull().any():
                df_clean[col] = df_clean[col].fillna(default_val)

        # Convertir a categ√≥ricas
        categorical_cols = ['SEXO', 'TIPO PARTO', 'MULTIPLICIDAD EMBARAZO']
        for col in categorical_cols:
            if col in df_clean.columns:
                df_clean[col] = df_clean[col].astype('category')

        # One-hot encoding
        if 'TIPO PARTO' in df_clean.columns:
            df_clean = pd.get_dummies(df_clean, columns=['TIPO PARTO'], drop_first=False)

        if 'MULTIPLICIDAD EMBARAZO' in df_clean.columns:
            df_clean = pd.get_dummies(df_clean, columns=['MULTIPLICIDAD EMBARAZO'], drop_first=False)

        if 'SEXO' in df_clean.columns:
            df_clean = pd.get_dummies(df_clean, columns=['SEXO'], drop_first=True)

        # Crear √≠ndice de masa neonatal
        if 'PESO (Gramos)' in df_clean.columns and 'TALLA (CentImetros)' in df_clean.columns:
            # Evitar divisi√≥n por cero
            df_clean['TALLA (CentImetros)'] = df_clean['TALLA (CentImetros)'].replace(0, np.nan)
            df_clean['TALLA (CentImetros)'] = df_clean['TALLA (CentImetros)'].fillna(50)

            df_clean['INDICE_MASA_NEONATAL'] = df_clean['PESO (Gramos)'] / (df_clean['TALLA (CentImetros)'] ** 2)
            df_clean['INDICE_MASA_NEONATAL'] = df_clean['INDICE_MASA_NEONATAL'].replace([np.inf, -np.inf], np.nan)
            df_clean['INDICE_MASA_NEONATAL'] = df_clean['INDICE_MASA_NEONATAL'].fillna(1.28)

        # Eliminar columnas innecesarias
        cols_to_drop = [
            'PESO (Gramos)', 'TALLA (CentImetros)', 'EDAD MADRE',
            'NUMERO HIJOS NACIDOS VIVOS', 'NUMERO EMBARAZOS'
        ]

        dummy_cols_to_drop = [
            'TIPO PARTO_INSTRUMENTADO', 'MULTIPLICIDAD EMBARAZO_DOBLE',
            'MULTIPLICIDAD EMBARAZO_SIMPLE', 'MULTIPLICIDAD EMBARAZO_TRIPLE',
            'SEXO_MASCULINO'
        ]

        all_cols_to_drop = cols_to_drop + dummy_cols_to_drop
        existing_cols_to_drop = [col for col in all_cols_to_drop if col in df_clean.columns]

        if existing_cols_to_drop:
            df_clean = df_clean.drop(columns=existing_cols_to_drop)

        # Llenar cualquier valor faltante restante
        df_clean = df_clean.fillna(0)

        # VERIFICACI√ìN FINAL - debe mantener el mismo n√∫mero de filas
        final_length = len(df_clean)
        if final_length != original_length:
            print(f"‚ö†Ô∏è  ADVERTENCIA: Cambio en n√∫mero de filas: {original_length} ‚Üí {final_length}")
        else:
            print(f"‚úÖ Filas preservadas: {original_length}")

        # Asegurar que el DataFrame tenga √≠ndices consecutivos
        df_clean = df_clean.reset_index(drop=True)

        return df_clean

    def fit_transform(self, X, y=None):
        return self.fit(X, y).transform(X)




@st.cache_resource
def cargar_modelo(path='/content/pipeline_apgar_streamlit.pkl'):
    return joblib.load(path)

pipeline = cargar_modelo()

archivo_csv = st.file_uploader("Sube un archivo CSV", type=['csv'])

if archivo_csv is not None:
    try:
        datos = pd.read_csv(archivo_csv)
        st.write("Datos cargados exitosamente:")
        st.dataframe(datos.head())

        st.subheader("Predicci√≥n de APGAR2")
        predicciones = pipeline.predict(datos)
        datos['APGAR2_PREDICTED'] = predicciones

        st.write("Resultados:")
        st.dataframe(datos[['APGAR2_PREDICTED']].head())

        st.download_button(
            label="Descargar resultados",
            data=datos.to_csv(index=False).encode('utf-8'),
            file_name="predicciones_apgar2.csv",
            mime='text/csv'
        )
    except Exception as e:
        st.error(f"Error al procesar el archivo: {e}")


Overwriting app.py


In [110]:
#Correr la app en background, recuerda cargar el archivo app.py
!nohup streamlit run app.py &

nohup: appending output to 'nohup.out'


In [111]:
!npm install localtunnel

[1G[0K‚†ô[1G[0K‚†π[1G[0K‚†∏[1G[0K‚†º[1G[0K‚†¥[1G[0K‚†¶[1G[0K‚†ß[1G[0K
up to date, audited 23 packages in 1s
[1G[0K‚†ß[1G[0K
[1G[0K‚†ß[1G[0K3 packages are looking for funding
[1G[0K‚†ß[1G[0K  run `npm fund` for details
[1G[0K‚†ß[1G[0K
2 [31m[1mhigh[22m[39m severity vulnerabilities

To address all issues (including breaking changes), run:
  npm audit fix --force

Run `npm audit` for details.
[1G[0K‚†ß[1G[0K

In [112]:
#La IP de salida es la clave que el local tunel necesita para ejecutar
import urllib.request

print("Password/Enpoint IP for localtunnel is:",urllib.request.urlopen('https://ipv4.icanhazip.com').read().decode('utf8').strip("\n"))

Password/Enpoint IP for localtunnel is: 34.125.69.78


In [113]:
#Se crea un t√∫nel hacia un servidor local que se est√° ejecutando en el puerto 8501.
!npx localtunnel --port 8501

[1G[0K‚†ô[1G[0Kyour url is: https://neat-bottles-boil.loca.lt
^C
