In [4]:
import pandas as pd
import joblib

# --- 1. CONFIGURACIÓN ---
archivo_modelo = 'modelo_pm25_predictor_cdmx.pkl'
archivo_datos_nuevos = 'datos_realtime_Centro_CDMX.csv'
archivo_salida_prediccion = 'prediccion_cdmx.csv'

try:
    # --- 2. CARGAR EL MODELO Y LOS DATOS NUEVOS ---
    print("Cargando el modelo entrenado y los nuevos datos...")
    modelo = joblib.load(archivo_modelo)
    datos_nuevos = pd.read_csv(archivo_datos_nuevos)
    datos_nuevos['timestamp'] = pd.to_datetime(datos_nuevos['timestamp'])

    # --- 3. PREPARAR LA FILA PARA EL MODELO ---
    print("\n--- PASO DE DEPURACIÓN ---")
    columnas_del_modelo = modelo.feature_name_
    
    # --- LA CORRECCIÓN ESTÁ AQUÍ ---
    # Simplemente imprimimos la lista directamente, sin .tolist()
    print(f"El modelo espera estas {len(columnas_del_modelo)} columnas:\n{columnas_del_modelo}")
    
    ultima_fila_completa = datos_nuevos.tail(1)
    hora_actual = ultima_fila_completa['timestamp'].iloc[0]
    pm25_actual = ultima_fila_completa['pm25'].iloc[0]

    fila_para_predecir = ultima_fila_completa[columnas_del_modelo]
    print(f"\nLa 'fila_para_predecir' que se le da al modelo solo contiene estas {len(fila_para_predecir.columns)} columnas:\n{fila_para_predecir.columns.tolist()}")
    print("--------------------------\n")

    # --- 4. HACER LA PREDICCIÓN ---
    print("Realizando la predicción...")
    prediccion_valor = modelo.predict(fila_para_predecir)
    valor_final = prediccion_valor[0]

    # --- 5. PREPARAR Y GUARDAR EL RESULTADO EN CSV ---
    print("Generando el archivo CSV con el resultado...")
    
    hora_prediccion = hora_actual + pd.Timedelta(hours=24)

    resultado_df = pd.DataFrame({
        'prediction_timestamp': [hora_prediccion],
        'base_timestamp': [hora_actual],
        'city': ['Mexico City'],
        'pm25_current': [pm25_actual],
        'pm25_predicted_24h': [valor_final]
    })
    
    resultado_df.to_csv(archivo_salida_prediccion, index=False)

    print("\n-------------------------------------------")
    print(f"✔️ Predicción generada y guardada en '{archivo_salida_prediccion}'")
    print("-------------------------------------------")
    print("Contenido del archivo:")
    print(resultado_df.to_string(index=False))
    print("-------------------------------------------")

except FileNotFoundError as e:
    print(f"❌ Error: No se encontró uno de los archivos necesarios. Detalles: {e}")
except Exception as e:
    print(f"❌ Ocurrió un error inesperado: {e}")

Cargando el modelo entrenado y los nuevos datos...

--- PASO DE DEPURACIÓN ---
El modelo espera estas 23 columnas:
['temperature_2m', 'relativehumidity_2m', 'precipitation', 'pressure_msl', 'windspeed_10m', 'winddirection_10m', 'boundary_layer_height', 'shortwave_radiation_sum', 'hour_of_day', 'day_of_week', 'month_of_year', 'is_weekend', 'co', 'no', 'no2', 'nox', 'o3', 'pm25', 'so2', 'pm25_lag_3h', 'pm25_lag_6h', 'pm25_lag_12h', 'pm25_lag_24h']

La 'fila_para_predecir' que se le da al modelo solo contiene estas 23 columnas:
['temperature_2m', 'relativehumidity_2m', 'precipitation', 'pressure_msl', 'windspeed_10m', 'winddirection_10m', 'boundary_layer_height', 'shortwave_radiation_sum', 'hour_of_day', 'day_of_week', 'month_of_year', 'is_weekend', 'co', 'no', 'no2', 'nox', 'o3', 'pm25', 'so2', 'pm25_lag_3h', 'pm25_lag_6h', 'pm25_lag_12h', 'pm25_lag_24h']
--------------------------

Realizando la predicción...
Generando el archivo CSV con el resultado...

--------------------------------

In [6]:
import pandas as pd
import joblib

# --- 1. CONFIGURACIÓN ---
archivo_modelo = 'modelo_pm25_predictor_LA.pkl'
archivo_datos_nuevos = 'datos_realtime_Centro_LA.csv'
archivo_salida_prediccion = 'prediccion_LA.csv'

try:
    # --- 2. CARGAR EL MODELO Y LOS DATOS NUEVOS ---
    print("Cargando el modelo entrenado y los nuevos datos...")
    modelo = joblib.load(archivo_modelo)
    datos_nuevos = pd.read_csv(archivo_datos_nuevos)
    datos_nuevos['timestamp'] = pd.to_datetime(datos_nuevos['timestamp'])

    # --- 3. PREPARAR LA FILA PARA EL MODELO ---
    print("\n--- PASO DE DEPURACIÓN ---")
    columnas_del_modelo = modelo.feature_name_
    
    # --- LA CORRECCIÓN ESTÁ AQUÍ ---
    # Simplemente imprimimos la lista directamente, sin .tolist()
    print(f"El modelo espera estas {len(columnas_del_modelo)} columnas:\n{columnas_del_modelo}")
    
    ultima_fila_completa = datos_nuevos.tail(1)
    hora_actual = ultima_fila_completa['timestamp'].iloc[0]
    pm25_actual = ultima_fila_completa['pm25'].iloc[0]

    fila_para_predecir = ultima_fila_completa[columnas_del_modelo]
    print(f"\nLa 'fila_para_predecir' que se le da al modelo solo contiene estas {len(fila_para_predecir.columns)} columnas:\n{fila_para_predecir.columns.tolist()}")
    print("--------------------------\n")

    # --- 4. HACER LA PREDICCIÓN ---
    print("Realizando la predicción...")
    prediccion_valor = modelo.predict(fila_para_predecir)
    valor_final = prediccion_valor[0]

    # --- 5. PREPARAR Y GUARDAR EL RESULTADO EN CSV ---
    print("Generando el archivo CSV con el resultado...")
    
    hora_prediccion = hora_actual + pd.Timedelta(hours=24)

    resultado_df = pd.DataFrame({
        'prediction_timestamp': [hora_prediccion],
        'base_timestamp': [hora_actual],
        'city': ['Mexico City'],
        'pm25_current': [pm25_actual],
        'pm25_predicted_24h': [valor_final]
    })
    
    resultado_df.to_csv(archivo_salida_prediccion, index=False)

    print("\n-------------------------------------------")
    print(f"✔️ Predicción generada y guardada en '{archivo_salida_prediccion}'")
    print("-------------------------------------------")
    print("Contenido del archivo:")
    print(resultado_df.to_string(index=False))
    print("-------------------------------------------")

except FileNotFoundError as e:
    print(f"❌ Error: No se encontró uno de los archivos necesarios. Detalles: {e}")
except Exception as e:
    print(f"❌ Ocurrió un error inesperado: {e}")

Cargando el modelo entrenado y los nuevos datos...

--- PASO DE DEPURACIÓN ---
El modelo espera estas 23 columnas:
['temperature_2m', 'relativehumidity_2m', 'precipitation', 'pressure_msl', 'windspeed_10m', 'winddirection_10m', 'boundary_layer_height', 'shortwave_radiation_sum', 'hour_of_day', 'day_of_week', 'month_of_year', 'is_weekend', 'co', 'no', 'no2', 'nox', 'o3', 'pm25', 'so2', 'pm25_lag_3h', 'pm25_lag_6h', 'pm25_lag_12h', 'pm25_lag_24h']

La 'fila_para_predecir' que se le da al modelo solo contiene estas 23 columnas:
['temperature_2m', 'relativehumidity_2m', 'precipitation', 'pressure_msl', 'windspeed_10m', 'winddirection_10m', 'boundary_layer_height', 'shortwave_radiation_sum', 'hour_of_day', 'day_of_week', 'month_of_year', 'is_weekend', 'co', 'no', 'no2', 'nox', 'o3', 'pm25', 'so2', 'pm25_lag_3h', 'pm25_lag_6h', 'pm25_lag_12h', 'pm25_lag_24h']
--------------------------

Realizando la predicción...
Generando el archivo CSV con el resultado...

--------------------------------