In [None]:
#  IMPORTAR DATASET + AGREGAR ALTURA (msnm)

from google.colab import drive
import pandas as pd

# Montar Google Drive
drive.mount('/content/drive')

# Definir ruta de entrada y salida
ruta_entrada = "/content/drive/MyDrive/Datasets_Limpios/MICE.xlsx"
ruta_salida  = "/content/drive/MyDrive/Datasets_Limpios/MICE_con_altura.xlsx"

# Cargar el dataset
df = pd.read_excel(ruta_entrada)
print(f"Archivo cargado con {len(df)} filas y {len(df.columns)} columnas.")

# Diccionario de alturas (msnm) por estación
altura_por_estacion = {
    "SURESTE": 500,
    "NORESTE": 474,
    "CENTRO": 562,
    "NOROESTE": 568,
    "SUROESTE": 674,
    "NOROESTE2": 702,
    "NORTE": 503,
    "NORESTE2": 432,
    "SURESTE2": 387,
    "SUROESTE2": 636,
    "SURESTE3": 334,
    "SUR": 555,
    "NORTE2": 520,
    "NORESTE3": 346,
    "NOROESTE3": 607,
}

# Configuración de columnas
col_estacion = "__hoja"
col_altura   = "altura_msnm"

# Crear columna si no existe
if col_altura not in df.columns:
    df[col_altura] = pd.NA

# Rellenar solo donde falte y la estación exista en el diccionario
mask_faltante = df[col_altura].isna()
mask_valida   = df[col_estacion].isin(altura_por_estacion.keys())
df.loc[mask_faltante & mask_valida, col_altura] = (
    df.loc[mask_faltante & mask_valida, col_estacion].map(altura_por_estacion)
)

# Validaciones
estaciones_df  = set(df[col_estacion].dropna().unique())
estaciones_map = set(altura_por_estacion.keys())
faltan_en_mapa = sorted(estaciones_df - estaciones_map)
sobran_en_mapa = sorted(estaciones_map - estaciones_df)

print("\n Estaciones en el dataset sin altura definida en el mapeo:", faltan_en_mapa)
print(" Estaciones del mapeo que ya no están en el dataset:", sobran_en_mapa)

# resumen
print("\nResumen por estación:\n")
print(df[[col_estacion, col_altura]].drop_duplicates().sort_values(col_estacion))

# Guardar
df.to_excel(ruta_salida, index=False)
print(f"\n Archivo guardado en: {ruta_salida}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Archivo cargado con 190685 filas y 17 columnas.

 Estaciones en el dataset sin altura definida en el mapeo: []
 Estaciones del mapeo que ya no están en el dataset: ['NORESTE3', 'NOROESTE2', 'NOROESTE3', 'SURESTE2', 'SURESTE3']

Resumen por estación:

           __hoja altura_msnm
27740      CENTRO         562
13870     NORESTE         474
83220    NORESTE2         432
41610    NOROESTE         568
69350       NORTE         503
124830     NORTE2         520
110960        SUR         555
0         SURESTE         500
55480    SUROESTE         674
97090   SUROESTE2         636

 Archivo guardado en: /content/drive/MyDrive/Datasets_Limpios/MICE_con_altura.xlsx
