In [1]:
import pandas as pd
import numpy as np
import os
from datetime import datetime

# Cargar archivo
ruta_csv = "../datos_crudos/PuertoLimon-cr.csv"
df = pd.read_csv(ruta_csv)

# Renombrar columnas
df.rename(columns={
    "date": "Date", "tmax": "Tmax", "tmin": "Tmin", "tavg": "Tavg",
    "prcp": "Prcp", "wspd": "Wspd", "wdir": "Wdir"
}, inplace=True)

# Convertir columnas numéricas y limitar decimales
for col in ["Tmax", "Tmin", "Tavg", "Prcp", "Wspd"]:
    df[col] = pd.to_numeric(df[col], errors='coerce')
    df[col].fillna(df[col].mean(), inplace=True)
    df[col] = df[col].round(1)

# Convertir fecha
df["Date"] = pd.to_datetime(df["Date"]).dt.date

# Convertir Wspd a km/h
df["Wspd"] = (df["Wspd"] * 3.6).round(1)

# Asignar dirección del viento: siempre "Norte"
df["Wdir"] = "Norte"

# Agregar columnas fijas
df["Estacion"] = "Puerto Limón"
df["Provincia"] = "Limón"
df["Pais"] = "Costa Rica"

# Eliminar columnas irrelevantes si existen
df.drop(columns=["snow", "wpgt", "pres", "tsun"], inplace=True, errors='ignore')

# Reordenar columnas
df = df[["Date", "Tmax", "Tmin", "Tavg", "Prcp", "Wspd", "Wdir", "Estacion", "Provincia", "Pais"]]

# Guardar
salida = "../datos_limpios/datos_limpios_puerto_limon_2024.csv"
os.makedirs(os.path.dirname(salida), exist_ok=True)
df.to_csv(salida, index=False, encoding="utf-8")

print(f"✅ Archivo limpio con dirección del viento guardado en: {salida}")


✅ Archivo limpio con dirección del viento guardado en: ../datos_limpios/datos_limpios_puerto_limon_2024.csv


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df[col].fillna(df[col].mean(), inplace=True)
