# 📊 Tutorial de Análisis de Datos Meteorológicos con Pandas y Matplotlib
Este notebook utiliza datos meteorológicos simulados de varias estaciones de la provincia de Castellón durante un año completo.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Cargar el archivo Excel
df = pd.read_csv('datos_meteorologicos_castellon.csv', sep=';', decimal=',')

# Mostrar unas primeras filas para chequear si está bien la exportación según lo previsto
df.head()


In [35]:
# Asegurar que la columna 'Fecha' es datetime, porque sino no reconoce el orden de
df['Fecha'] = pd.to_datetime(df['Fecha'])

# Agrupar por fecha, promedio entre estaciones
df_grouped = df.groupby('Fecha').mean(numeric_only=True)
df_grouped.head()

df_benicassim = df[df['Estación'] == 'Benicàssim']
df_benicassim.head()

df_benicassim = df[df['Temp_Max'] >35 ]

df_benicassim = df_benicassim[df_benicassim['Temp_Max'] >36 ]
df_benicassim.head()


Unnamed: 0,Fecha,Estación,Temp_Max,Temp_Min,Temp_Med,Hum_Max,Hum_Min,Hum_Med,Lluvia_Max,Lluvia_Min,Lluvia_Med,Presion_Max,Presion_Min,Presion_Med,Viento_Max,Viento_Min,Viento_Med
73,2024-01-15,Segorbe,37.7,28.6,33.2,94,57,75.5,1.1,0.3,0.7,1014.1,1011.3,1012.7,22.9,11.3,17.1
78,2024-01-16,Segorbe,36.9,26.1,31.5,85,63,74.0,1.5,0.7,1.1,1018.1,1010.6,1014.4,17.4,8.7,13.0
202,2024-02-10,Villarreal,36.3,28.4,32.4,98,44,71.0,0.0,0.0,0.0,1011.1,1007.4,1009.2,14.7,7.9,11.3
246,2024-02-19,Benicàssim,38.5,27.7,33.1,87,61,74.0,0.0,0.0,0.0,1010.3,1003.4,1006.9,18.2,7.8,13.0
249,2024-02-19,Morella,39.1,32.5,35.8,93,68,80.5,0.2,0.1,0.1,1009.6,1005.2,1007.4,13.9,2.9,8.4


In [None]:
def graficar_variable(df_grouped, base_name, ylabel):
    plt.figure(figsize=(12, 6))
    plt.plot(df_grouped[f'{base_name}_Max'], label='Máximo', color='red', linestyle='--', linewidth=2, alpha=0.7, marker='o')
    plt.plot(df_grouped[f'{base_name}_Min'], label='Mínimo')
    plt.plot(df_grouped[f'{base_name}_Med'], label='Media')
    plt.title(f'{base_name.capitalize()} diaria en la provincia de Castellón')
    plt.xlabel('Fecha')
    plt.ylabel(ylabel)
    plt.legend()
    plt.grid(True)
    plt.show()


In [None]:
def graficar_variable(df_grouped, base_name, ylabel):
    plt.figure(figsize=(12, 6))
    plt.bar(df_grouped.index, df_grouped[f'{base_name}_Max'], label='Máximo', color='red', alpha=0.7)
    plt.bar(df_grouped.index, df_grouped[f'{base_name}_Min'], label='Mínimo', color='blue', alpha=0.5)
    plt.bar(df_grouped.index, df_grouped[f'{base_name}_Med'], label='Media', color='green', alpha=0.5)
    plt.title(f'{base_name.capitalize()} diaria en la provincia de Castellón (Barras)')
    plt.xlabel('Fecha')
    plt.ylabel(ylabel)
    plt.legend()
    plt.grid(True)
    plt.show()

In [None]:
graficar_variable(df_grouped, 'Temp', 'Temperatura (°C)')
graficar_variable(df_grouped, 'Hum', 'Humedad (%)')
graficar_variable(df_grouped, 'Lluvia', 'Lluvia (mm)')
graficar_variable(df_grouped, 'Presion', 'Presión (hPa)')
graficar_variable(df_grouped, 'Viento', 'Velocidad viento (km/h)')


In [None]:
variables = ['Temp', 'Hum', 'Lluvia', 'Presion', 'Viento']
tipos = ['Max', 'Min', 'Med']

# DataFrame resumen
resumen = pd.DataFrame()

for var in variables:
    for tipo in tipos:
        serie = df_grouped[f'{var}_{tipo}']
        resumen.loc[f'{var}_{tipo}', 'Media'] = serie.mean()
        resumen.loc[f'{var}_{tipo}', 'Varianza'] = serie.var()
        resumen.loc[f'{var}_{tipo}', 'Desviación Std'] = serie.std()
        resumen.loc[f'{var}_{tipo}', 'Máximo'] = serie.max()
        resumen.loc[f'{var}_{tipo}', 'Mínimo'] = serie.min()

resumen


In [None]:
def graficar_estadisticas(var):
    stats = resumen.filter(like=var, axis=0)
    stats.plot(kind='bar', figsize=(12, 6))
    plt.title(f'Estadísticas anuales para {var}')
    plt.ylabel('Valor')
    plt.grid(True)
    plt.xticks(rotation=45)
    plt.show()


In [None]:
for var in variables:
    graficar_estadisticas(var)
