# An√°lisis de Datos Meteorol√≥gicos
Por Sergio Rasillo Flores

## Creaci√≥n del dataset

In [3]:
import numpy as np

np.random.seed(42)
n_estaciones, n_dias, n_horas, n_vars = 5, 30, 24, 6
datos = np.zeros((n_estaciones, n_dias, n_horas, n_vars))

# Temperatura base por estaci√≥n + variaci√≥n diaria + ruido
temp_base = np.array([8, 12, 14, 10, 6]).reshape(5, 1, 1)
hora = np.arange(24).reshape(1, 1, 24)
variacion_diaria = 5 * np.sin((hora - 6) * np.pi / 12)
datos[:, :, :, 0] = temp_base + variacion_diaria + np.random.normal(0, 2, (5, 30, 24))

# Resto de variables (humedad, presi√≥n, viento, precipitaci√≥n, radiaci√≥n)
datos[:, :, :, 1] = np.clip(
    70 - datos[:, :, :, 0] + np.random.normal(0, 10, (5, 30, 24)), 30, 100
)
datos[:, :, :, 2] = 1013 + np.random.normal(0, 5, (5, 30, 24))
datos[:, :, :, 3] = np.abs(np.random.normal(15, 10, (5, 30, 24)))
datos[:, :, :, 4] = np.maximum(0, np.random.exponential(2, (5, 30, 24)))
radiacion_base = np.maximum(0, 400 * np.sin((hora - 6) * np.pi / 12))
datos[:, :, :, 5] = np.clip(
    radiacion_base + np.random.normal(0, 50, (5, 30, 24)), 0, 800
)

# Guardar en carpeta data/
np.save('datos-meteo/datos_meteorologicos.npy', datos)
print(f"Datos guardados: {datos.shape}")

Datos guardados: (5, 30, 24, 6)


## Bloque 1: Exploraci√≥n y acceso a datos

In [None]:
import numpy as np

# Cargar datos: shape (5, 30, 24, 6) ‚Üí (estaciones, d√≠as, horas, variables)
datos = np.load('datos-meteo/datos_meteorologicos.npy')

# Ejercicio 01. Verificaci√≥n de estructura
# shape: dimensiones, size: total elementos, dtype: tipo de dato
print(f"La forma del array datos es {datos.shape}, el numero total de mediciones es de {datos.size} y su tipo es {datos.dtype}")

# Ejercicio 02. Extracci√≥n de series temporales
# Indexaci√≥n: estaci√≥n 0 (Madrid), d√≠a 15, todas las horas, variable 0 (temperatura)
temperaturas_madrid_dia_15 = datos[0, 15, :, 0]
print(f"Temperaturas de Madrid el dia 15(tama√±o {temperaturas_madrid_dia_15.size}):\n {temperaturas_madrid_dia_15}")

# Ejercicio 03. Comparativa entre estaciones
# Indexaci√≥n: todas las estaciones, d√≠a 20, hora 12, temperatura
temperaturas_todas_estaciones_12_dia_20 = datos[:, 20, 12, 0]
print(f"La temperatura de todas las estaciones el dia 20 a las 12:00(tama√±o {temperaturas_todas_estaciones_12_dia_20.size}):\n {temperaturas_todas_estaciones_12_dia_20}")

# Ejercicio 04. Bloque de datos
# Indexaci√≥n: Barcelona (estaci√≥n 1), d√≠as 0-6, todas horas y variables
datos_barcelona_primera_semana = datos[1, :7, :, :]
print(f"La forma de los datos de Barcelona durante la primera semana es de {datos_barcelona_primera_semana.shape}")

La forma del array datos es (5, 30, 24, 6), el numero total de mediciones es de 21600 y su tipo es float64
Temperaturas de Madrid el dia 15(tama√±o 24):
 [ 4.03869303  6.23584869  3.45235268  5.26788954  6.88028798  5.90346383
  8.44818496  9.31928003 10.6953522   9.98951434 12.37914737 13.82562571
 15.90228722 14.74817078 16.63649193 10.00083878 12.24464127  9.66077924
 12.37960587  5.0893082   3.82055632  3.2656808  -0.57791847  2.11886083]
La temperatura de todas las estaciones el dia 20 a las 12:00(tama√±o 5):
 [13.15473662 15.56318547 18.06937909 16.02158418 13.9018551 ]
La forma de los datos de Barcelona durante la primera semana es de (7, 24, 6)


## Bloque 2: Estad√≠stica descritiva

In [None]:
# Ejercicio 05. Temperatura media por estaci√≥n
# mean(axis=(1,2)): promedia sobre d√≠as y horas, deja solo estaciones
temperatura_media_por_estacion_mes = datos[:, :, :, 0].mean(axis=(1, 2))
estacion_mas_calida = np.argmax(temperatura_media_por_estacion_mes)
estacion_mas_fria = np.argmin(temperatura_media_por_estacion_mes)
print(f"La temperatura media de todo el mes para cada estaci√≥n es(tama√±o {temperatura_media_por_estacion_mes.size}):\n {temperatura_media_por_estacion_mes}")
# Nombres correctos seg√∫n el enunciado
nombres_estaciones = ['Madrid', 'Barcelona', 'Sevilla', 'Bilbao', 'Granada']
print(f"La estaci√≥n m√°s c√°lida es {nombres_estaciones[estacion_mas_calida]} y la m√°s fr√≠a es {nombres_estaciones[estacion_mas_fria]}")

# Ejercicio 06. Perfil horario medio
# mean(axis=(0,1)): promedia sobre estaciones y d√≠as, deja solo horas
temperatura_media_por_hora_dia = datos[:, :, :, 0].mean(axis=(0,1))
print(f"El perfil t√©rmico diario t√≠pico es(tama√±o {temperatura_media_por_hora_dia.size}):\n {temperatura_media_por_hora_dia}")

# Ejercicio 07. Variabilidad clim√°tica
# std(axis=(1,2)): desviaci√≥n est√°ndar sobre d√≠as y horas por estaci√≥n
std_temperatura_por_estacion = datos[:, :, :, 0].std(axis=(1,2))
estacion_mayor_variablidad = np.argmax(std_temperatura_por_estacion)
print(f"La desviaci√≥n estandar de cada estaci√≥n es(tama√±o {std_temperatura_por_estacion.size}):\n {std_temperatura_por_estacion}")
print(f"La estaci√≥n con mayor variablidad es la de {nombres_estaciones[estacion_mayor_variablidad]}")

# Ejercicio 08. Extremos meteorol√≥gicos
temperaturas = datos[:, :, :, 0]
# argmax/argmin: devuelve √≠ndice lineal en el array aplanado
temperatura_maxima = np.argmax(temperaturas)
temperatura_minima = np.argmin(temperaturas)
# unravel_index: convierte √≠ndice lineal a √≠ndices multidimensionales
estacion_max, dia_max, hora_max = np.unravel_index(temperatura_maxima, (5, 30, 24))
estacion_min, dia_min, hora_min = np.unravel_index(temperatura_minima, (5, 30, 24))
temp_max = temperaturas[estacion_max, dia_max, hora_max]
temp_min = temperaturas[estacion_min, dia_min, hora_min]
print(f"La temperatura m√°xima es de {temp_max:.2f} y fu√© en la estaci√≥n {nombres_estaciones[estacion_max]}, el d√≠a {dia_max} a las {hora_max}")
print(f"La temperatura m√≠nima es de {temp_min:.2f} y fu√© en la estaci√≥n {nombres_estaciones[estacion_min]}, el d√≠a {dia_min} a las {hora_min}")

La temperatura media de todo el mes para cada estaci√≥n es(tama√±o 5):
 [ 7.97979927 12.17957761 14.05481385 10.05142752  6.00037658]
La estaci√≥n m√°s c√°lida es Valencia y la m√°s fr√≠a es Bilbao
El perfil t√©rmico diario t√≠pico es(tama√±o 24):
 [ 5.03030346  5.15957045  5.47876169  6.51047736  7.64368656  9.00376843
 10.22693188 11.22172575 12.54605061 13.54669175 14.12382854 14.95674594
 15.18853598 14.8724688  14.36788922 13.68001046 12.35216023 11.69066635
 10.17147117  8.84390555  7.55498809  6.14391655  5.63976116  5.32245924]
La desviaci√≥n estandar de cada estaci√≥n es(tama√±o 5):
 [4.1079113  4.01935776 4.11146254 4.05992189 4.09005996]
La estaci√≥n con mayor variablidad es la de Valencia
La temperatura m√°xima es de 25.11 y fu√© en la estaci√≥n Valencia, el d√≠a 21 a las 13
La temperatura m√≠nima es de -4.19 y fu√© en la estaci√≥n Bilbao, el d√≠a 23 a las 22


## Bloque 3: Filtrado y selecci√≥n condicional

In [None]:
# Ejercicio 9. Detecci√≥n de heladas
# Comparaci√≥n booleana: crea m√°scara True/False, sum cuenta los True
temperaturas_inferiores_a_0 = np.sum(temperaturas < 0)
porcentaje_del_total_temps_inf = temperaturas_inferiores_a_0 / temperaturas.size * 100
print(f"Ha habido un total de {temperaturas_inferiores_a_0} heladas y el porcentaje total de mediciones inferiores a 0 es de {porcentaje_del_total_temps_inf:.2f}%")

# Ejercicio 10. D√≠as de lluvia significativa
# sum(axis=2): acumula precipitaci√≥n de las 24 horas por d√≠a
precip_diaria = datos[:, :, :, 4].sum(axis=2)
# np.where: devuelve √≠ndices donde la condici√≥n es True
estaciones_supera_prec, dias_supera_prec = np.where(precip_diaria > 10)
for est, dia in zip(estaciones_supera_prec, dias_supera_prec):
    print(f"El d√≠a {dia}, la estaci√≥n {nombres_estaciones[est]} super√≥ los 10 mm de precipitaci√≥n")

# Ejercicio 11. Condiciones de confort
# Operador &: combina m√∫ltiples condiciones booleanas elemento a elemento
condiciones_confort = np.sum((datos[:, :, :, 0] >= 18) & 
                              (datos[:, :, :, 0] <= 24) & 
                              (datos[:, :, :, 1] >= 40) & 
                              (datos[:, :, :, 1] <= 60) & 
                              (datos[:, :, :, 3] < 20))
porcentaje_mediciones_cumpliendo_condiciones = (condiciones_confort / datos[:, :, :, 0].size) * 100
print(f"El porcentaje de mediciones que cumplen las condiciones de confort es de {porcentaje_mediciones_cumpliendo_condiciones:.2f}%")

Ha habido un total de 62 heladas y el porcentaje total de mediciones inferiores a 0 es de 1.72%
El d√≠a 0, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 1, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 2, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 3, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 4, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 5, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 6, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 7, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 8, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 9, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 10, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 11, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 12, la estaci√≥n Madrid super√≥ los 10 mm de precipitaci√≥n
El d√≠a 13, la estaci√≥n Madri

## Bloque 4: Operaciones avanzadas

In [None]:
# Ejercicio 12. Normalizaci√≥n de datos
# keepdims=True: mantiene dimensiones (1,1,1,6) para broadcasting correcto
min = datos.min(axis=(0, 1, 2), keepdims=True)
max = datos.max(axis=(0, 1, 2), keepdims=True)
# Normalizaci√≥n min-max: escala cada variable independientemente al rango [0,1]
x_norm = (datos - min) / (max - min)
print(f"Datos normalizados con forma {x_norm.shape}")

# Ejercicio 13. Anomal√≠as t√©rmicas
# reshape(5,1,1): prepara para broadcasting con shape (5,30,24)
temperaturas_medias_por_estacion_re = np.reshape(temperatura_media_por_estacion_mes, (5, 1, 1))
# Resta media de cada estaci√≥n a todas sus mediciones
anomalias_termicas = temperaturas - temperaturas_medias_por_estacion_re

mayor_anomalia_positiva = np.max(anomalias_termicas)
print(f"La mayor anomalia positiva es la de {mayor_anomalia_positiva:.2f}¬∞C")

# Ejercicio 14. Correlaci√≥n temperatura-humedad
# reshape(-1, 6): aplana a 2D con todas mediciones como filas, variables como columnas
datos_planos = datos.reshape(-1, 6)
# rowvar=False: cada columna es una variable
correlacion_temp_humedad = np.corrcoef(datos_planos, rowvar=False)
# [0,1]: correlaci√≥n entre temperatura (√≠ndice 0) y humedad (√≠ndice 1)
print(f"La correlaci√≥n entre la temperatura y la humedad es de {correlacion_temp_humedad[0, 1]:.2f} por lo que tiene sentido f√≠sico")

# Ejercicio 15. Potencial de energ√≠a solar
radiaciones = datos[:, :, :, 5]
# sum(axis=2): acumula radiaci√≥n de 24 horas por d√≠a
radiacion_diaria = radiaciones.sum(axis=2)
radiacion_total_est = radiacion_diaria.sum(axis=1)
estacion_mayor_potencial_solar = np.argmax(radiacion_total_est)
print(f"La estaci√≥n con mayor potencial solar es {nombres_estaciones[estacion_mayor_potencial_solar]}")

radiacion_media_diaria = radiacion_diaria.mean(axis=1)
# argsort: devuelve √≠ndices ordenados, [::-1] invierte para orden descendente
ranking_indices = np.argsort(radiacion_media_diaria)[::-1]

print("\nRanking de estaciones por energ√≠a solar media diaria:")
for i, idx in enumerate(ranking_indices, 1):
    print(f"{i}. {nombres_estaciones[idx]}: {radiacion_media_diaria[idx]:.2f} W/m¬≤")

Datos normalizados con forma (5, 30, 24, 6)
La mayor anomalia positiva es la de 11.39¬∞C
La correlaci√≥n entre la temperatura y la humedad es de -0.44 por lo que tiene sentido f√≠sico
La estaci√≥n con mayor potencial solar es Madrid

Ranking de estaciones por energ√≠a solar media diaria:
1. Madrid: 3333.65 W/m¬≤
2. Valencia: 3305.53 W/m¬≤
3. Barcelona: 3305.02 W/m¬≤
4. Sevilla: 3291.87 W/m¬≤
5. Bilbao: 3279.58 W/m¬≤


## Bloque 5: Ejercicio integrador

In [None]:
# Ejercicio 16
def informe_meteorologico(datos):
    """
    Genera informe meteorol√≥gico para cada estaci√≥n.
    
    Args:
        datos: array shape (5, 30, 24, 6) - (estaciones, d√≠as, horas, variables)
    
    Returns:
        dict con m√©tricas por estaci√≥n
    """
    estaciones = ['Madrid-Retiro', 'Barcelona-El Prat', 'Sevilla-Aeropuerto', 
                  'Bilbao-Sondica', 'Granada-Base A√©rea']
    
    # Temperatura
    temperatura = datos[:, :, :, 0]
    temperatura_media = temperatura.mean(axis=(1,2))
    temperatura_minima = temperatura.min(axis=(1,2))
    temperatura_maxima = temperatura.max(axis=(1,2))
    
    # Amplitud t√©rmica media diaria: max diario - min diario, luego promediar
    temperatura_minima_diaria = temperatura.min(axis=2)
    temperatura_maxima_diaria = temperatura.max(axis=2)
    amplitud_media = (temperatura_maxima_diaria - temperatura_minima_diaria).mean(axis=1)

    # Precipitaci√≥n
    precipitacion = datos[:, :, :, 4]
    precipitacion_total_acumulada = precipitacion.sum(axis=(1,2))
    precipitacion_diaria = precipitacion.sum(axis=2) 
    dias_lluvia = (precipitacion_diaria > 1).sum(axis=1)

    # Viento
    viento = datos[:, :, :, 3]
    viento_medio = viento.mean(axis=(1,2))
    viento_fuerte = (viento > 40).sum(axis=(1,2))
    horas_totales = viento.shape[1] * viento.shape[2]
    porcentaje_vientos_fuertes = (viento_fuerte / horas_totales) * 100

    # Radiacion
    radiacion = datos[:, :, :, 5]
    radiacion_total_mes = radiacion.sum(axis=(1,2))

    # Construcci√≥n del informe por estaci√≥n
    informe = {}
    for i, estacion in enumerate(estaciones):
        informe[estacion] = {
            'temperatura': {
                'media': temperatura_media[i],
                'minima': temperatura_minima[i],
                'maxima': temperatura_maxima[i],
                'amplitud_termica_media_diaria': amplitud_media[i]
            },
            'precipitacion': {
                'total_acumulada_mm': precipitacion_total_acumulada[i],
                'dias_con_lluvia': int(dias_lluvia[i])
            },
            'viento': {
                'velocidad_media_kmh': viento_medio[i],
                'porcentaje_viento_fuerte': porcentaje_vientos_fuertes[i]
            },
            'radiacion': {
                'energia_total_Wh_m2': radiacion_total_mes[i]
            }
        }
    
    return informe

informe = informe_meteorologico(datos=datos)

# Visualizaci√≥n formateada
print("\n" + "="*70)
print("INFORME METEOROL√ìGICO - ENERO 2026")
print("="*70)

for estacion, metricas in informe.items():
    print(f"\n{'‚îÄ'*70}")
    print(f"üìç {estacion.upper()}")
    print(f"{'‚îÄ'*70}")
    
    print("\nüå°Ô∏è  TEMPERATURA:")
    print(f"   Media mensual:           {metricas['temperatura']['media']:.2f}¬∞C")
    print(f"   M√≠nima registrada:       {metricas['temperatura']['minima']:.2f}¬∞C")
    print(f"   M√°xima registrada:       {metricas['temperatura']['maxima']:.2f}¬∞C")
    print(f"   Amplitud t√©rmica diaria: {metricas['temperatura']['amplitud_termica_media_diaria']:.2f}¬∞C")
    
    print("\nüåßÔ∏è  PRECIPITACI√ìN:")
    print(f"   Total acumulada:         {metricas['precipitacion']['total_acumulada_mm']:.2f} mm")
    print(f"   D√≠as con lluvia (>1mm):  {metricas['precipitacion']['dias_con_lluvia']} d√≠as")
    
    print("\nüí® VIENTO:")
    print(f"   Velocidad media:         {metricas['viento']['velocidad_media_kmh']:.2f} km/h")
    print(f"   Horas con viento fuerte: {metricas['viento']['porcentaje_viento_fuerte']:.2f}%")
    
    print("\n‚òÄÔ∏è  RADIACI√ìN SOLAR:")
    print(f"   Energ√≠a total mensual:   {metricas['radiacion']['energia_total_Wh_m2']:.2f} Wh/m¬≤")

print("\n" + "="*70 + "\n")


INFORME METEOROL√ìGICO - ENERO 2026

‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ
üìç MADRID-RETIRO
‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ

üå°Ô∏è  TEMPERATURA:
   Media mensual:           7.98¬∞C
   M√≠nima registrada:       -2.81¬∞C
   M√°xima registrada:       18.27¬∞C
   Amplitud t√©rmica diaria: 14.81¬∞C

üåßÔ∏è  PRECIPITACI√ìN:
   Total acumulada:         1536.97 mm
   D√≠as con lluvia (>1mm):  30 d√≠as

üí® VIENTO:
   Velocidad media:         15.22 km/h
   Horas con viento fuerte: 0.42%

‚òÄÔ∏è  RADIACI√ìN SOLAR:
   Energ√≠a total mensual:   100009.54 Wh/m¬≤

‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ