In [1]:
#Check para ver si lee mi key

import os
from dotenv import load_dotenv
import requests
import pandas as pd
from io import StringIO
import time

# 1) Cargar el archivo .env
load_dotenv()

# 2) Leer la variable del entorno
API_KEY = os.getenv("AEMET_API_KEY")

# 3) Comprobar que se ha cargado
if API_KEY is None:
    print("No se ha encontrado AEMET_API_KEY. Revisa tu archivo .env")
else:
    print("✅ API key cargada correctamente. Longitud:", len(API_KEY))
    # Opcional: mostrar solo los primeros caracteres para comprobar
    print("Inicio de la key:", API_KEY[:10], "... (oculto)")



✅ API key cargada correctamente. Longitud: 292
Inicio de la key: eyJhbGciOi ... (oculto)


In [2]:
# Estación de Peñafiel (código que ves en la web: 2166Y)
STATION_ID = "2166Y"

# Endpoint /api/ de climatologías mensuales/anuales:
BASE_URL = (
    "https://opendata.aemet.es/opendata/api/"
    "valores/climatologicos/mensualesanuales/datos/"
    "anioini/{year}/aniofin/{year}/estacion/{station}"
)

print("✅ Configuración lista para estación", STATION_ID)


✅ Configuración lista para estación 2166Y


In [3]:
# evitar errores de tiempos de espera

def get_with_retry(url, *, headers=None, params=None, max_retries=5, base_wait=5, label=""):
    """
    Hace una petición GET con reintentos si recibe 429 Too Many Requests.
    - max_retries: nº máximo de intentos.
    - base_wait: segundos base de espera (se multiplica por el nº de intento).
    """
    for attempt in range(1, max_retries + 1):
        try:
            resp = requests.get(url, headers=headers, params=params, timeout=30)
        except Exception as e:
            print(f"[{label}] ❌ Error en intento {attempt}: {e}")
            # si es un error de conexión raro, esperamos un poco y reintentamos
            time.sleep(base_wait * attempt)
            continue

        # Si es 429 Too Many Requests → esperamos y reintentamos
        if resp.status_code == 429:
            wait = base_wait * attempt
            print(f"[{label}] ⚠️ 429 Too Many Requests. Esperando {wait} segundos antes de reintentar...")
            time.sleep(wait)
            continue

        # Para cualquier otro código, si es error >400 lanza excepción:
        try:
            resp.raise_for_status()
            return resp  # éxito
        except requests.exceptions.HTTPError as e:
            print(f"[{label}] ❌ HTTPError (código {resp.status_code}): {e}")
            return None

    print(f"[{label}] ❌ Se alcanzó el nº máximo de reintentos ({max_retries})")
    return None


In [4]:
# Crea función para descargar datos ajustado con control de errores

def get_aemet_year(year):
    """
    Descarga climatologías mensuales/anuales de AEMET para un año y la estación 2166Y.
    Usa la API con reintentos automáticos si recibe 429 Too Many Requests.
    """

    # 1. Construir la URL del endpoint API
    url_api = BASE_URL.format(year=year, station=STATION_ID)

    # 2. Llamar al endpoint /api/... con tu key (con reintentos)
    headers = {"api_key": API_KEY}
    resp = get_with_retry(
        url_api,
        headers=headers,
        params=None,
        max_retries=5,
        base_wait=5,  # puedes bajar o subir esto
        label=f"API {year}"
    )

    if resp is None:
        print(f"[{year}] ❌ No se pudo obtener respuesta válida del endpoint API.")
        return pd.DataFrame()

    info = resp.json()
    estado = info.get("estado")
    desc = info.get("descripcion")

    if estado != 200:
        print(f"[{year}] ❌ Error de API: estado={estado}, descripcion={desc}")
        return pd.DataFrame()

    data_url = info["datos"]  # URL sh/... fresca

    # 3. Descargar los datos desde 'datos' (también con reintentos)
    r_data = get_with_retry(
        data_url,
        headers=None,
        params=None,
        max_retries=5,
        base_wait=5,
        label=f"DATOS {year}"
    )

    if r_data is None:
        print(f"[{year}] ❌ No se pudo descargar la URL de datos.")
        return pd.DataFrame()

    # 4. Intentar primero JSON (detecta 'datos expirados' o datos en JSON)
    try:
        data_json = r_data.json()

        # Caso dict con estado=404 → datos expirados
        if isinstance(data_json, dict) and data_json.get("estado") == 404:
            print(f"[{year}] ⚠️ 'datos expirados' en la URL de datos. Prueba en otro momento.")
            return pd.DataFrame()

        # Caso lista de dicts → datos en JSON
        if isinstance(data_json, list):
            df = pd.DataFrame(data_json)
            df["year"] = year
            print(f"[{year}] ✅ OK JSON con {len(df)} filas")
            return df

    except ValueError:
        # No era JSON → intentamos CSV
        pass

    # 5. Intentar CSV
    try:
        csv_buf = StringIO(r_data.text)
        df = pd.read_csv(csv_buf, sep=";")
        df["year"] = year
        print(f"[{year}] ✅ OK CSV con {len(df)} filas")
        return df
    except Exception as e:
        print(f"[{year}] ❌ Error leyendo CSV: {e}")
        return pd.DataFrame()


In [5]:
# Creamos bucle
# De 2003 a 2024 inclusive
years = list(range(2003, 2025))
dfs = []

for y in years:
    df_y = get_aemet_year(y)
    if not df_y.empty:
        dfs.append(df_y)
    else:
        print(f"[{y}] ⚠️ Sin datos válidos, no se añade al total.")

    # Pausa pequeña entre años para no saturar la API
    time.sleep(5)

if dfs:
    df_aemet = pd.concat(dfs, ignore_index=True, sort=False)
    print(f"\n✅ Concatenación completa: {len(df_aemet)} filas en total.")
else:
    df_aemet = pd.DataFrame()
    print("❌ No se han obtenido datos para ningún año.")

df_aemet.head()



[API 2003] ⚠️ 429 Too Many Requests. Esperando 5 segundos antes de reintentar...
[2003] ✅ OK JSON con 13 filas
[2004] ✅ OK JSON con 13 filas
[2005] ✅ OK JSON con 13 filas
[2006] ✅ OK JSON con 13 filas
[2007] ✅ OK JSON con 13 filas
[2008] ✅ OK JSON con 13 filas
[2009] ✅ OK JSON con 13 filas
[2010] ✅ OK JSON con 13 filas
[2011] ✅ OK JSON con 13 filas
[2012] ✅ OK JSON con 13 filas
[2013] ✅ OK JSON con 13 filas
[2014] ✅ OK JSON con 13 filas
[2015] ✅ OK JSON con 13 filas
[2016] ✅ OK JSON con 13 filas
[2017] ✅ OK JSON con 13 filas
[2018] ✅ OK JSON con 13 filas
[2019] ✅ OK JSON con 13 filas
[2020] ✅ OK JSON con 13 filas
[2021] ✅ OK JSON con 13 filas
[2022] ✅ OK JSON con 13 filas
[2023] ✅ OK JSON con 13 filas
[2024] ✅ OK JSON con 13 filas

✅ Concatenación completa: 286 filas en total.


Unnamed: 0,indicativo,fecha,p_max,np_100,np_001,np_300,p_mes,np_010,tm_min,ta_max,...,nt_00,ti_max,tm_mes,tm_max,year,e,hr,n_cub,n_des,n_nub
0,2166Y,2003-1,,,,,,,,,...,,,,,2003,,,,,
1,2166Y,2003-7,5.0(15),0.0,6.0,0.0,11.0,3.0,,,...,,,,,2003,,,,,
2,2166Y,2003-8,8.6(27),0.0,10.0,0.0,27.2,6.0,,,...,,,,,2003,,,,,
3,2166Y,2003-11,11.6(23),1.0,15.0,0.0,48.8,8.0,,,...,,,,,2003,,,,,
4,2166Y,2003-5,6.8(31),0.0,7.0,0.0,26.2,6.0,,,...,,,,,2003,,,,,


In [6]:
# Exportar a CSV
df_aemet.to_csv("aemet_vino_raw.csv", index=False)

In [7]:
#Mostrar todas las columnas del dataframe
pd.set_option('display.max_columns', None)
print(df_aemet.columns)

Index(['indicativo', 'fecha', 'p_max', 'np_100', 'np_001', 'np_300', 'p_mes',
       'np_010', 'tm_min', 'ta_max', 'ts_min', 'nt_30', 'ta_min', 'nt_00',
       'ti_max', 'tm_mes', 'tm_max', 'year', 'e', 'hr', 'n_cub', 'n_des',
       'n_nub'],
      dtype='object')


In [8]:
# copy para no perder columnas originales
df_aemet_clean = df_aemet.copy()


In [9]:
# Data cleaning: nos quedamos con las columnas que nos interesan y las renombramos
# columnas de interés: indicativo, fecha, p_mes, nt_30, nt_00, tm_mes, year, hr
df_aemet_clean = df_aemet.rename(columns={"indicativo": "estacion", "fecha": "fecha_mes", "p_mes": "precipitacion_total_mensual", 
                          "nt_30": "num_dias_temp_mayor30", "nt_00": "num_dias_temp_menor0", 
                          "tm_mes": "temp_media_mes", "year": "año", "hr": "humedad_relativa"})
df_aemet_clean.head()


Unnamed: 0,estacion,fecha_mes,p_max,np_100,np_001,np_300,precipitacion_total_mensual,np_010,tm_min,ta_max,ts_min,num_dias_temp_mayor30,ta_min,num_dias_temp_menor0,ti_max,temp_media_mes,tm_max,año,e,humedad_relativa,n_cub,n_des,n_nub
0,2166Y,2003-1,,,,,,,,,,,,,,,,2003,,,,,
1,2166Y,2003-7,5.0(15),0.0,6.0,0.0,11.0,3.0,,,,,,,,,,2003,,,,,
2,2166Y,2003-8,8.6(27),0.0,10.0,0.0,27.2,6.0,,,,,,,,,,2003,,,,,
3,2166Y,2003-11,11.6(23),1.0,15.0,0.0,48.8,8.0,,,,,,,,,,2003,,,,,
4,2166Y,2003-5,6.8(31),0.0,7.0,0.0,26.2,6.0,,,,,,,,,,2003,,,,,


In [10]:
#check datos columnas
df_aemet_clean.dtypes

estacion                       object
fecha_mes                      object
p_max                          object
np_100                         object
np_001                         object
np_300                         object
precipitacion_total_mensual    object
np_010                         object
tm_min                         object
ta_max                         object
ts_min                         object
num_dias_temp_mayor30          object
ta_min                         object
num_dias_temp_menor0           object
ti_max                         object
temp_media_mes                 object
tm_max                         object
año                             int64
e                              object
humedad_relativa               object
n_cub                          object
n_des                          object
n_nub                          object
dtype: object

In [11]:
# Cambiar todo el dataframe a float excepto las columnas de fecha_mes, año y estacion (excepto tambien las que tienen paréntesis)
cols_to_float = [col for col in df_aemet_clean.columns if col not in ['fecha_mes', 'año', 'estacion', 'p_max', 'ta_max', 'ta_min']]
df_aemet_clean[cols_to_float] = df_aemet_clean[cols_to_float].astype(float)
df_aemet_clean.dtypes



estacion                        object
fecha_mes                       object
p_max                           object
np_100                         float64
np_001                         float64
np_300                         float64
precipitacion_total_mensual    float64
np_010                         float64
tm_min                         float64
ta_max                          object
ts_min                         float64
num_dias_temp_mayor30          float64
ta_min                          object
num_dias_temp_menor0           float64
ti_max                         float64
temp_media_mes                 float64
tm_max                         float64
año                              int64
e                              float64
humedad_relativa               float64
n_cub                          float64
n_des                          float64
n_nub                          float64
dtype: object

In [12]:
df_aemet_clean.columns.tolist()

['estacion',
 'fecha_mes',
 'p_max',
 'np_100',
 'np_001',
 'np_300',
 'precipitacion_total_mensual',
 'np_010',
 'tm_min',
 'ta_max',
 'ts_min',
 'num_dias_temp_mayor30',
 'ta_min',
 'num_dias_temp_menor0',
 'ti_max',
 'temp_media_mes',
 'tm_max',
 'año',
 'e',
 'humedad_relativa',
 'n_cub',
 'n_des',
 'n_nub']

In [13]:
# Crear una nueva columna para calcular la humedad de una forma manual -> tm_min/tm_max * 100 - asegurándonos de que ambas columnas son numéricas 
df_aemet_clean["humedad_relativa_manual"] = (
    df_aemet_clean["tm_min"] / df_aemet_clean["tm_max"] * 100
)

df_aemet_clean.head(20)


Unnamed: 0,estacion,fecha_mes,p_max,np_100,np_001,np_300,precipitacion_total_mensual,np_010,tm_min,ta_max,ts_min,num_dias_temp_mayor30,ta_min,num_dias_temp_menor0,ti_max,temp_media_mes,tm_max,año,e,humedad_relativa,n_cub,n_des,n_nub,humedad_relativa_manual
0,2166Y,2003-1,,,,,,,,,,,,,,,,2003,,,,,,
1,2166Y,2003-7,5.0(15),0.0,6.0,0.0,11.0,3.0,,,,,,,,,,2003,,,,,,
2,2166Y,2003-8,8.6(27),0.0,10.0,0.0,27.2,6.0,,,,,,,,,,2003,,,,,,
3,2166Y,2003-11,11.6(23),1.0,15.0,0.0,48.8,8.0,,,,,,,,,,2003,,,,,,
4,2166Y,2003-5,6.8(31),0.0,7.0,0.0,26.2,6.0,,,,,,,,,,2003,,,,,,
5,2166Y,2003-9,17.6(30),2.0,8.0,0.0,39.6,4.0,,,,,,,,,,2003,,,,,,
6,2166Y,2003-12,5.6(29),0.0,15.0,0.0,26.2,5.0,0.4,16.2(21),6.0,0.0,-3.7(17),16.0,3.0,4.7,8.9,2003,,,,,,4.494382
7,2166Y,2003-13,,,,,,,,,,,,,,,,2003,,,,,,
8,2166Y,2003-2,10.4(18),2.0,13.0,0.0,42.6,8.0,,,,,,,,,,2003,,,,,,
9,2166Y,2003-10,22.8(30),5.0,19.0,0.0,121.2,15.0,,,,,,,,,,2003,,,,,,


In [14]:
df_aemet_clean.columns.tolist()

['estacion',
 'fecha_mes',
 'p_max',
 'np_100',
 'np_001',
 'np_300',
 'precipitacion_total_mensual',
 'np_010',
 'tm_min',
 'ta_max',
 'ts_min',
 'num_dias_temp_mayor30',
 'ta_min',
 'num_dias_temp_menor0',
 'ti_max',
 'temp_media_mes',
 'tm_max',
 'año',
 'e',
 'humedad_relativa',
 'n_cub',
 'n_des',
 'n_nub',
 'humedad_relativa_manual']

In [15]:
#Eliminar columnas innecesarias, por ejemplo np_100
df_aemet_clean.drop(columns=['np_100', 'np_001', 'np_300', 'np_010', 'tm_min', 'ta_max', 'ts_min', 'ta_min', 'ti_max', 'tm_max', 'e', 'n_cub', 'n_des', 'n_nub', 'p_max'], inplace=True)
df_aemet_clean.head()

Unnamed: 0,estacion,fecha_mes,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,año,humedad_relativa,humedad_relativa_manual
0,2166Y,2003-1,,,,,2003,,
1,2166Y,2003-7,11.0,,,,2003,,
2,2166Y,2003-8,27.2,,,,2003,,
3,2166Y,2003-11,48.8,,,,2003,,
4,2166Y,2003-5,26.2,,,,2003,,


In [16]:
#Data cleanining de la columna de "fecha_mes" para tener mes y año (no días),
#por ejemplo tengo el formato "2003-1" quiero que sea 2003 en una columna y en otra columna lo que está después del "-", es decir, 1
# Separar en dos columnas: año y mes
df_aemet_clean[["año", "mes"]] = (
    df_aemet_clean["fecha_mes"]
        .astype(str)                # por si viene como número
        .str.split("-", expand=True)
        .astype(int)                # si quieres que sean enteros
)

df_aemet_clean.head()



Unnamed: 0,estacion,fecha_mes,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,año,humedad_relativa,humedad_relativa_manual,mes
0,2166Y,2003-1,,,,,2003,,,1
1,2166Y,2003-7,11.0,,,,2003,,,7
2,2166Y,2003-8,27.2,,,,2003,,,8
3,2166Y,2003-11,48.8,,,,2003,,,11
4,2166Y,2003-5,26.2,,,,2003,,,5


In [17]:
#Ordenar ascendentemente por año y mes:

df_aemet_clean = (
    df_aemet_clean
        .sort_values(["año", "mes"], ascending=[True, True])
        .reset_index(drop=True)
)

df_aemet_clean.head()

Unnamed: 0,estacion,fecha_mes,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,año,humedad_relativa,humedad_relativa_manual,mes
0,2166Y,2003-1,,,,,2003,,,1
1,2166Y,2003-2,42.6,,,,2003,,,2
2,2166Y,2003-3,29.0,,,,2003,,,3
3,2166Y,2003-4,38.2,,,,2003,,,4
4,2166Y,2003-5,26.2,,,,2003,,,5


In [18]:
# Exportar a excel - check 2
df_aemet_clean.to_excel("aemet_vino_clean.xlsx", index=False)


In [19]:
# Nos quedamos con los meses del 4 al 9, ambos incluidos y eliminamos el resto y también eliminamos 2003 porque no tiene datos completos
df_aemet_clean = df_aemet_clean[
    (df_aemet_clean["mes"] >= 4) &  (df_aemet_clean["mes"] <= 9) &
    (df_aemet_clean["año"] != 2003)
]
df_aemet_clean.head(20)


Unnamed: 0,estacion,fecha_mes,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,año,humedad_relativa,humedad_relativa_manual,mes
16,2166Y,2004-4,0.0,0.0,4.0,9.2,2004,,15.822785,4
17,2166Y,2004-5,0.2,0.0,1.0,12.9,2004,,33.160622,5
18,2166Y,2004-6,0.0,12.0,0.0,20.3,2004,,40.138408,6
19,2166Y,2004-7,0.0,18.0,0.0,20.7,2004,,39.393939,7
20,2166Y,2004-8,,,,,2004,,,8
21,2166Y,2004-9,,3.0,0.0,18.1,2004,,33.703704,9
29,2166Y,2005-4,35.4,0.0,5.0,10.9,2005,,22.346369,4
30,2166Y,2005-5,17.6,4.0,0.0,15.5,2005,,33.766234,5
31,2166Y,2005-6,29.2,,,,2005,,,6
32,2166Y,2005-7,3.4,,,,2005,,,7


In [20]:
# Generar medias para todas mis variables (precipitacion_total_mensual, num_dias_temp_mayor30, num_dias_temp_menor0, temp_media_mes y humedad_relativa) por año
cols_media = [
    "precipitacion_total_mensual",
    "num_dias_temp_mayor30",
    "num_dias_temp_menor0",
    "temp_media_mes",
    "humedad_relativa",
    "humedad_relativa_manual",
]

# Aseguramos que esas columnas son numéricas (por si vienen como string)
df_aemet_clean[cols_media] = df_aemet_clean[cols_media].apply(
    pd.to_numeric, errors="coerce"
)

# Agrupamos por año y calculamos la media
df_aemet_mean = (
    df_aemet_clean
    .groupby("año")[cols_media]
    .mean()
    .reset_index()
)

df_aemet_mean.head(21)




Unnamed: 0,año,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,humedad_relativa,humedad_relativa_manual
0,2004,0.05,6.6,1.0,16.24,,32.443892
1,2005,18.833333,2.0,2.5,13.2,,28.056301
2,2006,27.2,9.166667,1.0,18.2,,37.337666
3,2007,14.95,4.0,0.833333,16.316667,,34.959299
4,2008,60.75,3.75,0.25,16.375,,39.639432
5,2009,18.36,8.0,1.5,17.283333,,35.609556
6,2010,37.68,3.8,2.0,15.66,56.0,36.065573
7,2011,15.7,6.0,0.0,17.683333,54.666667,37.871439
8,2012,29.466667,5.666667,0.166667,16.783333,60.0,37.598473
9,2013,21.016667,7.0,1.333333,16.0,62.333333,34.733125


In [21]:
#exportar excel - check 3
df_aemet_mean.to_excel("aemet_vino_check3.xlsx", index=False)

In [22]:
# para datos Nan del 2004-2009 de humedad_relativa queremos darles los valores de humedad_relativa_manual y sumarles + 16
df_aemet_mean.loc[
    (df_aemet_mean["año"].between(2004, 2009)) & (df_aemet_mean["humedad_relativa"].isna()),
    "humedad_relativa"
] = df_aemet_mean["humedad_relativa_manual"] + 16   
df_aemet_mean.head(21)

Unnamed: 0,año,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,humedad_relativa,humedad_relativa_manual
0,2004,0.05,6.6,1.0,16.24,48.443892,32.443892
1,2005,18.833333,2.0,2.5,13.2,44.056301,28.056301
2,2006,27.2,9.166667,1.0,18.2,53.337666,37.337666
3,2007,14.95,4.0,0.833333,16.316667,50.959299,34.959299
4,2008,60.75,3.75,0.25,16.375,55.639432,39.639432
5,2009,18.36,8.0,1.5,17.283333,51.609556,35.609556
6,2010,37.68,3.8,2.0,15.66,56.0,36.065573
7,2011,15.7,6.0,0.0,17.683333,54.666667,37.871439
8,2012,29.466667,5.666667,0.166667,16.783333,60.0,37.598473
9,2013,21.016667,7.0,1.333333,16.0,62.333333,34.733125


In [23]:
#Columnas finales del dataframe con medias teniendo en cuenta meses Abril a Septiembre:
df_aemet_mean.columns.tolist()
df_aemet_mean.head(21)

Unnamed: 0,año,precipitacion_total_mensual,num_dias_temp_mayor30,num_dias_temp_menor0,temp_media_mes,humedad_relativa,humedad_relativa_manual
0,2004,0.05,6.6,1.0,16.24,48.443892,32.443892
1,2005,18.833333,2.0,2.5,13.2,44.056301,28.056301
2,2006,27.2,9.166667,1.0,18.2,53.337666,37.337666
3,2007,14.95,4.0,0.833333,16.316667,50.959299,34.959299
4,2008,60.75,3.75,0.25,16.375,55.639432,39.639432
5,2009,18.36,8.0,1.5,17.283333,51.609556,35.609556
6,2010,37.68,3.8,2.0,15.66,56.0,36.065573
7,2011,15.7,6.0,0.0,17.683333,54.666667,37.871439
8,2012,29.466667,5.666667,0.166667,16.783333,60.0,37.598473
9,2013,21.016667,7.0,1.333333,16.0,62.333333,34.733125


In [24]:
# Renombrar finalmente las columnas y redondeos de números decimales
df_aemet_mean = df_aemet_mean.rename(columns={
    "año": "año",
    "precipitacion_total_mensual": "precipitacion_total_mensual(mm)",
    "num_dias_temp_mayor30": "num_dias_temp_mayor30(c)",
    "num_dias_temp_menor0": "num_dias_temp_menor0(c)",
    "temp_media_mes": "temp_media_mes(c)",
    "humedad_relativa": "humedad_relativa(%)"
})
df_aemet_mean.head(21)

#redondeos para todas las columnas menos año
cols_to_round = [
    "precipitacion_total_mensual(mm)",
    "num_dias_temp_mayor30(c)",
    "num_dias_temp_menor0(c)",
    "temp_media_mes(c)",
    "humedad_relativa(%)"
]

for col in cols_to_round:
    df_aemet_mean[col] = df_aemet_mean[col].round(2)

df_aemet_mean.head(21)

Unnamed: 0,año,precipitacion_total_mensual(mm),num_dias_temp_mayor30(c),num_dias_temp_menor0(c),temp_media_mes(c),humedad_relativa(%),humedad_relativa_manual
0,2004,0.05,6.6,1.0,16.24,48.44,32.443892
1,2005,18.83,2.0,2.5,13.2,44.06,28.056301
2,2006,27.2,9.17,1.0,18.2,53.34,37.337666
3,2007,14.95,4.0,0.83,16.32,50.96,34.959299
4,2008,60.75,3.75,0.25,16.38,55.64,39.639432
5,2009,18.36,8.0,1.5,17.28,51.61,35.609556
6,2010,37.68,3.8,2.0,15.66,56.0,36.065573
7,2011,15.7,6.0,0.0,17.68,54.67,37.871439
8,2012,29.47,5.67,0.17,16.78,60.0,37.598473
9,2013,21.02,7.0,1.33,16.0,62.33,34.733125


In [25]:
# eliminar humedad_relativa_manual
df_aemet_mean.drop(columns=['humedad_relativa_manual'], inplace=True)
df_aemet_mean.head(21)

Unnamed: 0,año,precipitacion_total_mensual(mm),num_dias_temp_mayor30(c),num_dias_temp_menor0(c),temp_media_mes(c),humedad_relativa(%)
0,2004,0.05,6.6,1.0,16.24,48.44
1,2005,18.83,2.0,2.5,13.2,44.06
2,2006,27.2,9.17,1.0,18.2,53.34
3,2007,14.95,4.0,0.83,16.32,50.96
4,2008,60.75,3.75,0.25,16.38,55.64
5,2009,18.36,8.0,1.5,17.28,51.61
6,2010,37.68,3.8,2.0,15.66,56.0
7,2011,15.7,6.0,0.0,17.68,54.67
8,2012,29.47,5.67,0.17,16.78,60.0
9,2013,21.02,7.0,1.33,16.0,62.33
