In [1]:
import requests
import pandas as pd
import matplotlib.pyplot as plt
import json
import os
import numpy as np

In [2]:
aemet = os.getenv("api")

with open('../api.txt', 'r') as file: 
    
    token = file.read()

header = {'Authorization': f"password {token}"}

## Enero 22

In [3]:
url = "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-01-01T00%3A00%3A00UTC/fechafin/2022-01-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response = requests.request("GET", url, headers=header, params=querystring)
enero_datos= response.json()
print(response.text)


{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/b338cd98",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [4]:
#He comprobado que la solicitud ha sido exitosa por lo que hago una segunda solicitud para obtener los datos reales en la key "datos":
url_datos = enero_datos["datos"]
url_datos

'https://opendata.aemet.es/opendata/sh/b338cd98'

In [5]:
response_datos = requests.get(url_datos, headers=header)
response_datos

<Response [200]>

In [6]:
datos_enero = response_datos.json()
datos_enero[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

A continuación, tranformo mis lista de dicc en un DataFrame para estructurar la información climática de manera ordenada y eficiente. Esto facilita la manipulación, análisis y visualización de los datos, permitiendo un acceso más rápido y preciso a la información clave, como las temperaturas medias, precipitaciones y fechas.

In [7]:
df_enero = pd.DataFrame(datos_enero)
df_enero.head()


Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-01-01,4358X,DON BENITO,BADAJOZ,273,138,0,68,02:50,208,15:30,8.0,14.0,50.0,09:10,82.0,9963.0,23,9938.0,15
1,2022-01-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,108,5,8,06:30,208,15:40,,,,,,,,,
2,2022-01-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,199,0,150,08:01,248,11:06,11.0,28.0,78.0,14:38,72.0,9547.0,Varias,9509.0,04
3,2022-01-01,6106X,ANTEQUERA,MALAGA,408,126,0,58,23:50,193,13:00,16.0,11.0,97.0,12:10,,9801.0,23,9775.0,Varias
4,2022-01-01,9698U,TALARN,LLEIDA,807,104,0,50,07:20,157,14:40,17.0,11.0,33.0,12:20,,,,,


Una vez en este punto, voy a quedarme con las columnas que necesito y tienen relevancia en mi análisis de turismo. Así simplificaré y optimizaré mi conjunto de datos. Beneficios:

- Reducción de dimensiones
- Mayor claridad
- Eficiencia en el almacenamiento
- Mayor precisión

In [8]:
columnas_interes = ['fecha', 'provincia', 'tmed', 'prec', 'sol', 'tmin', 'tmax']
df_enero = df_enero[columnas_interes]
df_enero.head()

Unnamed: 0,fecha,provincia,tmed,prec,sol,tmin,tmax
0,2022-01-01,BADAJOZ,138,0,82.0,68,208
1,2022-01-01,CIUDAD REAL,108,5,,8,208
2,2022-01-01,STA. CRUZ DE TENERIFE,199,0,72.0,150,248
3,2022-01-01,MALAGA,126,0,,58,193
4,2022-01-01,LLEIDA,104,0,,50,157


In [9]:
df_enero.shape

(7513, 7)

In [10]:
df_enero.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7513 entries, 0 to 7512
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype 
---  ------     --------------  ----- 
 0   fecha      7513 non-null   object
 1   provincia  7513 non-null   object
 2   tmed       7301 non-null   object
 3   prec       7300 non-null   object
 4   sol        4303 non-null   object
 5   tmin       7302 non-null   object
 6   tmax       7304 non-null   object
dtypes: object(7)
memory usage: 411.0+ KB


In [11]:
df_enero['tmed'] = df_enero['tmed'].str.replace(',', '.').astype(float)
df_enero['prec'] = df_enero['prec'].replace('Ip', np.nan)
df_enero['prec'] = df_enero['prec'].str.replace(',', '.').astype(float)
df_enero['sol'] = df_enero['sol'].str.replace(',', '.').astype(float)
df_enero['tmin'] = df_enero['tmin'].str.replace(',', '.').astype(float)
df_enero['tmax'] = df_enero['tmax'].str.replace(',', '.').astype(float)

In [12]:
#convertir la columna "fecha" en datetime:
df_enero['fecha'] = pd.to_datetime(df_enero['fecha'])

In [13]:
df_enero.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7513 entries, 0 to 7512
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   fecha      7513 non-null   datetime64[ns]
 1   provincia  7513 non-null   object        
 2   tmed       7301 non-null   float64       
 3   prec       7208 non-null   float64       
 4   sol        4303 non-null   float64       
 5   tmin       7302 non-null   float64       
 6   tmax       7304 non-null   float64       
dtypes: datetime64[ns](1), float64(5), object(1)
memory usage: 411.0+ KB


In [14]:
df_enero.head()

Unnamed: 0,fecha,provincia,tmed,prec,sol,tmin,tmax
0,2022-01-01,BADAJOZ,13.8,0.0,8.2,6.8,20.8
1,2022-01-01,CIUDAD REAL,10.8,0.5,,0.8,20.8
2,2022-01-01,STA. CRUZ DE TENERIFE,19.9,0.0,7.2,15.0,24.8
3,2022-01-01,MALAGA,12.6,0.0,,5.8,19.3
4,2022-01-01,LLEIDA,10.4,0.0,,5.0,15.7


In [15]:
# Agrupar por provincia y calcular la media de cada columna
enero = df_enero.groupby('provincia').agg({
    'tmed': 'mean',
    'prec': 'mean',
    'sol': 'mean',
    'tmin': 'mean',
    'tmax': 'mean'
}).reset_index()

# Renombrar las columnas para mayor claridad
enero = enero.rename(columns={
    'tmed': 'media_tmed',
    'prec': 'media_prec',
    'sol': 'media_sol',
    'tmin': 'media_tmin',
    'tmax': 'media_tmax'
})

# Resultado con la media de cada columna por provincia
print(enero)


                provincia  media_tmed  media_prec  media_sol  media_tmin  \
0                A CORUÑA   10.129289    1.503376   5.338356    6.190377   
1                ALBACETE    6.384677    0.045968   7.015385    0.026613   
2                ALICANTE    9.916129    0.433636   6.690323    3.551613   
3                 ALMERIA   11.836585    0.116129   6.777419    7.021138   
4             ARABA/ALAVA    4.653226    2.538333   5.422581   -1.283871   
5                ASTURIAS    8.325740    1.619512   4.994170    4.604734   
6                   AVILA    5.700000    0.184000   5.935484   -0.200000   
7                 BADAJOZ    9.021505    0.143011   7.554545    2.715054   
8               BARCELONA    8.913333    0.241818   6.178378    3.700000   
9                 BIZKAIA    8.689247    3.305691   4.803226    4.669892   
10                 BURGOS    3.540645    0.644371   4.911382   -2.896774   
11                CACERES    8.376129    0.194839   8.050538    2.640000   
12          

In [16]:
enero

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,10.129289,1.503376,5.338356,6.190377,14.065272
1,ALBACETE,6.384677,0.045968,7.015385,0.026613,12.737097
2,ALICANTE,9.916129,0.433636,6.690323,3.551613,16.283065
3,ALMERIA,11.836585,0.116129,6.777419,7.021138,16.647967
4,ARABA/ALAVA,4.653226,2.538333,5.422581,-1.283871,10.593548
5,ASTURIAS,8.32574,1.619512,4.99417,4.604734,12.047041
6,AVILA,5.7,0.184,5.935484,-0.2,11.592157
7,BADAJOZ,9.021505,0.143011,7.554545,2.715054,15.317742
8,BARCELONA,8.913333,0.241818,6.178378,3.7,14.126061
9,BIZKAIA,8.689247,3.305691,4.803226,4.669892,12.7


In [91]:
#eliminar ceuta y melilla
indices_a_eliminar = enero[enero['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
enero = enero.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
enero= enero.reset_index(drop=True)
enero

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,10.129289,1.503376,5.338356,6.190377,14.065272
1,ALBACETE,6.384677,0.045968,7.015385,0.026613,12.737097
2,ALICANTE,9.916129,0.433636,6.690323,3.551613,16.283065
3,ALMERIA,11.836585,0.116129,6.777419,7.021138,16.647967
4,ARABA/ALAVA,4.653226,2.538333,5.422581,-1.283871,10.593548
5,ASTURIAS,8.32574,1.619512,4.99417,4.604734,12.047041
6,AVILA,5.7,0.184,5.935484,-0.2,11.592157
7,BADAJOZ,9.021505,0.143011,7.554545,2.715054,15.317742
8,BARCELONA,8.913333,0.241818,6.178378,3.7,14.126061
9,BIZKAIA,8.689247,3.305691,4.803226,4.669892,12.7


Hago una función para aplicar en el resto de meses:

In [18]:
def procesar_mes(df_mes):
    # Reemplazar comas por puntos y convertir las columnas numéricas a tipo float
    df_mes['tmed'] = df_mes['tmed'].str.replace(',', '.').astype(float)
    df_mes['prec'] = df_mes['prec'].replace('Acum', np.nan)
    df_mes['prec'] = df_mes['prec'].str.replace(',', '.').replace('Ip', np.nan).astype(float)
    df_mes['sol'] = df_mes['sol'].str.replace(',', '.').astype(float)
    df_mes['tmin'] = df_mes['tmin'].str.replace(',', '.').astype(float)
    df_mes['tmax'] = df_mes['tmax'].str.replace(',', '.').astype(float)
    
    # Convertir la columna "fecha" en datetime
    df_mes['fecha'] = pd.to_datetime(df_mes['fecha'])
    
    # Agrupar por provincia y calcular la media de cada columna
    df_media_mes = df_mes.groupby('provincia').agg({
        'tmed': 'mean',
        'prec': 'mean',
        'sol': 'mean',
        'tmin': 'mean',
        'tmax': 'mean'
    }).reset_index()
    
    # Renombrar las columnas para mayor claridad
    df_media_mes = df_media_mes.rename(columns={
        'tmed': 'media_tmed',
        'prec': 'media_prec',
        'sol': 'media_sol',
        'tmin': 'media_tmin',
        'tmax': 'media_tmax'
    })
    
    return df_media_mes

## FEBRERO 22

In [19]:
url2 = "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-02-01T00%3A00%3A00UTC/fechafin/2022-02-28T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response2 = requests.request("GET", url2, headers=header, params=querystring)
febrero_datos= response2.json()
print(response2.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/f7f48dd9",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [20]:
url2_datos= febrero_datos['datos']
url2_datos

'https://opendata.aemet.es/opendata/sh/f7f48dd9'

In [21]:
response2_datos = requests.get(url2_datos, headers=header)
response2_datos

<Response [200]>

In [22]:
datos_febrero= response2_datos.json()
datos_febrero[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [23]:
df_febrero= pd.DataFrame(datos_febrero)
df_febrero.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-02-01,4358X,DON BENITO,BADAJOZ,273,92,0,8,07:50,177,15:40,9.0,8.0,50.0,23:59,95.0,9971.0,09,9942.0,17.0
1,2022-02-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,74,0,-17,07:30,165,16:00,,,,,,,,,
2,2022-02-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,170,29,126,00:51,213,12:36,,22.0,,,5.0,9502.0,Varias,9477.0,15.0
3,2022-02-01,6106X,ANTEQUERA,MALAGA,408,81,0,4,07:30,158,14:30,31.0,11.0,64.0,13:30,,9797.0,24,9760.0,15.0
4,2022-02-01,9698U,TALARN,LLEIDA,807,102,0,27,04:20,178,13:50,99.0,25.0,86.0,Varias,,,,,


In [24]:
#Aplico la función:

febrero = procesar_mes(df_febrero)
febrero

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,10.768304,1.522535,5.409023,6.922321,14.616518
1,ALBACETE,9.515179,0.190909,7.159615,3.148214,15.877679
2,ALICANTE,12.166964,0.072222,7.178571,5.994643,18.336607
3,ALMERIA,13.342727,0.166429,7.192857,8.209091,18.477273
4,ARABA/ALAVA,6.5125,0.366,5.073214,-0.242857,13.269643
5,ASTURIAS,9.59097,1.451916,5.686567,5.618395,13.566221
6,AVILA,8.616071,0.225,6.792857,2.158929,15.053571
7,BADAJOZ,11.331548,0.136905,7.321324,4.488095,18.180952
8,BARCELONA,11.382143,0.086429,6.0375,6.654286,16.109286
9,BIZKAIA,10.154737,1.444444,4.192857,5.417895,14.886316


In [92]:
#eliminar ceuta y melilla
indices_a_eliminar = febrero[febrero['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
febrero = febrero.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
febrero= febrero.reset_index(drop=True)
febrero

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,10.768304,1.522535,5.409023,6.922321,14.616518
1,ALBACETE,9.515179,0.190909,7.159615,3.148214,15.877679
2,ALICANTE,12.166964,0.072222,7.178571,5.994643,18.336607
3,ALMERIA,13.342727,0.166429,7.192857,8.209091,18.477273
4,ARABA/ALAVA,6.5125,0.366,5.073214,-0.242857,13.269643
5,ASTURIAS,9.59097,1.451916,5.686567,5.618395,13.566221
6,AVILA,8.616071,0.225,6.792857,2.158929,15.053571
7,BADAJOZ,11.331548,0.136905,7.321324,4.488095,18.180952
8,BARCELONA,11.382143,0.086429,6.0375,6.654286,16.109286
9,BIZKAIA,10.154737,1.444444,4.192857,5.417895,14.886316


## MARZO 22

In [26]:
url3 = "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-03-01T00%3A00%3A00UTC/fechafin/2022-03-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response3 = requests.request("GET", url3, headers=header, params=querystring)
marzo_datos= response3.json()
print(response3.text)


{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/bfeac398",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [27]:
url3_datos = marzo_datos['datos']
url3_datos

'https://opendata.aemet.es/opendata/sh/bfeac398'

In [28]:
response3_datos= requests.get(url3_datos, headers = header)
response3_datos

<Response [200]>

In [29]:
datos_marzo= response3_datos.json()
datos_marzo[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [30]:
df_marzo= pd.DataFrame(datos_marzo)
df_marzo.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-03-01,4358X,DON BENITO,BADAJOZ,273,132,0,47,07:00,217,13:30,31.0,11.0,58.0,16:20,89.0,9950.0,09,9911.0,17.0
1,2022-03-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,109,0,7,07:00,211,15:00,,,,,,,,,
2,2022-03-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,141,0,117,04:26,165,13:33,31.0,89.0,206.0,09:26,52.0,9547.0,Varias,9516.0,4.0
3,2022-03-01,6106X,ANTEQUERA,MALAGA,408,124,0,67,07:20,181,15:30,15.0,14.0,108.0,00:30,,9786.0,10,9748.0,18.0
4,2022-03-01,9698U,TALARN,LLEIDA,807,88,0,10,06:30,165,14:40,99.0,17.0,64.0,Varias,,,,,


In [31]:
#Aplico la función:
marzo= procesar_mes(df_marzo)
marzo

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,11.490283,3.748899,5.258865,7.617004,15.374597
1,ALBACETE,9.291129,2.70082,2.983929,5.733871,12.842742
2,ALICANTE,12.98871,7.066942,3.702151,9.316935,16.670968
3,ALMERIA,14.205405,2.833077,4.927778,10.381081,18.029054
4,ARABA/ALAVA,8.56129,1.629508,3.272581,3.990323,13.125806
5,ASTURIAS,9.973314,3.297554,4.055696,6.281232,13.670381
6,AVILA,8.612903,4.781356,3.467742,4.943548,12.295161
7,BADAJOZ,12.212366,2.766667,4.734194,7.497849,16.91828
8,BARCELONA,11.885714,2.649664,2.651087,8.777273,14.992857
9,BIZKAIA,12.367742,3.609836,3.096774,8.63871,16.095968


In [93]:
#eliminar ceuta y melilla
indices_a_eliminar = marzo[marzo['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
marzo = marzo.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
marzo= marzo.reset_index(drop=True)
marzo

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,11.490283,3.748899,5.258865,7.617004,15.374597
1,ALBACETE,9.291129,2.70082,2.983929,5.733871,12.842742
2,ALICANTE,12.98871,7.066942,3.702151,9.316935,16.670968
3,ALMERIA,14.205405,2.833077,4.927778,10.381081,18.029054
4,ARABA/ALAVA,8.56129,1.629508,3.272581,3.990323,13.125806
5,ASTURIAS,9.973314,3.297554,4.055696,6.281232,13.670381
6,AVILA,8.612903,4.781356,3.467742,4.943548,12.295161
7,BADAJOZ,12.212366,2.766667,4.734194,7.497849,16.91828
8,BARCELONA,11.885714,2.649664,2.651087,8.777273,14.992857
9,BIZKAIA,12.367742,3.609836,3.096774,8.63871,16.095968


## ABRIL 22

In [33]:
url4= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-04-01T00%3A00%3A00UTC/fechafin/2022-04-30T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response4 = requests.request("GET", url4, headers=header, params=querystring)
abril_datos= response4.json()
print(response4.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/b4d5ad32",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [34]:
url4_datos= abril_datos['datos']
url4_datos

'https://opendata.aemet.es/opendata/sh/b4d5ad32'

In [35]:
response4_datos= requests.get(url4_datos, headers=header)
response4_datos

<Response [200]>

In [36]:
datos_abril=response4_datos.json()
datos_abril[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [37]:
df_abril= pd.DataFrame(datos_abril)
df_abril.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-04-01,4358X,DON BENITO,BADAJOZ,273,122,0,65,06:30,180,15:00,34.0,22.0,86.0,16:30,99.0,9860.0,24.0,9797.0,2.0
1,2022-04-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,100,4,40,06:00,159,14:40,,,,,,,,,
2,2022-04-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,143,0,117,Varias,169,12:03,,,,,59.0,,,,
3,2022-04-01,6106X,ANTEQUERA,MALAGA,408,110,0,64,06:20,156,16:00,31.0,17.0,83.0,13:40,,9674.0,24.0,9638.0,4.0
4,2022-04-01,9698U,TALARN,LLEIDA,807,28,0,-12,23:50,67,14:00,32.0,72.0,189.0,08:40,,,,,


In [38]:
#Aplico función:
abril=procesar_mes(df_abril)
abril

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,12.187611,2.299561,6.859701,8.303097,16.064159
1,ALBACETE,10.9275,3.810345,6.924074,5.479167,16.370833
2,ALICANTE,14.869167,2.708475,7.886667,9.794167,19.945833
3,ALMERIA,15.366443,1.734014,8.213333,10.883221,19.847651
4,ARABA/ALAVA,9.601667,2.714815,5.845,3.841667,15.368333
5,ASTURIAS,10.63617,3.420952,6.326244,6.692705,14.57234
6,AVILA,9.119048,2.043902,7.73,3.645455,14.725
7,BADAJOZ,13.959551,1.605556,8.265101,7.618539,20.305056
8,BARCELONA,14.297203,1.166216,7.422989,9.644755,18.948252
9,BIZKAIA,12.030088,3.69596,4.696667,8.039823,16.023894


In [94]:
#eliminar ceuta y melilla
indices_a_eliminar = abril[abril['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
abril = abril.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
abril= abril.reset_index(drop=True)
abril

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,12.187611,2.299561,6.859701,8.303097,16.064159
1,ALBACETE,10.9275,3.810345,6.924074,5.479167,16.370833
2,ALICANTE,14.869167,2.708475,7.886667,9.794167,19.945833
3,ALMERIA,15.366443,1.734014,8.213333,10.883221,19.847651
4,ARABA/ALAVA,9.601667,2.714815,5.845,3.841667,15.368333
5,ASTURIAS,10.63617,3.420952,6.326244,6.692705,14.57234
6,AVILA,9.119048,2.043902,7.73,3.645455,14.725
7,BADAJOZ,13.959551,1.605556,8.265101,7.618539,20.305056
8,BARCELONA,14.297203,1.166216,7.422989,9.644755,18.948252
9,BIZKAIA,12.030088,3.69596,4.696667,8.039823,16.023894


## MAYO 22

In [40]:
url5= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-05-01T00%3A00%3A00UTC/fechafin/2022-05-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response5 = requests.request("GET", url5, headers=header, params=querystring)
mayo_datos= response5.json()
print(response5.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/8611e676",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [41]:
url5_datos= mayo_datos['datos']
url5_datos

'https://opendata.aemet.es/opendata/sh/8611e676'

In [42]:
response5_datos= requests.get(url5_datos, headers = header)
response5_datos

<Response [200]>

In [43]:
datos_mayo=response5_datos.json()
datos_mayo[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [44]:
df_mayo= pd.DataFrame(datos_mayo)
df_mayo.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-05-01,4358X,DON BENITO,BADAJOZ,273,207,0,133,23:59,281,Varias,25.0,28.0,97.0,13:40,117.0,9887.0,08,9842.0,18.0
1,2022-05-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,178,0,92,05:30,263,14:20,,,,,,,,,
2,2022-05-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,180,0,124,23:40,235,13:20,29.0,53.0,117.0,21:58,119.0,9523.0,Varias,9503.0,5.0
3,2022-05-01,6106X,ANTEQUERA,MALAGA,408,176,0,95,05:00,258,14:30,23.0,14.0,69.0,17:10,,9736.0,00,9685.0,19.0
4,2022-05-01,9698U,TALARN,LLEIDA,807,146,168,74,04:20,219,12:40,99.0,28.0,103.0,Varias,,,,,


In [45]:
#Aplico función:
mayo=procesar_mes(df_mayo)
mayo

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,16.305809,1.342678,7.578472,12.051867,20.556432
1,ALBACETE,18.918548,0.447967,11.3625,11.329032,26.507258
2,ALICANTE,20.262727,0.919008,11.537975,13.944545,26.575455
3,ALMERIA,20.394483,1.441135,11.187097,15.505517,25.275172
4,ARABA/ALAVA,15.954839,0.389831,8.048387,8.641935,23.275806
5,ASTURIAS,15.094395,1.062654,6.226106,11.385841,18.799705
6,AVILA,17.269767,0.690698,10.432258,10.611111,24.016279
7,BADAJOZ,21.605914,0.21828,10.985621,13.473118,29.745161
8,BARCELONA,20.109868,0.815584,9.852174,15.009868,25.203289
9,BIZKAIA,16.894898,0.865854,6.3,12.403061,21.397959


## JUNIO 22

In [46]:
url6 = "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-06-01T00%3A00%3A00UTC/fechafin/2022-06-30T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response6 = requests.request("GET", url6, headers=header, params=querystring)
junio_datos= response6.json()
print(response6.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/1e04fc76",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [47]:
url6_datos= junio_datos['datos']
url6_datos

'https://opendata.aemet.es/opendata/sh/1e04fc76'

In [48]:
response6_datos= requests.get(url6_datos, headers=header)
response6_datos

<Response [200]>

In [49]:
datos_junio= response6_datos.json()
datos_junio[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [50]:
df_junio= pd.DataFrame(datos_junio)
df_junio.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-06-01,4358X,DON BENITO,BADAJOZ,273,232,0,165,05:00,299,17:00,26.0,31.0,100.0,15:10,68.0,9842.0,08,9811.0,18
1,2022-06-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,211,0,122,04:30,300,16:20,,,,,,,,,
2,2022-06-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,164,0,134,22:48,193,15:29,29.0,42.0,114.0,08:21,21.0,9487.0,Varias,9449.0,04
3,2022-06-01,6106X,ANTEQUERA,MALAGA,408,213,0,137,05:00,289,16:00,29.0,17.0,78.0,19:00,,9693.0,08,9659.0,Varias
4,2022-06-01,9698U,TALARN,LLEIDA,807,227,0,146,03:20,308,14:00,24.0,25.0,92.0,14:30,,,,,


In [51]:
#Aplico función:
junio= procesar_mes(df_junio)
junio

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,17.140529,2.204545,6.298592,13.66652,20.613656
1,ALBACETE,24.45042,0.089655,11.8625,16.366387,32.522689
2,ALICANTE,24.78,0.255085,12.43,18.069167,31.484167
3,ALMERIA,23.676154,0.050394,10.983051,18.652308,28.7
4,ARABA/ALAVA,19.431667,0.510909,7.826667,12.016667,26.85
5,ASTURIAS,16.89939,2.607166,5.286111,13.256707,20.55
6,AVILA,19.996667,0.257143,10.603333,13.166667,26.806667
7,BADAJOZ,24.242778,0.043333,11.126846,16.171111,32.310556
8,BARCELONA,24.592617,0.232653,10.644444,19.653691,29.532215
9,BIZKAIA,19.484783,1.889916,5.473333,14.948913,24.016304


In [95]:
#eliminar ceuta y melilla
indices_a_eliminar = junio[junio['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
junio = junio.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
junio= junio.reset_index(drop=True)
junio

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,17.140529,2.204545,6.298592,13.66652,20.613656
1,ALBACETE,24.45042,0.089655,11.8625,16.366387,32.522689
2,ALICANTE,24.78,0.255085,12.43,18.069167,31.484167
3,ALMERIA,23.676154,0.050394,10.983051,18.652308,28.7
4,ARABA/ALAVA,19.431667,0.510909,7.826667,12.016667,26.85
5,ASTURIAS,16.89939,2.607166,5.286111,13.256707,20.55
6,AVILA,19.996667,0.257143,10.603333,13.166667,26.806667
7,BADAJOZ,24.242778,0.043333,11.126846,16.171111,32.310556
8,BARCELONA,24.592617,0.232653,10.644444,19.653691,29.532215
9,BIZKAIA,19.484783,1.889916,5.473333,14.948913,24.016304


## JULIO 22

In [52]:
url7= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-07-01T00%3A00%3A00UTC/fechafin/2022-07-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response7 = requests.request("GET", url7, headers=header, params=querystring)
julio_datos= response7.json()
print(response7.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/5dbc83a2",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [53]:
url7_datos= julio_datos['datos']
url7_datos

'https://opendata.aemet.es/opendata/sh/5dbc83a2'

In [54]:
response7_datos= requests.get(url7_datos, headers=header)
response7_datos

<Response [200]>

In [55]:
datos_julio=response7_datos.json()
datos_julio[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [56]:
df_julio= pd.DataFrame(datos_julio)
df_julio.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-07-01,4358X,DON BENITO,BADAJOZ,273,264,0,166,05:40,361,16:30,30.0,11.0,50.0,16:50,114.0,9834.0,9.0,9797.0,19.0
1,2022-07-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,245,0,126,05:20,364,16:50,,,,,,,,,
2,2022-07-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,172,42,140,05:21,203,14:45,,,,,32.0,,,,
3,2022-07-01,6106X,ANTEQUERA,MALAGA,408,214,0,140,05:40,289,12:10,15.0,25.0,111.0,21:10,,9685.0,23.0,9655.0,4.0
4,2022-07-01,9698U,TALARN,LLEIDA,807,209,0,137,04:00,281,16:20,21.0,31.0,103.0,Varias,,,,,


In [57]:
#Aplico función:
julio= procesar_mes(df_julio)
julio

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,20.661382,0.122785,9.77551,15.865041,25.458943
1,ALBACETE,27.159677,0.35,12.430645,18.901613,35.417742
2,ALICANTE,27.262903,0.001653,12.211957,20.855645,33.681452
3,ALMERIA,26.990278,0.013571,9.216129,21.835417,32.145833
4,ARABA/ALAVA,20.906452,0.091667,9.348387,12.354839,29.464516
5,ASTURIAS,19.654601,0.745141,8.082178,15.699387,23.615337
6,AVILA,27.105085,0.0,13.1,19.005085,35.31
7,BADAJOZ,29.574194,0.0,12.850323,20.126344,39.032258
8,BARCELONA,26.762903,0.45124,10.906452,21.455645,32.078226
9,BIZKAIA,21.855645,0.183471,9.216129,16.962903,26.758871


In [96]:
#eliminar ceuta y melilla
indices_a_eliminar = julio[julio['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
julio = julio.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
julio= julio.reset_index(drop=True)
julio

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,20.661382,0.122785,9.77551,15.865041,25.458943
1,ALBACETE,27.159677,0.35,12.430645,18.901613,35.417742
2,ALICANTE,27.262903,0.001653,12.211957,20.855645,33.681452
3,ALMERIA,26.990278,0.013571,9.216129,21.835417,32.145833
4,ARABA/ALAVA,20.906452,0.091667,9.348387,12.354839,29.464516
5,ASTURIAS,19.654601,0.745141,8.082178,15.699387,23.615337
6,AVILA,27.105085,0.0,13.1,19.005085,35.31
7,BADAJOZ,29.574194,0.0,12.850323,20.126344,39.032258
8,BARCELONA,26.762903,0.45124,10.906452,21.455645,32.078226
9,BIZKAIA,21.855645,0.183471,9.216129,16.962903,26.758871


## AGOSTO 22

In [58]:
url8="https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-08-01T00%3A00%3A00UTC/fechafin/2022-08-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response8 = requests.request("GET", url8, headers=header, params=querystring)
agosto_datos= response8.json()
print(response8.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/00aee56b",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [59]:
url8_datos= agosto_datos['datos']
url8_datos

'https://opendata.aemet.es/opendata/sh/00aee56b'

In [60]:
response8_datos= requests.get(url8_datos, headers=header)
response8_datos

<Response [200]>

In [61]:
datos_agosto= response8_datos.json()
datos_agosto[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [62]:
df_agosto=pd.DataFrame(datos_agosto)
df_agosto.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-08-01,4358X,DON BENITO,BADAJOZ,273,338,0,254,05:50,422,15:10,25.0,11.0,72.0,22:30,115.0,9835.0,10,9798.0,18.0
1,2022-08-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,315,0,214,04:10,416,15:00,,,,,,,,,
2,2022-08-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,200,0,170,04:15,230,12:52,99.0,83.0,133.0,Varias,105.0,9470.0,Varias,9452.0,19.0
3,2022-08-01,6106X,ANTEQUERA,MALAGA,408,278,0,224,05:20,333,15:20,15.0,33.0,111.0,13:10,,9690.0,Varias,9665.0,17.0
4,2022-08-01,9698U,TALARN,LLEIDA,807,252,0,175,05:00,330,14:50,18.0,31.0,106.0,13:50,,,,,


In [63]:
#Aplicar función:
agosto=procesar_mes(df_agosto)
agosto

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,20.262083,0.40042,8.037162,15.996667,24.53
1,ALBACETE,25.786179,0.931707,11.014286,17.927642,33.652846
2,ALICANTE,27.542742,0.18871,11.206452,21.107258,33.979839
3,ALMERIA,27.325175,0.088571,6.398387,21.953147,32.699301
4,ARABA/ALAVA,22.341935,0.213208,8.469355,14.454839,30.235484
5,ASTURIAS,19.806607,1.934259,5.71907,16.327327,23.281982
6,AVILA,25.094872,0.16,11.396774,17.753846,32.441026
7,BADAJOZ,27.649462,0.034409,11.680392,19.03172,36.261828
8,BARCELONA,26.902479,2.288889,9.783516,21.309917,32.495041
9,BIZKAIA,22.45534,0.970492,6.93871,18.01165,26.900971


In [97]:
#eliminar ceuta y melilla
indices_a_eliminar = agosto[agosto['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
agosto = agosto.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
agosto= agosto.reset_index(drop=True)
agosto

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,20.262083,0.40042,8.037162,15.996667,24.53
1,ALBACETE,25.786179,0.931707,11.014286,17.927642,33.652846
2,ALICANTE,27.542742,0.18871,11.206452,21.107258,33.979839
3,ALMERIA,27.325175,0.088571,6.398387,21.953147,32.699301
4,ARABA/ALAVA,22.341935,0.213208,8.469355,14.454839,30.235484
5,ASTURIAS,19.806607,1.934259,5.71907,16.327327,23.281982
6,AVILA,25.094872,0.16,11.396774,17.753846,32.441026
7,BADAJOZ,27.649462,0.034409,11.680392,19.03172,36.261828
8,BARCELONA,26.902479,2.288889,9.783516,21.309917,32.495041
9,BIZKAIA,22.45534,0.970492,6.93871,18.01165,26.900971


## SEPTIEMBRE 22

In [64]:
url9= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-09-01T00%3A00%3A00UTC/fechafin/2022-09-30T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response9 = requests.request("GET", url9, headers=header, params=querystring)
septiembre_datos= response9.json()
print(response9.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/ce82dd04",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [65]:
url9_datos= septiembre_datos['datos']
url9_datos

'https://opendata.aemet.es/opendata/sh/ce82dd04'

In [66]:
response9_datos= requests.get(url9_datos, headers=header)
response9_datos

<Response [200]>

In [67]:
datos_septiembre= response9_datos.json()
datos_septiembre[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [68]:
df_septiembre= pd.DataFrame(datos_septiembre)
df_septiembre.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-09-01,4358X,DON BENITO,BADAJOZ,273,241,0,168,06:00,314,15:00,23.0,25.0,83.0,16:00,80.0,9849.0,09,9823.0,Varias
1,2022-09-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,218,0,122,05:50,313,13:50,,,,,,,,,
2,2022-09-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,225,1,192,05:59,258,11:47,99.0,33.0,89.0,Varias,2.0,9494.0,Varias,9463.0,07
3,2022-09-01,6106X,ANTEQUERA,MALAGA,408,245,0,166,06:50,324,15:30,29.0,14.0,81.0,16:10,,9690.0,09,9662.0,15
4,2022-09-01,9698U,TALARN,LLEIDA,807,205,0,123,04:40,287,15:20,18.0,17.0,75.0,14:20,,,,,


In [69]:
#Aplico función:
septiembre= procesar_mes(df_septiembre)
septiembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,18.676695,3.230568,6.824648,14.812288,22.547458
1,ALBACETE,21.633333,0.981667,8.618182,15.055833,28.206667
2,ALICANTE,24.683333,2.377119,8.538889,18.810833,30.55
3,ALMERIA,23.904225,0.090345,6.974419,19.039437,28.771127
4,ARABA/ALAVA,17.236667,0.650909,6.813333,9.42,25.053333
5,ASTURIAS,17.770684,2.340532,6.385024,13.951466,21.591857
6,AVILA,19.152542,1.598246,8.44,12.530508,25.771186
7,BADAJOZ,22.544068,1.205556,9.116892,15.682486,29.40226
8,BARCELONA,22.934167,0.800847,7.274157,18.038333,27.819167
9,BIZKAIA,19.53,3.530275,5.516667,14.635556,24.425556


In [98]:
#eliminar ceuta y melilla
indices_a_eliminar = septiembre[septiembre['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
septiembre = septiembre.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
septiembre= septiembre.reset_index(drop=True)
septiembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,18.676695,3.230568,6.824648,14.812288,22.547458
1,ALBACETE,21.633333,0.981667,8.618182,15.055833,28.206667
2,ALICANTE,24.683333,2.377119,8.538889,18.810833,30.55
3,ALMERIA,23.904225,0.090345,6.974419,19.039437,28.771127
4,ARABA/ALAVA,17.236667,0.650909,6.813333,9.42,25.053333
5,ASTURIAS,17.770684,2.340532,6.385024,13.951466,21.591857
6,AVILA,19.152542,1.598246,8.44,12.530508,25.771186
7,BADAJOZ,22.544068,1.205556,9.116892,15.682486,29.40226
8,BARCELONA,22.934167,0.800847,7.274157,18.038333,27.819167
9,BIZKAIA,19.53,3.530275,5.516667,14.635556,24.425556


## OCTUBRE 22

In [70]:
url10="https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-10-01T00%3A00%3A00UTC/fechafin/2022-10-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response10 = requests.request("GET", url10, headers=header, params=querystring)
octubre_datos= response10.json()
print(response10.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/10e075b0",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [71]:
url10_datos=octubre_datos['datos']
url10_datos

'https://opendata.aemet.es/opendata/sh/10e075b0'

In [72]:
response10_datos=requests.get(url10_datos, headers=header)
response10_datos

<Response [200]>

In [73]:
datos_octubre= response10_datos.json()
datos_octubre[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [74]:
df_octubre=pd.DataFrame(datos_octubre)
df_octubre.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-10-01,4358X,DON BENITO,BADAJOZ,273,195,00,104,05:40,286,15:20,5.0,8.0,50.0,14:00,104.0,9937.0,10,9887.0,00
1,2022-10-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,163,,53,06:10,273,14:10,,,,,,,,,
2,2022-10-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,184,Ip,156,05:36,211,12:43,32.0,39.0,144.0,00:06,69.0,9491.0,Varias,9465.0,17
3,2022-10-01,6106X,ANTEQUERA,MALAGA,408,156,00,78,06:40,235,13:10,14.0,28.0,114.0,18:00,,9771.0,23,9721.0,Varias
4,2022-10-01,9698U,TALARN,LLEIDA,807,138,00,53,03:30,223,14:30,22.0,22.0,61.0,14:30,,,,,


In [75]:
#Aplicar función:
octubre= procesar_mes(df_octubre)
octubre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,17.074797,7.699574,4.36039,13.95122,20.199187
1,ALBACETE,18.606504,0.519672,5.74717,12.44065,24.782927
2,ALICANTE,20.96087,0.838983,7.208046,15.174783,26.753913
3,ALMERIA,21.492523,0.05463,7.119355,16.188785,26.795327
4,ARABA/ALAVA,17.472581,1.156,5.466129,10.345161,24.595161
5,ASTURIAS,16.997647,2.069552,4.499537,13.131471,20.862647
6,AVILA,17.45,1.627586,5.5,11.853333,23.045
7,BADAJOZ,21.022826,1.137297,6.659355,14.675,27.355435
8,BARCELONA,20.510569,0.520833,6.288043,15.811382,25.212195
9,BIZKAIA,20.168817,0.46087,4.129032,15.829032,24.505376


In [99]:
#eliminar ceuta y melilla
indices_a_eliminar = octubre[octubre['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
octubre = octubre.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
octubre= septiembre.reset_index(drop=True)
octubre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,18.676695,3.230568,6.824648,14.812288,22.547458
1,ALBACETE,21.633333,0.981667,8.618182,15.055833,28.206667
2,ALICANTE,24.683333,2.377119,8.538889,18.810833,30.55
3,ALMERIA,23.904225,0.090345,6.974419,19.039437,28.771127
4,ARABA/ALAVA,17.236667,0.650909,6.813333,9.42,25.053333
5,ASTURIAS,17.770684,2.340532,6.385024,13.951466,21.591857
6,AVILA,19.152542,1.598246,8.44,12.530508,25.771186
7,BADAJOZ,22.544068,1.205556,9.116892,15.682486,29.40226
8,BARCELONA,22.934167,0.800847,7.274157,18.038333,27.819167
9,BIZKAIA,19.53,3.530275,5.516667,14.635556,24.425556


## NOVIEMBRE 22

In [76]:
url11= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-11-01T00%3A00%3A00UTC/fechafin/2022-11-30T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response11 = requests.request("GET", url11, headers=header, params=querystring)
noviembre_datos= response11.json()
print(response11.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/1aaa0a38",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [77]:
url11_datos= noviembre_datos['datos']
url11_datos

'https://opendata.aemet.es/opendata/sh/1aaa0a38'

In [78]:
response11_datos= requests.get(url11_datos, headers=header)
response11_datos

<Response [200]>

In [79]:
datos_noviembre= response11_datos.json()
datos_noviembre[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [80]:
df_noviembre= pd.DataFrame(datos_noviembre)
df_noviembre.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-11-01,4358X,DON BENITO,BADAJOZ,273,182,0,138,23:59,225,14:00,34.0,8.0,44.0,13:00,59.0,9926.0,Varias,9897.0,0.0
1,2022-11-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,170,0,93,07:00,247,14:30,,,,,,,,,
2,2022-11-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,196,0,148,Varias,244,13:57,11.0,28.0,67.0,14:17,95.0,9533.0,Varias,9506.0,4.0
3,2022-11-01,6106X,ANTEQUERA,MALAGA,408,188,0,113,07:20,263,14:50,31.0,11.0,56.0,15:50,,9755.0,09,9721.0,15.0
4,2022-11-01,9698U,TALARN,LLEIDA,807,130,0,84,06:00,176,15:40,16.0,17.0,44.0,12:40,,,,,


In [81]:
#Aplico la función:
noviembre= procesar_mes(df_noviembre)
noviembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,13.310417,6.299571,3.182,10.267083,16.355417
1,ALBACETE,12.128814,0.794737,5.203704,6.997458,17.261017
2,ALICANTE,16.55641,1.467227,6.667816,11.092308,22.012821
3,ALMERIA,16.593277,0.167164,6.873333,11.676471,21.517647
4,ARABA/ALAVA,9.786667,2.984,3.458333,4.308333,15.261667
5,ASTURIAS,12.168085,3.497819,3.84381,8.385714,15.94772
6,AVILA,10.278,2.928,4.183333,5.53,15.022
7,BADAJOZ,13.843017,1.546667,5.252027,8.981564,18.702235
8,BARCELONA,14.894167,0.470175,5.174444,10.239167,19.541667
9,BIZKAIA,13.656667,7.276136,3.033333,9.568889,17.754444


In [100]:
#eliminar ceuta y melilla
indices_a_eliminar = noviembre[noviembre['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
noviembre = noviembre.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
noviembre= noviembre.reset_index(drop=True)
noviembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,13.310417,6.299571,3.182,10.267083,16.355417
1,ALBACETE,12.128814,0.794737,5.203704,6.997458,17.261017
2,ALICANTE,16.55641,1.467227,6.667816,11.092308,22.012821
3,ALMERIA,16.593277,0.167164,6.873333,11.676471,21.517647
4,ARABA/ALAVA,9.786667,2.984,3.458333,4.308333,15.261667
5,ASTURIAS,12.168085,3.497819,3.84381,8.385714,15.94772
6,AVILA,10.278,2.928,4.183333,5.53,15.022
7,BADAJOZ,13.843017,1.546667,5.252027,8.981564,18.702235
8,BARCELONA,14.894167,0.470175,5.174444,10.239167,19.541667
9,BIZKAIA,13.656667,7.276136,3.033333,9.568889,17.754444


## DICIEMBRE 22

In [82]:
url12= "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2022-12-01T00%3A00%3A00UTC/fechafin/2022-12-31T00%3A00%3A00UTC/todasestaciones"
querystring = {"api_key": token}

headers = {
    'cache-control': "no-cache"
    }

response12 = requests.request("GET", url12, headers=header, params=querystring)
diciembre_datos= response12.json()
print(response12.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/1dbadfee",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


In [83]:
url12_datos= diciembre_datos['datos']
url12_datos

'https://opendata.aemet.es/opendata/sh/1dbadfee'

In [84]:
response12_datos= requests.get(url12_datos, headers=header)
response12_datos

<Response [200]>

In [85]:
datos_diciembre= response12_datos.json()
datos_diciembre[0].keys()

dict_keys(['fecha', 'indicativo', 'nombre', 'provincia', 'altitud', 'tmed', 'prec', 'tmin', 'horatmin', 'tmax', 'horatmax', 'dir', 'velmedia', 'racha', 'horaracha', 'sol', 'presMax', 'horaPresMax', 'presMin', 'horaPresMin'])

In [86]:
df_diciembre=pd.DataFrame(datos_diciembre)
df_diciembre.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2022-12-01,4358X,DON BENITO,BADAJOZ,273,126,0.0,71,23:59,180,14:40,11.0,8.0,39.0,09:00,82.0,9820.0,0.0,9798.0,16.0
1,2022-12-01,4220X,PUEBLA DE DON RODRIGO,CIUDAD REAL,531,106,,37,23:59,174,13:50,,,,,,,,,
2,2022-12-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,153,115.0,119,07:46,187,Varias,29.0,72.0,133.0,21:45,78.0,9481.0,0.0,9443.0,15.0
3,2022-12-01,9698U,TALARN,LLEIDA,807,29,0.0,-17,07:20,75,14:50,18.0,11.0,39.0,12:30,,,,,
4,2022-12-01,4410X,MÉRIDA,BADAJOZ,228,108,0.0,33,23:40,183,14:40,1.0,11.0,47.0,11:10,,,,,


In [87]:
#Aplico función:
diciembre=procesar_mes(df_diciembre)
diciembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,11.919421,10.436797,2.552903,9.270661,14.563636
1,ALBACETE,10.366393,2.361017,3.254545,5.92541,14.795902
2,ALICANTE,13.939516,0.532,4.976344,8.792742,19.090323
3,ALMERIA,14.474016,1.621739,5.477419,9.506299,19.447244
4,ARABA/ALAVA,8.71129,1.02807,2.946774,4.993548,12.425806
5,ASTURIAS,10.755294,3.558631,2.60553,7.491765,14.018529
6,AVILA,8.763333,2.116129,2.848387,5.426667,12.098333
7,BADAJOZ,12.483784,6.032609,3.828571,8.522162,16.436216
8,BARCELONA,11.779508,1.197479,4.319565,7.486885,16.066393
9,BIZKAIA,12.222581,2.598,2.035484,8.91828,15.52043


In [89]:
#eliminar ceuta y melilla
indices_a_eliminar = diciembre[diciembre['provincia'].isin(['CEUTA', 'MELILLA'])].index

# Eliminar las filas correspondientes a los índices encontrados
diciembre = diciembre.drop(indices_a_eliminar)

# Ahora, el DataFrame contendrá las filas sin "CEUTA" y "MELILLA"
diciembre= diciembre.reset_index(drop=True)

In [90]:
diciembre

Unnamed: 0,provincia,media_tmed,media_prec,media_sol,media_tmin,media_tmax
0,A CORUÑA,11.919421,10.436797,2.552903,9.270661,14.563636
1,ALBACETE,10.366393,2.361017,3.254545,5.92541,14.795902
2,ALICANTE,13.939516,0.532,4.976344,8.792742,19.090323
3,ALMERIA,14.474016,1.621739,5.477419,9.506299,19.447244
4,ARABA/ALAVA,8.71129,1.02807,2.946774,4.993548,12.425806
5,ASTURIAS,10.755294,3.558631,2.60553,7.491765,14.018529
6,AVILA,8.763333,2.116129,2.848387,5.426667,12.098333
7,BADAJOZ,12.483784,6.032609,3.828571,8.522162,16.436216
8,BARCELONA,11.779508,1.197479,4.319565,7.486885,16.066393
9,BIZKAIA,12.222581,2.598,2.035484,8.91828,15.52043
