In [70]:
import requests
import pandas as pd

def obtener_datos_climaticos(fecha_inicio, fecha_fin, api_key):
    # URL de la API inicial
    url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_inicio}/fechafin/{fecha_fin}/todasestaciones"
    
    # Encabezados de la solicitud
    headers = {
        'accept': 'application/json',
        'api_key': api_key
    }

    # Realizar la solicitud GET inicial
    response = requests.get(url, headers=headers)

    # Verificar el estado de la respuesta
    if response.status_code == 200:
        # Convertir la respuesta a JSON
        data = response.json()
        
        # Obtener la URL de los datos reales
        datos_url = data.get('datos')
        
        if datos_url:
            # Realizar la segunda solicitud GET para obtener los datos reales
            response_datos = requests.get(datos_url)
            
            if response_datos.status_code == 200:
                # Extraer los datos en formato JSON
                datos_reales = response_datos.json()
                
                # Verificar si datos_reales es una lista y convertirla a DataFrame
                if isinstance(datos_reales, list):
                    df = pd.DataFrame(datos_reales)
                    
                    # Filtrar el DataFrame para excluir las provincias no deseadas
                    provincias_no_deseadas = ['ILLES BALEARS', 'STA. CRUZ DE TENERIFE', 'LAS PALMAS', 'CEUTA', 'MELILLA']
                    df_filtrado = df[~df['provincia'].isin(provincias_no_deseadas)].copy()
                    
                    # Seleccionar solo los campos deseados
                    df_final = df_filtrado[['fecha', 'tmed', 'hrMedia', 'provincia']].copy()
                    
                    # Reemplazar comas con puntos en los campos 'tmed' y 'hrMedia'
                    df_final['tmed'] = df_final['tmed'].str.replace(',', '.', regex=False)
                    df_final['hrMedia'] = df_final['hrMedia'].str.replace(',', '.', regex=False)
                    
                    # Convertir los campos 'tmed' y 'hrMedia' a tipo numérico
                    df_final['tmed'] = pd.to_numeric(df_final['tmed'], errors='coerce')
                    df_final['hrMedia'] = pd.to_numeric(df_final['hrMedia'], errors='coerce')
                    
                    # Agrupar por provincia y fecha y calcular la media de 'tmed' y 'hrMedia'
                    df_provincia_fecha = df_final.groupby(['provincia', 'fecha']).agg({
                        'tmed': 'mean',
                        'hrMedia': 'mean'
                    }).reset_index()
                    
                    # Agrupar por fecha para obtener la media total peninsular
                    df_agrupado = df_provincia_fecha.groupby('fecha').agg({
                        'tmed': 'mean',
                        'hrMedia': 'mean'
                    }).reset_index()
                    
                    return df_agrupado
                else:
                    print("La estructura de los datos no es una lista.")
                    return None
            else:
                print(f"Error al obtener los datos reales: {response_datos.status_code}")
        else:
            print("No se encontró la URL de los datos reales en la respuesta.")
    else:
        print(f"Error en la solicitud inicial: {response.status_code}, {response.text}")



In [72]:
# Ejemplo de uso
api_key = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJncmVnb3Jpb3ZhbHZlcmRlOEBnbWFpbC5jb20iLCJqdGkiOiJkZGYyMDUzMy1lYmZmLTQ5MmUtOGYzNi05ZTE0YjEyNjUzZWUiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTcyNTk5NDA0NiwidXNlcklkIjoiZGRmMjA1MzMtZWJmZi00OTJlLThmMzYtOWUxNGIxMjY1M2VlIiwicm9sZSI6IiJ9.zgqzThSKPnGhAikI7O601zI9CTHsklcQ7Mk1UX83K-I'
# Reemplaza con tu API key
fecha_inicio = '2022-01-01T00:00:00UTC'
fecha_fin = '2022-01-01T00:00:00UTC'
datos_climaticos_df = obtener_datos_climaticos(fecha_inicio, fecha_fin, api_key)

#if datos_climaticos_df is not None:
#   print(datos_climaticos_df)

datos_climaticos_df.head()
    

Unnamed: 0,fecha,tmed,hrMedia
0,2022-01-01,12.010493,63.451175


In [74]:
import time  # Asegúrate de importar el módulo time

def datos_climaticos_anuales(year, api_key):
    # Definir el rango de fechas para el año completo
    fecha_inicio = f"{year}-01-01T00:00:00UTC"
    fecha_final = f"{year}-12-31T23:59:59UTC"
    
    # Crear una lista para almacenar los DataFrames de cada intervalo
    dfs = []
    
    # Iterar por cada intervalo de 10 días
    fecha_actual = datetime.strptime(f"{year}-01-01", '%Y-%m-%d')
    fecha_final = datetime.strptime(f"{year}-12-31", '%Y-%m-%d')
    
    while fecha_actual <= fecha_final:
        # Definir el rango de fechas para el intervalo actual
        fecha_str_inicio = fecha_actual.strftime('%Y-%m-%dT00:00:00UTC')
        fecha_str_fin = (fecha_actual + timedelta(days=9)).strftime('%Y-%m-%dT23:59:59UTC')
        
        # Asegurarse de no exceder la fecha final del año
        if fecha_str_fin > f"{year}-12-31T23:59:59UTC":
            fecha_str_fin = f"{year}-12-31T23:59:59UTC"
        
        # Obtener datos del intervalo actual
        df_intervalo = obtener_datos_climaticos(fecha_str_inicio, fecha_str_fin, api_key)
        
        if df_intervalo is not None:
            dfs.append(df_intervalo)
        
        # Pasar al siguiente intervalo de 10 días
        fecha_actual += timedelta(days=10)
        
        # Retraso para evitar exceder el límite de peticiones
        time.sleep(1)  # Esperar 1 segundo antes de la siguiente solicitud
    
    # Concatenar todos los DataFrames y calcular la media para cada fecha
    df_anual = pd.concat(dfs).groupby('fecha').agg({
        'tmed': 'mean',
        'hrMedia': 'mean'
    }).reset_index()
    
    return df_anual

In [75]:
def guardar_datos_climaticos_csv(df, year, archivo=None):
    if archivo is None:
        archivo = f'datos_climaticos_{year}.csv'
    # Guardar el DataFrame en un archivo CSV
    df.to_csv(archivo, index=False)

year = 2019
api_key = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJncmVnb3Jpb3ZhbHZlcmRlOEBnbWFpbC5jb20iLCJqdGkiOiJkZGYyMDUzMy1lYmZmLTQ5MmUtOGYzNi05ZTE0YjEyNjUzZWUiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTcyNTk5NDA0NiwidXNlcklkIjoiZGRmMjA1MzMtZWJmZi00OTJlLThmMzYtOWUxNGIxMjY1M2VlIiwicm9sZSI6IiJ9.zgqzThSKPnGhAikI7O601zI9CTHsklcQ7Mk1UX83K-I'
df_anual = datos_climaticos_anuales(year, api_key)
guardar_datos_climaticos_csv(df_anual, year)

In [79]:
Años = [2019, 2020, 2021, 2022, 2023, 2024]

for year in Años:
    df_anual = datos_climaticos_anuales(year, api_key)
    guardar_datos_climaticos_csv(df_anual, year)

No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
No se encontró la URL de los datos reales en la respuesta.
