## Imports

In [1]:
# Importaciones necesarias
import requests
import pandas as pdpip
import os
import json
import time
import boto3
from datetime import datetime, timedelta
from dotenv import load_dotenv

In [2]:
pip show requests

Name: requests
Version: 2.32.3
Summary: Python HTTP for Humans.
Home-page: https://requests.readthedocs.io
Author: Kenneth Reitz
Author-email: me@kennethreitz.org
License: Apache-2.0
Location: c:\Users\prtor\anaconda3\Lib\site-packages
Requires: certifi, charset-normalizer, idna, urllib3
Required-by: aext-assistant-server, anaconda-auth, anaconda-catalogs, anaconda-client, anaconda-project, conda, conda-build, conda-repo-cli, conda_package_streaming, cookiecutter, datashader, jupyterlab_server, panel, requests-file, requests-toolbelt, Sphinx, streamlit, tensorflow, tldextract
Note: you may need to restart the kernel to use updated packages.


## Local

In [None]:
# Cargar las variables de entorno desde el archivo .env
load_dotenv()
AEMET_API_KEY = os.getenv("AEMET_API_KEY")
AEMET_BASE_URL = "https://opendata.aemet.es/opendata/api"

# Directorio local para guardar los archivos
OUTPUT_BASE_DIRECTORY = "data/raw/aemet-semanal"
os.makedirs(OUTPUT_BASE_DIRECTORY, exist_ok=True)

def extractor_AEMET():
    if not AEMET_API_KEY:
        print("Error: AEMET_API_KEY no encontrada. Por favor, asegúrate de que esté configurada.")
        return []
    
    # Fecha de hoy
    fecha_hoy = "2025-07-16"#datetime.now().strftime("%Y-%m-%d")
    fecha_ini_api_format = f"{fecha_hoy}T00:00:00UTC"
    fecha_fin_api_format = f"{fecha_hoy}T23:59:59UTC"
    endpoint_url = (
        f"{AEMET_BASE_URL}/valores/climatologicos/diarios/datos/"
        f"fechaini/{fecha_ini_api_format}/fechafin/{fecha_fin_api_format}/todasestaciones"
    )
    print(f"  Solicitando datos para el día de hoy: {fecha_hoy}")
    
    try:
        response_inicial = requests.get(
            endpoint_url,
            params={'api_key': AEMET_API_KEY},
            headers={'Cache-Control': 'no-cache'},
            timeout=30
        )
        response_inicial.raise_for_status()
        data_inicial = response_inicial.json()
        if response_inicial.status_code != 200 or 'datos' not in data_inicial:
            print(f"  Error en la solicitud inicial o no hay datos disponibles. Código: {response_inicial.status_code}. Detalles: {data_inicial.get('descripcion', 'N/A')}")
            return []
        datos_url = data_inicial.get('datos')
        if not datos_url:
            print(f"  Error: No se encontró la URL de los datos reales en la respuesta inicial para {fecha_hoy}.")
            print(f"  Respuesta inicial de AEMET: {data_inicial}")
            return []
        time.sleep(1.0)
        response_datos = requests.get(datos_url)
        response_datos.raise_for_status()
        batch_data = response_datos.json()

        if isinstance(batch_data, list) and batch_data:
            print(f"  Datos recibidos para el día de hoy: {len(batch_data)} registros.")
            
            # Guardar los datos en un archivo JSON
            output_filename = f"{fecha_hoy}.json"
            local_file_path = os.path.join(OUTPUT_BASE_DIRECTORY, output_filename)
            with open(local_file_path, 'w', encoding='utf-8') as json_file:
                json.dump(batch_data, json_file, indent=4, ensure_ascii=False)
            
            print(f"Archivo generado: {local_file_path}")
            return batch_data
        else:
            print(f"  La respuesta de datos para el día de hoy no contiene una lista o está vacía.")
            return []
    except requests.exceptions.RequestException as e:
        print(f"  Error de conexión o HTTP para el día de hoy: {e}")
        return []
    except ValueError as e:
        print(f"  Error al parsear la respuesta JSON para el día de hoy: {e}")
        return []
    except Exception as e:
        print(f"  Ocurrió un error inesperado durante la extracción de los datos: {e}")
        return []

if __name__ == "__main__":
    extractor_AEMET()

  Solicitando datos para el día de hoy: 2025-07-16
  Error en la solicitud inicial o no hay datos disponibles. Código: 200. Detalles: No hay datos que satisfagan esos criterios


## AWS Bucket

In [None]:
# Cargar las variables de entorno desde el archivo .env
load_dotenv()
AEMET_API_KEY = os.getenv("AEMET_API_KEY")
AEMET_BASE_URL = "https://opendata.aemet.es/opendata/api"

# Configuración del bucket de S3
S3_BUCKET_NAME = "hab-bucket-prueba"
S3_REGION = "eu-north-1"
S3_OUTPUT_DIRECTORY = "data/raw/aemet-semanal"

def upload_to_s3(file_path, s3_key):
    try:
        s3 = boto3.client("s3", region_name=S3_REGION)
        s3.upload_file(file_path, S3_BUCKET_NAME, s3_key)
        print(f"Archivo subido exitosamente a S3: s3://{S3_BUCKET_NAME}/{s3_key}")
    except Exception as e:
        print(f"Error al subir el archivo a S3: {e}")

def extractor_AEMET():
    if not AEMET_API_KEY:
        print("Error: AEMET_API_KEY no encontrada. Por favor, asegúrate de que esté configurada.")
        return []
    
    # Fecha de hoy
    fecha_hoy = datetime.now().strftime("%Y-%m-%d")
    fecha_ini_api_format = f"{fecha_hoy}T00:00:00UTC"
    fecha_fin_api_format = f"{fecha_hoy}T23:59:59UTC"
    endpoint_url = (
        f"{AEMET_BASE_URL}/valores/climatologicos/diarios/datos/"
        f"fechaini/{fecha_ini_api_format}/fechafin/{fecha_fin_api_format}/todasestaciones"
    )
    print(f"  Solicitando datos para el día de hoy: {fecha_hoy}")
    
    try:
        response_inicial = requests.get(
            endpoint_url,
            params={'api_key': AEMET_API_KEY},
            headers={'Cache-Control': 'no-cache'},
            timeout=60
        )
        response_inicial.raise_for_status()
        data_inicial = response_inicial.json()
        if response_inicial.status_code != 200 or 'datos' not in data_inicial:
            print(f"  Error en la solicitud inicial o no hay datos disponibles. Código: {response_inicial.status_code}. Detalles: {data_inicial.get('descripcion', 'N/A')}")
            return []
        datos_url = data_inicial.get('datos')
        if not datos_url:
            print(f"  Error: No se encontró la URL de los datos reales en la respuesta inicial para {fecha_hoy}.")
            print(f"  Respuesta inicial de AEMET: {data_inicial}")
            return []
        time.sleep(1.0)
        response_datos = requests.get(datos_url)
        response_datos.raise_for_status()
        batch_data = response_datos.json()

        if isinstance(batch_data, list) and batch_data:
            print(f"  Datos recibidos para el día de hoy: {len(batch_data)} registros.")
            
            # Guardar los datos en un archivo JSON
            output_filename = f"{fecha_hoy}.json"
            local_file_path = os.path.join(S3_OUTPUT_DIRECTORY, output_filename)
            with open(local_file_path, 'w', encoding='utf-8') as json_file:
                json.dump(batch_data, json_file, indent=4, ensure_ascii=False)
            
            print(f"Archivo generado: {local_file_path}")

            # Subir el archivo a S3
            s3_key = f"{S3_OUTPUT_DIRECTORY}/{output_filename}"
            upload_to_s3(local_file_path, s3_key)

            return batch_data
        else:
            print(f"  La respuesta de datos para el día de hoy no contiene una lista o está vacía.")
            return []
    except requests.exceptions.RequestException as e:
        print(f"  Error de conexión o HTTP para el día de hoy: {e}")
        return []
    except ValueError as e:
        print(f"  Error al parsear la respuesta JSON para el día de hoy: {e}")
        return []
    except Exception as e:
        print(f"  Ocurrió un error inesperado durante la extracción de los datos: {e}")
        return []

if __name__ == "__main__":
    extractor_AEMET()

  Solicitando datos para el día de hoy: 2025-07-18
  Error en la solicitud inicial o no hay datos disponibles. Código: 200. Detalles: No hay datos que satisfagan esos criterios


---

In [None]:
# Importaciones necesarias
import requests
import pandas as pdpip
import os
import json
import time
import boto3
from datetime import datetime, timedelta
from dotenv import load_dotenv


# Cargar las variables de entorno desde el archivo .env
load_dotenv()
AEMET_API_KEY = os.getenv("AEMET_API_KEY")
AEMET_BASE_URL = "https://opendata.aemet.es/opendata/api"

# Configuración del bucket de S3
S3_BUCKET_NAME = "hab-bucket-prueba"
S3_REGION = "eu-north-1"
S3_OUTPUT_DIRECTORY = "data/raw/aemet-semanal"

# Credenciales IAM
AWS_ACCESS_KEY_ID = "AKIA3PUPV5RPANPE736P"  # Reemplaza con tu Access Key ID
AWS_SECRET_ACCESS_KEY = "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"  # Reemplaza con tu Secret Access Key

def upload_to_s3(file_path, s3_key):
    try:
        s3 = boto3.client(
            "s3", 
            region_name=S3_REGION,
            aws_access_key_id=AWS_ACCESS_KEY_ID,
            aws_secret_access_key=AWS_SECRET_ACCESS_KEY
        )
        s3.upload_file(file_path, S3_BUCKET_NAME, s3_key)
        print(f"Archivo subido exitosamente a S3: s3://{S3_BUCKET_NAME}/{s3_key}")
    except Exception as e:
        print(f"Error al subir el archivo a S3: {e}")

def extractor_AEMET():
    if not AEMET_API_KEY:
        print("Error: AEMET_API_KEY no encontrada. Por favor, asegúrate de que esté configurada.")
        return []
    
    # Fecha de hoy
    fecha_hoy = (datetime.now().strftime("%Y-%m-%d") - timedelta(days=5))
    fecha_ini_api_format = f"{fecha_hoy}T00:00:00UTC"
    fecha_fin_api_format = f"{fecha_hoy}T23:59:59UTC"
    endpoint_url = (
        f"{AEMET_BASE_URL}/valores/climatologicos/diarios/datos/"
        f"fechaini/{fecha_ini_api_format}/fechafin/{fecha_fin_api_format}/todasestaciones"
    )
    print(f"  Solicitando datos para el día de hoy: {fecha_hoy}")
    
    try:
        response_inicial = requests.get(
            endpoint_url,
            params={'api_key': AEMET_API_KEY},
            headers={'Cache-Control': 'no-cache'},
            timeout=60
        )
        response_inicial.raise_for_status()
        data_inicial = response_inicial.json()
        if response_inicial.status_code != 200 or 'datos' not in data_inicial:
            print(f"  Error en la solicitud inicial o no hay datos disponibles. Código: {response_inicial.status_code}. Detalles: {data_inicial.get('descripcion', 'N/A')}")
            return []
        datos_url = data_inicial.get('datos')
        if not datos_url:
            print(f"  Error: No se encontró la URL de los datos reales en la respuesta inicial para {fecha_hoy}.")
            print(f"  Respuesta inicial de AEMET: {data_inicial}")
            return []
        time.sleep(1.0)
        response_datos = requests.get(datos_url)
        response_datos.raise_for_status()
        batch_data = response_datos.json()

        if isinstance(batch_data, list) and batch_data:
            print(f"  Datos recibidos para el día de hoy: {len(batch_data)} registros.")
            
            # Guardar los datos en un archivo JSON
            output_filename = f"{fecha_hoy}.json"
            local_file_path = os.path.join(S3_OUTPUT_DIRECTORY, output_filename)
            with open(local_file_path, 'w', encoding='utf-8') as json_file:
                json.dump(batch_data, json_file, indent=4, ensure_ascii=False)
            
            print(f"Archivo generado: {local_file_path}")

            # Subir el archivo a S3
            s3_key = f"{S3_OUTPUT_DIRECTORY}/{output_filename}"
            upload_to_s3(local_file_path, s3_key)

            return batch_data
        else:
            print(f"  La respuesta de datos para el día de hoy no contiene una lista o está vacía.")
            return []
    except requests.exceptions.RequestException as e:
        print(f"  Error de conexión o HTTP para el día de hoy: {e}")
        return []
    except ValueError as e:
        print(f"  Error al parsear la respuesta JSON para el día de hoy: {e}")
        return []
    except Exception as e:
        print(f"  Ocurrió un error inesperado durante la extracción de los datos: {e}")
        return []
def lambda_handler(event, context):
    extractor_AEMET()

if __name__ == "__main__":
    extractor_AEMET()


  Solicitando datos para el día de hoy: 2025-07-11
  Datos recibidos para el día de hoy: 866 registros.
Archivo generado: data/raw/aemet-semanal\2025-07-11.json
Archivo subido exitosamente a S3: s3://hab-bucket-prueba/data/raw/aemet-semanal/2025-07-11.json
