# Documentaci√≥n de la Extracci√≥n de Datos Clim√°ticos üßë‚Äçüíª

En esta secci√≥n, detallaremos el proceso que seguimos para obtener los datos de temperatura m√°xima y m√≠nima de Pinar del R√≠o, Cuba, utilizando la API de Open-Meteo. Este script fue dise√±ado para preparar nuestro dataset de series de tiempo.

## 1. Configuraci√≥n del Entorno e Importaci√≥n de Librer√≠as
Lo primero que hice fue importar las bibliotecas de Python necesarias para realizar nuestra tarea:

In [1]:
import pandas as pd
import requests

* pandas: La import√© para manejar y estructurar los datos extra√≠dos en un formato tabular (DataFrame), lo cual es esencial para el an√°lisis posterior y la exportaci√≥n a CSV.

* requests: La us√© para realizar la solicitud HTTP a la API de Open-Meteo, que es la forma en que "pedimos" los datos desde Internet.

## 2. Definici√≥n de Par√°metros de la API
A continuaci√≥n, establec√≠ todas las variables que definen qu√© datos queremos obtener.

In [None]:
# 1. Definir los par√°metros de la API Open-Meteo, usando Pinar del R√≠o
LATITUD = 22.4167       # Latitud de Pinar del R√≠o, Cuba
LONGITUD = -83.6961     # Longitud de Pinar del R√≠o, Cuba
FECHA_INICIO = "2024-01-01"
FECHA_FIN = "2025-11-01"
VARIABLES = "temperature_2m_max,temperature_2m_min"
ZONA_HORARIA = "America/Havana"
URL_BASE = "https://archive-api.open-meteo.com/v1/archive"

* Coordenadas (LATITUD/LONGITUD): Fijamos las coordenadas geogr√°ficas que identifican la ubicaci√≥n de Pinar del R√≠o.

* Rango de Fechas: Establecimos la ventana de tiempo exacta para la serie: desde el 1 de enero de 2024 hasta el 1 de noviembre de 2025. Us√© la URL archive-api porque estamos pidiendo datos hist√≥ricos.

* VARIABLES: Indicamos expl√≠citamente a la API que solo necesitamos dos series de tiempo diarias: temperature_2m_max (M√°xima) y temperature_2m_min (M√≠nima).

## 3. Solicitud de Datos a la API
Aqu√≠ es donde constru√≠ la solicitud y la envi√© a los servidores de Open-Meteo, utilizando un bloque try...except para manejar cualquier error de conexi√≥n.

In [None]:
# 2. Construir la URL completa para la solicitud
parametros = {
    # ... diccionario con latitud, longitud, etc. ...
}

# 3. Realizar la solicitud HTTP y obtener la respuesta JSON
try:
    respuesta = requests.get(URL_BASE, params=parametros)
    respuesta.raise_for_status()  
    datos = respuesta.json()
    # ...
except requests.exceptions.RequestException as e:
    print(f"‚ùå Error al conectar con la API: {e}")

1. Ensamblaje de Par√°metros: Primero, organic√© todos mis par√°metros definidos en un diccionario llamado parametros.

2. Llamada GET: Luego, utilic√© requests.get() para enviar la solicitud HTTP, adjuntando el diccionario de par√°metros a la URL_BASE.

3. Manejo de Errores: La l√≠nea respuesta.raise_for_status() es crucial; si la API devuelve un error (por ejemplo, un error 404 o 500), esta l√≠nea lo detecta y lo lanza como una excepci√≥n, permitiendo que mi bloque except me informe del problema.

4. Decodificaci√≥n: Si la solicitud fue exitosa, utilic√© respuesta.json() para convertir el texto plano de la respuesta en un objeto de Python (datos), que normalmente es un diccionario.

## 4. Procesamiento de Datos y Creaci√≥n del DataFrame
En este paso, transform√© el diccionario datos (la respuesta JSON) en nuestro objeto DataFrame de Pandas, listo para el an√°lisis.

In [None]:
# 4. Procesar los datos y crear un DataFrame de Pandas
if 'daily' in datos:
    # Extraer las series de tiempo del JSON
    fechas = datos['daily']['time']
    temp_max = datos['daily']['temperature_2m_max']
    temp_min = datos['daily']['temperature_2m_min']

    # Crear el DataFrame
    df_clima_pr = pd.DataFrame({
        'Fecha': fechas,
        'Temp_Maxima_C': temp_max,
        'Temp_Minima_C': temp_min
    })

    # Convertir la columna de Fecha al formato datetime
    df_clima_pr['Fecha'] = pd.to_datetime(df_clima_pr['Fecha'])
    df_clima_pr = df_clima_pr.set_index('Fecha')
    # ...

1. Extracci√≥n de Listas: Navegu√© dentro del diccionario datos hasta la clave 'daily' (donde la API almacena los datos diarios) y extraje las listas de time, temperature_2m_max y temperature_2m_min.

2. Creaci√≥n del DataFrame: Utilic√© estas listas para crear un DataFrame con las columnas Fecha, Temp_Maxima_C y Temp_Minima_C.

3. Formato de Fecha: Transform√© la columna 'Fecha' (que originalmente era una cadena de texto, string) al tipo de dato datetime usando pd.to_datetime().

4. √çndice de Serie de Tiempo: Finalmente, establec√≠ la columna 'Fecha' como el √≠ndice del DataFrame usando .set_index('Fecha'). Esto es fundamental para trabajar con series de tiempo en Pandas.

##  5. Exportaci√≥n a CSV

El √∫ltimo paso fue guardar nuestro dataset limpio y estructurado.

In [None]:
# 5. Exportar el DataFrame a un archivo CSV
nombre_archivo = "pinar_del_rio_temperaturas_2024_2025.csv"
df_clima_pr.to_csv(nombre_archivo)

print("‚úÖ Extracci√≥n y guardado exitoso.")
# ...

Us√© el m√©todo .to_csv() para exportar el DataFrame completo a un archivo llamado pinar_del_rio_temperaturas_2024_2025.csv, que es el que utilizaremos para todos nuestros an√°lisis de modelos.