In [5]:
import pandas as pd
# --- Librerías estándar ---
import json
import time
import warnings
from datetime import datetime, timedelta
from pprint import pprint
# --- Configuración ---
warnings.filterwarnings("ignore", category=UserWarning, module="xgboost")
pd.set_option('display.max_columns', None)  # Mostrar todas las columnas
# --- Librerías para manipulación de datos ---
import pandas as pd
import numpy as np
import requests as req
import swagger_client
from swagger_client.rest import ApiException
# --- Visualización ---
import matplotlib.pyplot as plt
import seaborn as sns
# --- Machine Learning ---
## Modelos
from catboost import CatBoostClassifier
import lightgbm as lgb
from lightgbm import LGBMRegressor
import xgboost as xgb
from xgboost import XGBClassifier, XGBRegressor
## Modelos de Scikit-Learn
from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import (
    RandomForestClassifier, RandomForestRegressor, StackingClassifier
)
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.svm import SVC
## Preprocesamiento y selección de características
from sklearn.feature_selection import (
    RFE, RFECV, SelectFromModel, SelectKBest, f_classif
)
from sklearn.preprocessing import (
    LabelEncoder, MinMaxScaler, PowerTransformer, RobustScaler, StandardScaler
)
## Evaluación de modelos
from sklearn.metrics import (
    accuracy_score, classification_report, confusion_matrix, 
    mean_squared_error, r2_score
)
## División de datos y optimización de hiperparámetros
from sklearn.model_selection import GridSearchCV, train_test_split
# --- Balanceo de datos ---
from imblearn.combine import SMOTETomek
from imblearn.over_sampling import ADASYN, SMOTE
from imblearn.under_sampling import NearMiss



In [6]:
# api_key
#a partir de aqui es el codigo que descarga todos los registros desde el 1-1-2000
# conf API
configuration = swagger_client.Configuration()
configuration.api_key['api_key'] = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJpcGhvbmVkZWRhbmllbEBnbWFpbC5jb20iLCJqdGkiOiJjZThiMzM4YS1mM2NhLTRkNDgtOTQ3Zi00NTUzMmZkNTNiY2QiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTczODUwMjQwNiwidXNlcklkIjoiY2U4YjMzOGEtZjNjYS00ZDQ4LTk0N2YtNDU1MzJmZDUzYmNkIiwicm9sZSI6IiJ9.-50vwaqb_nrSxCFkTqrg0MQt5dppbNAU2yDSmJEFjfU'
api_instance = swagger_client.ValoresClimatologicosApi(swagger_client.ApiClient(configuration))

# Parametros
idema = '3200,3195,3196,3129,3191E,3170Y,3268C,3100B,3182Y,3110C,3191E,3126Y,3194Y,3266A,2462,3104Y,3338,3330Y,3125Y,3111D,3229Y,3343Y'  #estaciones meteorologicas
fecha_inicio = datetime(2000, 1, 1)  
fecha_fin_total = datetime(2025, 1, 31)  

# creo dataFrame final
df_total = pd.DataFrame()

# bucle
while fecha_inicio < fecha_fin_total:
    fecha_fin = fecha_inicio + timedelta(days=182)  #  6 meses +o-
    if fecha_fin > fecha_fin_total:
        fecha_fin = fecha_fin_total  # ajuste si excede

    # devolver a str
    fecha_ini_str = fecha_inicio.strftime('%Y-%m-%dT00:00:00UTC')
    fecha_fin_str = fecha_fin.strftime('%Y-%m-%dT23:59:59UTC')

    try:
        # API
        api_response = api_instance.climatologas_diarias_(fecha_ini_str, fecha_fin_str, idema)
        url = api_response.datos
        response = req.get(url)
        r = response.json()

        df = pd.DataFrame(r)

        # Concateno  el df
        df_total = pd.concat([df_total, df], ignore_index=True)

        # guardar
        df_total.to_csv("datos_climatologicos2.csv", index=False)

        print(f"Datos de {fecha_ini_str} a {fecha_fin_str} agregados correctamente.")

    except Exception as e:
        print(f"Error obteniendo datos de {fecha_ini_str} a {fecha_fin_str}: {e}")

    # avanzo la fecha de inicio
    fecha_inicio = fecha_fin + timedelta(days=1)

print("Proceso completo")
print(df_total.info())


Datos de 2000-01-01T00:00:00UTC a 2000-07-01T23:59:59UTC agregados correctamente.
Datos de 2000-07-02T00:00:00UTC a 2000-12-31T23:59:59UTC agregados correctamente.
Datos de 2001-01-01T00:00:00UTC a 2001-07-02T23:59:59UTC agregados correctamente.
Datos de 2001-07-03T00:00:00UTC a 2002-01-01T23:59:59UTC agregados correctamente.
Datos de 2002-01-02T00:00:00UTC a 2002-07-03T23:59:59UTC agregados correctamente.
Datos de 2002-07-04T00:00:00UTC a 2003-01-02T23:59:59UTC agregados correctamente.
Datos de 2003-01-03T00:00:00UTC a 2003-07-04T23:59:59UTC agregados correctamente.
Datos de 2003-07-05T00:00:00UTC a 2004-01-03T23:59:59UTC agregados correctamente.
Datos de 2004-01-04T00:00:00UTC a 2004-07-04T23:59:59UTC agregados correctamente.
Datos de 2004-07-05T00:00:00UTC a 2005-01-03T23:59:59UTC agregados correctamente.
Datos de 2005-01-04T00:00:00UTC a 2005-07-05T23:59:59UTC agregados correctamente.
Datos de 2005-07-06T00:00:00UTC a 2006-01-04T23:59:59UTC agregados correctamente.
Datos de 2006-01