In [None]:
import xarray as xr
import netCDF4
import numpy as np
import matplotlib.pyplot as plt
import cartopy.crs as ccrs
import cartopy.feature as cfeature
import pandas as pd
import numpy as np
import xesmf as xe
from pathlib import Path

In [None]:
def abrir_modelos(variable, ruta_base=None):
    """
    Abrir todos los archivos .nc en la subcarpeta correspondiente a la variable dentro de 'modelos'.

    Returns:
      list[xarray.Dataset]: lista con los datasets abiertos.

    Raises:
      FileNotFoundError: si la carpeta no existe o no contiene archivos .nc.
    """
    try:
        base = Path(__file__).parent  # disponible si se ejecuta como script
    except NameError:
        base = Path.cwd()
    # Resolver ruta_base: por defecto 'modelos' relativa a este archivo,
    # pero permite pasar una ruta absoluta o relativa si se desea.
    if ruta_base:
        modelos_root = Path(ruta_base)
        if not modelos_root.is_absolute():
            modelos_root = base / modelos_root
    else:
        modelos_root = base / 'modelos'

    ruta_variable = modelos_root / variable
    if not ruta_variable.exists() or not ruta_variable.is_dir():
        raise FileNotFoundError(f"No existe la carpeta de la variable: {ruta_variable}")

    nc_files = sorted(ruta_variable.glob('*.nc'))
    if not nc_files:
        raise FileNotFoundError(f"No se encontraron archivos .nc en {ruta_variable}")

    modelos = [xr.open_dataset(str(archivo)) for archivo in nc_files]

    print(f"Se abrieron {len(modelos)} modelos para la variable '{variable}'.")
    return modelos

In [None]:
modelos_clt = abrir_modelos('clt')
print(modelos_clt)

Se abrieron 7 modelos para la variable 'clt'.
[<xarray.Dataset> Size: 219MB
Dimensions:    (time: 1980, bnds: 2, lat: 144, lon: 192)
Coordinates:
  * time       (time) datetime64[ns] 16kB 1850-01-16T12:00:00 ... 2014-12-16T...
  * lat        (lat) float64 1kB -89.38 -88.12 -86.88 ... 86.88 88.12 89.38
  * lon        (lon) float64 2kB 0.9375 2.812 4.688 6.562 ... 355.3 357.2 359.1
Dimensions without coordinates: bnds
Data variables:
    time_bnds  (time, bnds) datetime64[ns] 32kB ...
    lat_bnds   (lat, bnds) float64 2kB ...
    lon_bnds   (lon, bnds) float64 3kB ...
    clt        (time, lat, lon) float32 219MB ...
Attributes: (12/47)
    Conventions:            CF-1.7 CMIP-6.2
    activity_id:            CMIP
    branch_method:          standard
    branch_time_in_child:   0.0
    branch_time_in_parent:  0.0
    creation_date:          2019-11-08T10:46:33Z
    ...                     ...
    variable_id:            clt
    variant_label:          r1i1p1f1
    version:                

  var = coder.decode(var, name=name)


In [None]:
print(modelos_clt[1]['clt'])

<xarray.DataArray 'clt' (time: 1980, lat: 145, lon: 192)> Size: 220MB
[55123200 values with dtype=float32]
Coordinates:
  * time     (time) datetime64[ns] 16kB 1850-01-16T12:00:00 ... 2014-12-16T12...
  * lat      (lat) float64 1kB -90.0 -88.75 -87.5 -86.25 ... 87.5 88.75 90.0
  * lon      (lon) float64 2kB 0.0 1.875 3.75 5.625 ... 352.5 354.4 356.2 358.1
Attributes:
    standard_name:   cloud_area_fraction
    long_name:       Total Cloud Cover Percentage
    comment:         Total cloud area fraction (reported as a percentage) for...
    units:           %
    original_units:  1
    history:         2019-11-15T07:21:23Z altered by CMOR: Converted units fr...
    cell_methods:    area: time: mean
    cell_measures:   area: areacella


In [None]:
def info_grids(modelos):
    """
    Dada una lista de modelos (xarray.Dataset),
    devuelve un resumen con el tamaño y nombre de las coordenadas de cada grid.
    """
    info = []
    for i, ds in enumerate(modelos, start=1):
        # Buscar posibles nombres de coordenadas de lat/lon
        lat_name = next((c for c in ds.coords if 'lat' in c.lower()), None)
        lon_name = next((c for c in ds.coords if 'lon' in c.lower()), None)
        
        if lat_name and lon_name:
            lat_size = ds[lat_name].size
            lon_size = ds[lon_name].size
            info.append({
                'modelo': i,
                'lat_name': lat_name,
                'lon_name': lon_name,
                'lat_size': lat_size,
                'lon_size': lon_size
            })
        else:
            info.append({
                'modelo': i,
                'lat_name': lat_name,
                'lon_name': lon_name,
                'error': 'No se encontraron coordenadas lat/lon'
            })
    
    return info


In [None]:
grids_info = info_grids(modelos_clt)
for g in grids_info:
    print(g)

{'modelo': 1, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 144, 'lon_size': 192}
{'modelo': 2, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 145, 'lon_size': 192}
{'modelo': 3, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 192, 'lon_size': 288}
{'modelo': 4, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 192, 'lon_size': 288}
{'modelo': 5, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 192, 'lon_size': 288}
{'modelo': 6, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 160, 'lon_size': 320}
{'modelo': 7, 'lat_name': 'lat', 'lon_name': 'lon', 'lat_size': 192, 'lon_size': 288}


In [None]:
def regrid_all(modelos, var_name, ref_index):
    """
    Regridea todas las variables 'var_name' de los modelos (en una lista)
    al grid del modelo de referencia indicado por ref_index.

    Parámetros
    ----------
    modelos : list[xarray.Dataset | xarray.DataArray]
        Lista de modelos.
    var_name : str
        Nombre de la variable a regridear (ej: 'clt')
    ref_index : int
        Índice del modelo de referencia en la lista (ej: 2 para el tercero)
    
    Retorna
    -------
    list[xarray.DataArray]
        Lista de variables regrideadas al mismo grid.
    """
    regridded = []
    ref_model = modelos[ref_index]
    ref_grid = ref_model[var_name] if hasattr(ref_model, 'data_vars') else ref_model

    for i, model in enumerate(modelos):
        print(f"Procesando modelo {i}...")
        data = model[var_name] if hasattr(model, 'data_vars') else model
        
        if i == ref_index:
            regridded.append(data)
        else:
            regridder = xe.Regridder(
                data,
                ref_grid,
                method='bilinear',
                extrap_method='nearest_s2d',
                reuse_weights=False
            )
            regridded.append(regridder(data))
    
    return regridded

In [None]:
clt_regridded = regrid_all(modelos_clt, 'clt', 3)


Procesando modelo 0...
Procesando modelo 1...
Procesando modelo 2...
Procesando modelo 3...
Procesando modelo 4...
Procesando modelo 5...
Procesando modelo 6...


In [None]:
clt_regridded[0]

In [None]:
def calc_monthly_means(modelos, var_name=None, start='1950-01-01', end='1980-12-31'):
    """
    Calcula la media mensual (1950–1980 por defecto) para una lista de modelos.
    
    Parámetros
    ----------
    modelos : list[xarray.Dataset | xarray.DataArray]
        Lista de modelos o variables.
    var_name : str | None
        Nombre de la variable si los elementos son Datasets (ej: 'clt').
        Si ya son DataArray, déjalo en None.
    start, end : str
        Fechas para el rango temporal (slice).
    
    Retorna
    -------
    list[xarray.DataArray]
        Lista con las medias mensuales de cada modelo.
    """
    monthly_means = []
    
    for i, model in enumerate(modelos):
        print(f"Calculando media mensual para modelo {i+1}...")
        
        # Extrae la variable si es Dataset
        data = model[var_name] if (var_name and hasattr(model, 'data_vars')) else model
        
        # Selección temporal y promedio mensual
        mean_month = (
            data
            .sel(time=slice(start, end))
            .groupby('time.month')
            .mean('time')
        )
        
        monthly_means.append(mean_month)
    
    return monthly_means


In [None]:
clt_monthly_means = calc_monthly_means(clt_regridded, start='1950-01-01', end='1980-12-31')


Calculando media mensual para modelo 1...
Calculando media mensual para modelo 2...
Calculando media mensual para modelo 3...
Calculando media mensual para modelo 4...
Calculando media mensual para modelo 5...
Calculando media mensual para modelo 6...
Calculando media mensual para modelo 7...


In [None]:
clt_monthly_means[2]

In [None]:

def ensemble_mean(models_monthly):
    """
    Calcula la media del ensemble (promedio entre modelos).
    
    Parámetros
    ----------
    models_monthly : list[xarray.DataArray]
        Lista de DataArrays con las medias mensuales de cada modelo.
    
    Retorna
    -------
    xarray.DataArray
        DataArray con el promedio del ensemble.
    """
    # Concatenamos a lo largo de un eje ficticio 'model'
    combined = xr.concat(models_monthly, dim='model')
    return combined.mean(dim='model')

In [None]:
clt_ensemble_mean = ensemble_mean(clt_monthly_means)
clt_ensemble_mean