In [1]:
import climate_learn as cl
from climate_learn.data import DataModule
from climate_learn.data.climate_dataset.args import ERA5Args
from climate_learn.data.dataset.args import ShardDatasetArgs, MapDatasetArgs
from climate_learn.data.task.args import ForecastingArgs

import torch.multiprocessing
torch.multiprocessing.set_sharing_strategy("file_system")

In [2]:
root = "/home/data/datasets/weatherbench/era5/5.625deg"
dataset = "era5"
variables = [
    "2m_temperature",
    # "geopotential",
    # "temperature",
    # "specific_humidity",
    # "u_component_of_wind",
    # "v_component_of_wind"
]
in_vars = [f"{dataset}:{var}" for var in variables]
out_vars = [f"{dataset}:{var}" for var in variables]

train_years = range(1979, 2015)
val_years = range(2015, 2017)
test_years = range(2017, 2019)
history = 3
subsample = 6
pred_range = 6  # CHANGE ME

In [3]:
forecasting_args = ForecastingArgs(
    in_vars,
    out_vars,
    history=history,
    pred_range=pred_range,
    subsample=subsample
)

train_dataset_args = ShardDatasetArgs(
    ERA5Args(root, variables, train_years, name=dataset),
    forecasting_args,
    n_chunks=4
)
val_dataset_args = MapDatasetArgs(
    ERA5Args(root, variables, val_years, name=dataset),
    forecasting_args
)
test_dataset_args = MapDatasetArgs(
    ERA5Args(root, variables, test_years, name=dataset),
    forecasting_args
)

dm = DataModule(
    train_dataset_args,
    val_dataset_args,
    test_dataset_args,
    batch_size=32,
    num_workers=0
)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 33.92it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 45.08it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 44.11it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 40.46it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 46.81it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 38.55it/s]


In [4]:
climatology = cl.load_forecasting_module(data_module=dm, preset="climatology")
persistence = cl.load_forecasting_module(data_module=dm, preset="persistence")
linreg = cl.load_forecasting_module(data_module=dm, preset="linear-regression")

Loading preset: climatology


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 38.08it/s]


Using preset optimizer
Using preset learning rate scheduler
Loading training loss: lat_mse
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading preset: persistence


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 37.67it/s]


Using preset optimizer
Using preset learning rate scheduler
Loading training loss: lat_mse
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading preset: linear-regression


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:00<00:00, 37.44it/s]


Using preset optimizer
Using preset learning rate scheduler
Loading training loss: lat_mse
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation loss: lat_rmse
Loading validation loss: lat_acc
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize
Loading validation transform: denormalize


In [5]:
trainer = cl.Trainer(
    early_stopping="lat_rmse:aggregate",
    patience=5,
    accelerator="gpu",
    devices=[0]
)

Global seed set to 0
  warn("In interactive environment: cannot use DDP spawn strategy")


In [None]:
trainer.fit(linreg, dm)



Output()

In [6]:
trainer.test(climatology, dm)

Output()



In [7]:
trainer.test(persistence, dm)

Output()

In [8]:
trainer.test(linreg, dm)

Output()