In [1]:
%load_ext autoreload
%autoreload 2

from nirs4all.dataset.indexer import SampleIndexManager
import polars as pl

n_rows = 100
df = pl.DataFrame({
    "row": list(range(n_rows)),
    "sample": list(range(n_rows)),
    "origin": list(range(n_rows)),
    "partition": ["train"] * 5 + ["val"] * 20 + ["test"] * 20 + ["train"] * 20 + ["val"] * 15 + ["test"] * 20,
    "group": [0] * 50 + [1] * 50,
    "branch": [0] * 30 + [1] * 10 + [0] * 60,
    "processing": ["raw"] * n_rows
})

print(df)

# Initialisation du gestionnaire
manager = SampleIndexManager(df)

# Récupération d'index avec filtres
train_indices = manager.get_indices({"partition": "train", "branch": 0})
print(len(train_indices), "index trouvés pour partition 'train' et branche 0")
print(f"Index d'entraînement branch 0: {train_indices}...")

# Récupération de ranges contigus
ranges = manager.get_contiguous_ranges({"partition": "train", "group": 0})
print(f"Ranges contigus: {ranges}")

# Mise à jour par filtre
manager.update_by_filter(
    {"partition": "train", "group": 0},
    {"processing": "normalized"}
)

# Mise à jour par liste d'index
manager.update_by_indices([0, 1, 2], {"branch": 2})

# Statistiques
stats = manager.get_stats()
print("Statistiques:")
print(stats)


shape: (100, 7)
┌─────┬────────┬────────┬───────────┬───────┬────────┬────────────┐
│ row ┆ sample ┆ origin ┆ partition ┆ group ┆ branch ┆ processing │
│ --- ┆ ---    ┆ ---    ┆ ---       ┆ ---   ┆ ---    ┆ ---        │
│ i64 ┆ i64    ┆ i64    ┆ str       ┆ i64   ┆ i64    ┆ str        │
╞═════╪════════╪════════╪═══════════╪═══════╪════════╪════════════╡
│ 0   ┆ 0      ┆ 0      ┆ train     ┆ 0     ┆ 0      ┆ raw        │
│ 1   ┆ 1      ┆ 1      ┆ train     ┆ 0     ┆ 0      ┆ raw        │
│ 2   ┆ 2      ┆ 2      ┆ train     ┆ 0     ┆ 0      ┆ raw        │
│ 3   ┆ 3      ┆ 3      ┆ train     ┆ 0     ┆ 0      ┆ raw        │
│ 4   ┆ 4      ┆ 4      ┆ train     ┆ 0     ┆ 0      ┆ raw        │
│ …   ┆ …      ┆ …      ┆ …         ┆ …     ┆ …      ┆ …          │
│ 95  ┆ 95     ┆ 95     ┆ test      ┆ 1     ┆ 0      ┆ raw        │
│ 96  ┆ 96     ┆ 96     ┆ test      ┆ 1     ┆ 0      ┆ raw        │
│ 97  ┆ 97     ┆ 97     ┆ test      ┆ 1     ┆ 0      ┆ raw        │
│ 98  ┆ 98     ┆ 98     ┆ test  