### Pre-elaborazione del dataset

TSLib si aspetta dataset in un formato standard (tipicamente con train, validation e test). Potresti dover creare uno script di preprocessing per:

- Convertire la colonna date in formato datetime.
- Ordinare i dati cronologicamente.
- Dividere il dataset in train/validation/test (ad es. 70%/15%/15%).

In [1]:
from pathlib import Path
import pandas as pd

# Definisci il percorso del file CSV
data_path = Path("../data/final/B101_50khz_downsampled_reduced.csv")
output_path = Path("../data/final/B101_50khz_downsampled_reduced_2.csv")

# Leggi il CSV
df = pd.read_csv(data_path)

# Controlla che la colonna "date" esista
if "date" not in df.columns:
    print("La colonna 'date' non è presente nel dataset.")
else:
    # Crea una lista delle colonne e rimuove "date"
    cols = list(df.columns)
    cols.remove("date")
    
    # Nuovo ordine: prima la colonna "date", poi tutte le altre
    new_order = ["date"] + cols
    
    # Riordina il dataframe
    df = df[new_order]
    
    # Salva il nuovo CSV
    df.to_csv(output_path, index=False)
    print(f"File salvato con le colonne riordinate: {output_path}")


File salvato con le colonne riordinate: ..\data\final\B101_50khz_downsampled_reduced_2.csv


In [4]:
import pandas as pd
from pathlib import Path

# Leggi il CSV
data_path = Path("../data/final/predictive_maintenance/cleaned_predictive_maintenance.csv")
df = pd.read_csv(data_path)

# Converti la colonna date
df['date'] = pd.to_datetime(df['date'])

# Ordina per data (se non già ordinato)
df = df.sort_values(by='date')

# Dividi il dataset (ad es. 70% train, 15% val, 15% test)
n = len(df)
train_df = df.iloc[: int(0.7 * n)]
val_df = df.iloc[int(0.7 * n) : int(0.85 * n)]
test_df = df.iloc[int(0.85 * n) :]

# Salva i file
train_df.to_csv("../data/final/predictive_maintenance/train.csv", index=False)
val_df.to_csv("../data/final/predictive_maintenance/val.csv", index=False)
test_df.to_csv("../data/final/predictive_maintenance/test.csv", index=False)

print("Preprocessing completato!")


Preprocessing completato!
