In [14]:
import os
import pandas as pd
from sdv.metadata import Metadata
from sdv.sequential import PARSynthesizer
from datetime import datetime

In [8]:
def init_paths(path: str) -> str:
    abs_path = os.path.abspath(path)
    if not os.path.exists(abs_path):
        os.makedirs(abs_path, exist_ok=True)
    return abs_path

model = "ieee123"
data_dir = f"./features/{model}"
output_dir = init_paths(f"./output/{model}")
model_dir = init_paths(f"./model/{model}")

In [9]:
profiles = os.listdir(data_dir)
single_day = range(96)
metadata = Metadata.load_from_dict({
    'tables': {
        'table': {
            'sequence_key': 'variable',
            'columns': {
                'variable': { 'sdtype': 'id' },
                "value": {"sdtype": "numerical"}
            }
        },
    }
})

synthesizer = PARSynthesizer(
    metadata,
    epochs=100,
    enforce_min_max_values=True,
    verbose=True)

In [16]:
n = len(profiles)
for i in range(n):
    if "csv" not in profiles[i]:
        continue

    profile = profiles[i]
    name,_ = profile.split(".", 1)
    
    print("Generating: ", profile)
    df = pd.read_csv(f"{data_dir}/{profile}", index_col=0)
    count = len(df.columns)
    data = df.iloc[single_day].melt()
    
    model_path = f"{model_dir}/{name}.pkl"
    print(model_path)
    if os.path.exists(model_path):
        synthesizer.load(filepath=model_path)
    else:
        synthesizer.fit(data)
        synthesizer.save(filepath=model_path)

        loss_df = synthesizer.get_loss_values()
        loss_df.to_csv(f'{output_dir}/loss_{profile}')

    syn_data = synthesizer.sample(num_sequences=count, sequence_length=len(single_day))
    syn_data.to_csv(f'{output_dir}/synth_{name}.csv')

Generating:  s2b_s114a.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s2b_s114a.pkl



RNN module weights are not part of single contiguous chunk of memory. This means they need to be compacted at every call, possibly greatly increasing memory usage. To compact weights again call flatten_parameters(). (Triggered internally at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:1479.)


RNN module weights are not part of single contiguous chunk of memory. This means they need to be compacted at every call, possibly greatly increasing memory usage. To compact weights again call flatten_parameters(). (Triggered internally at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:1479.)


RNN module weights are not part of single contiguous chunk of memory. This means they need to be compacted at every call, possibly greatly increasing memory usage. To compact weights again call flatten_parameters(). (Triggered internally at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:1479.)


RNN module weights are not part of single contiguous chunk of memory. This means they need to be compacted at every c

Generating:  s1a_s113a.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s1a_s113a.pkl



We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.

Loss (-0.488): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:09<00:00, 10.11it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 46/46 [00:11<00:00,  3.87it/s]

We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



Generating:  s35a_s35a.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s35a_s35a.pkl


Loss (-14.222): 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:01<00:00, 57.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00,  3.80it/s]

We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



Generating:  s47_s76a.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s47_s76a.pkl


Loss (-7.376): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:02<00:00, 45.91it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  3.69it/s]

We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



Generating:  s65c_s76c.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s65c_s76c.pkl


Loss (-3.265): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:03<00:00, 32.76it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:02<00:00,  3.77it/s]


Generating:  s64b_s66c.csv



We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s64b_s66c.pkl


Loss (-0.244): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:15<00:00,  6.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 81/81 [00:20<00:00,  3.97it/s]

We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



Generating:  s65a_s65b.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s65a_s65b.pkl


Loss (-6.939): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:02<00:00, 37.90it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00,  3.88it/s]


Generating:  s49a_s49c.csv



We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s49a_s49c.pkl


Loss (-0.263): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:15<00:00,  6.61it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.73it/s]


Generating:  s49b_s49b.csv



We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s49b_s49b.pkl


Loss (-0.235): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:15<00:00,  6.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.86it/s]

We strongly recommend saving the metadata using 'save_to_json' for replicability in future SDV versions.



Generating:  s48_s48.csv
/home/tylor/dev/oedisi_dopf/profiler/model/ieee123/s48_s48.pkl


Loss (-7.522): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:02<00:00, 43.35it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  3.72it/s]
