In [1]:
import ml_collections
from ml_collections.config_dict import ConfigDict
import torch
import sys
from run import main
import yaml
from IPython.display import Image
import pandas as pd

In [2]:
config_dir = 'configs/config.yaml'

with open(config_dir) as file:
    config = ml_collections.ConfigDict(yaml.safe_load(file))

# General config

Choose GPU and fix the random seed

In [3]:
config.update({"device": "cuda"}, allow_val_change=True)
config.update({"gpu_id": "0"}, allow_val_change=True)
config.update({"seed": 0}, allow_val_change=True)

# Load data

We use SPX stock data with rolling window length of 20

In [4]:
sample_data = torch.load('data/stock/processed_data_20/train_X.pt')
config.update({"dataset": "custom_dataset"}, allow_val_change=True)

# Model architecture setup

We train a TimeGAN model

In [5]:
config.Model.TimeGAN.update({"generator": "LSTM"}, allow_val_change=True)
config.Model.TimeGAN.update({"discriminator": "LSTM"}, allow_val_change=True)
config.Model.TimeGAN.update({"G_hidden_dim": 64}, allow_val_change=True)
config.Model.TimeGAN.update({"G_num_layers": 2}, allow_val_change=True)
config.Model.TimeGAN.update({"D_hidden_dim": 32}, allow_val_change=True)
config.Model.TimeGAN.update({"D_num_layers": 3}, allow_val_change=True)

# Training config setup

In [6]:
# Set to number of trianing iterations to 5
config.Model.TimeGAN.update({"steps": 5}, allow_val_change=True)
config.Model.TimeGAN.update({"lr_G": 0.002}, allow_val_change=True)
config.Model.TimeGAN.update({"lr_D": 0.003}, allow_val_change=True)

### Train the model

In [7]:
config.update({"train": True}, allow_val_change=True)
config.update({"evaluate": False}, allow_val_change=True)

In [8]:
main(config = config, algo = "TimeGAN", dataset = sample_data)

data shape: torch.Size([64, 20, 2])
TimeGAN
custom_dataset_TimeGAN
GPU's available: 1
{'D_hidden_dim': 32, 'D_num_layers': 3, 'D_steps_per_G_step': 3, 'Evaluation': {'TestMetrics': {'acf_loss': {'stationary': True}, 'cov_loss': 'None', 'cross_corr': 'None', 'discriminative_score': {'batch_size': 128, 'epochs': 10, 'hidden_size': 32, 'num_layers': 2}, 'hist_loss': {'n_bins': 50}, 'icd': 'None', 'innd': 'None', 'onnd': 'None', 'permutation_test': {'n_permutation': 5}, 'predictive_score': {'batch_size': 128, 'epochs': 10, 'hidden_size': 32, 'num_layers': 2}, 'sig_mmd': {'depth': 5}, 'sigw1_loss': {'depth': 2, 'normalise': False}}, 'batch_size': 256, 'metrics_enabled': ['discriminative_score', 'predictive_score', 'sigw1', 'hist_loss', 'acf_loss', 'cov_loss', 'cross_corr', 'onnd', 'innd', 'icd'], 'n_eval': 5, 'sample_size': 1000, 'test_ratio': 0.2}, 'G_hidden_dim': 64, 'G_input_dim': 5, 'G_num_layers': 2, 'WANDB': {'log': {'image': False, 'root_dir': './numerical_results'}, 'wandb_api': 'a0

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00,  2.84it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00,  2.90it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:05<00:00,  1.10s/it]


# Switch to evaluation

In [5]:
config.update({"train": False}, allow_val_change=True)
config.update({"evaluate": True}, allow_val_change=True)

In [6]:
print(config.Evaluation.metrics_enabled)

['discriminative_score', 'predictive_score', 'sigw1', 'hist_loss', 'acf_loss', 'cov_loss', 'cross_corr', 'onnd', 'innd', 'icd']


In [7]:
main(config = config, algo = "TimeGAN", dataset = sample_data)

data shape: torch.Size([64, 20, 2])
TimeGAN
custom_dataset_TimeGAN
GPU's available: 1
---- evaluation metric = hist_loss in group = stylized_fact_scores ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 28.33it/s]


---- evaluation metric = acf_loss in group = stylized_fact_scores ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 89.59it/s]


---- evaluation metric = cov_loss in group = stylized_fact_scores ----


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 172.12it/s]


---- evaluation metric = cross_corr in group = stylized_fact_scores ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 59.09it/s]


---- evaluation metric = discriminative_score in group = implicit_scores ----


  0%|                                                                                                                                                                                                                             | 0/5 [00:00<?, ?it/s]

Epoch 1/10 | Loss: 0.7007 | Acc: 0.5112
Epoch 2/10 | Loss: 0.6891 | Acc: 0.4612
Epoch 3/10 | Loss: 0.6805 | Acc: 0.6694
Epoch 4/10 | Loss: 0.6545 | Acc: 0.7756
Epoch 5/10 | Loss: 0.5326 | Acc: 0.8325
Epoch 6/10 | Loss: 0.2010 | Acc: 0.9506
Epoch 7/10 | Loss: 0.0185 | Acc: 0.9981
Epoch 8/10 | Loss: 0.0051 | Acc: 1.0000


 20%|██████████████████████████████████████████▌                                                                                                                                                                          | 1/5 [00:01<00:04,  1.03s/it]

Epoch 9/10 | Loss: 0.0093 | Acc: 0.9975
Epoch 10/10 | Loss: 0.0028 | Acc: 1.0000
Epoch 1/10 | Loss: 0.6903 | Acc: 0.5275
Epoch 2/10 | Loss: 0.6809 | Acc: 0.7769
Epoch 3/10 | Loss: 0.6574 | Acc: 0.7844
Epoch 4/10 | Loss: 0.5550 | Acc: 0.8263
Epoch 5/10 | Loss: 0.2468 | Acc: 0.9413
Epoch 6/10 | Loss: 0.0360 | Acc: 0.9925
Epoch 7/10 | Loss: 0.0074 | Acc: 0.9988
Epoch 8/10 | Loss: 0.0025 | Acc: 1.0000


 40%|█████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                               | 2/5 [00:02<00:03,  1.04s/it]

Epoch 9/10 | Loss: 0.0018 | Acc: 1.0000
Epoch 10/10 | Loss: 0.0014 | Acc: 1.0000
Epoch 1/10 | Loss: 0.6992 | Acc: 0.4919
Epoch 2/10 | Loss: 0.6898 | Acc: 0.5400
Epoch 3/10 | Loss: 0.6838 | Acc: 0.5994
Epoch 4/10 | Loss: 0.6654 | Acc: 0.7044
Epoch 5/10 | Loss: 0.5667 | Acc: 0.7581
Epoch 6/10 | Loss: 0.2106 | Acc: 0.9513
Epoch 7/10 | Loss: 0.0201 | Acc: 0.9994
Epoch 8/10 | Loss: 0.0056 | Acc: 0.9994


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                     | 3/5 [00:03<00:02,  1.07s/it]

Epoch 9/10 | Loss: 0.0026 | Acc: 1.0000
Epoch 10/10 | Loss: 0.0022 | Acc: 1.0000
Epoch 1/10 | Loss: 0.6940 | Acc: 0.5088
Epoch 2/10 | Loss: 0.6885 | Acc: 0.6663
Epoch 3/10 | Loss: 0.6811 | Acc: 0.6931
Epoch 4/10 | Loss: 0.6528 | Acc: 0.7944
Epoch 5/10 | Loss: 0.4974 | Acc: 0.8562
Epoch 6/10 | Loss: 0.1179 | Acc: 0.9731
Epoch 7/10 | Loss: 0.0147 | Acc: 0.9975
Epoch 8/10 | Loss: 0.0461 | Acc: 0.9950


 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                          | 4/5 [00:04<00:01,  1.08s/it]

Epoch 9/10 | Loss: 0.4615 | Acc: 0.9075
Epoch 10/10 | Loss: 0.0662 | Acc: 0.9806
Epoch 1/10 | Loss: 0.6909 | Acc: 0.5244
Epoch 2/10 | Loss: 0.6862 | Acc: 0.7306
Epoch 3/10 | Loss: 0.6771 | Acc: 0.6925
Epoch 4/10 | Loss: 0.6461 | Acc: 0.7494
Epoch 5/10 | Loss: 0.4889 | Acc: 0.8331
Epoch 6/10 | Loss: 0.1117 | Acc: 0.9806
Epoch 7/10 | Loss: 0.0090 | Acc: 1.0000
Epoch 8/10 | Loss: 0.0034 | Acc: 1.0000


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:05<00:00,  1.07s/it]


Epoch 9/10 | Loss: 0.0023 | Acc: 1.0000
Epoch 10/10 | Loss: 0.0019 | Acc: 1.0000
---- evaluation metric = predictive_score in group = implicit_scores ----


  0%|                                                                                                                                                                                                                             | 0/5 [00:00<?, ?it/s]

Epoch 1/10 | Loss: 0.1105
Epoch 2/10 | Loss: 0.0461
Epoch 3/10 | Loss: 0.0199
Epoch 4/10 | Loss: 0.0108
Epoch 5/10 | Loss: 0.0045
Epoch 6/10 | Loss: 0.0026
Epoch 7/10 | Loss: 0.0017


 20%|██████████████████████████████████████████▌                                                                                                                                                                          | 1/5 [00:00<00:02,  1.42it/s]

Epoch 8/10 | Loss: 0.0014
Epoch 9/10 | Loss: 0.0011
Epoch 10/10 | Loss: 0.0010
Epoch 1/10 | Loss: 0.1441
Epoch 2/10 | Loss: 0.0809
Epoch 3/10 | Loss: 0.0321
Epoch 4/10 | Loss: 0.0157
Epoch 5/10 | Loss: 0.0093
Epoch 6/10 | Loss: 0.0049
Epoch 7/10 | Loss: 0.0041


 40%|█████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                               | 2/5 [00:01<00:02,  1.44it/s]

Epoch 8/10 | Loss: 0.0029
Epoch 9/10 | Loss: 0.0017
Epoch 10/10 | Loss: 0.0009
Epoch 1/10 | Loss: 0.0392
Epoch 2/10 | Loss: 0.0138
Epoch 3/10 | Loss: 0.0078
Epoch 4/10 | Loss: 0.0040
Epoch 5/10 | Loss: 0.0026
Epoch 6/10 | Loss: 0.0023
Epoch 7/10 | Loss: 0.0012
Epoch 8/10 | Loss: 0.0010


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                     | 3/5 [00:02<00:01,  1.47it/s]

Epoch 9/10 | Loss: 0.0014
Epoch 10/10 | Loss: 0.0015
Epoch 1/10 | Loss: 0.0450
Epoch 2/10 | Loss: 0.0111
Epoch 3/10 | Loss: 0.0068
Epoch 4/10 | Loss: 0.0053
Epoch 5/10 | Loss: 0.0031
Epoch 6/10 | Loss: 0.0016
Epoch 7/10 | Loss: 0.0011
Epoch 8/10 | Loss: 0.0008
Epoch 9/10 | Loss: 0.0009


 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                          | 4/5 [00:02<00:00,  1.49it/s]

Epoch 10/10 | Loss: 0.0013
Epoch 1/10 | Loss: 0.1004
Epoch 2/10 | Loss: 0.0511
Epoch 3/10 | Loss: 0.0238
Epoch 4/10 | Loss: 0.0083
Epoch 5/10 | Loss: 0.0056
Epoch 6/10 | Loss: 0.0046
Epoch 7/10 | Loss: 0.0032
Epoch 8/10 | Loss: 0.0021
Epoch 9/10 | Loss: 0.0014
Epoch 10/10 | Loss: 0.0013


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:03<00:00,  1.48it/s]


---- evaluation metric = sigw1 in group = sig_scores ----


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 104.54it/s]


 No metrics enabled in group = permutation_test
---- evaluation metric = onnd in group = distance_based_metrics ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:12<00:00,  2.41s/it]


---- evaluation metric = innd in group = distance_based_metrics ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:16<00:00,  3.38s/it]


---- evaluation metric = icd in group = distance_based_metrics ----


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:17<00:00,  3.40s/it]


[t-SNE] Computing 121 nearest neighbors...
[t-SNE] Indexed 1080 samples in 0.000s...


Exception ignored on calling ctypes callback function: <function _ThreadpoolInfo._find_modules_with_dl_iterate_phdr.<locals>.match_module_callback at 0x7f8f9c468c10>
Traceback (most recent call last):
  File "/home/jtao/ac3/lib/python3.9/site-packages/threadpoolctl.py", line 400, in match_module_callback
    self._make_module_from_path(filepath)
  File "/home/jtao/ac3/lib/python3.9/site-packages/threadpoolctl.py", line 515, in _make_module_from_path
    module = module_class(filepath, prefix, user_api, internal_api)
  File "/home/jtao/ac3/lib/python3.9/site-packages/threadpoolctl.py", line 606, in __init__
    self.version = self.get_version()
  File "/home/jtao/ac3/lib/python3.9/site-packages/threadpoolctl.py", line 646, in get_version
    config = get_config().split()
AttributeError: 'NoneType' object has no attribute 'split'


[t-SNE] Computed neighbors for 1080 samples in 0.462s...
[t-SNE] Computed conditional probabilities for sample 1000 / 1080
[t-SNE] Computed conditional probabilities for sample 1080 / 1080
[t-SNE] Mean sigma: 0.000158
[t-SNE] KL divergence after 250 iterations with early exaggeration: 61.059402
[t-SNE] KL divergence after 300 iterations: 1.087111




The evaluation results, together with the trained model will be saved under "numerical_results" forlde

In [8]:
res_dir = "./numerical_results/custom_dataset/algo_TimeGAN_G_LSTM_D_LSTM_includeD_False_n_lag_20_0/"

# Test metrics

The evaluation is run over 5 iterations, the mean ans standard deviation are collected and stored as "final_results.csv"

In [10]:
df = pd.read_csv(res_dir+'final_results.csv').T
df

Unnamed: 0,0
Unnamed: 0,0.0
hist_loss_mean,0.21834
hist_loss_std,0.005722
acf_loss_mean,4.096016
acf_loss_std,0.029237
cov_loss_mean,0.2323
cov_loss_std,0.005398
cross_corr_mean,1.139979
cross_corr_std,0.007666
discriminative_score_mean,0.5
