In [1]:
import torch
import pickle
import random
import numpy as np
import main_data_representation as mdr

In [2]:
# seed 고정
random_seed = 42

torch.manual_seed(random_seed)
torch.cuda.manual_seed(random_seed)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False
np.random.seed(random_seed)
random.seed(random_seed)

In [3]:
# Case 1. model = rae_mepc
config1 = {
    "model": 'rae_mepc',
    "parameter": {
        "window_size": 64, # 모델의 input sequence 길이, int(default: 64, 범위: 0 이상 & 원래 데이터의 sequence 길이 이하)
        "input_dim": 561, # 데이터의 변수 개수, int
        "repr_dim": 128, # data representation 차원, int(default: 64, 범위: 1 이상, 2의 지수로 설정 권장)
        "num_epochs": 100, # 학습 epoch 횟수, int(default: 100, 범위: 1 이상)
        "batch_size": 64, # batch 크기, int(default: 64, 범위: 1 이상, 컴퓨터 사양에 적합하게 설정)
        "learning_rate": 0.0001, # learning rate, float(default: 0.0001, 범위: 0.1 이하)
        "device": "cuda" # 학습 환경, ["cuda", "cpu"] 중 선택
    }
}

# Case 2. model = STOC
config2 = {
        "model": 'stoc',
        "parameter": { 
            "forecast_step": 1, 
            "window_size": 64, # 모델의 input sequence 길이, int(default: 64, 범위: 0 이상 & 원래 데이터의 sequence 길이 이하)
            "input_dim": 561, # 데이터의 변수 개수, int
            "repr_dim": 128, # data representation 차원, int(default: 64, 범위: 1 이상, 2의 지수로 설정 권장)
            "lr": 0.001, # learning rate, float(default: 0.0001, 범위: 0.1 이하)
            "num_epochs": 2, # 학습 epoch 횟수, int(default: 100, 범위: 1 이상)
            "batch_size": 8, # batch 크기, int(default: 64, 범위: 1 이상, 컴퓨터 사양에 적합하게 설정)
            "device": "cuda", # 학습 환경, ["cuda", "cpu"] 중 선택, 
            "patience": 50, # 예측 모델 학습 시, 사전 설정한 epoch 동안 loss가 감소하지 않으면 학습 조기 중단, int(default: 50, 범위: 1 이상 num_epochs 미만)
        }
}

# Case 3. model = ts_tcc
config3 = {
    "model": 'ts_tcc',
    "parameter": {
        
    }
}

# Case 4. model = ts2vec
config4 = {
    "model": 'ts2vec',
    "parameter": {
        "gpu": 0, # gpu 할당 번호 (default: 0, 범위: 0 이상)
        "batch_size": 8, # batch 크기, int(default: 8, 범위: 1 이상, 컴퓨터 사양에 적합하게 설정)
        "lr": 0.001, # learning rate, float(default: 0.0001, 범위: 0.1 이하)
        "input_dims": 561, # 데이터의 변수 개수, int
        "repr_dims": 128, # data representation 차원, int(default: 320, 범위: 1 이상, 2의 지수로 설정 권장)
        "window_size": 64, # 모델의 input sequence 길이, int(default: 64, 범위: 0 이상 & 원래 데이터의 sequence 길이 이하)
        "epochs": 2, # 학습 epoch 횟수, int(default: 2, 범위: 1 이상)
        "device": "cuda" # 학습 환경, ["cuda", "cpu"] 중 선택
    }
}

In [4]:
# Dataset
dataset_dir = {
    "train": './data/x_train.pkl',
    "test": './data/x_test.pkl'
}

# train/test 데이터 불러오기 (pickle 형태)
train_data = pickle.load(open(dataset_dir["train"], 'rb'))
test_data = pickle.load(open(dataset_dir["test"], 'rb'))

In [None]:
# Case 1. model = rae_mepc
config = config1
data_representation = mdr.Encode(config, train_data, test_data)
output = data_representation.getResult()

In [None]:
# Case 2. model = STOC
config = config2
data_representation = mdr.Encode(config, train_data, test_data)
output = data_representation.getResult()

In [None]:
# Case 3. model = ts_tcc
config = config3
data_representation = mdr.Encode(config, train_data, test_data)
output = data_representation.getResult()

In [None]:
print(output.shape)
output.head()

In [None]:
# Case 4. model = ts2vec
config = config4
data_representation = mdr.Encode(config, train_data, test_data)
output = data_representation.getResult()