In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import pandas as pd
from torch.utils.data import Dataset, DataLoader
from Models.AutoEncoder import AutoEncoder, AutoEncoderDataset
from utils.preprocess import process_data
from tqdm import tqdm

# Auto Encoder Test

## Base Setup

In [2]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

cuda


In [3]:
num_epochs = 50
batch_size = 128
lr = 1e-4

In [4]:
# Feature Selection
cat_features = ['Gender', 'Card Brand', 'Card Type', 'Expires', 'Has Chip', 'Year PIN last Changed', 'Whether Security Chip is Used', 'Day']
num_features = ['Current Age', 'Retirement Age', 'Per Capita Income - Zipcode', 'Yearly Income', 'Total Debt', 'Credit Score', 'Credit Limit', 'Amount']

# 데이터 전처리
data_path = './Data/[24-2 DS_Project2] Data.csv'
(train_cat_X, train_num_X, train_y), (valid_cat_X, valid_num_X, valid_y) = process_data(data_path, cat_features, num_features)

In [5]:
train_dataset = AutoEncoderDataset(train_cat_X, train_num_X, device)
valid_dataset = AutoEncoderDataset(valid_cat_X, valid_num_X, device)
train_loader = DataLoader(train_dataset, batch_size=128, shuffle=True)
valid_loader = DataLoader(valid_dataset, batch_size=128, shuffle=False)

In [6]:
model = AutoEncoder(encoding_dim=16, cat_features=cat_features, num_features=num_features).to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.MSELoss()

In [9]:
for epoch in range(100):
    model.train()
    train_loss = 0
    for batch_idx, (cat_features, num_features) in tqdm(enumerate(train_loader), total=len(train_loader), desc=f'에포크 {epoch+1}', bar_format='{l_bar}{bar:20}{r_bar}'):
        optimizer.zero_grad()
        y_hat, y = model(cat_features, num_features)
        loss = criterion(y_hat, y)
        loss.backward()
        optimizer.step()
        train_loss += loss.item()
    
    avg_train_loss = train_loss / len(train_loader)
    print(f'에포크 {epoch+1}/100 | 평균 학습 손실: {avg_train_loss:.6f}')

에포크 1: 100%|████████████████████| 7062/7062 [00:17<00:00, 392.43it/s]


에포크 1/100 | 평균 학습 손실: 0.128896


에포크 2: 100%|████████████████████| 7062/7062 [00:16<00:00, 434.62it/s]


에포크 2/100 | 평균 학습 손실: 0.128879


에포크 3: 100%|████████████████████| 7062/7062 [00:20<00:00, 338.84it/s]


에포크 3/100 | 평균 학습 손실: 0.128869


에포크 4: 100%|████████████████████| 7062/7062 [00:18<00:00, 391.87it/s]


에포크 4/100 | 평균 학습 손실: 0.128867


에포크 5: 100%|████████████████████| 7062/7062 [00:19<00:00, 359.09it/s]


에포크 5/100 | 평균 학습 손실: 0.128865


에포크 6: 100%|████████████████████| 7062/7062 [00:14<00:00, 498.33it/s]


에포크 6/100 | 평균 학습 손실: 0.128863


에포크 7: 100%|████████████████████| 7062/7062 [00:17<00:00, 400.48it/s]


에포크 7/100 | 평균 학습 손실: 0.128863


에포크 8: 100%|████████████████████| 7062/7062 [00:18<00:00, 374.87it/s]


에포크 8/100 | 평균 학습 손실: 0.128863


에포크 9: 100%|████████████████████| 7062/7062 [00:20<00:00, 339.96it/s]


에포크 9/100 | 평균 학습 손실: 0.128861


에포크 10: 100%|████████████████████| 7062/7062 [00:19<00:00, 365.79it/s]


에포크 10/100 | 평균 학습 손실: 0.128862


에포크 11: 100%|████████████████████| 7062/7062 [00:19<00:00, 366.78it/s]


에포크 11/100 | 평균 학습 손실: 0.128861


에포크 12: 100%|████████████████████| 7062/7062 [00:19<00:00, 358.61it/s]


에포크 12/100 | 평균 학습 손실: 0.128860


에포크 13: 100%|████████████████████| 7062/7062 [00:17<00:00, 415.28it/s]


에포크 13/100 | 평균 학습 손실: 0.128862


에포크 14: 100%|████████████████████| 7062/7062 [00:15<00:00, 466.46it/s]


에포크 14/100 | 평균 학습 손실: 0.128860


에포크 15: 100%|████████████████████| 7062/7062 [00:15<00:00, 443.92it/s]


에포크 15/100 | 평균 학습 손실: 0.128861


에포크 16: 100%|████████████████████| 7062/7062 [00:16<00:00, 422.96it/s]


에포크 16/100 | 평균 학습 손실: 0.128861


에포크 17: 100%|████████████████████| 7062/7062 [00:15<00:00, 447.18it/s]


에포크 17/100 | 평균 학습 손실: 0.128860


에포크 18: 100%|████████████████████| 7062/7062 [00:16<00:00, 427.25it/s]


에포크 18/100 | 평균 학습 손실: 0.128861


에포크 19: 100%|████████████████████| 7062/7062 [00:15<00:00, 442.53it/s]


에포크 19/100 | 평균 학습 손실: 0.128860


에포크 20: 100%|████████████████████| 7062/7062 [00:18<00:00, 381.51it/s]


에포크 20/100 | 평균 학습 손실: 0.128859


에포크 21: 100%|████████████████████| 7062/7062 [00:20<00:00, 337.73it/s]


에포크 21/100 | 평균 학습 손실: 0.128861


에포크 22: 100%|████████████████████| 7062/7062 [00:18<00:00, 376.07it/s]


에포크 22/100 | 평균 학습 손실: 0.128861


에포크 23: 100%|████████████████████| 7062/7062 [00:20<00:00, 351.18it/s]


에포크 23/100 | 평균 학습 손실: 0.128860


에포크 24: 100%|████████████████████| 7062/7062 [00:19<00:00, 362.13it/s]


에포크 24/100 | 평균 학습 손실: 0.128860


에포크 25: 100%|████████████████████| 7062/7062 [00:18<00:00, 372.59it/s]


에포크 25/100 | 평균 학습 손실: 0.128861


에포크 26: 100%|████████████████████| 7062/7062 [00:17<00:00, 396.21it/s]


에포크 26/100 | 평균 학습 손실: 0.128862


에포크 27: 100%|████████████████████| 7062/7062 [00:21<00:00, 334.67it/s]


에포크 27/100 | 평균 학습 손실: 0.128862


에포크 28: 100%|████████████████████| 7062/7062 [00:17<00:00, 393.15it/s]


에포크 28/100 | 평균 학습 손실: 0.128860


에포크 29: 100%|████████████████████| 7062/7062 [00:19<00:00, 359.89it/s]


에포크 29/100 | 평균 학습 손실: 0.128860


에포크 30: 100%|████████████████████| 7062/7062 [00:17<00:00, 394.36it/s]


에포크 30/100 | 평균 학습 손실: 0.128860


에포크 31: 100%|████████████████████| 7062/7062 [00:16<00:00, 416.03it/s]


에포크 31/100 | 평균 학습 손실: 0.128860


에포크 32: 100%|████████████████████| 7062/7062 [00:18<00:00, 374.39it/s]


에포크 32/100 | 평균 학습 손실: 0.128861


에포크 33: 100%|████████████████████| 7062/7062 [00:20<00:00, 341.99it/s]


에포크 33/100 | 평균 학습 손실: 0.128861


에포크 34: 100%|████████████████████| 7062/7062 [00:19<00:00, 370.62it/s]


에포크 34/100 | 평균 학습 손실: 0.128859


에포크 35: 100%|████████████████████| 7062/7062 [00:19<00:00, 362.15it/s]


에포크 35/100 | 평균 학습 손실: 0.128861


에포크 36: 100%|████████████████████| 7062/7062 [00:15<00:00, 470.33it/s]


에포크 36/100 | 평균 학습 손실: 0.128861


에포크 37: 100%|████████████████████| 7062/7062 [00:16<00:00, 431.74it/s]


에포크 37/100 | 평균 학습 손실: 0.128860


에포크 38: 100%|████████████████████| 7062/7062 [00:17<00:00, 399.51it/s]


에포크 38/100 | 평균 학습 손실: 0.128860


에포크 39: 100%|████████████████████| 7062/7062 [00:15<00:00, 442.71it/s]


에포크 39/100 | 평균 학습 손실: 0.128860


에포크 40: 100%|████████████████████| 7062/7062 [00:15<00:00, 442.64it/s]


에포크 40/100 | 평균 학습 손실: 0.128860


에포크 41: 100%|████████████████████| 7062/7062 [00:18<00:00, 391.30it/s]


에포크 41/100 | 평균 학습 손실: 0.128861


에포크 42: 100%|████████████████████| 7062/7062 [00:17<00:00, 396.32it/s]


에포크 42/100 | 평균 학습 손실: 0.128860


에포크 43: 100%|████████████████████| 7062/7062 [00:16<00:00, 428.03it/s]


에포크 43/100 | 평균 학습 손실: 0.128860


에포크 44: 100%|████████████████████| 7062/7062 [00:14<00:00, 500.48it/s]


에포크 44/100 | 평균 학습 손실: 0.128861


에포크 45: 100%|████████████████████| 7062/7062 [00:19<00:00, 357.68it/s]


에포크 45/100 | 평균 학습 손실: 0.128861


에포크 46: 100%|████████████████████| 7062/7062 [00:20<00:00, 350.25it/s]


에포크 46/100 | 평균 학습 손실: 0.128859


에포크 47: 100%|████████████████████| 7062/7062 [00:15<00:00, 448.11it/s]


에포크 47/100 | 평균 학습 손실: 0.128859


에포크 48: 100%|████████████████████| 7062/7062 [00:16<00:00, 434.00it/s]


에포크 48/100 | 평균 학습 손실: 0.128860


에포크 49: 100%|████████████████████| 7062/7062 [00:19<00:00, 356.23it/s]


에포크 49/100 | 평균 학습 손실: 0.128859


에포크 50: 100%|████████████████████| 7062/7062 [00:15<00:00, 460.03it/s]


에포크 50/100 | 평균 학습 손실: 0.128860


에포크 51: 100%|████████████████████| 7062/7062 [00:17<00:00, 402.89it/s]


에포크 51/100 | 평균 학습 손실: 0.128860


에포크 52: 100%|████████████████████| 7062/7062 [00:16<00:00, 432.57it/s]


에포크 52/100 | 평균 학습 손실: 0.128859


에포크 53: 100%|████████████████████| 7062/7062 [00:19<00:00, 360.00it/s]


에포크 53/100 | 평균 학습 손실: 0.128861


에포크 54: 100%|████████████████████| 7062/7062 [00:14<00:00, 491.81it/s]


에포크 54/100 | 평균 학습 손실: 0.128860


에포크 55: 100%|████████████████████| 7062/7062 [00:15<00:00, 463.69it/s]


에포크 55/100 | 평균 학습 손실: 0.128860


에포크 56: 100%|████████████████████| 7062/7062 [00:21<00:00, 323.72it/s]


에포크 56/100 | 평균 학습 손실: 0.128861


에포크 57: 100%|████████████████████| 7062/7062 [00:20<00:00, 346.03it/s]


에포크 57/100 | 평균 학습 손실: 0.128861


에포크 58: 100%|████████████████████| 7062/7062 [00:23<00:00, 302.56it/s]


에포크 58/100 | 평균 학습 손실: 0.128861


에포크 59: 100%|████████████████████| 7062/7062 [00:25<00:00, 273.26it/s]


에포크 59/100 | 평균 학습 손실: 0.128860


에포크 60: 100%|████████████████████| 7062/7062 [00:25<00:00, 273.22it/s]


에포크 60/100 | 평균 학습 손실: 0.128861


에포크 61: 100%|████████████████████| 7062/7062 [00:25<00:00, 275.32it/s]


에포크 61/100 | 평균 학습 손실: 0.128859


에포크 62: 100%|████████████████████| 7062/7062 [00:25<00:00, 278.93it/s]


에포크 62/100 | 평균 학습 손실: 0.128860


에포크 63: 100%|████████████████████| 7062/7062 [00:20<00:00, 346.42it/s]


에포크 63/100 | 평균 학습 손실: 0.128859


에포크 64: 100%|████████████████████| 7062/7062 [00:25<00:00, 281.83it/s]


에포크 64/100 | 평균 학습 손실: 0.128862


에포크 65: 100%|████████████████████| 7062/7062 [00:17<00:00, 407.70it/s]


에포크 65/100 | 평균 학습 손실: 0.128861


에포크 66: 100%|████████████████████| 7062/7062 [00:23<00:00, 303.12it/s]


에포크 66/100 | 평균 학습 손실: 0.128860


에포크 67: 100%|████████████████████| 7062/7062 [00:25<00:00, 278.91it/s]


에포크 67/100 | 평균 학습 손실: 0.128859


에포크 68: 100%|████████████████████| 7062/7062 [00:24<00:00, 292.83it/s]


에포크 68/100 | 평균 학습 손실: 0.128860


에포크 69: 100%|████████████████████| 7062/7062 [00:25<00:00, 280.67it/s]


에포크 69/100 | 평균 학습 손실: 0.128860


에포크 70: 100%|████████████████████| 7062/7062 [00:16<00:00, 440.74it/s]


에포크 70/100 | 평균 학습 손실: 0.128860


에포크 71: 100%|████████████████████| 7062/7062 [00:21<00:00, 323.20it/s]


에포크 71/100 | 평균 학습 손실: 0.128860


에포크 72: 100%|████████████████████| 7062/7062 [00:14<00:00, 494.61it/s]


에포크 72/100 | 평균 학습 손실: 0.128860


에포크 73: 100%|████████████████████| 7062/7062 [00:14<00:00, 492.89it/s]


에포크 73/100 | 평균 학습 손실: 0.128861


에포크 74: 100%|████████████████████| 7062/7062 [00:14<00:00, 495.39it/s]


에포크 74/100 | 평균 학습 손실: 0.128861


에포크 75: 100%|████████████████████| 7062/7062 [00:18<00:00, 377.43it/s]


에포크 75/100 | 평균 학습 손실: 0.128860


에포크 76: 100%|████████████████████| 7062/7062 [00:23<00:00, 300.69it/s]


에포크 76/100 | 평균 학습 손실: 0.128860


에포크 77: 100%|████████████████████| 7062/7062 [00:16<00:00, 433.71it/s]


에포크 77/100 | 평균 학습 손실: 0.128862


에포크 78: 100%|████████████████████| 7062/7062 [00:17<00:00, 411.30it/s]


에포크 78/100 | 평균 학습 손실: 0.128860


에포크 79: 100%|████████████████████| 7062/7062 [00:24<00:00, 288.48it/s]


에포크 79/100 | 평균 학습 손실: 0.128861


에포크 80: 100%|████████████████████| 7062/7062 [00:15<00:00, 444.72it/s]


에포크 80/100 | 평균 학습 손실: 0.128859


에포크 81: 100%|████████████████████| 7062/7062 [00:14<00:00, 490.71it/s]


에포크 81/100 | 평균 학습 손실: 0.128861


에포크 82: 100%|████████████████████| 7062/7062 [00:15<00:00, 469.70it/s]


에포크 82/100 | 평균 학습 손실: 0.128862


에포크 83: 100%|████████████████████| 7062/7062 [00:20<00:00, 338.85it/s]


에포크 83/100 | 평균 학습 손실: 0.128861


에포크 84: 100%|████████████████████| 7062/7062 [00:16<00:00, 439.15it/s]


에포크 84/100 | 평균 학습 손실: 0.128861


에포크 85: 100%|████████████████████| 7062/7062 [00:14<00:00, 471.30it/s]


에포크 85/100 | 평균 학습 손실: 0.128860


에포크 86: 100%|████████████████████| 7062/7062 [00:16<00:00, 438.63it/s]


에포크 86/100 | 평균 학습 손실: 0.128861


에포크 87: 100%|████████████████████| 7062/7062 [00:15<00:00, 458.34it/s]


에포크 87/100 | 평균 학습 손실: 0.128859


에포크 88: 100%|████████████████████| 7062/7062 [00:19<00:00, 354.34it/s]


에포크 88/100 | 평균 학습 손실: 0.128859


에포크 89: 100%|████████████████████| 7062/7062 [00:18<00:00, 376.18it/s]


에포크 89/100 | 평균 학습 손실: 0.128860


에포크 90: 100%|████████████████████| 7062/7062 [00:17<00:00, 402.36it/s]


에포크 90/100 | 평균 학습 손실: 0.128860


에포크 91: 100%|████████████████████| 7062/7062 [00:22<00:00, 317.26it/s]


에포크 91/100 | 평균 학습 손실: 0.128861


에포크 92: 100%|████████████████████| 7062/7062 [00:22<00:00, 313.73it/s]


에포크 92/100 | 평균 학습 손실: 0.128860


에포크 93: 100%|████████████████████| 7062/7062 [00:22<00:00, 311.12it/s]


에포크 93/100 | 평균 학습 손실: 0.128860


에포크 94: 100%|████████████████████| 7062/7062 [00:22<00:00, 309.83it/s]


에포크 94/100 | 평균 학습 손실: 0.128862


에포크 95: 100%|████████████████████| 7062/7062 [00:22<00:00, 318.63it/s]


에포크 95/100 | 평균 학습 손실: 0.128860


에포크 96: 100%|████████████████████| 7062/7062 [00:22<00:00, 317.35it/s]


에포크 96/100 | 평균 학습 손실: 0.128859


에포크 97: 100%|████████████████████| 7062/7062 [00:22<00:00, 311.16it/s]


에포크 97/100 | 평균 학습 손실: 0.128860


에포크 98: 100%|████████████████████| 7062/7062 [00:23<00:00, 304.91it/s]


에포크 98/100 | 평균 학습 손실: 0.128860


에포크 99: 100%|████████████████████| 7062/7062 [00:22<00:00, 317.89it/s]


에포크 99/100 | 평균 학습 손실: 0.128860


에포크 100: 100%|████████████████████| 7062/7062 [00:22<00:00, 311.95it/s]

에포크 100/100 | 평균 학습 손실: 0.128861



