In [1]:
from src.model import EpochLogger, MakeEmbed
from src.dataset import MakeDataset
from torch.utils.data import DataLoader

embed = MakeEmbed()
embed.load_word2vec()

batch_size = 128
dataset = MakeDataset()
ood_train_dataset, ood_test_dataset = dataset.make_ood_dataset(embed)

train_dataloader = DataLoader(ood_train_dataset, batch_size=batch_size, shuffle=True)
test_dataloader = DataLoader(ood_test_dataset, batch_size=batch_size, shuffle=True)

In [2]:
import torch
from src.model import DAN
weights = embed.word2vec.wv.vectors
weights = torch.FloatTensor(weights)

dan_model = DAN(weights, 256, 0.5, 2)
optimizer = torch.optim.Adam(dan_model.parameters(), lr= 0.001)


In [3]:
from tqdm import tqdm
from tqdm import trange
import os
import torch.nn.functional as F

epoch = 100
prev_acc = 0
save_dir = "./nlp/pretrained/"
save_prefix = "ood_clsf"

def save(model, save_dir, save_prefix, epoch):
    if not os.path.isdir(save_dir):
        os.makedirs(save_dir)
    save_prefix = os.path.join(save_dir, save_prefix)
    save_path = '{}_steps_{}.pt'.format(save_prefix, epoch)
    torch.save(model.state_dict(), save_path)

for i in range(epoch):
    steps = 0

    dan_model.train() # 모델 학습 하겠다. (parameters가 수정됨)

    with tqdm(train_dataloader, unit="batch") as tepoch: # 진행상황 표시
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            target = data[1]
            logit = dan_model.forward(x)

            optimizer.zero_grad()
            loss = F.cross_entropy(logit, target) 
            loss.backward()
            optimizer.step()

            corrects = (torch.max(logit, 1)[1].view(target.size()).data == target.data).sum()
            accuracy = 100.0 * corrects/x.size()[0]
            tepoch.set_postfix(loss=loss.item(), accuracy= accuracy.numpy())

    dan_model.eval() # 모델 검증하겠다 (parameters 수정안됨)
    steps = 0
    accuarcy_list = []
    with tqdm(test_dataloader, unit="batch") as tepoch:
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            target = data[1]

            logit = dan_model.forward(x)
            loss = F.cross_entropy(logit, target)
            corrects = (torch.max(logit, 1)[1].view(target.size()).data == target.data).sum()
            accuracy = 100.0 * corrects/x.size()[0]
            accuarcy_list.append(accuracy.tolist())

            tepoch.set_postfix(loss=loss.item(), accuracy= sum(accuarcy_list)/len(accuarcy_list))

    # epoch 당 검증 셋의 정확도를 계산하고 이전 정확도 보다 높으면 저장
    acc = sum(accuarcy_list)/len(accuarcy_list)
    if(acc>prev_acc):
        prev_acc = acc
        save(dan_model, save_dir, save_prefix+"_"+str(round(acc,3)), i)

Epoch 0: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 49.16batch/s, accuracy=92.72727, loss=0.254]
Epoch 0: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 120.00batch/s, accuracy=96.8, loss=0.202]
Epoch 1: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 53.57batch/s, accuracy=92.72727, loss=0.198]
Epoch 1: 100%|█████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 125.00batch/s, accuracy=98.9, loss=0.099]
Epoch 2: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 55.33batch/s, accuracy=92.72727, loss=0.149]
Epoch 2: 100%|██████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 110.10batch/s, accuracy=99.3, loss=0.43]
Epoch 3: 100%|████████

Epoch 25: 100%|███████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 61.38batch/s, accuracy=98.181816, loss=0.0261]
Epoch 25: 100%|█████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 110.48batch/s, accuracy=99.5, loss=0.000424]
Epoch 26: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 60.10batch/s, accuracy=100.0, loss=0.00207]
Epoch 26: 100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 129.74batch/s, accuracy=99.6, loss=2.86e-5]
Epoch 27: 100%|█████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 61.50batch/s, accuracy=100.0, loss=0.000142]
Epoch 27: 100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 125.79batch/s, accuracy=99.5, loss=7.52e-5]
Epoch 28: 100%|███████

Epoch 50: 100%|███████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 58.24batch/s, accuracy=98.181816, loss=0.0595]
Epoch 50: 100%|█████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 130.25batch/s, accuracy=99.6, loss=0.000394]
Epoch 51: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 61.13batch/s, accuracy=100.0, loss=0.00767]
Epoch 51: 100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 113.27batch/s, accuracy=99.6, loss=0.00135]
Epoch 52: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 60.44batch/s, accuracy=100.0, loss=0.00544]
Epoch 52: 100%|█████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 131.23batch/s, accuracy=99.6, loss=0.000234]
Epoch 53: 100%|███████

Epoch 75: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 64.65batch/s, accuracy=100.0, loss=0.00265]
Epoch 75: 100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 148.48batch/s, accuracy=99.6, loss=0.00222]
Epoch 76: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 63.16batch/s, accuracy=100.0, loss=0.00271]
Epoch 76: 100%|█████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 143.01batch/s, accuracy=99.6, loss=0.000394]
Epoch 77: 100%|██████████████████████████████████████████████████████████████████████████████████| 93/93 [00:01<00:00, 66.45batch/s, accuracy=100.0, loss=0.00239]
Epoch 77: 100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 132.22batch/s, accuracy=99.5, loss=0.00101]
Epoch 78: 100%|███████