In [1]:
from src.model import EpochLogger, MakeEmbed
from src.dataset import MakeDataset
from torch.utils.data import DataLoader

embed = MakeEmbed()
embed.load_word2vec()

batch_size = 128
dataset = MakeDataset()
ood_train_dataset, ood_test_dataset = dataset.make_ood_dataset(embed)

train_dataloader = DataLoader(ood_train_dataset, batch_size=batch_size, shuffle=True)
test_dataloader = DataLoader(ood_test_dataset, batch_size=batch_size, shuffle=True)

In [2]:
import torch
from src.model import DAN
weights = embed.word2vec.wv.vectors
weights = torch.FloatTensor(weights)

dan_model = DAN(weights, 256, 0.5, 2)
optimizer = torch.optim.Adam(dan_model.parameters(), lr= 0.001)


In [3]:
from tqdm import tqdm
from tqdm import trange
import os
import torch.nn.functional as F

epoch = 100
prev_acc = 0
save_dir = "./nlp/pretrained/"
save_prefix = "ood_clsf"

def save(model, save_dir, save_prefix, epoch):
    if not os.path.isdir(save_dir):
        os.makedirs(save_dir)
    save_prefix = os.path.join(save_dir, save_prefix)
    save_path = '{}_steps_{}.pt'.format(save_prefix, epoch)
    torch.save(model.state_dict(), save_path)

for i in range(epoch):
    steps = 0

    dan_model.train() # 모델 학습 하겠다. (parameters가 수정됨)

    with tqdm(train_dataloader, unit="batch") as tepoch: # 진행상황 표시
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            target = data[1]
            logit = dan_model.forward(x)

            optimizer.zero_grad()
            loss = F.cross_entropy(logit, target) 
            loss.backward()
            optimizer.step()

            corrects = (torch.max(logit, 1)[1].view(target.size()).data == target.data).sum()
            accuracy = 100.0 * corrects/x.size()[0]
            tepoch.set_postfix(loss=loss.item(), accuracy= accuracy.numpy())

    dan_model.eval() # 모델 검증하겠다 (parameters 수정안됨)
    steps = 0
    accuarcy_list = []
    with tqdm(test_dataloader, unit="batch") as tepoch:
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            target = data[1]

            logit = dan_model.forward(x)
            loss = F.cross_entropy(logit, target)
            corrects = (torch.max(logit, 1)[1].view(target.size()).data == target.data).sum()
            accuracy = 100.0 * corrects/x.size()[0]
            accuarcy_list.append(accuracy.tolist())

            tepoch.set_postfix(loss=loss.item(), accuracy= sum(accuarcy_list)/len(accuarcy_list))

    # epoch 당 검증 셋의 정확도를 계산하고 이전 정확도 보다 높으면 저장
    acc = sum(accuarcy_list)/len(accuarcy_list)
    if(acc>prev_acc):
        prev_acc = acc
        save(dan_model, save_dir, save_prefix+"_"+str(round(acc,3)), i)

Epoch 0: 100%|████████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 56.23batch/s, accuracy=96.8, loss=0.186]
Epoch 0: 100%|██████████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 127.08batch/s, accuracy=98, loss=0.16]
Epoch 1: 100%|████████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 60.16batch/s, accuracy=96.8, loss=0.118]
Epoch 1: 100%|██████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 118.23batch/s, accuracy=99.1, loss=0.0455]
Epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 59.44batch/s, accuracy=97.6, loss=0.0924]
Epoch 2: 100%|██████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 125.26batch/s, accuracy=99.6, loss=0.0362]
Epoch 3: 100%|████████████████████

Epoch 25: 100%|███████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 50.89batch/s, accuracy=100.0, loss=0.000943]
Epoch 25: 100%|██████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 73.02batch/s, accuracy=99.4, loss=0.0211]
Epoch 26: 100%|████████████████████████████████████████████████████████████████████████████████| 90/90 [00:02<00:00, 42.81batch/s, accuracy=100.0, loss=0.00179]
Epoch 26: 100%|███████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 131.60batch/s, accuracy=99.5, loss=0.000275]
Epoch 27: 100%|██████████████████████████████████████████████████████████████████████████████████| 90/90 [00:02<00:00, 41.31batch/s, accuracy=99.2, loss=0.0107]
Epoch 27: 100%|████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 89.89batch/s, accuracy=99.5, loss=0.000817]
Epoch 28: 100%|███████████████████

Epoch 50: 100%|████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 58.90batch/s, accuracy=100.0, loss=0.00224]
Epoch 50: 100%|████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 132.95batch/s, accuracy=99.4, loss=0.00184]
Epoch 51: 100%|███████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 59.84batch/s, accuracy=100.0, loss=0.000776]
Epoch 51: 100%|████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 123.66batch/s, accuracy=99.4, loss=0.00049]
Epoch 52: 100%|████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 57.92batch/s, accuracy=100.0, loss=0.00288]
Epoch 52: 100%|█████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 133.73batch/s, accuracy=99.5, loss=0.0109]
Epoch 53: 100%|███████████████████

Epoch 75: 100%|████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 61.61batch/s, accuracy=100.0, loss=0.00994]
Epoch 75: 100%|██████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 152.09batch/s, accuracy=99.4, loss=0.154]
Epoch 76: 100%|██████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 61.20batch/s, accuracy=99.2, loss=0.0112]
Epoch 76: 100%|███████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 142.08batch/s, accuracy=99.4, loss=0.000475]
Epoch 77: 100%|████████████████████████████████████████████████████████████████████████████████| 90/90 [00:01<00:00, 65.00batch/s, accuracy=100.0, loss=0.00285]
Epoch 77: 100%|██████████████████████████████████████████████████████████████████████████████████| 23/23 [00:00<00:00, 131.36batch/s, accuracy=99.4, loss=0.155]
Epoch 78: 100%|███████████████████