In [2]:
from src.dataset import MakeDataset
from src.model import MakeEmbed
from torch.utils.data import DataLoader

# 데이터셋 만들기
dataset = MakeDataset()

# 임베딩 모델 불러오기
embed = MakeEmbed()
embed.load_word2vec()

entity_train_dataset, entity_test_dataset = dataset.make_entity_dataset(embed)

batch_size = 128

train_dataloader = DataLoader(entity_train_dataset, batch_size=batch_size, shuffle=True)
test_dataloader = DataLoader(entity_test_dataset, batch_size=batch_size, shuffle=True)

In [3]:
import torch
from src.model import BiLSTM_CRF

# bilstm CNN 모델 만들기
weights = embed.word2vec.wv.vectors
weights = torch.FloatTensor(weights)

bilstm_crf_model = BiLSTM_CRF(weights, dataset.entity_label, 256, 128)
optimizer = torch.optim.Adam(bilstm_crf_model.parameters(), lr=0.001)

bilstm_crf_model.train()

BiLSTM_CRF(
  (word_embeds): Embedding(472, 300)
  (lstm): LSTM(300, 128, batch_first=True, bidirectional=True)
  (hidden2tag): Linear(in_features=256, out_features=26, bias=True)
  (crf): CRF(num_tags=26)
)

In [4]:
from tqdm import tqdm
from tqdm import trange
import os
import torch.nn.functional as F

epoch = 100
prev_acc = 0
save_dir = "./nlp/pretrained/"
save_prefix = "cafe_entity_recog"

def save(model, save_dir, save_prefix, epoch):
    if not os.path.isdir(save_dir):
        os.makedirs(save_dir)
    save_prefix = os.path.join(save_dir, save_prefix)
    save_path = '{}_steps_{}.pt'.format(save_prefix, epoch)
    torch.save(model.state_dict(), save_path)

for i in range(epoch):
    steps = 0
    
    bilstm_crf_model.train() # 모델 학습 하겠다. (parameters가 수정됨)
    
    with tqdm(train_dataloader, unit="batch") as tepoch: # 진행상황 표시
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            y = data[1]
            length = data[2]
            
            logits = bilstm_crf_model.forward(x)
            
            
            # padding 된 부분을 마스킹하기 위한 코드
            mask = torch.where(x > 0, torch.tensor([1.]), torch.tensor([0.])).type(torch.uint8)
            
            loss = bilstm_crf_model.compute_loss(y, logits, mask)
            
            loss.backward()
            optimizer.step()

            tepoch.set_postfix(loss=loss.item())
            
    bilstm_crf_model.eval() # 모델 검증하겠다 (parameters 수정안됨)
    steps = 0
    accuracy_list = []
    with tqdm(test_dataloader, unit="batch") as tepoch:
        for data in tepoch:
            tepoch.set_description(f"Epoch {i}")
            x = data[0]
            y = data[1]
            length = data[2]
            mask = torch.where(x > 0, torch.tensor([1.]), torch.tensor([0.])).type(torch.uint8)
            logits = bilstm_crf_model.forward(x)

            predicts = bilstm_crf_model.decode(logits, mask)
            
            corrects = []
            
            for target, leng, predict in zip(y, length, predicts):
                corrects.append(target[:leng].tolist() == predict) 
                
            accuracy = 100.0 * sum(corrects)/len(corrects)
            accuracy_list.append(accuracy)
            
            loss = bilstm_crf_model.compute_loss(y, logits, mask)

            
            tepoch.set_postfix(loss=loss.item(), accuracy= sum(accuracy_list)/len(accuracy_list))
    
    # epoch 당 검증 셋의 정확도를 계산하고 이전 정확도 보다 높으면 저장     
    acc = sum(accuracy_list)/len(accuracy_list)
    if(acc>prev_acc):
        prev_acc = acc
        save(bilstm_crf_model, save_dir, save_prefix+"_"+str(round(acc, 3)), i)

  score = torch.where(mask[i].unsqueeze(1), next_score, score)
Epoch 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:02<00:00,  5.81batch/s, loss=3.55]
Epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.17batch/s, accuracy=18, loss=2.21]
Epoch 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:02<00:00,  6.85batch/s, loss=1.41]
Epoch 1: 100%|████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.95batch/s, accuracy=47.3, loss=0.539]
Epoch 2: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:02<00:00,  7.13batch/s, loss=0.701]
Epoch 2: 100%|█████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,

Epoch 23: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.73batch/s, loss=2.07]
Epoch 23: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.57batch/s, accuracy=91.7, loss=-]
Epoch 24: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.47batch/s, loss=-]
Epoch 24: 100%|████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  8.88batch/s, accuracy=71.4, loss=3.01]
Epoch 25: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:09<00:00,  1.79batch/s, loss=-]
Epoch 25: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.45batch/s, accuracy=90.9, loss=-]
Epoch 26: 100%|███████

Epoch 48: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.44batch/s, loss=-]
Epoch 48: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  7.28batch/s, accuracy=91.4, loss=-]
Epoch 49: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.54batch/s, loss=-]
Epoch 49: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  6.27batch/s, accuracy=91.2, loss=-]
Epoch 50: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:07<00:00,  2.40batch/s, loss=1.53e-5]
Epoch 50: 100%|██████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00,  4.08batch/s, accuracy=91.4, loss=0.0299]
Epoch 51: 100%|███████

Epoch 73: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:08<00:00,  1.91batch/s, loss=-]
Epoch 73: 100%|█████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.92batch/s, accuracy=91.9, loss=0.00385]
Epoch 74: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.62batch/s, loss=0.000702]
Epoch 74: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.58batch/s, accuracy=91.2, loss=-]
Epoch 75: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.78batch/s, loss=1.23]
Epoch 75: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.98batch/s, accuracy=90.8, loss=-]
Epoch 76: 100%|███████

Epoch 98: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.77batch/s, loss=-]
Epoch 98: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.05batch/s, accuracy=90.5, loss=-]
Epoch 99: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.68batch/s, loss=0.00179]
Epoch 99: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  5.63batch/s, accuracy=90.8, loss=-]
