In [1]:
import re
import os
import math
import torch
import pandas as pd
import pytorch_lightning as pl


from tqdm import tqdm
from rouge import Rouge
from datetime import datetime


from torch import nn
from konlpy.tag import Mecab
from tensorboardX import SummaryWriter
from transformers import AutoTokenizer
from torch.optim.lr_scheduler import _LRScheduler
from torch.utils.data import Dataset , DataLoader
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM


  from .autonotebook import tqdm as notebook_tqdm


In [2]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'

In [3]:
model_id = "psyche/KoT5-summarization"
train_df = pd.read_csv('../dataset/cleaned_train.csv')
val_df = pd.read_csv('../dataset/cleaned_dev.csv')
test_df = pd.read_csv("../dataset/test.csv")

epochs = 100
batch_size = 16
num_workers = 0
patience = 5

init_lr = 0.0001
max_lr = 0.001
warmup_epochs = 10
T_0 = 100
T_mult = 1
T_gamma = 0.5

dig_max_len = 1024
sum_max_len = 512

tokenizer = AutoTokenizer.from_pretrained(model_id)
special_tokens_dict={'additional_special_tokens': ['#Person1#', '#Person2#','#Person3#', '#Person4#', '#Person5#', '#Person6#', '#Person7#', '#PhoneNumber#', 
                                                   '#Address#', '#PassportNumber#', '#CardNumber#', '#Email#', '#DateOfBirth#',
                                                   '<sep>']}

tokenizer.add_special_tokens(special_tokens_dict)
print(tokenizer.special_tokens_map)

remove_tokens = [
    '<usr>',
    f"{tokenizer.unk_token}", 
    f"{tokenizer.eos_token}", 
    f"{tokenizer.pad_token}"
]

{'eos_token': '</s>', 'unk_token': '<unk>', 'pad_token': '<pad>', 'additional_special_tokens': ['#Person1#', '#Person2#', '#Person3#', '#Person4#', '#Person5#', '#Person6#', '#Person7#', '#PhoneNumber#', '#Address#', '#PassportNumber#', '#CardNumber#', '#Email#', '#DateOfBirth#', '<sep>']}




In [4]:
model = AutoModelForSeq2SeqLM.from_pretrained(model_id).to(device)
optimizer = torch.optim.AdamW(model.parameters(), lr=1e-4, weight_decay=0.01)

In [5]:
class CustomDataset(Dataset):
    def __init__(self, df, tokenizer, input_len, summ_len, is_train=True):
        self.tokenizer = tokenizer
        self.df = df.copy()  # 원본 데이터를 보존하기 위해 복사본을 사용
        self.source_len = input_len
        self.summ_len = summ_len
        self.is_train = is_train

        ###
        # 화자가 바뀔 때 SEP 토큰을 추가
        self.df.loc[:, 'dialogue'] = self.df['dialogue'].apply(self.add_sep_tokens)

        if self.is_train:
            self.input_ids = tokenizer(self.df['dialogue'].tolist(), return_tensors="pt", padding=True,
                                add_special_tokens=True, truncation=True, max_length=512, return_token_type_ids=False).input_ids
            self.labels = tokenizer(self.df['summary'].tolist(), return_tensors="pt", padding=True,
                                add_special_tokens=True, truncation=True, max_length=100, return_token_type_ids=False).input_ids
        else:
            self.input_ids = tokenizer(self.df['dialogue'].tolist(), return_tensors="pt", padding=True,
                                add_special_tokens=True, truncation=True, max_length=512, return_token_type_ids=False).input_ids

    def __len__(self):
        return len(self.input_ids)

    def __getitem__(self, idx):
        if self.is_train:
            return self.input_ids[idx], self.labels[idx]
        else:
            return self.input_ids[idx]

    ###
    def add_sep_tokens(self, dialogue):
        # 화자가 바뀔 때 SEP 토큰을 추가하는 함수
        pattern = r'(#Person\d+#)'  # 화자를 나타내는 패턴
        parts = re.split(pattern, dialogue)  # 화자를 기준으로 대화 분리
        result = []
        prev_speaker = None
        for part in parts:
            if re.match(pattern, part):  # 화자가 바뀌면
                if prev_speaker and prev_speaker != part:
                    result.append('<sep>')  # SEP 토큰 추가
                prev_speaker = part
            result.append(part)
        return ''.join(result)


In [6]:
train_dataset = CustomDataset(train_df[['dialogue', 'summary']], tokenizer, dig_max_len, sum_max_len)
val_dataset = CustomDataset(val_df[['dialogue', 'summary']], tokenizer, dig_max_len, sum_max_len)
test_dataset = CustomDataset(test_df[['dialogue']], tokenizer, dig_max_len, sum_max_len, is_train=False)

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True, num_workers=num_workers)
val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False, num_workers=num_workers)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False, num_workers=num_workers)

In [7]:
def ids_to_words(tokenizer, preds, labels):
    decoded_preds = tokenizer.batch_decode(preds, clean_up_tokenization_spaces=True)
    labels = tokenizer.batch_decode(labels, clean_up_tokenization_spaces=True)

    replaced_predictions = decoded_preds.copy()
    replaced_labels = labels.copy()
    # remove_tokens = ['<usr>', f"{tokenizer.unk_token}", f"{tokenizer.eos_token}", f"{tokenizer.pad_token}"]

    for token in remove_tokens:
        replaced_predictions = [sentence.replace(token," ") for sentence in replaced_predictions]
        replaced_labels = [sentence.replace(token," ") for sentence in replaced_labels]
    return replaced_predictions, replaced_labels

In [8]:
def compute_metrics(replaced_predictions, replaced_labels):
    rouge = Rouge()

    results = rouge.get_scores(replaced_predictions, replaced_labels,avg=True)
    result = {key: value["f"] for key, value in results.items()}
    
    return result

In [9]:
class CosineAnnealingWarmUpRestarts(_LRScheduler):
    def __init__(self, optimizer, T_0, T_mult=1, eta_max=0.1, T_up=0, gamma=1., last_epoch=-1):
        if T_0 <= 0 or not isinstance(T_0, int):
            raise ValueError("Expected positive integer T_0, but got {}".format(T_0))
        if T_mult < 1 or not isinstance(T_mult, int):
            raise ValueError("Expected integer T_mult >= 1, but got {}".format(T_mult))
        if T_up < 0 or not isinstance(T_up, int):
            raise ValueError("Expected positive integer T_up, but got {}".format(T_up))
        self.T_0 = T_0
        self.T_mult = T_mult
        self.base_eta_max = eta_max
        self.eta_max = eta_max
        self.T_up = T_up
        self.T_i = T_0
        self.gamma = gamma
        self.cycle = 0
        self.T_cur = last_epoch
        super(CosineAnnealingWarmUpRestarts, self).__init__(optimizer, last_epoch)
    
    def get_lr(self):
        if self.T_cur == -1:
            return self.base_lrs
        elif self.T_cur < self.T_up:
            return [(self.eta_max - base_lr)*self.T_cur / self.T_up + base_lr for base_lr in self.base_lrs]
        else:
            return [base_lr + (self.eta_max - base_lr) * (1 + math.cos(math.pi * (self.T_cur-self.T_up) / (self.T_i - self.T_up))) / 2
                    for base_lr in self.base_lrs]

    def step(self, epoch=None):
        if epoch is None:
            epoch = self.last_epoch + 1
            self.T_cur = self.T_cur + 1
            if self.T_cur >= self.T_i:
                self.cycle += 1
                self.T_cur = self.T_cur - self.T_i
                self.T_i = (self.T_i - self.T_up) * self.T_mult + self.T_up
        else:
            if epoch >= self.T_0:
                if self.T_mult == 1:
                    self.T_cur = epoch % self.T_0
                    self.cycle = epoch // self.T_0
                else:
                    n = int(math.log((epoch / self.T_0 * (self.T_mult - 1) + 1), self.T_mult))
                    self.cycle = n
                    self.T_cur = epoch - self.T_0 * (self.T_mult ** n - 1) / (self.T_mult - 1)
                    self.T_i = self.T_0 * self.T_mult ** (n)
            else:
                self.T_i = self.T_0
                self.T_cur = epoch
                
        self.eta_max = self.base_eta_max * (self.gamma**self.cycle)
        self.last_epoch = math.floor(epoch)
        for param_group, lr in zip(self.optimizer.param_groups, self.get_lr()):
            param_group['lr'] = lr

In [10]:
def train(epoch, model, device, train_loader, optimizer, train_step, writer):
    model.train()
    total_loss = 0.0

    for idx, batch in tqdm(enumerate(train_loader), total=len(train_loader), desc=f"Training Epoch {epoch}", leave=False):
        input_ids = batch[0].to(device, dtype=torch.long)
        labels = batch[1].to(device, dtype=torch.long)

        optimizer.zero_grad()
        outputs = model(input_ids=input_ids, labels=labels)
        ce_loss = outputs.loss

        ce_loss.backward()
        optimizer.step()

        total_loss += ce_loss.item()
        train_step += 1

    avg_loss = total_loss / len(train_loader)

    writer.add_scalar('Loss/train', avg_loss, epoch)
    return train_step, avg_loss

In [11]:
def validate(tokenizer, model, device, val_loader, writer, epoch):
    model.eval()
    total_loss = 0
    all_results = []
    all_predictions = []
    all_labels = []

    with torch.no_grad():
        for idx, batch in tqdm(enumerate(val_loader), total=len(val_loader), desc="Validating", leave=False):
            input_ids = batch[0].to(device, dtype=torch.long)
            labels = batch[1].to(device, dtype=torch.long)

            pred_ids = model.generate(input_ids=input_ids, max_length=256, num_beams=4, repetition_penalty=2.0, 
                                      length_penalty=1.0, early_stopping=True, no_repeat_ngram_size=2)

            loss = model(input_ids=input_ids, labels=labels).loss
            total_loss += loss.item()

            replaced_predictions, replaced_labels = ids_to_words(tokenizer, pred_ids, labels)
            result = compute_metrics(replaced_predictions, replaced_labels)

            all_results.append(result)
            all_predictions.extend(replaced_predictions)
            all_labels.extend(replaced_labels)

    val_loss = total_loss / len(val_loader)
    avg_result = {key: sum(r[key] for r in all_results) / len(all_results) for key in all_results[0]}
    
    writer.add_scalar('Loss/valid', val_loss, epoch)
    writer.add_scalar('ROUGE/rouge-1', avg_result['rouge-1'], epoch)
    writer.add_scalar('ROUGE/rouge-2', avg_result['rouge-2'], epoch)
    writer.add_scalar('ROUGE/rouge-l', avg_result['rouge-l'], epoch)

    return val_loss, avg_result, all_predictions, all_labels

In [12]:
train_step = 0

timestamp = datetime.now().strftime('%Y-%m-%d-%H-%M-%S')
save_path = os.path.join("./T5_runs", timestamp)

weights_path = os.path.join(save_path, 'weights')
logs_path = os.path.join(save_path, 'logs')
os.makedirs(weights_path, exist_ok=True)
os.makedirs(logs_path, exist_ok=True)

best_avg_rouge = 0
early_stopping_counter = 0
best_val_loss = float('inf')
writer = SummaryWriter(log_dir=logs_path)
scheduler = CosineAnnealingWarmUpRestarts(optimizer, T_0=T_0, T_mult=T_mult, eta_max=max_lr,  T_up=warmup_epochs, gamma=T_gamma)
for epoch in range(1, epochs + 1):
    train_step, train_loss = train(epoch, model, device, train_loader, optimizer, train_step, writer)
    val_loss, val_result, val_predictions, val_labels = validate(tokenizer, model, device, val_loader, writer, epoch)

    avg_rouge = (val_result['rouge-1'] + val_result['rouge-2'] + val_result['rouge-l']) / 3
    print(f"Epoch {epoch}/{epochs}")
    print(f"Train Loss: {train_loss:.6f}")
    print(f"Validation Loss: {val_loss:.6f}, Rouge-1: {val_result['rouge-1']:.6f}, Rouge-2: {val_result['rouge-2']:.6f}, Rouge-l: {val_result['rouge-l']:.6f}")
    print(f"Average ROUGE: {avg_rouge:.6f}")

    print('-'*150)
    for i in range(3):
        print(f"PRED: {val_predictions[i]}")
        print(f"GOLD: {val_labels[i]}")
        print('-'*150)

    if avg_rouge > best_avg_rouge:
        best_avg_rouge = avg_rouge
        early_stopping_counter = 0 
        torch.save(model.state_dict(), os.path.join(weights_path, 'best.pth'))
        print(f"New best model saved with average ROUGE: {best_avg_rouge:.6f}")

    else:
        early_stopping_counter += 1
        print(f"Not improve. Early stopping counter: {early_stopping_counter}/{patience}")

    # Early stopping 조건 확인
    if early_stopping_counter >= patience:
        print("Early stopping triggered.")
        break

    torch.save(model.state_dict(), os.path.join(weights_path, f'epoch-{epoch}.pth'))
    print()

writer.close()
torch.save(model.state_dict(), os.path.join(weights_path, 'last.pth'))
print("Training completed. Last model saved.")

                                                                   

Epoch 1/100
Train Loss: 0.765012
Validation Loss: 0.586895, Rouge-1: 0.342694, Rouge-2: 0.111150, Rouge-l: 0.320415
Average ROUGE: 0.258086
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨쉬기가 힘들다고 느끼고, 알레르기가 있는지 묻습니다. #Person2# 는 폐 전문의에게 천식에 대한 검사를 받게 할 것입니다.                                     
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   헤이, 지미는 3시 30분에 운동하러 가자고 제안한다. 그들은 단지 두 날을 바꾸는 것을 제안하고, 금요일에 다리를 할 수 있다고 말한다.                                   
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
--------------------------

                                                                   

Epoch 2/100
Train Loss: 0.580652
Validation Loss: 0.557176, Rouge-1: 0.338138, Rouge-2: 0.108483, Rouge-l: 0.318480
Average ROUGE: 0.255034
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   의사 선생님은 #Person1# 에게 최근 숨쉬기가 힘들다고 말하고, 알레르기가 있는지 묻습니다. #Person2# 는 폐 전문의에게 천식에 대한 검사를 받도록 할 것입니다.                         
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   헤이, 지미는 3시 30분에 헬스장에 가자고 제안한다. 그들은 금요일에 두 날을 바꾸기로 결정하고 다시 만나기로 한다.                                
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
--------------------------------------

                                                                   

Epoch 3/100
Train Loss: 0.530246
Validation Loss: 0.534735, Rouge-1: 0.373175, Rouge-2: 0.130584, Rouge-l: 0.350167
Average ROUGE: 0.284642
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 #Person2# 에게 최근 숨쉬기가 힘들다고 말합니다. #Person1# 는 폐 전문의에게 천식에 대한 검사를 받도록 요청합니다.                                 
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미는 #Person1# 에게 운동하러 가자고 제안하지만, #Person2# 은 지미 때문에 모든 것이 망가지고 있다고 말한다.                                    
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
----------------------------------

                                                                   

Epoch 4/100
Train Loss: 0.484493
Validation Loss: 0.526318, Rouge-1: 0.363181, Rouge-2: 0.125128, Rouge-l: 0.341818
Average ROUGE: 0.276709
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨쉬기가 힘들다고 #Person2# 에게 말하고, 알레르기는 없지만 운동을 할 때 많이 나타난다고 말한다. #Person1# 는 폐 전문의에게 천식 검사를 받도록 요청한다.             
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미는 #Person1# 에게 운동하러 가자고 제안한다. 그들은 금요일에 다리를 할 수 있도록 두 날을 바꾼다.                           
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
-------------------------------------------------

                                                                   

Epoch 5/100
Train Loss: 0.447137
Validation Loss: 0.525816, Rouge-1: 0.372769, Rouge-2: 0.129491, Rouge-l: 0.351387
Average ROUGE: 0.284549
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨쉬기가 좀 힘들다고 #Person2# 에게 말합니다. #Person1# 는 알레르기가 없고 운동을 할 때 많이 나타납니다.                             
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미는 #Person1# 에게 운동하러 가자고 제안한다. 그들은 금요일에 다리를 할 수 있도록 두 날을 바꾸기로 한다.                               
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
----------------------------------------------------

                                                                   

Epoch 6/100
Train Loss: 0.412844
Validation Loss: 0.533887, Rouge-1: 0.370534, Rouge-2: 0.128973, Rouge-l: 0.348303
Average ROUGE: 0.282603
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 #Person2# 에게 최근 숨쉬기가 힘들다고 말하고, 알레르기가 없다고 말한다. #Person1# 는 폐 전문의에게 천식 검사를 받도록 요청할 것이다.                          
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 지미에게 운동하러 가자고 제안한다. 지미는 팔과 배를 운동하자고 제안하지만, #Person2# 은 주간 스케줄을 따르고 있다. 그들은 금요일에 다리를 할 것이다.                      
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
-------------

                                                                   

Epoch 7/100
Train Loss: 0.383491
Validation Loss: 0.536356, Rouge-1: 0.374041, Rouge-2: 0.133915, Rouge-l: 0.351502
Average ROUGE: 0.286486
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 최근 숨쉬기가 힘들다고 #Person2# 에게 말하고, 알레르기를 가지고 있지 않다고 말한다. #Person1# 는 폐 전문의에게 천식 검사를 받도록 요청할 것이다.                       
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미와 #Person1# 은 3시 30분에 헬스장에서 만나기로 한다. 그들은 금요일에 다리를 할 수 있도록 두 날을 바꾼다.                                 
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
------------------------------

                                                                   

Epoch 8/100
Train Loss: 0.356226
Validation Loss: 0.549146, Rouge-1: 0.370178, Rouge-2: 0.133255, Rouge-l: 0.349796
Average ROUGE: 0.284409
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴집니다. #Person2# 는 #Person1# 을 폐 전문의에게 보내 천식에 대한 검사를 받게 할 것입니다.                          
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미와 #Person1# 은 3시 30분에 헬스장에서 만나 운동을 하기로 결정한다.                                      
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
---------------------------------------------------------

                                                                   

Epoch 9/100
Train Loss: 0.332251
Validation Loss: 0.560377, Rouge-1: 0.374798, Rouge-2: 0.142210, Rouge-l: 0.356280
Average ROUGE: 0.291096
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴진다고 #Person2# 에게 말합니다. #Person1# 는 천식에 대한 검사를 받기 위해 폐 전문의에게 갈 예정입니다.                                
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미와 #Person1# 은 3시 30분에 헬스장에서 만나 운동을 하기로 결정한다. 그들은 금요일에 다리를 할 예정이다.                                        
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
---------------------

                                                                    

Epoch 10/100
Train Loss: 0.309152
Validation Loss: 0.577659, Rouge-1: 0.365597, Rouge-2: 0.131282, Rouge-l: 0.345538
Average ROUGE: 0.280806
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴진다고 #Person2# 에게 말한다. 알레르기는 없지만, 운동을 할 때 많이 나타난다. 의사 선생님은 그를 폐 전문의에게 보내 천식 검사를 받게 할 것이다.                 
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미와 #Person1# 은 3시 30분에 헬스장에서 만나 운동을 하기로 결정한다. 그들은 금요일에 다리를 할 예정이다.                                   
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
--------------------

                                                                    

Epoch 11/100
Train Loss: 0.286345
Validation Loss: 0.591629, Rouge-1: 0.375732, Rouge-2: 0.137638, Rouge-l: 0.352941
Average ROUGE: 0.288770
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴집니다. #Person2# 는 #Person1# 을 폐 전문의에게 보내 천식에 대한 검사를 받게 할 것입니다.                         
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person2# 와 지미는 3시 30분에 헬스장에서 만나기로 결정한다. 그들은 금요일에 다리를 할 예정이다.                                
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
-------------------------------------------------

                                                                    

Epoch 12/100
Train Loss: 0.268055
Validation Loss: 0.607645, Rouge-1: 0.359650, Rouge-2: 0.125014, Rouge-l: 0.340566
Average ROUGE: 0.275077
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴져서 #Person2# 에게 천식에 대한 검사를 받으러 찾아갑니다.                                 
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:   지미와 #Person1# 은 3시 30분에 헬스장에서 만나 운동을 하기로 결정한다. 그들은 금요일에 다리를 할 예정이다.                                
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
----------------------------------------------------------

                                                                    

Epoch 13/100
Train Loss: 0.251051
Validation Loss: 0.624959, Rouge-1: 0.369562, Rouge-2: 0.130819, Rouge-l: 0.349536
Average ROUGE: 0.283305
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person2# 는 숨을 쉴 때마다 가슴이 무겁게 느껴진다고 #Person1# 에게 말한다. #Person2# 은 천식에 대한 검사를 위해 폐 전문의에게 보내기로 결정한다.                   
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 과 지미는 3시 30분에 헬스장에서 만나기로 결정한다. 그들은 금요일에 다리를 하기 위해 두 날을 바꾼다.                          
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
------------------------------------------------

                                                                    

Epoch 14/100
Train Loss: 0.234872
Validation Loss: 0.642607, Rouge-1: 0.360467, Rouge-2: 0.129528, Rouge-l: 0.339053
Average ROUGE: 0.276349
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 은 숨을 쉴 때마다 가슴이 무겁게 느껴집니다. #Person2# 는 #Person1# 에게 폐 전문의에게 천식에 대한 검사를 받게 해달라고 요청합니다.                                     
GOLD: #Person2# 는 숨쉬기에 어려움을 겪는다. 의사는 #Person1# 에게 이에 대해 묻고, #Person2# 를 폐 전문의에게 보낼 예정이다.                                                                 
------------------------------------------------------------------------------------------------------------------------------------------------------
PRED:  #Person1# 과 지미는 3시 30분에 헬스장에서 만나기로 하고, 그들은 금요일에 다리를 할 예정이다.                                              
GOLD: #Person1# 은 지미에게 운동하러 가자고 제안하고 팔과 배를 운동하도록 설득한다.                                                                         
-----------------------

In [16]:
def predict(tokenizer, model, device, test_loader, fname):
    model.eval()
    summary = []
    with torch.no_grad():
        for input_ids in tqdm(test_loader):
            input_ids = input_ids.to(device, dtype=torch.long)

            pred_ids = model.generate(
                input_ids=input_ids,
                max_length=256, 
                num_beams=4,
                repetition_penalty=2.0, 
                length_penalty=1.0, 
                early_stopping=True,
                no_repeat_ngram_size=2
            )
            for ids in pred_ids:
                result = tokenizer.decode(ids)
                summary.append(result)
                
    remove_tokens = ['<usr>', f"{tokenizer.unk_token}", f"{tokenizer.eos_token}", f"{tokenizer.pad_token}"]
    preprocessed_summary = summary.copy()
    for token in remove_tokens:
        preprocessed_summary = [sentence.replace(token," ") for sentence in preprocessed_summary]

    output = pd.DataFrame(
        {
            "fname": fname,
            "summary" : preprocessed_summary,
        }
    )
    return output

In [17]:
best_model = torch.load(f'{save_path}/weights/best.pth')
output = predict(tokenizer, model, device, test_loader, test_df['fname'])
output.to_csv(f"{save_path}/prediction.csv", index=False)

100%|██████████| 32/32 [00:34<00:00,  1.09s/it]
