In [35]:
!git clone https://github.com/dikey4405/23520728_Lab4_DeepLearning.git

Cloning into '23520728_Lab4_DeepLearning'...
remote: Enumerating objects: 29, done.[K
remote: Counting objects: 100% (29/29), done.[K
remote: Compressing objects: 100% (26/26), done.[K
remote: Total 29 (delta 6), reused 0 (delta 0), pack-reused 0 (from 0)[K
Receiving objects: 100% (29/29), 1.91 MiB | 4.82 MiB/s, done.
Resolving deltas: 100% (6/6), done.


In [36]:
import sys
sys.path.append('/kaggle/working/23520728_Lab4_DeepLearning') 

# Check thư mục
import os
print(os.listdir('/kaggle/working/23520728_Lab4_DeepLearning'))

['.git', 'dataset.py', 'train.py', 'test.py', 'assignments.ipynb', '__pycache__', 'LSTM.py', 'vocab.py', 'README.md', '23520728_Lab4_DeepLearning', 'LSTM_Bai2.py', 'data', 'config', 'LSTM_Bai3.py']


In [37]:
import torch
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [38]:
!pip install evaluate pyyaml tqdm
!pip install protobuf==3.20.3
!pip install rouge_score



In [39]:
%cd 23520728_Lab4_DeepLearning
base_path = os.getcwd()
base_path

/kaggle/working/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning


'/kaggle/working/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning/23520728_Lab4_DeepLearning'

In [40]:
import os
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from tqdm.auto import tqdm 

import evaluate


SETTINGS = {
    "data_dir": "data",  
    "src_lang": "english",
    "tgt_lang": "vietnamese",
    "batch_size": 32,       
    "lr": 0.0001,
    "epochs": 30,           
    "patience": 3,          
    "hidden_dim": 256,
    "num_layers": 3,
    "dropout": 0.1,
    "weight_decay": 0.00001,
    "device": torch.device("cuda" if torch.cuda.is_available() else "cpu")
}

print(f"Running on device: {SETTINGS['device']}")

Running on device: cuda


In [41]:
from vocab import Vocabulary
from dataset import TranslationDataset, translation_collate_fn

from LSTM import Seq2Seq
from LSTM_Bai2 import Seq2SeqBahdanau
from LSTM_Bai3 import Seq2SeqLuong

class DirectTrainer:
    def __init__(self, model_name):
        self.model_name = model_name
        self.device = SETTINGS["device"]
        self.metric = evaluate.load("rouge")
        
        # 1. Prepare Data
        self._prepare_data()
        
        # 2. Build Model
        self._build_model()
        
        # 3. Optimizer & Loss
        self.optimizer = optim.Adam(self.model.parameters(), lr=SETTINGS["lr"])
        self.criterion = nn.CrossEntropyLoss(ignore_index=self.vocab.pad_idx)
        
    def _prepare_data(self):
        print(f"[{self.model_name.upper()}] Loading Data...")
        data_dir = SETTINGS["data_dir"]
        
        # Load Vocab
        self.vocab = Vocabulary(
            f"{data_dir}/small-train.json", 
            SETTINGS["src_lang"], 
            SETTINGS["tgt_lang"]
        )
        
        # Load Datasets
        train_ds = TranslationDataset(f"{data_dir}/small-train.json", self.vocab)
        dev_ds   = TranslationDataset(f"{data_dir}/small-dev.json", self.vocab)
        test_ds  = TranslationDataset(f"{data_dir}/small-test.json", self.vocab)
        
        # Dataloaders
        self.train_loader = DataLoader(train_ds, batch_size=SETTINGS["batch_size"], shuffle=True, collate_fn=translation_collate_fn)
        self.dev_loader   = DataLoader(dev_ds, batch_size=SETTINGS["batch_size"], shuffle=False, collate_fn=translation_collate_fn)
        self.test_loader  = DataLoader(test_ds, batch_size=SETTINGS["batch_size"], shuffle=False, collate_fn=translation_collate_fn)
        
    def _build_model(self):
        print(f"[{self.model_name.upper()}] Building Model...")
        if self.model_name == "bai1":
            self.model = Seq2Seq(self.vocab, SETTINGS["hidden_dim"], SETTINGS["num_layers"], SETTINGS["dropout"])
        elif self.model_name == "bai2":
            self.model = Seq2SeqBahdanau(self.vocab, SETTINGS["hidden_dim"], SETTINGS["num_layers"], SETTINGS["dropout"])
        elif self.model_name == "bai3":
            self.model = Seq2SeqLuong(self.vocab, SETTINGS["hidden_dim"], SETTINGS["num_layers"], SETTINGS["dropout"])
        else:
            raise ValueError("Model name must be 'bai1', 'bai2', or 'bai3'")
            
        self.model.to(self.device)

    def train_one_epoch(self):
        self.model.train()
        total_loss = 0
        
        for batch in tqdm(self.train_loader, desc="Training", leave=False):
            src = batch["src"].to(self.device)
            tgt = batch["tgt"].to(self.device)
            src_len = batch["src_len"].to(self.device)
            
            self.optimizer.zero_grad()
            output = self.model(src, src_len, tgt, teacher_forcing=True)
            
            # Flatten
            output = output[:, 1:].reshape(-1, output.shape[-1])
            tgt = tgt[:, 1:].reshape(-1)
            
            loss = self.criterion(output, tgt)
            loss.backward()
            torch.nn.utils.clip_grad_norm_(self.model.parameters(), 1.0)
            self.optimizer.step()
            
            total_loss += loss.item()
            
        return total_loss / len(self.train_loader)

    @torch.no_grad()
    def evaluate(self, loader):
        self.model.eval()
        total_loss = 0
        preds, refs = [], []
        
        for batch in tqdm(loader, desc="Evaluating", leave=False):
            src = batch["src"].to(self.device)
            tgt = batch["tgt"].to(self.device)
            src_len = batch["src_len"].to(self.device)
            
            # Calc Loss
            out = self.model(src, src_len, tgt, teacher_forcing=True)
            loss = self.criterion(out[:, 1:].reshape(-1, out.shape[-1]), tgt[:, 1:].reshape(-1))
            total_loss += loss.item()
            
            # Inference Text
            pred_ids = self.model.inference(src, src_len)
            for i in range(src.size(0)):
                preds.append(self.vocab.indices_to_text(pred_ids[i], self.vocab.tgt_lang))
                refs.append(self.vocab.indices_to_text(tgt[i], self.vocab.tgt_lang))
                
        rouge = self.metric.compute(predictions=preds, references=refs)
        return total_loss / len(loader), rouge["rougeL"], preds, refs

    def run(self):
        best_score = 0 
        no_improve = 0
        save_path = f"checkpoints/{self.model_name}.pt"
        os.makedirs("checkpoints", exist_ok=True)
        
        print(f"\n START TRAINING {self.model_name.upper()}")
        for epoch in range(1, SETTINGS["epochs"] + 1):
            train_loss = self.train_one_epoch()
            val_loss, val_rouge, _, _ = self.evaluate(self.dev_loader)
            
            print(f"Epoch {epoch}: Train Loss={train_loss:.4f} | Val Loss={val_loss:.4f} | ROUGE-L={val_rouge:.4f}")
            
            if val_rouge > best_score:
                best_score = val_rouge
                no_improve = 0
                torch.save(self.model.state_dict(), save_path)
                print("  >>> Saved Best Model!")
            else:
                no_improve += 1
                if no_improve >= SETTINGS["patience"]:
                    print(" Early Stopping ")
                    break
        
        print(f"\n TESTING {self.model_name.upper()} <<<")
        if os.path.exists(save_path):
            self.model.load_state_dict(torch.load(save_path))
            print("  >>> Loaded Best Checkpoint.")
        else:
            print("  >>> Warning: No checkpoint found (Model didn't learn well). Using last epoch state.")

        test_loss, test_rouge, preds, refs = self.evaluate(self.test_loader)
        
        print(f"FINAL TEST ROUGE-L: {test_rouge:.4f}")
        print("\n Example Predictions")
        for i in range(min(3, len(preds))):
            print(f"Ref : {refs[i]}")
            print(f"Pred: {preds[i]}")
            print("-" * 20)

In [42]:
def main():
    # #  Bài 1
    print("\n" + "="*40)
    trainer1 = DirectTrainer("bai1")
    trainer1.run()
    
    # #  Bài 2
    print("\n" + "="*40)
    trainer2 = DirectTrainer("bai2")
    trainer2.run()
    
    #  Bài 3
    print("\n" + "="*40)
    trainer3 = DirectTrainer("bai3")
    trainer3.run()

if __name__ == "__main__":
    main()


[BAI1] Loading Data...
[BAI1] Building Model...

 START TRAINING BAI1


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 1: Train Loss=6.3926 | Val Loss=6.3521 | ROUGE-L=0.1694
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 2: Train Loss=6.0566 | Val Loss=6.2701 | ROUGE-L=0.1717
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 3: Train Loss=5.9298 | Val Loss=6.1646 | ROUGE-L=0.2171
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 4: Train Loss=5.8170 | Val Loss=6.0762 | ROUGE-L=0.2319
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 5: Train Loss=5.6991 | Val Loss=5.9807 | ROUGE-L=0.2879
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 6: Train Loss=5.5762 | Val Loss=5.8968 | ROUGE-L=0.2987
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 7: Train Loss=5.4600 | Val Loss=5.7952 | ROUGE-L=0.2611


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 8: Train Loss=5.3448 | Val Loss=5.7086 | ROUGE-L=0.2707


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 9: Train Loss=5.2376 | Val Loss=5.6337 | ROUGE-L=0.3007
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 10: Train Loss=5.1432 | Val Loss=5.5682 | ROUGE-L=0.2974


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 11: Train Loss=5.0613 | Val Loss=5.5108 | ROUGE-L=0.3166
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 12: Train Loss=4.9870 | Val Loss=5.4665 | ROUGE-L=0.2974


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 13: Train Loss=4.9159 | Val Loss=5.4220 | ROUGE-L=0.3093


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 14: Train Loss=4.8560 | Val Loss=5.3807 | ROUGE-L=0.3161
 Early Stopping 

 TESTING BAI1 <<<
  >>> Loaded Best Checkpoint.


Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

FINAL TEST ROUGE-L: 0.3238

 Example Predictions
Ref : anh albert và chị susan , thuộc hội thánh west ở tuscaloosa , alabama
Pred: những người có thể có thể được được , và một người , và những người , họ có thể được được được .
--------------------
Ref : ngày 11 và 12 - 1 - 2020 , những cơn bão lớn đã quét qua và phá huỷ nhiều vùng ở miền nam và miền trung hoa kỳ .
Pred: những người có thể có thể được một người khác , và những người có thể có thể được được được , và những người .
--------------------
Ref : những trận mưa to và gió lớn trong suốt hai ngày cùng với nhiều cơn lốc xoáy đã gây thiệt hại nặng nề cho nhiều bang .
Pred: trong một người , các người , một người , một người , những người có thể có thể được được được được .
--------------------

[BAI2] Loading Data...
[BAI2] Building Model...

 START TRAINING BAI2


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 1: Train Loss=6.2561 | Val Loss=6.2457 | ROUGE-L=0.1605
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 2: Train Loss=5.9000 | Val Loss=6.0861 | ROUGE-L=0.1877
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 3: Train Loss=5.6398 | Val Loss=5.8461 | ROUGE-L=0.2413
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 4: Train Loss=5.4166 | Val Loss=5.7078 | ROUGE-L=0.2784
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 5: Train Loss=5.2513 | Val Loss=5.5940 | ROUGE-L=0.3086
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 6: Train Loss=5.1031 | Val Loss=5.4818 | ROUGE-L=0.3163
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 7: Train Loss=4.9638 | Val Loss=5.4027 | ROUGE-L=0.3313
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 8: Train Loss=4.8350 | Val Loss=5.3081 | ROUGE-L=0.3339
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 9: Train Loss=4.7150 | Val Loss=5.2423 | ROUGE-L=0.3403
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 10: Train Loss=4.5991 | Val Loss=5.1683 | ROUGE-L=0.3455
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 11: Train Loss=4.4919 | Val Loss=5.1102 | ROUGE-L=0.3521
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 12: Train Loss=4.3915 | Val Loss=5.0843 | ROUGE-L=0.3597
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 13: Train Loss=4.2970 | Val Loss=5.0345 | ROUGE-L=0.3629
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 14: Train Loss=4.2079 | Val Loss=4.9710 | ROUGE-L=0.3655
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 15: Train Loss=4.1241 | Val Loss=4.9404 | ROUGE-L=0.3679
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 16: Train Loss=4.0422 | Val Loss=4.9053 | ROUGE-L=0.3745
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 17: Train Loss=3.9632 | Val Loss=4.8608 | ROUGE-L=0.3755
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 18: Train Loss=3.8874 | Val Loss=4.8350 | ROUGE-L=0.3794
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 19: Train Loss=3.8119 | Val Loss=4.8137 | ROUGE-L=0.3841
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 20: Train Loss=3.7366 | Val Loss=4.7860 | ROUGE-L=0.3866
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 21: Train Loss=3.6661 | Val Loss=4.7621 | ROUGE-L=0.3883
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 22: Train Loss=3.5989 | Val Loss=4.7430 | ROUGE-L=0.3900
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 23: Train Loss=3.5331 | Val Loss=4.7234 | ROUGE-L=0.3947
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 24: Train Loss=3.4666 | Val Loss=4.7085 | ROUGE-L=0.3953
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 25: Train Loss=3.4123 | Val Loss=4.7040 | ROUGE-L=0.4000
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 26: Train Loss=3.3520 | Val Loss=4.6771 | ROUGE-L=0.4012
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 27: Train Loss=3.2924 | Val Loss=4.6684 | ROUGE-L=0.4011


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 28: Train Loss=3.2359 | Val Loss=4.6555 | ROUGE-L=0.4052
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 29: Train Loss=3.1832 | Val Loss=4.6398 | ROUGE-L=0.4043


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 30: Train Loss=3.1282 | Val Loss=4.6516 | ROUGE-L=0.4097
  >>> Saved Best Model!

 TESTING BAI2 <<<
  >>> Loaded Best Checkpoint.


Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

FINAL TEST ROUGE-L: 0.4233

 Example Predictions
Ref : anh albert và chị susan , thuộc hội thánh west ở tuscaloosa , alabama
Pred: mẹ mẹ mẹ và vợ mẹ và người ta , sự nhìn từ , từ nhà tây , ở nhà tây , ở đâu ,
--------------------
Ref : ngày 11 và 12 - 1 - 2020 , những cơn bão lớn đã quét qua và phá huỷ nhiều vùng ở miền nam và miền trung hoa kỳ .
Pred: các bạn đang ở khắp các khu vực của các khu vực và các nhà trị trên trên trường trên 10 và 10 năm , và một nhà sáng .
--------------------
Ref : những trận mưa to và gió lớn trong suốt hai ngày cùng với nhiều cơn lốc xoáy đã gây thiệt hại nặng nề cho nhiều bang .
Pred: hai ngày , các bức tường khác , hải sáng , và một cách bào nhân được chuyển chuyển được chuyển chuyển .
--------------------

[BAI3] Loading Data...
[BAI3] Building Model...

 START TRAINING BAI3


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 1: Train Loss=6.4155 | Val Loss=6.4449 | ROUGE-L=0.0000


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 2: Train Loss=6.1497 | Val Loss=6.3352 | ROUGE-L=0.0457
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 3: Train Loss=5.9992 | Val Loss=6.2272 | ROUGE-L=0.1343
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 4: Train Loss=5.8931 | Val Loss=6.0802 | ROUGE-L=0.1592
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 5: Train Loss=5.6975 | Val Loss=5.9137 | ROUGE-L=0.1187


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 6: Train Loss=5.5228 | Val Loss=5.7857 | ROUGE-L=0.2631
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 7: Train Loss=5.3684 | Val Loss=5.6822 | ROUGE-L=0.2969
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 8: Train Loss=5.2344 | Val Loss=5.5652 | ROUGE-L=0.3158
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 9: Train Loss=5.1134 | Val Loss=5.4785 | ROUGE-L=0.3212
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 10: Train Loss=5.0027 | Val Loss=5.3888 | ROUGE-L=0.3291
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 11: Train Loss=4.8986 | Val Loss=5.3186 | ROUGE-L=0.3348
  >>> Saved Best Model!


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 12: Train Loss=4.8030 | Val Loss=5.2709 | ROUGE-L=0.3323


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 13: Train Loss=4.7110 | Val Loss=5.2005 | ROUGE-L=0.3274


Training:   0%|          | 0/625 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 14: Train Loss=4.6267 | Val Loss=5.1364 | ROUGE-L=0.3286
 Early Stopping 

 TESTING BAI3 <<<
  >>> Loaded Best Checkpoint.


Evaluating:   0%|          | 0/63 [00:00<?, ?it/s]

FINAL TEST ROUGE-L: 0.3392

 Example Predictions
Ref : anh albert và chị susan , thuộc hội thánh west ở tuscaloosa , alabama
Pred: một người , khi tôi nghĩ , những người , những người , những người , những người , trong năm .
--------------------
Ref : ngày 11 và 12 - 1 - 2020 , những cơn bão lớn đã quét qua và phá huỷ nhiều vùng ở miền nam và miền trung hoa kỳ .
Pred: những người đã nữ đầu đầu của những người đã dụng những người và sự sống của những người , những người đã bị dụng của những người , và người , .
--------------------
Ref : những trận mưa to và gió lớn trong suốt hai ngày cùng với nhiều cơn lốc xoáy đã gây thiệt hại nặng nề cho nhiều bang .
Pred: một người trong những người , những người , và những người có thể ra những người có thể ra một người .
--------------------
