In [1]:
import torch
from torch.utils.data import DataLoader, Dataset
from transformers import BartForConditionalGeneration, AutoTokenizer, BartTokenizer
import torch.optim
import accelerate
import os
import json
from tqdm import tqdm
from time import time
from random import sample
from nltk.translate.bleu_score import corpus_bleu
from nltk.translate.bleu_score import SmoothingFunction
from nltk.translate import bleu_score
import nltk
from rouge import Rouge
from pycocoevalcap.cider.cider import Cider

In [2]:
data_root_path = os.path.join(os.getcwd(), 'IndicHeadlineGeneration/data/hi_IndicHeadlineGeneration_v1.0')
model_path = os.path.join(os.path.join(os.getcwd(), 'Models'), 'Title_generation')

In [3]:
train_path = os.path.join(data_root_path,'hi_train.jsonl')
dev_path = os.path.join(data_root_path,'hi_dev.jsonl')
test_path = os.path.join(data_root_path,'hi_test.jsonl')

In [4]:
class CustomDataset(Dataset):
    def __init__(self, data_path, tokenizer, sample_size, max_length=512):
        self.data = self.load_data(data_path, sample_size)
        self.tokenizer = tokenizer
        self.max_length = max_length
        #self.sample_size = sample_size
    def __len__(self):
        return len(self.data)
    def __getitem__(self, idx):
        item = self.data[idx]
        input_text = item['Document']
        target_text = item['Title']
        
        inputs = self.tokenizer.encode_plus(input_text, max_length=self.max_length,
                                            padding='max_length', truncation=True, return_tensors='pt'
                                           )
        
        targets = self.tokenizer.encode(target_text, max_length=self.max_length,
                                        padding='max_length', truncation=True, return_tensors='pt'
                                        )
        
        return {'input_ids': inputs['input_ids'].squeeze(),
                'attention_mask': inputs['attention_mask'].squeeze(),
                'labels': targets.squeeze()
               }
    def load_data(self, data_path, sample_size):
        '''with open(data_path, 'r',encoding="utf8") as file:
            data = json.load(file)'''
        data = []
        with open(data_path, 'r', encoding="utf8") as file:
            for line in file:
                data.append(json.loads(line))
        return sample(data, sample_size)

In [5]:
model_name = "facebook/bart-base"
tokenizer = BartTokenizer.from_pretrained(model_name)

In [6]:
train_dataset = CustomDataset(train_path, tokenizer, 4000)
dev_dataset = CustomDataset(dev_path, tokenizer, 600)
test_dataset = CustomDataset(test_path, tokenizer, 1000)

In [7]:
len(train_dataset)

4000

In [8]:
train_loader = DataLoader(train_dataset, batch_size=25, shuffle=True)
val_loader = DataLoader(dev_dataset, batch_size=25, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=25, shuffle=False)

In [9]:
def Fine_Tune(train_loader, val_loader, num_epochs, num_layers_to_finetune):
    model = BartForConditionalGeneration.from_pretrained("facebook/bart-base")
    
    for param in model.parameters():
        param.requires_grad = False
    
    for i in range(1, num_layers_to_finetune + 1):
        for param in model.model.encoder.layers[-i].parameters():
            param.requires_grad = True
        for param in model.model.decoder.layers[-i].parameters():
            param.requires_grad = True
    
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    print(device)
    model.to(device)
    optimizer = torch.optim.Adam(model.parameters(), lr=1e-4, weight_decay=3e-6)
    for epoch in tqdm(range(num_epochs)):
        model.train()
        print("Training phase")
        #for idx, batch in enumerate(train_loader):
        for batch in tqdm(train_loader):
            #time0 = time()
            #print(f"batch: {idx+1} starts")
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            labels = batch['labels'].to(device)
            optimizer.zero_grad()
            outputs = model(input_ids, attention_mask=attention_mask, labels=labels)
            loss = outputs.loss
            loss.backward()
            optimizer.step()
            #time1 = time()
            #print(f"batch: {idx+1} ends\ntime taken: {time1-time0} seconds")
            #print(f"time taken: {time1-time0} seconds")
        
        model.eval()
        print("Validation phase")
        with torch.no_grad():
            total_val_loss = 0.0
            for val_batch in tqdm(val_loader):
                input_ids = val_batch['input_ids'].to(device)
                attention_mask = val_batch['attention_mask'].to(device)
                labels = val_batch['labels'].to(device)
                val_output = model(input_ids, attention_mask=attention_mask, labels=labels)
                total_val_loss += val_output.loss.item()
            average_val_loss = total_val_loss / len(val_loader)
            
        print(f'Epoch: {epoch+1}/{num_epochs}, Validation Loss: {average_val_loss}')
    os.makedirs(model_path, exist_ok=True)
    model.save_pretrained(model_path, from_pt=True)
    torch.save(model.state_dict(), os.path.join(model_path, 'pytorch_model.bin'))

In [10]:
def Generate_title_show(val_loader):
    model = BartForConditionalGeneration.from_pretrained(model_path)
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    model.to(device)
    with torch.no_grad():
        for val_batch in val_loader:
            input_ids = val_batch['input_ids'].to(device)
            attention_mask = val_batch['attention_mask'].to(device)
            labels = val_batch['labels'].to(device)
            generated_ids = model.generate(input_ids, attention_mask=attention_mask,
                                           max_length=60, num_beams=2, repetition_penalty=2.0,
                                           length_penalty=2.0, early_stopping=True
                                          )
            generated_title = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
            input_text = tokenizer.decode(input_ids[0], skip_special_tokens=True)
            actual_title = tokenizer.decode(labels[0], skip_special_tokens=True)
            
            print(f'Input Text: {input_text}\nGenerated Title: {generated_title}\nActual Title: {actual_title}')
            print('\n'+'='*50+'\n')

In [11]:
def Generate_title(val_loader):
    model = BartForConditionalGeneration.from_pretrained(model_path)
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    model.to(device)
    generated_titles = []
    actual_titles = []
    with torch.no_grad():
        for val_batch in val_loader:
            input_ids = val_batch['input_ids'].to(device)
            attention_mask = val_batch['attention_mask'].to(device)
            labels = val_batch['labels'].to(device)
            generated_ids = model.generate(input_ids, attention_mask=attention_mask,
                                           max_length=60, num_beams=2, repetition_penalty=2.0,
                                           length_penalty=2.0, early_stopping=True
                                          )
            generated_title = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
            input_text = tokenizer.decode(input_ids[0], skip_special_tokens=True)
            actual_title = tokenizer.decode(labels[0], skip_special_tokens=True)
            generated_titles.append(generated_title)
            actual_titles.append(actual_title)
    return generated_titles, actual_titles

In [12]:
def calculate_bleu_scores(actual, generated):
    smoothie = SmoothingFunction().method4
    actual_tokenized = [[nltk.word_tokenize(act) for act in group] for group in actual]
    generated_tokenized = [nltk.word_tokenize(gen) for gen in generated]
    score = corpus_bleu(actual_tokenized, generated_tokenized, smoothing_function=smoothie)
    return score

In [13]:
def calculate_rouge_scores(actual, generated):
    rouge = Rouge()
    scores = rouge.get_scores(generated, actual)
    return scores

In [14]:
def calculate_cider_scores(actual, generated):
    act_dict = {idx: [line] for idx, line in enumerate(actual)}
    gen_dict = {idx: [line] for idx, line in enumerate(generated)}
    cider = Cider()
    (score, scores) = cider.compute_score(act_dict, gen_dict)
    return score

In [11]:
Fine_Tune(train_loader, val_loader, 5, 2)

cuda


  0%|                                                                                                                                                                                                                                                   | 0/5 [00:00<?, ?it/s]

Training phase



  attn_output = torch.nn.functional.scaled_dot_product_attention(

  1%|█▍                                                                                                                                                                                                                                       | 1/160 [00:06<17:51,  6.74s/it][A
  1%|██▉                                                                                                                                                                                                                                      | 2/160 [00:07<08:25,  3.20s/it][A
  2%|████▎                                                                                                                                                                                                                                    | 3/160 [00:15<14:00,  5.36s/it][A
  2%|█████▊                                                                                                   

 18%|████████████████████████████████████████▌                                                                                                                                                                                               | 28/160 [03:25<16:43,  7.60s/it][A
 18%|██████████████████████████████████████████                                                                                                                                                                                              | 29/160 [03:33<16:36,  7.61s/it][A
 19%|███████████████████████████████████████████▌                                                                                                                                                                                            | 30/160 [03:40<16:27,  7.60s/it][A
 19%|████████████████████████████████████████████▉                                                                                                                                

 36%|██████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                     | 57/160 [07:41<16:46,  9.77s/it][A
 36%|████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                    | 58/160 [07:51<16:33,  9.74s/it][A
 37%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                  | 59/160 [08:00<16:25,  9.76s/it][A
 38%|███████████████████████████████████████████████████████████████████████████████████████                                                                                      

 54%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                           | 86/160 [12:23<12:01,  9.75s/it][A
 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                         | 87/160 [12:32<11:51,  9.74s/it][A
 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                        | 88/160 [12:42<11:40,  9.73s/it][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                            

 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                 | 115/160 [17:04<07:16,  9.71s/it][A
 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                               | 116/160 [17:14<07:06,  9.70s/it][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 117/160 [17:24<06:57,  9.71s/it][A
 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎  

 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                       | 144/160 [21:46<02:35,  9.69s/it][A
 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 145/160 [21:56<02:25,  9.72s/it][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 146/160 [22:05<02:15,  9.69s/it][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Validation phase



  0%|                                                                                                                                                                                                                                                  | 0/24 [00:00<?, ?it/s][A
  4%|█████████▊                                                                                                                                                                                                                                | 1/24 [00:12<04:46, 12.45s/it][A
  8%|███████████████████▌                                                                                                                                                                                                                      | 2/24 [00:16<02:49,  7.69s/it][A
 12%|█████████████████████████████▎                                                                                                                                              

Epoch: 1/5, Validation Loss: 3.9655893743038177
Training phase



  0%|                                                                                                                                                                                                                                                 | 0/160 [00:00<?, ?it/s][A
  1%|█▍                                                                                                                                                                                                                                       | 1/160 [00:08<22:36,  8.53s/it][A
  1%|██▉                                                                                                                                                                                                                                      | 2/160 [00:09<11:31,  4.38s/it][A
  2%|████▎                                                                                                                                                                       

 18%|██████████████████████████████████████████                                                                                                                                                                                              | 29/160 [03:55<18:14,  8.35s/it][A
 19%|███████████████████████████████████████████▌                                                                                                                                                                                            | 30/160 [04:03<18:05,  8.35s/it][A
 19%|████████████████████████████████████████████▉                                                                                                                                                                                           | 31/160 [04:12<17:56,  8.34s/it][A
 20%|██████████████████████████████████████████████▍                                                                                                                              

 36%|████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                    | 58/160 [07:59<14:40,  8.64s/it][A
 37%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                  | 59/160 [08:07<14:22,  8.54s/it][A
 38%|███████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                 | 60/160 [08:15<14:08,  8.49s/it][A
 38%|████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    

 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                         | 87/160 [12:02<10:17,  8.45s/it][A
 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                        | 88/160 [12:10<10:06,  8.43s/it][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                       | 89/160 [12:19<09:56,  8.40s/it][A
 56%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                          

 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                               | 116/160 [16:04<06:07,  8.36s/it][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 117/160 [16:13<05:59,  8.35s/it][A
 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 118/160 [16:21<05:50,  8.36s/it][A
 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ 

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 145/160 [20:08<02:06,  8.44s/it][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 146/160 [20:16<01:57,  8.41s/it][A
 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                  | 147/160 [20:25<01:49,  8.39s/it][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Validation phase



  0%|                                                                                                                                                                                                                                                  | 0/24 [00:00<?, ?it/s][A
  4%|█████████▊                                                                                                                                                                                                                                | 1/24 [00:11<04:16, 11.16s/it][A
  8%|███████████████████▌                                                                                                                                                                                                                      | 2/24 [00:15<02:37,  7.18s/it][A
 12%|█████████████████████████████▎                                                                                                                                              

Epoch: 2/5, Validation Loss: 3.8834740022818246
Training phase



  0%|                                                                                                                                                                                                                                                 | 0/160 [00:00<?, ?it/s][A
  1%|█▍                                                                                                                                                                                                                                       | 1/160 [00:01<03:42,  1.40s/it][A
  1%|██▉                                                                                                                                                                                                                                      | 2/160 [00:09<14:32,  5.52s/it][A
  2%|████▎                                                                                                                                                                       

 18%|██████████████████████████████████████████                                                                                                                                                                                              | 29/160 [03:55<18:16,  8.37s/it][A
 19%|███████████████████████████████████████████▌                                                                                                                                                                                            | 30/160 [04:03<18:09,  8.38s/it][A
 19%|████████████████████████████████████████████▉                                                                                                                                                                                           | 31/160 [04:11<18:00,  8.38s/it][A
 20%|██████████████████████████████████████████████▍                                                                                                                              

 36%|████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                    | 58/160 [07:57<14:13,  8.37s/it][A
 37%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                  | 59/160 [08:06<14:05,  8.37s/it][A
 38%|███████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                 | 60/160 [08:14<13:56,  8.37s/it][A
 38%|████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    

 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                         | 87/160 [12:01<10:10,  8.36s/it][A
 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                        | 88/160 [12:09<10:01,  8.36s/it][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                       | 89/160 [12:17<09:53,  8.36s/it][A
 56%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                          

 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                               | 116/160 [16:07<06:10,  8.43s/it][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 117/160 [16:15<06:01,  8.42s/it][A
 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 118/160 [16:24<05:54,  8.44s/it][A
 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ 

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 145/160 [20:13<02:05,  8.39s/it][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 146/160 [20:21<01:57,  8.38s/it][A
 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                  | 147/160 [20:30<01:48,  8.37s/it][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Validation phase



  0%|                                                                                                                                                                                                                                                  | 0/24 [00:00<?, ?it/s][A
  4%|█████████▊                                                                                                                                                                                                                                | 1/24 [00:11<04:16, 11.13s/it][A
  8%|███████████████████▌                                                                                                                                                                                                                      | 2/24 [00:15<02:38,  7.18s/it][A
 12%|█████████████████████████████▎                                                                                                                                              

Epoch: 3/5, Validation Loss: 3.816487600406011
Training phase



  0%|                                                                                                                                                                                                                                                 | 0/160 [00:00<?, ?it/s][A
  1%|█▍                                                                                                                                                                                                                                       | 1/160 [00:01<03:55,  1.48s/it][A
  1%|██▉                                                                                                                                                                                                                                      | 2/160 [00:09<14:42,  5.59s/it][A
  2%|████▎                                                                                                                                                                       

 18%|██████████████████████████████████████████                                                                                                                                                                                              | 29/160 [03:58<18:18,  8.39s/it][A
 19%|███████████████████████████████████████████▌                                                                                                                                                                                            | 30/160 [04:06<18:08,  8.37s/it][A
 19%|████████████████████████████████████████████▉                                                                                                                                                                                           | 31/160 [04:14<17:58,  8.36s/it][A
 20%|██████████████████████████████████████████████▍                                                                                                                              

 36%|████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                    | 58/160 [08:00<14:13,  8.37s/it][A
 37%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                  | 59/160 [08:09<14:05,  8.37s/it][A
 38%|███████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                 | 60/160 [08:17<13:57,  8.37s/it][A
 38%|████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    

 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                         | 87/160 [12:03<10:12,  8.39s/it][A
 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                        | 88/160 [12:12<10:04,  8.39s/it][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                       | 89/160 [12:20<09:55,  8.38s/it][A
 56%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                          

 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                               | 116/160 [16:06<06:07,  8.36s/it][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 117/160 [16:15<05:59,  8.35s/it][A
 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 118/160 [16:23<05:50,  8.35s/it][A
 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ 

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 145/160 [20:10<02:05,  8.37s/it][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 146/160 [20:19<01:57,  8.36s/it][A
 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                  | 147/160 [20:27<01:48,  8.37s/it][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Validation phase



  0%|                                                                                                                                                                                                                                                  | 0/24 [00:00<?, ?it/s][A
  4%|█████████▊                                                                                                                                                                                                                                | 1/24 [00:11<04:15, 11.10s/it][A
  8%|███████████████████▌                                                                                                                                                                                                                      | 2/24 [00:15<02:37,  7.16s/it][A
 12%|█████████████████████████████▎                                                                                                                                              

Epoch: 4/5, Validation Loss: 3.7498125533262887
Training phase



  0%|                                                                                                                                                                                                                                                 | 0/160 [00:00<?, ?it/s][A
  1%|█▍                                                                                                                                                                                                                                       | 1/160 [00:01<04:01,  1.52s/it][A
  1%|██▉                                                                                                                                                                                                                                      | 2/160 [00:09<14:44,  5.60s/it][A
  2%|████▎                                                                                                                                                                       

 18%|██████████████████████████████████████████                                                                                                                                                                                              | 29/160 [03:55<18:11,  8.33s/it][A
 19%|███████████████████████████████████████████▌                                                                                                                                                                                            | 30/160 [04:03<18:03,  8.34s/it][A
 19%|████████████████████████████████████████████▉                                                                                                                                                                                           | 31/160 [04:11<17:54,  8.33s/it][A
 20%|██████████████████████████████████████████████▍                                                                                                                              

 36%|████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                    | 58/160 [08:08<15:59,  9.41s/it][A
 37%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                  | 59/160 [08:17<15:38,  9.29s/it][A
 38%|███████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                 | 60/160 [08:26<15:20,  9.20s/it][A
 38%|████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    

 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                         | 87/160 [12:27<10:50,  8.91s/it][A
 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                        | 88/160 [12:36<10:42,  8.92s/it][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                       | 89/160 [12:45<10:33,  8.93s/it][A
 56%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                          

 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                               | 116/160 [16:50<06:29,  8.84s/it][A
 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 117/160 [16:59<06:21,  8.87s/it][A
 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 118/160 [17:08<06:09,  8.79s/it][A
 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ 

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 145/160 [21:09<02:13,  8.92s/it][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 146/160 [21:18<02:05,  8.93s/it][A
 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                  | 147/160 [21:27<01:56,  8.93s/it][A
 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Validation phase



  0%|                                                                                                                                                                                                                                                  | 0/24 [00:00<?, ?it/s][A
  4%|█████████▊                                                                                                                                                                                                                                | 1/24 [00:11<04:33, 11.91s/it][A
  8%|███████████████████▌                                                                                                                                                                                                                      | 2/24 [00:16<02:48,  7.67s/it][A
 12%|█████████████████████████████▎                                                                                                                                              

Epoch: 5/5, Validation Loss: 3.6714065174261727


In [15]:
generated_titles, actual_titles = Generate_title(test_loader)

  attn_output = torch.nn.functional.scaled_dot_product_attention(


Input Text: <s>प्रधानमंत्री मनमोहन सिंह ब्रिक शिखर सम्मेलन में भाग लेने के लिए मंगलवार को चीन पहुंच गए हैं। इस सम्मेलन में दक्षिण अफ्रीका को ब्रिक्स के पांचवें सदस्य के रूप में औपचारिक तौर पर शामिल किया जाएगा। फिलहाल ब्राजील, रूस, भारत और चीन ब्रिक्स के सदस्य देश हैं। सान्या हवाई अड्डïे पर चीन के सहायक विदेशी मंत्री वु हेलांग ने प्रधानमंत</s>
Generated Title: </s><s>मंगलवार को ब्रिक शि-�र, पहुच गए हैं। �</s>
Actual Title: <s>ब्रिक्स में रहेंगे विकास और विवाद के मुद्दे</s><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad

Input Text: <s>ऑस्ट्रेलिया के खिलाफ पहला वनडे मैच पूरी एकदिवसीय सीरीज़ के भाग्य को निर्धारित करने की दिशा में बहुत महत्वपूर्ण रोल प्ले करेगा।अकसर यह सीरीज़ का पहला मैच ही होता ऑस्ट्रेलिया के खिलाफ पहला वनडे मैच पूरी एकदिवसीय सीरीज़ के भाग्य को निर्धारित करने की दिशा में बहुत महत्वपूर्ण रोल प्ले करेगा।अकसर यह सीरीज़ का पहला मैच ही होता ह</s>
Generated Title: </s><s>एकदिवसीय से भाग्य, को नि'�् '�ारि', पहला</s>
Actual Title: <s>तेज़ गेंदबाज़ों के प्रदर्शन से निश्चित होगा आज के मैच का परिणाम</s><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad

Input Text: <s>केंद्र सरकार ने महाराष्ट्र, मध्य प्रदेश, कर्नाटक और राजस्थान में ओलावृष्टि और बेमौसम बारिश से प्रभावित वानिकी फसलों को फिर से लगाने के लिए 352 करोड़ रुपये की सहायता मंजूर की है। यह जानकारी आज एक सरकारी सूत्र ने कही। सूत्र ने बताया कि इसके अलावा कर्नाटक के उन किसानों के लिए 92 करोड़ रुपये सहायता मंजूर की गई है जिनके मकान और रबी की फसलों �</s>
Generated Title: </s><s>केंद्र सरकार, ने मिलों की बताया</s><pad><pad><pad><pad><pad><pad><pad><pad><pad>
Actual Title: <s>चार राज्यों को 352 करोड़ रुपये की सहायता</s><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad>

Input Text: <s> आयुष्मान और भूमि ने एक वीडियो भी जारी किया है जिसमें ये दिखाया गया है कि भारत में लोग सेक्स पर किस तरह बात करते हैं।नई दिल्लीः'बरेली की बर्फी'के बाद अभिनेता आयुष्मान खुराना की अगली फिल्म'शुभ मंगल सावधान'कल यानी 1 सितंबर को रिलीज होने जा रही है।फिल्म में आयुष्मान के साथ 'दम लगा के हईशा' में उनके साथ दिखी एक्ट्रेस भूमि पेडनेक र लीड र�</s>
Generated Title: </s><s>आयुष्मान और भूमि ने किस तरह बात, जारी �</s>
Actual Title: <s>शादी से पहले सेक्स पर बोले आयुष्मान खुराना</s><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad

Input Text: <s>आज अमेरिका में राष्ट्रपति चुनाव के लिए वोटिंग जारी है।जनवरी महीने से ही चुनावी सरगर्मियां तेज हो गई थी।दुनिया के सबसे ताकतवर मुल्क अमेरिका में राष्ट्रपति चयन की प्रक्रिया भारत के मुकाबले थोड़ा अलग और खास है।अमेरिका का राष्ट्रपति नई दिल्लीः आज अमेरिका में राष्ट्रपति चुनाव के लिए वोटिंग जारी है।राष्ट्रपति पद के लिए डेमोक�</s>
Generated Title: </s><s>आज अमेरिका से ही चुनावी, प्य�कोट्'�प�</s>
Actual Title: <s>अमेरिका चुन रहा है अगली सरकार, जानिए यूएस में कैसे बनता है कोई राष्ट्रपति?</s><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pa

In [16]:
bleu_score = calculate_bleu_scores(actual_titles, generated_titles)

In [17]:
rouge_score = calculate_rouge_scores(actual_titles, generated_titles)

In [18]:
cider_score = calculate_cider_scores(actual_titles, generated_titles)

In [19]:
bleu_score, rouge_score, cider_score

(0.002857269379435842,
 [{'rouge-1': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-l': {'r': 0.0, 'p': 0.0, 'f': 0.0}},
  {'rouge-1': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-l': {'r': 0.0, 'p': 0.0, 'f': 0.0}},
  {'rouge-1': {'r': 0.16666666666666666, 'p': 0.125, 'f': 0.14285713795918387},
   'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-l': {'r': 0.16666666666666666,
    'p': 0.125,
    'f': 0.14285713795918387}},
  {'rouge-1': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-l': {'r': 0.0, 'p': 0.0, 'f': 0.0}},
  {'rouge-1': {'r': 0.18181818181818182, 'p': 0.5, 'f': 0.26666666275555556},
   'rouge-2': {'r': 0.09090909090909091,
    'p': 0.3333333333333333,
    'f': 0.14285713948979603},
   'rouge-l': {'r': 0.18181818181818182, 'p': 0.5, 'f': 0.26666666275555556}},
  {'rouge-1': {'r': 0.0, 'p': 0.0, 'f': 0.0},
   'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0

In [20]:
Generate_title_show(test_loader)

Input Text:   श्याओमी के लेटेस्ट स्मार्टफोन एमआई सीसी 9 प्रो को लॉन्च होने में कुछ ही दिन बाकी है।फोन नवंबर में चीन में लॉन्च होगा।लेकिन लॉन्चिंग से पहले ही फोन के फीचर्स और स्पेसिफिकेशन सामने आने लगे हैं।लेटेस्ट टीजर के मुताबिक एमआई सीसी 9 प्रो में 5260 एमएएच की बड़ी बैटरी मिलेगी जो 30 वॉट फास्ट चार्जिंग को सपोर्ट करेगी।कंपनी का कहना है
Generated Title:   श्याओमी के लॉन्'� होगा बाकी, पहले- से 10
Actual Title:   Mi CC9 प्रो फोन में मिलेगी 30W फास्ट चार्जिंग सपोर्ट वाली 5260mAh बैटरी, 65 मिनट में होगी फुल चार्ज


Input Text:   कर्नाटक में सरकार बनाने की कवायद तेज हो गई है।भाजपा नेता जगदीश शेट्टार और अरविंद लिम्बावली समेत वरिष्ठ नेता अमित शाह और पार्टी के कार्यकारी अध्यक्ष जेपी नड्डा से मिले।सरकार बनाने पर अंतिम फैसला संसदीय बोर्ड की बैठक में लिया जाएगा।इस बीच, भावी मुख्यमंत्री बीएस येदियुरप्पा के लिए मंत्रिमंडल का गठन सबसे बड़ी चुनौती बन गया है�
Generated Title:   सरकार बनाने की कवायद तेज हो गई, मुख्य
Actual Title:   येदियुरप्पा के लिए मंत्रिमंडल गठन बड़ी चुनौती; मंत्री पद 34, बागियों स