In [1]:
# Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')

# File paths
guj_train = "/content/drive/MyDrive/Project_Glory/Guj_train.csv"
guj_test = "/content/drive/MyDrive/Project_Glory/Guj_val_article.csv"

# Install dependencies
!pip install transformers
!pip install pytorch-lightning

# Imports
import pandas as pd
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import MT5Tokenizer, MT5ForConditionalGeneration
import pytorch_lightning as pl
from sklearn.model_selection import train_test_split

# Set device
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Load CSVs
df_train = pd.read_csv(guj_train)
df_test = pd.read_csv(guj_test)

# Ensure Summary column exists in test set
if 'Summary' not in df_test.columns:
    df_test['Summary'] = ""

# Clean training and test data
df_train = df_train[["Summary", "Article"]].dropna()
df_train = df_train[df_train["Summary"].str.strip() != ""]

df_test = df_test[["Summary", "Article"]].dropna()

# Split train/val
df_train, df_valid = train_test_split(df_train, test_size=0.1, random_state=42)

# Load tokenizer
MODEL_NAME = "google/mt5-small"
tokenizer = MT5Tokenizer.from_pretrained(MODEL_NAME)
tokenizer.pad_token = tokenizer.eos_token  # Important for mT5
tokenizer.padding_side = "right"

# Dataset
class NewsSummaryDataset(Dataset):
    def __init__(self, data, tokenizer, text_max_tokens_len=512, summary_max_tokens_len=75):
        self.data = data.reset_index(drop=True)
        self.tokenizer = tokenizer
        self.text_max_tokens_len = text_max_tokens_len
        self.summary_max_tokens_len = summary_max_tokens_len

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        article = str(self.data.loc[idx, "Article"])
        summary = str(self.data.loc[idx, "Summary"])
        input_text = "summarize: " + article

        input_encoding = self.tokenizer(
            input_text,
            max_length=self.text_max_tokens_len,
            padding="max_length",
            truncation=True,
            return_tensors="pt"
        )
        target_encoding = self.tokenizer(
            summary,
            max_length=self.summary_max_tokens_len,
            padding="max_length",
            truncation=True,
            return_tensors="pt"
        )

        labels = target_encoding.input_ids.squeeze()

        # Ensure valid target
        if all(token == tokenizer.pad_token_id for token in labels.tolist()):
            labels[0] = tokenizer.eos_token_id
        labels[labels == tokenizer.pad_token_id] = -100

        return {
            "input_ids": input_encoding.input_ids.squeeze(),
            "attention_mask": input_encoding.attention_mask.squeeze(),
            "labels": labels,
            "decoder_attention_mask": target_encoding.attention_mask.squeeze(),
        }

# DataModule
class NewsSummaryDataModule(pl.LightningDataModule):
    def __init__(self, train_df, val_df, tokenizer, batch_size=2, text_max_tokens_len=512, summary_max_tokens_len=75):
        super().__init__()
        self.train_df = train_df
        self.val_df = val_df
        self.tokenizer = tokenizer
        self.batch_size = batch_size
        self.text_max_tokens_len = text_max_tokens_len
        self.summary_max_tokens_len = summary_max_tokens_len

    def setup(self, stage=None):
        self.train_dataset = NewsSummaryDataset(self.train_df, self.tokenizer, self.text_max_tokens_len, self.summary_max_tokens_len)
        self.val_dataset = NewsSummaryDataset(self.val_df, self.tokenizer, self.text_max_tokens_len, self.summary_max_tokens_len)

    def train_dataloader(self):
        return DataLoader(self.train_dataset, batch_size=self.batch_size, shuffle=True, num_workers=2)

    def val_dataloader(self):
        return DataLoader(self.val_dataset, batch_size=self.batch_size, shuffle=False, num_workers=2)

# Lightning Model
class NewsSummaryModel(pl.LightningModule):
    def __init__(self):
        super().__init__()
        self.model = MT5ForConditionalGeneration.from_pretrained(MODEL_NAME)

    def forward(self, input_ids, attention_mask, labels, decoder_attention_mask=None):
        output = self.model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            labels=labels,
            decoder_attention_mask=decoder_attention_mask,
        )
        return output.loss, output.logits

    def training_step(self, batch, batch_idx):
        loss, _ = self(
            input_ids=batch["input_ids"],
            attention_mask=batch["attention_mask"],
            labels=batch["labels"],
            decoder_attention_mask=batch["decoder_attention_mask"],
        )
        self.log("train_loss", loss, prog_bar=True)
        return loss

    def validation_step(self, batch, batch_idx):
        loss, _ = self(
            input_ids=batch["input_ids"],
            attention_mask=batch["attention_mask"],
            labels=batch["labels"],
            decoder_attention_mask=batch["decoder_attention_mask"],
        )
        self.log("val_loss", loss, prog_bar=True)
        return loss

    def configure_optimizers(self):
        return torch.optim.AdamW(self.parameters(), lr=2e-5)

# Training
BATCH_SIZE = 16
EPOCHS = 8

datamodule = NewsSummaryDataModule(df_train, df_valid, tokenizer, batch_size=BATCH_SIZE)
model = NewsSummaryModel()

trainer = pl.Trainer(
    max_epochs=EPOCHS,
    accelerator="auto",
    devices=1 if torch.cuda.is_available() else None,
    precision="32",
    gradient_clip_val=1.0
)

trainer.fit(model, datamodule=datamodule)
trainer.validate(model, datamodule=datamodule)

# Inference
model.freeze()

def summarize_text(text, max_length=150):
    input_text = "summarize: " + text
    encoding = tokenizer(
        input_text,
        max_length=512,
        padding="max_length",
        truncation=True,
        return_tensors="pt"
    )
    input_ids = encoding.input_ids.to(model.device)
    attention_mask = encoding.attention_mask.to(model.device)

    generated_ids = model.model.generate(
        input_ids=input_ids,
        attention_mask=attention_mask,
        max_length=max_length,
        num_beams=4,
        early_stopping=True,
        repetition_penalty=2.5,
        length_penalty=1.0,
        no_repeat_ngram_size=3
    )
    return tokenizer.decode(generated_ids[0], skip_special_tokens=True)

# Try a sample
sample_text = df_valid.iloc[0]["Article"]
print("Original Text:\n", sample_text)
print("\nGenerated Summary:\n", summarize_text(sample_text))


Mounted at /content/drive
Collecting pytorch-lightning
  Downloading pytorch_lightning-2.5.5-py3-none-any.whl.metadata (20 kB)
Collecting torchmetrics>0.7.0 (from pytorch-lightning)
  Downloading torchmetrics-1.8.2-py3-none-any.whl.metadata (22 kB)
Collecting lightning-utilities>=0.10.0 (from pytorch-lightning)
  Downloading lightning_utilities-0.15.2-py3-none-any.whl.metadata (5.7 kB)
Downloading pytorch_lightning-2.5.5-py3-none-any.whl (832 kB)
[2K   [90mтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБ[0m [32m832.4/832.4 kB[0m [31m27.4 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading lightning_utilities-0.15.2-py3-none-any.whl (29 kB)
Downloading torchmetrics-1.8.2-py3-none-any.whl (983 kB)
[2K   [90mтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБтФБ[0m [32m983.2/983.2 kB[0m [31m65.8 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling col

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/82.0 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/99.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/553 [00:00<?, ?B/s]

The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. 
The tokenizer class you load from this checkpoint is 'T5Tokenizer'. 
The class this function is called from is 'MT5Tokenizer'.
You are using the default legacy behaviour of the <class 'transformers.models.mt5.tokenization_mt5.MT5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


pytorch_model.bin:   0%|          | 0.00/1.20G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.20G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

INFO:pytorch_lightning.utilities.rank_zero:ЁЯТб Tip: For seamless cloud uploads and versioning, try installing [litmodels](https://pypi.org/project/litmodels/) to enable LitModelCheckpoint, which syncs automatically with the Lightning model registry.
INFO:pytorch_lightning.utilities.rank_zero:GPU available: True (cuda), used: True
INFO:pytorch_lightning.utilities.rank_zero:TPU available: False, using: 0 TPU cores
INFO:pytorch_lightning.utilities.rank_zero:HPU available: False, using: 0 HPUs
INFO:pytorch_lightning.accelerators.cuda:LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]
INFO:pytorch_lightning.callbacks.model_summary:
  | Name  | Type                        | Params | Mode
-------------------------------------------------------------
0 | model | MT5ForConditionalGeneration | 300 M  | eval
-------------------------------------------------------------
300 M     Trainable params
0         Non-trainable params
300 M     Total params
1,200.707 Total estimated model params size (MB)
0      

Sanity Checking: |          | 0/? [00:00<?, ?it/s]



Training: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

Validation: |          | 0/? [00:00<?, ?it/s]

INFO:pytorch_lightning.utilities.rank_zero:`Trainer.fit` stopped: `max_epochs=8` reached.
INFO:pytorch_lightning.accelerators.cuda:LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]


Validation: |          | 0/? [00:00<?, ?it/s]

Original Text:
 рк╡ркбрлЛркжрк░рк╛: рк╡ркбрлЛркжрк░рк╛ рк╢рк╣рлЗрк░ркорк╛ркВ ркПркХ 19 рк╡рк░рлНрк╖рлАркп ркЖрк╢рк╛рк╕рлНрккркж ркЦрлЗрк▓рк╛ркбрлАркирлБркВ ркбрлЗркВркЧрлНркпрлВркерлА ркирк┐ркзрки ркеркпрлБркВ ркЫрлЗ. рк╢рк╣рлЗрк░ркирк╛ ркЖркЬрк╡рк╛ рк░рлЛркб ркЦрк╛ркдрлЗ рк░рк╣рлЗркдрлА 19 рк╡рк░рлНрк╖рлАркп рк╕рк╛ркХрлНрк╖рлА рк░рк╛рк╡рк▓ (Sakshi Rawal)ркирлБркВ ркирк┐ркзрки ркеркпрлБркВ ркЫрлЗ. рк╕рк╛ркХрлНрк╖рлАркП рк╡рк░рлНрк╖ 2019ркорк╛ркВ ркЭрк╛рк░ркЦркВркб (Jharkhand) ркЦрк╛ркдрлЗ ркпрлЛркЬрк╛ркпрлЗрк▓рлА ркЬрлБркбрлЛркирлА рк╕рлБрк░рк╛рк╢ ркХрлЛркорлНрккрк┐ркЯрк┐рк╢ркиркорк╛ркВ ркмрлНрк░рлЛркирлНркЭ ркорлЗркбрк▓ ркорлЗрк│рк╡рлНркпрлЛ рк╣ркдрлЛ. рк╡ркбрлЛркжрк░рк╛ рк╢рк╣рлЗрк░ (Vadodara city)ркорк╛ркВ рк╡ркХрк░рлЗрк▓рк╛ рккрк╛ркгрлАркЬркирлНркп рк░рлЛркЧркЪрк╛рк│рк╛ркП ркПркХ ркирлЗрк╢ркирк▓ рккрлНрк▓рлЗркпрк░ркирлЛ ркнрлЛркЧ рк▓рлАркзрлЛ ркЫрлЗ. ркирлЗрк╢ркирк▓ рккрлНрк▓рлЗркпрк░ ркПрк╡рлА рк╕рк╛ркХрлНрк╖рлАркирк╛ ркирк┐ркзркиркерлА рккрк░рк┐рк╡рк╛рк░ркорк╛ркВ рк╢рлЛркХ рк╡рлН

In [2]:
sample_text = df_valid.iloc[10]["Article"]
print("Original Text:\n", sample_text)
print("\nGenerated Summary:\n", summarize_text(sample_text))

Original Text:
 ркнрк░рлВркЪ ркЕркирлЗ ркЕркВркХрлНрк▓рлЗрк╢рлНрк╡рк░ркирлЗ ркЬрлЛркбркдрлЛ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ ркмрлЗ рк╢рк╣рлЗрк░ рк╡ркЪрлНркЪрлЗркирлБркВ ркЕркВркдрк░ ркШркЯрк╛ркбрк╡рк╛ рк╕рк╛ркерлЗ ркЯрлНрк░рк╛рклрк┐ркХркирлА рк╕ркорк╕рлНркпрк╛ркорк╛ркВркерлА ркорлБркХрлНркд ркЕрккрк╛рк╡ркирк╛рк░ ркорк╣ркдрлНрк╡ркирлЛ ркмрлНрк░рлАркЬ рк╕рк╛ркмрк┐ркд ркеркпрлЛ ркЫрлЗ. ркЬрлЛркХрлЗ, ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬркирк╛ ркирк┐рк░рлНркорк╛ркг ркмрк╛ркж ркЖ ркмрлНрк░рлАркЬ ркЕркХрк╕рлНркорк╛ркд ркЭрлЛрки ркдрлЗркоркЬ рк╕рлБрк╕рк╛ркЗркб рккрлЛркЗркирлНркЯ ркмркирлА ркЧркпрлЛ рк╣рлЛркп ркдрлЗрко рк▓рк╛ркЧрлА рк░рк╣рлНркпрлБркВ ркЫрлЗ. ркмрлНрк░рлАркЬ рккрк░ рккрлБрк░ркЭркбрккрлЗ ркЬркдрк╛ркВ рк╡рк╛рк╣ркирлЛ рк╡ркЪрлНркЪрлЗ ркЕркХрк╕рлНркорк╛ркдркирк╛ ркмркирк╛рк╡рлЛ рк╡ркзрлА ркЧркпрк╛ркВ ркЫрлЗ. ркмрлАркЬрлА ркдрк░ркл ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ рккрк░ркерлА ркЫрк╛рк╕рк╡рк╛рк░рлЗ рк▓рлЛркХрлЛ ркЖрккркШрк╛ркд ркХрк░рк╡рк╛рки

In [5]:
!pip install evaluate




In [17]:
import gradio as gr

# --- Your summarization function (keep your model logic here) ---
def summarize_interface(article):
    summary = summarize_text(article)   # тЬЕ your model function
    return summary


# --- Custom colorful theme (only valid tokens) ---
theme = gr.themes.Base(
    primary_hue="purple",
    secondary_hue="yellow",
    neutral_hue="cyan"
).set(
    background_fill_primary="linear-gradient(to right, #ffe57f, #ffd180)",  # golden-orange gradient
    background_fill_secondary="linear-gradient(to right, #81d4fa, #b388ff)",  # blue-purple gradient
    input_background_fill="#ffffff",
    button_primary_background_fill="#ff6f00",  # vibrant orange
    button_primary_text_color="#ffffff",
    body_text_color="#263238"  # dark slate
)


# --- Launch Gradio Interface ---
gr.Interface(
    fn=summarize_interface,
    inputs=gr.Textbox(
        lines=12,
        label="ЁЯУ░ Gujarati Article",
        placeholder="рк▓рлЗркЦ ркЕрк╣рлАркВ рккрлЗрк╕рлНркЯ ркХрк░рлЛ... (Paste article here)",
        elem_id="input-box"
    ),
    outputs=gr.Textbox(
        lines=6,
        label="ЁЯза Generated Summary",
        elem_id="output-box"
    ),
    title="ЁЯОЙ Gujarati News Summarizer",
    description="""
    <div style='text-align: center; font-size: 16px; color: #37474f; font-family: Comic Sans MS;'>
        <p>ЁЯФН <b>Paste your Gujarati news article</b> below and get a short, clear summary using a powerful mT5 model.</p>
        <p>тЬи Built with <span style="color:#7e57c2;"><b>HuggingFace Transformers</b></span> and <span style="#ff6f00;"><b>PyTorch Lightning</b></span></p>
    </div>
    """,
    theme=theme,
    allow_flagging="never",
    live=True,
    css="""
        /* Global font override */
        * {
            font-family: "Comic Sans MS", cursive, sans-serif !important;
        }
        #input-box textarea {
            border: 2px solid #7e57c2;
            box-shadow: 0 0 10px rgba(126, 87, 194, 0.4);
            background: #fff8e1;
        }
        #output-box textarea {
            border: 2px solid #ff6f00;
            background: #e1f5fe;
            color: #263238;
            font-weight: bold;
        }
        .gr-button {
            font-size: 16px;
            font-weight: bold;
            border-radius: 10px;
            transition: 0.3s ease;
        }
        .gr-button:hover {
            background: #ffd54f !important;
            color: #000 !important;
        }
    """
).launch(share=True)




Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://d8788c01f537151c67.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [10]:
!pip install bert_score



In [13]:
import pandas as pd
from bert_score import score

# Index to test
index = 10

# Get article and reference summary
sample_text = df_valid.iloc[index]["Article"]

reference_summary = "ркнрк░рлВркЪ ркЕркирлЗ ркЕркВркХрлНрк▓рлЗрк╢рлНрк╡рк░ркирлЗ ркЬрлЛркбркдрлЛ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ ркмрлЗ рк╢рк╣рлЗрк░ рк╡ркЪрлНркЪрлЗркирлБркВ ркЕркВркдрк░ ркШркЯрк╛ркбрк╡рк╛ рк╕рк╛ркерлЗ ркЯрлНрк░рк╛рклрк┐ркХркирлА рк╕ркорк╕рлНркпрк╛ркорк╛ркВркерлА ркорлБркХрлНркд ркЕрккрк╛рк╡ркирк╛рк░ ркорк╣ркдрлНрк╡ркирлЛ ркмрлНрк░рлАркЬ рк╕рк╛ркмрк┐ркд ркеркпрлЛ ркЫрлЗ. ркЬрлЛркХрлЗ, ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬркирк╛ ркирк┐рк░рлНркорк╛ркг ркмрк╛ркж ркЖ ркмрлНрк░рлАркЬ ркЕркХрк╕рлНркорк╛ркд ркЭрлЛрки ркдрлЗркоркЬ рк╕рлБрк╕рк╛ркЗркб рккрлЛркЗркирлНркЯ ркмркирлА ркЧркпрлЛ рк╣рлЛркп ркдрлЗрко рк▓рк╛ркЧрлА рк░рк╣рлНркпрлБркВ ркЫрлЗ. ркмрлНрк░рлАркЬ рккрк░ рккрлБрк░ркЭркбрккрлЗ ркЬркдрк╛ркВ рк╡рк╛рк╣ркирлЛ рк╡ркЪрлНркЪрлЗ ркЕркХрк╕рлНркорк╛ркдркирк╛ ркмркирк╛рк╡рлЛ рк╡ркзрлА ркЧркпрк╛ркВ ркЫрлЗ. ркмрлАркЬрлА ркдрк░ркл ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ рккрк░ркерлА ркЫрк╛рк╕рк╡рк╛рк░рлЗ рк▓рлЛркХрлЛ ркЖрккркШрк╛ркд ркХрк░рк╡рк╛ркирк╛ ркЗрк░рк╛ркжрлЗ ркирк░рлНркоркжрк╛ ркиркжрлАркорк╛ркВ ркнрлБрк╕ркХрлЛ ркорк╛рк░ркдрк╛ркВ рк╣рлЛрк╡рк╛ркирк╛ ркмркирк╛рк╡рлЛ рк╕рк╛ркорлЗ ркЖрк╡рлА рк░рк╣рлНркпрк╛ркВ ркЫрлЗ. ркдрлНркпрк╛рк░рлЗ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ рккрк░ркерлА ркнрк╛рк░ркжрк╛рк░рлА рк╡рк╛рк╣ркирлЛркирлА ркЕрк╡рк░ркЬрк╡рк░ ркмркВркз ркХрк░рк╡рк╛ ркдрлЗркоркЬ рккрлЛрк▓рлАрк╕ ркжрлНрк╡рк╛рк░рк╛ ркмрлНрк░рлАркЬ рккрк░ рк╕ркдркд рккрлЗркЯрлНрк░рлЛрк▓рк┐ркВркЧ ркХрк░рк╡рк╛ркорк╛ркВ ркЖрк╡рлЗ ркдрлЗрк╡рлА ркорк╛ркВркЧ ркЙркарлА ркЫрлЗ.ркЕркВркХрк▓рлЗрк╢рлНрк╡рк░ ркЕркирлЗ ркнрк░рлВркЪ ркирлЗ ркЬрлЛркбрк╛ркдрк╛ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рк┐ркЬ рккрк░ ркЕркЪрк╛ркиркХ рк░рлАркХрлНрк╖рк╛ ркЙркнрлА ркеркЗ ркЬркдрк╛ркВ ркХрк╛рк░ ркзркбрк╛ркХрк╛ркнрлЗрк░ ркШрлБрк╕рлА ркЬрк╡рк╛ рккрк╛ркорлА рк╣ркдрлА . 7 рк╡рлНркпркХрлНркдрк┐ркУркирлЗ ркЗркЬрк╛ рккрк╣рлЛркВркЪрлА рк╣ркдрлА. 108 ркирлА ркоркжркж ркерлА ркЗркЬрк╛ркЧрлНрк░рк╕рлНркдрлЛркирлЗ рк╕рк╛рк░рк╡рк╛рк░ ркЕрк░рлНркерлЗ ркЦрк╕рлЗркбрк╛ркпрлЛ рк╣ркдрк╛. ркЕркХрк╕рлНркорк╛ркдркирк╛ рккркЧрк▓рлЗ рк╡рк╛рк╣рки рк╡рлНркпрк╡рк╣рк╛рк░ рккрк░ ркЖркВрк╢рк┐ркХ ркЕрк╕рк░ ркеркЗ рк╣ркдрлА.ркЕркВркХрк▓рлЗрк╢рлНрк╡рк░ркерлА ркнрк░рлВркЪ ркдрк░ркл ркЬркдрлА рккрлЗрк╕рлЗркирлНркЬрк░ ркнрк░рлЗрк▓рлА рк░рлАркХрлНрк╖рк╛ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рк┐ркЬ рккрк░ ркПркХрк╛ркПркХ ркКркнрлА ркХрк░рлА ркжрлЗркдрк╛ рккрк╛ркЫрк│ркерлА ркЖрк╡рлА рк░рк╣рлЗрк▓ ркХрк╛рк░ рк░рлАркХрлНрк╖рк╛ ркорк╛ркВ ркзркбрк╛ркХрк╛ркнрлЗрк░ ркнркЯркХрк╛ркИ ркЧркпрк╛ рк╣ркдрк╛. ркХрк╛рк░ ркЕркирлЗ рк░рлАркХрлНрк╖рк╛ рк╡ркЪрлНркЪрлЗ рк╕рк░рлНркЬрк╛ркпрлЗрк▓рк╛ ркЕркХрк╕рлНркорк╛ркдркорк╛ркВ рк░рлАркХрлНрк╖рк╛ ркорк╛ркВ рк╕рк╡рк╛рк░ ркбрлНрк░рк╛ркИрк╡рк░ рк╕рк╣рк┐ркд ркПркХ рк╡рлГркзрлНркз ркдрлЗркоркЬ ркПркХ ркорк╣рк┐рк▓рк╛ ркЕркирлЗ ркПркХ ркирк╛ркирлА ркмрк╛рк│ркХрлА ркирлЗ рккркЧ ркорк╛ркВ ркдрлЗркоркЬ ркорк╛ркерк╛ркирк╛ ркнрк╛ркЧрлЗ рк╡рк╛ркЧрлЗрк▓ ркЬрлНркпрк╛рк░рлЗ ркорлЛркЯрк░ркХрк╛рк░ ркорк╛ркВ рк╕рк╡рк╛рк░ 3 ркЬрлЗркЯрк▓рк╛ рк▓рлЛркХрлЛ ркирлЛ ркЖркмрк╛ркж ркмркЪрк╛рк╡ ркорлЛркЯрк░ ркХрк╛рк░ ркЪрк╛рк▓ркХ ркирлЗ ркорк╛ркерк╛ркирк╛ ркнрк╛ркЧрлЗ ркЗркЬрк╛ ркеркдрк╛ рк╕рк╛рк░рк╡рк╛рк░ ркЕрк░рлНркерлЗ 108 ркПркорлНркмрлНркпрлБрк▓ркирлНрк╕ рк╕рлЗрк╡рк╛ ркмрлЛрк▓рк╛рк╡рлА ркдрк╛ркдрлНркХрк╛рк▓рк┐ркХ ркнрк░рлВркЪ рк╕рк┐рк╡рк┐рк▓ рк╣рлЛрк╕рлНрккрк┐ркЯрк▓ ркЦрк╛ркдрлЗ ркЪрк╛рк░рлЗркп ркирлЗ ркЦрк╕рлЗркбрк╡рк╛ркорк╛ркВ ркЖрк╡рлЗрк▓ ркЫрлЗ. ркШркЯркирк╛ ркЕркирлЗ рккркЧрк▓рлЗ рк╡рк╛рк╣рки рк╡рлНркпрк╡рк╣рк╛рк░ ркирлЗ ркЖркВрк╢рк┐ркХ ркЕрк╕рк░ ркерк╡рк╛ рккрк╛ркорлА рк╣ркдрлА ркЬрлЗркирлЗ ркдрлНрк░рк╛рклрк┐ркХ ркЬрк╡рк╛ркирлЛ ркП рк╣рк│рк╡рлЛ ркХрк░рлНркпрлЛ рк╣ркдрлЛ."

generated_summary = "ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬркирк╛ ркирк┐рк░рлНркорк╛ркг ркмрк╛ркж ркЖ ркмрлНрк░рлАркЬ ркЕркХрк╕рлНркорк╛ркд ркЭрлЛрки ркдрлЗркоркЬ рк╕рлБрк╕рк╛ркЗркб рккрлЛркЗркирлНркЯ ркмркирлА ркЧркпрлЛ рк╣рлЛркп ркдрлЗрко рк▓рк╛ркЧрлАркЕркВркХрк▓рлЗрк╢рлНрк╡рк░ркерлА ркнрк░рлВркЪ ркдрк░ркл ркЬркдрлА рккрлЗрк╕рлЗркирлНркЬрк░ ркнрк░рлЗрк▓рлА рк░рлАркХрлНрк╖рк╛ ркПркХрк╛ркПркХ ркКркнрлА ркХрк░рлА ркжрлЗркдрк╛ ркХрк╛рк░ ркзркбрк╛ркХрк╛ркнрлЗрк░ ркШрлБрк╕рлА ркЬрк╡рк╛ рккрк╛ркорлА рк╣ркдрлА7 рк╡рлНркпркХрлНркдрк┐ркУркирлЗ ркЗркЬрк╛ рккрк╣рлЛркВркЪрлА рк╣ркдрлА, 108 ркирлА ркоркжркжркерлА ркЗркЬрк╛ркЧрлНрк░рк╕рлНркдрлЛркирлЗ рк╕рк╛рк░рк╡рк╛рк░ ркЕрк░рлНркерлЗ ркЦрк╕рлЗркбрк╛ркпрлЛ рк╣ркдрк╛. ркЕркХрк╕рлНркорк╛ркдркирк╛ рккркЧрк▓рлЗ рк╡рк╛рк╣рки рк╡рлНркпрк╡рк╣рк╛рк░ рккрк░ ркЖркВрк╢рк┐ркХ ркЕрк╕рк░ ркеркЗ рк╣"

# Print them
print("Generated Summary:\n", generated_summary)
print("Reference Summary:\n", reference_summary)

# тЪб BERTScore calculation
# Using multilingual model because Gujarati is low-resource
P, R, F1 = score([generated_summary], [reference_summary], lang="gu", model_type="microsoft/mdeberta-v3-base")

print("\nBERTScore:")
print(f"Precision: {P.mean().item():.4f}")
print(f"Recall:    {R.mean().item():.4f}")
print(f"F1 Score:  {F1.mean().item():.4f}")


Generated Summary:
 ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬркирк╛ ркирк┐рк░рлНркорк╛ркг ркмрк╛ркж ркЖ ркмрлНрк░рлАркЬ ркЕркХрк╕рлНркорк╛ркд ркЭрлЛрки ркдрлЗркоркЬ рк╕рлБрк╕рк╛ркЗркб рккрлЛркЗркирлНркЯ ркмркирлА ркЧркпрлЛ рк╣рлЛркп ркдрлЗрко рк▓рк╛ркЧрлАркЕркВркХрк▓рлЗрк╢рлНрк╡рк░ркерлА ркнрк░рлВркЪ ркдрк░ркл ркЬркдрлА рккрлЗрк╕рлЗркирлНркЬрк░ ркнрк░рлЗрк▓рлА рк░рлАркХрлНрк╖рк╛ ркПркХрк╛ркПркХ ркКркнрлА ркХрк░рлА ркжрлЗркдрк╛ ркХрк╛рк░ ркзркбрк╛ркХрк╛ркнрлЗрк░ ркШрлБрк╕рлА ркЬрк╡рк╛ рккрк╛ркорлА рк╣ркдрлА7 рк╡рлНркпркХрлНркдрк┐ркУркирлЗ ркЗркЬрк╛ рккрк╣рлЛркВркЪрлА рк╣ркдрлА, 108 ркирлА ркоркжркжркерлА ркЗркЬрк╛ркЧрлНрк░рк╕рлНркдрлЛркирлЗ рк╕рк╛рк░рк╡рк╛рк░ ркЕрк░рлНркерлЗ ркЦрк╕рлЗркбрк╛ркпрлЛ рк╣ркдрк╛. ркЕркХрк╕рлНркорк╛ркдркирк╛ рккркЧрк▓рлЗ рк╡рк╛рк╣рки рк╡рлНркпрк╡рк╣рк╛рк░ рккрк░ ркЖркВрк╢рк┐ркХ ркЕрк╕рк░ ркеркЗ рк╣
Reference Summary:
 ркнрк░рлВркЪ ркЕркирлЗ ркЕркВркХрлНрк▓рлЗрк╢рлНрк╡рк░ркирлЗ ркЬрлЛркбркдрлЛ ркирк░рлНркоркжрк╛ ркорлИркпрк╛ ркмрлНрк░рлАркЬ ркмрлЗ рк╢рк╣р