## Requirements

In [None]:
!pip install transformers
!pip install datasets
!pip install sentencepiece
!pip install evaluate
!pip install rouge_score
!pip install bert_score

## Dataset

Here we import the dataset.

In [3]:
import pandas as pd
from datasets import load_dataset, Dataset

dataset = load_dataset("pn_summary")

Downloading builder script:   0%|          | 0.00/5.55k [00:00<?, ?B/s]

Downloading metadata:   0%|          | 0.00/2.60k [00:00<?, ?B/s]

Downloading readme:   0%|          | 0.00/10.4k [00:00<?, ?B/s]

Downloading and preparing dataset pn_summary/1.0.0 to /root/.cache/huggingface/datasets/pn_summary/1.0.0/1.0.0/1429f2d17a6be7eb689d68d8cc17649ac07dce32dd69929acf95bdc791009d44...


Downloading data:   0%|          | 0.00/89.6M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/82022 [00:00<?, ? examples/s]

Generating validation split:   0%|          | 0/5592 [00:00<?, ? examples/s]

Generating test split:   0%|          | 0/5593 [00:00<?, ? examples/s]

Dataset pn_summary downloaded and prepared to /root/.cache/huggingface/datasets/pn_summary/1.0.0/1.0.0/1429f2d17a6be7eb689d68d8cc17649ac07dce32dd69929acf95bdc791009d44. Subsequent calls will reuse this data.


  0%|          | 0/3 [00:00<?, ?it/s]

In [4]:
dataset

DatasetDict({
    train: Dataset({
        features: ['id', 'title', 'article', 'summary', 'category', 'categories', 'network', 'link'],
        num_rows: 82022
    })
    validation: Dataset({
        features: ['id', 'title', 'article', 'summary', 'category', 'categories', 'network', 'link'],
        num_rows: 5592
    })
    test: Dataset({
        features: ['id', 'title', 'article', 'summary', 'category', 'categories', 'network', 'link'],
        num_rows: 5593
    })
})

## Fine-tune and load the model

Due to the size of models and space to fine-tune it with the dataset, we fine-tuned it on Hugging Face AutoTrain and push the fine-tuned models to the hub.

In [5]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

token='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'
tokenizer = AutoTokenizer.from_pretrained("arshandalili/autotrain-news-summarization-3366493100", use_auth_token=token)
model = AutoModelForSeq2SeqLM.from_pretrained("arshandalili/autotrain-news-summarization-3366493100", use_auth_token=token)

Downloading (…)okenizer_config.json:   0%|          | 0.00/478 [00:00<?, ?B/s]

Downloading (…)"spiece.model";:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

Downloading (…)"tokenizer.json";:   0%|          | 0.00/16.3M [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/74.0 [00:00<?, ?B/s]

Downloading (…)lve/main/config.json:   0%|          | 0.00/884 [00:00<?, ?B/s]

Downloading (…)"pytorch_model.bin";:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

## Evaluation

Here we sample 10 instances from test and see their results and compute evaluation metrics.

In [6]:
test_data = dataset['train'].shuffle(0).select(range(10))

In [11]:
evaluate.list_evaluation_modules()

['lvwerra/test',
 'precision',
 'code_eval',
 'roc_auc',
 'cuad',
 'xnli',
 'rouge',
 'pearsonr',
 'mse',
 'super_glue',
 'comet',
 'cer',
 'sacrebleu',
 'mahalanobis',
 'wer',
 'competition_math',
 'f1',
 'recall',
 'coval',
 'mauve',
 'xtreme_s',
 'bleurt',
 'ter',
 'accuracy',
 'exact_match',
 'indic_glue',
 'spearmanr',
 'mae',
 'squad',
 'chrf',
 'glue',
 'perplexity',
 'mean_iou',
 'squad_v2',
 'meteor',
 'bleu',
 'wiki_split',
 'sari',
 'frugalscore',
 'google_bleu',
 'bertscore',
 'matthews_correlation',
 'seqeval',
 'trec_eval',
 'rl_reliability',
 'jordyvl/ece',
 'angelina-wang/directional_bias_amplification',
 'cpllab/syntaxgym',
 'lvwerra/bary_score',
 'kaggle/amex',
 'kaggle/ai4code',
 'hack/test_metric',
 'yzha/ctc_eval',
 'codeparrot/apps_metric',
 'mfumanelli/geometric_mean',
 'daiyizheng/valid',
 'poseval',
 'erntkn/dice_coefficient',
 'mgfrantz/roc_auc_macro',
 'Vlasta/pr_auc',
 'gorkaartola/metric_for_tp_fp_samples',
 'idsedykh/metric',
 'idsedykh/codebleu2',
 'idsed

In [65]:
import evaluate
import numpy as np
import nltk

rouge = evaluate.load('rouge')
bleu = evaluate.load('bleu')
bertscore = evaluate.load('bertscore')

nltk.download('punkt')

def compute_metrics(eval_preds, metric, bertscore=False, rouge=True):
    preds = [res['generated_summary'] for res in eval_preds]
    labels = [res['original_summary'] for res in eval_preds]
    preds = ["\n".join(nltk.sent_tokenize(pred.strip())) for pred in preds]
    labels = ["\n".join(nltk.sent_tokenize(label.strip())) for label in labels]
    
    if rouge:
      result = metric.compute(predictions=preds, references=labels, tokenizer=lambda x: x.split())
    elif bertscore:
      result = metric.compute(predictions=preds, references=labels, lang='fa')
    else:
      result = metric.compute(predictions=preds, references=labels)
    return result

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


In [15]:
result = []
for data in test_data:

  input_ids = tokenizer(
      data['article'],
      return_tensors="pt",
      padding="max_length",
      truncation=True,
      max_length=512
    )['input_ids']

  output_ids = model.generate(
    input_ids=input_ids,
    max_length=84,
    no_repeat_ngram_size=2,
    num_beams=4
  )[0]

  summary = tokenizer.decode(
    output_ids,
    skip_special_tokens=True,
    clean_up_tokenization_spaces=False
  )

  result.append({
      'article': data['article'],
      'original_summary': data['summary'],
      'generated_summary': summary
  })

In [16]:
df = pd.DataFrame(result)
df

Unnamed: 0,article,original_summary,generated_summary
0,به گزارش خبرگزاری مهر به نقل از روابط عمومی مؤ...,تور هنری ایتالیا در آرته با محوریت تبادل فرهنگ...,مؤسسه هنری سکو، تور فرهنگی تاریخی در آرته با م...
1,به گزارش ایمنا، احمد پورحیدر، با اشاره به ظرفی...,مدیرکل گمرک منطقه ویژه اقتصادی انرژی پارس جنوب...,مدیرکل گمرک منطقه ویژه اقتصادی انرژی پارس جنوب...
2,به گفته توتال، این شرکت همچنین در نظر دارد ۱۸۰...,شرکت بزرگ نفتی توتال فرانسه از توقف پالایش نفت...,توتال، بزرگترین شرکت پالایش اروپا، اعلام کرد ک...
3,به گزارش خبرگزاری خبرآنلاین؛ ال‌کلاسیکوی ۲۷۸ ا...,ال‌کلاسیکوی شماره ۲۷۸ در حالی که تماشاگر نداشت...,تیم فوتبال رئال مادرید با نتیجه ۳ بر یک در ورز...
4,به گزارش ایمنا، مصطفی نیک‌نقش بر ضرورت ایجاد د...,معاون خدمات شهری شهردار ساری تشکیل کمیته‌های د...,معاون خدمات شهری شهردار ساری گفت: تلاش می کنیم...
5,رسول جهانگیری در گفت‌وگو با خبرنگار ایمنا اظها...,رئیس اتاق اصناف اصفهان گفت: به عنوان یک شهروند...,رئیس اتاق اصناف اصفهان از تعطیل کردن برخی از و...
6,به گزارش ایرنا، نام‌گذاری روز نخست هفته پارالم...,دارنده مدال طلای بازی‌های پاراآسیایی جاکارتا د...,ورزشکاران نابینا با مشکل دیگری به نام همراه ند...
7,به گزارش بازار، میزان بارش‌های کشور تا بیست به...,میزان بارش‌های کشور درسال آبی جاری از ابتدای م...,میزان بارش های کشور تا بیست بهمن ماه سال آبی ج...
8,سید علیرضا مروجی در گفت‌وگو با خبرنگار ایمنا ب...,رئیس دانشگاه علوم پزشکی کاشان گفت: طی ۲۴ ساعت ...,رئیس دانشگاه علوم پزشکی کاشان گفت: طی ۲۴ ساعت ...
9,به گزارش شانا به نقل از مرکز پژوهش‌های مجلس شو...,نخستین نشست کمیته کارشناسی مشترک حوزه انرژی با...,نخستین نشست کمیته کارشناسی مشترک حوزه انرژی ام...


In [66]:
print('ROUGE Score:')
compute_metrics(result, rouge, rouge=True)

ROUGE Score:


{'rouge1': 0.42019442558745246,
 'rouge2': 0.2740388642885063,
 'rougeL': 0.3772799697364326,
 'rougeLsum': 0.38573884980348727}

In [55]:
print('BLEU Score:')
compute_metrics(result, bleu)

BLEU Score:


{'bleu': 0.22912224597915648,
 'precisions': [0.5512820512820513,
  0.35714285714285715,
  0.2897196261682243,
  0.24509803921568626],
 'brevity_penalty': 0.6663215574396286,
 'length_ratio': 0.7112462006079028,
 'translation_length': 234,
 'reference_length': 329}

In [56]:
print('Bert Score:')
compute_metrics(result, bertscore, bertscore=True)

Bert Score:


{'precision': [0.8203858137130737,
  0.8496161699295044,
  0.7083439230918884,
  0.6703019738197327,
  0.8390079736709595,
  0.8958035111427307,
  0.6674365997314453,
  0.8232523202896118,
  0.9516125917434692,
  0.8308478593826294],
 'recall': [0.8510735034942627,
  0.8170831203460693,
  0.7802513241767883,
  0.6320977210998535,
  0.8088076710700989,
  0.8238754272460938,
  0.6353918313980103,
  0.7728919982910156,
  0.824344277381897,
  0.8791366219520569],
 'f1': [0.8354479670524597,
  0.8330321311950684,
  0.742560863494873,
  0.650639533996582,
  0.8236310482025146,
  0.8583352565765381,
  0.6510201096534729,
  0.7972776889801025,
  0.8834182620048523,
  0.8543103337287903],
 'hashcode': 'bert-base-multilingual-cased_L9_no-idf_version=0.3.12(hug_trans=4.26.1)'}