# Text Summarization dengan BART

Notebook ini mendemonstrasikan cara meringkas teks menggunakan model BART dari Hugging Face Transformers.

In [None]:
%pip install transformers torch

In [1]:
from transformers import pipeline

summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

  from .autonotebook import tqdm as notebook_tqdm
Device set to use mps:0


In [2]:
article = """
Hugging Face has become a central platform for AI developers,
hosting more than 1 million pretrained models, datasets, and apps.
Its open-source Transformers library allows anyone to run
state-of-the-art models with just a few lines of Python code.
"""
summary = summarizer(article, max_length=60, min_length=10, do_sample=False)
print(summary[0]["summary_text"])

Hugging Face has become a central platform for AI developers. The open-source Transformers library allows anyone to run state-of-the-art models.


# Penjelasan Kode

Pada kode di atas, kita mengimpor fungsi 'pipeline' dari pustaka 'transformers'.

Kemudian, kita membuat sebuah pipeline untuk tugas 'summarization' menggunakan model 'facebook/bart-large-cnn'.

Fungsi 'pipeline' ini digunakan untuk membuat model yang siap digunakan untuk tugas tertentu, dalam hal ini adalah meringkas teks.

Kita mendefinisikan sebuah artikel yang akan diringkas, lalu memanggil fungsi summarizer dengan parameter panjang maksimum dan minimum untuk ringkasan.

Terakhir, kita mencetak hasil ringkasan dari artikel tersebut dengan mengakses elemen pertama dari daftar hasil dan mengambil teks ringkasannya.

### QnA: Pertanyaan dan Jawaban

**Q: Apakah model 'facebook/bart-large-cnn' ini LLM?**

A: Ya, model 'facebook/bart-large-cnn' adalah salah satu contoh dari Large Language Model (LLM) yang dirancang untuk memahami dan menghasilkan teks dalam bahasa alami. LLM seperti BART (Bidirectional and Auto-Regressive Transformers) memiliki kemampuan untuk menangani berbagai tugas pemrosesan bahasa alami, termasuk meringkas teks, menjawab pertanyaan, dan menerjemahkan bahasa. Model ini dilatih pada sejumlah besar data teks, memungkinkan mereka untuk menangkap pola bahasa yang kompleks dan menghasilkan output yang koheren dan relevan.

**Q: Berapa parameter yang digunakan pada fungsi summarizer di atas dan apa fungsinya?**

A: Fungsi summarizer di atas menggunakan tiga parameter utama:
1. max_length: Parameter ini menentukan panjang maksimum dari ringkasan yang dihasilkan. Dalam contoh ini, ringkasan tidak akan melebihi 60 token.
2. min_length: Parameter ini menentukan panjang minimum dari ringkasan yang dihasilkan. Dalam contoh ini, ringkasan akan memiliki setidaknya 10 token.
3. do_sample: Parameter ini adalah boolean yang menentukan apakah model harus menggunakan sampling acak saat menghasilkan ringkasan. Jika diatur ke False, model akan menghasilkan ringkasan yang paling mungkin berdasarkan distribusi probabilitas.

**Q: Model ini berapa parameternya?**

A: Model 'facebook/bart-large-cnn' memiliki sekitar 406 juta parameter. Parameter ini adalah bobot yang dipelajari oleh model selama proses pelatihan dan digunakan untuk membuat prediksi atau menghasilkan teks berdasarkan input yang diberikan.

**Q: Bagaimana cara kerja model ini dalam meringkas teks?**

A: Model 'facebook/bart-large-cnn' bekerja dengan menggunakan arsitektur transformer yang terdiri dari encoder dan decoder. Proses meringkas teks dimulai dengan mengubah teks input menjadi representasi numerik yang dapat diproses oleh model. Encoder memproses teks input untuk menangkap konteks dan makna, sementara decoder menghasilkan ringkasan berdasarkan representasi yang dihasilkan oleh encoder. Model ini dilatih pada sejumlah besar data teks, memungkinkannya untuk memahami struktur bahasa dan menghasilkan ringkasan yang koheren dan relevan dengan konten asli.

**Q: Apa keunggulan menggunakan model 'facebook/bart-large-cnn' untuk meringkas teks dibandingkan metode tradisional?**

A: Keunggulan menggunakan model 'facebook/bart-large-cnn' untuk meringkas teks dibandingkan metode tradisional meliputi:
1. Akurasi yang lebih tinggi: Model ini dapat menangkap konteks dan makna yang lebih baik, menghasilkan ringkasan yang lebih relevan dan informatif.
2. Fleksibilitas: Model ini dapat digunakan untuk berbagai jenis teks dan domain, sementara metode tradisional mungkin terbatas pada jenis teks tertentu.
3. Kemampuan pembelajaran: Model ini dapat terus ditingkatkan dengan pelatihan tambahan pada data baru, sementara metode tradisional biasanya statis.
4. Penggunaan bahasa alami: Model ini menghasilkan ringkasan yang terdengar lebih alami dan mudah dipahami.