# **Let's try HuggingFace Transformers NLP Pipelines!**

In [None]:
!pip install transformers



In [None]:
from transformers import pipeline

# Inisialisasi zero-shot classification pipeline
classifier = pipeline("zero-shot-classification")

# Teks dan label yang dianalisis
input_text = "Artificial intelligence is transforming industries worldwide"
result = classifier(
    input_text,
    candidate_labels=["technology", "science", "entertainment"]
)

# Menampilkan teks input dan hasil dengan persentase lengkap
print(f"Teks: {input_text}")
for label, score in zip(result["labels"], result["scores"]):
    print(f"{label}: {score:.10f}")

No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.


Teks: Artificial intelligence is transforming industries worldwide
technology: 0.9851611257
science: 0.0118293287
entertainment: 0.0030095358


In [None]:
from transformers import pipeline

# Inisialisasi zero-shot classification pipeline dengan model spesifik
classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")

# Teks dan label yang dianalisis
input_text = "Climate change is causing more extreme weather events"
result = classifier(
    input_text,
    candidate_labels=['global warming', 'natural disasters', 'public awareness']
)

# Menampilkan teks input, model yang digunakan, dan hasil dengan persentase lengkap
print(f"Model: facebook/bart-large-mnli")
print(f"Teks: {input_text}")
for label, score in zip(result["labels"], result["scores"]):
    print(f"{label}: {score:.10f}")

Model: facebook/bart-large-mnli
Teks: Climate change is causing more extreme weather events
global warming: 0.7222746015
natural disasters: 0.2326687276
public awareness: 0.0450567044


In [None]:
from transformers import pipeline

# Inisialisasi zero-shot classification pipeline
classifier = pipeline("zero-shot-classification")

# Teks dan label yang dianalisis (Hanya 1 label)
input_text = "Artificial intelligence is revolutionizing various industries"
result = classifier(
    input_text,
    candidate_labels=['technology']
)

# Menampilkan teks input dan hasil dengan persentase lengkap
print(f"Teks: {input_text}")
for label, score in zip(result["labels"], result["scores"]):
    print(f"{label}: {score:.10f}")

No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/1.15k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]



Teks: Artificial intelligence is revolutionizing various industries
technology: 0.9893260598


In [None]:
from transformers import pipeline

# Inisialisasi text-generation pipeline
generator = pipeline("text-generation")

# Teks input dan pengaturan max_length untuk menghasilkan teks yang lebih panjang
generated_text = generator(
    "Through this tutorial, you will learn the basics of",
    max_length=50,  # Atur panjang maksimal teks yang dihasilkan
    num_return_sequences=1  # Menghasilkan satu teks saja
)

# Menampilkan hasil teks yang dihasilkan
for text in generated_text:
    print(text["generated_text"])

No model was supplied, defaulted to openai-community/gpt2 and revision 6c0e608 (https://huggingface.co/openai-community/gpt2).
Using a pipeline without specifying a model name and revision in production is not recommended.
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Through this tutorial, you will learn the basics of creating a game or game engine in Java. In order to build an application in JDK 8, you will need to learn how to build an environment and how to use web frameworks and JavaScript libraries.


In [None]:
from transformers import pipeline

# Menggunakan model GPT-2
generator = pipeline("text-generation", model="gpt2")

# Menghasilkan teks dengan input dan model baru
generated_text = generator(
    "This guide will show you how to start",
    max_length=40,
    num_return_sequences=5
)

# Menampilkan hasil teks yang dihasilkan
for text in generated_text:
    print(text["generated_text"])

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


This guide will show you how to start, how to work around the issue of screen shot quality on Chrome OS, and then how it works out for you. We will be using a new version of
This guide will show you how to start generating your own custom build log.

Go ahead and use it!

A very simple way to generate the log

This is my personal example
This guide will show you how to start using it.

Actions

Step 1: Create a Vue.js file in your root folder

This will be a quick guide and
This guide will show you how to start making your own custom dice with your favorite components.

There's also a guide to creating custom dice at home here as well. It's a little more
This guide will show you how to start working with it and learn where you need to begin.

It is highly recommended that you read the following tips on reading a copy of CMake:



In [None]:
from transformers import pipeline

# Menggunakan model GPT-2 Medium
generator = pipeline("text-generation", model="gpt2-medium")

# Menghasilkan teks dengan input dan model baru
generated_text = generator(
    "In this tutorial, we will explore the basics of AI",
    max_length=50,
    num_return_sequences=1
)

# Menampilkan hasil teks yang dihasilkan
for text in generated_text:
    print(text["generated_text"])

config.json:   0%|          | 0.00/718 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.52G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


In this tutorial, we will explore the basics of AI's to add depth to our game, and also to improve our visual design. You'll also discover various tools for managing your units before going into deeper details of AI.


A Note on


In [None]:
from transformers import pipeline

# Menggunakan model BERT base
unmasker = pipeline("fill-mask", model="bert-base-uncased")

# Menghasilkan prediksi untuk kata yang hilang
masked_text = unmasker("Artificial intelligence can help in [MASK] various industries.", top_k=2)

# Menampilkan hasil prediksi kata yang mengisi [MASK]
for result in masked_text:
    print(result)

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertForMaskedLM: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight', 'cls.seq_relationship.bias', 'cls.seq_relationship.weight']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


{'score': 0.4435833692550659, 'token': 1996, 'token_str': 'the', 'sequence': 'artificial intelligence can help in the various industries.'}
{'score': 0.06855323165655136, 'token': 4975, 'token_str': 'developing', 'sequence': 'artificial intelligence can help in developing various industries.'}


In [None]:
from transformers import pipeline

# Inisialisasi pipeline Named Entity Recognition (NER)
ner = pipeline("ner", grouped_entities=True)

# Menggunakan teks baru untuk dianalisis
ner_results = ner("Rafi is a scientist at OpenAI working in Russia.")

# Menampilkan hasil NER dengan entitas yang dikelompokkan
for entity in ner_results:
    print(entity)

No model was supplied, defaulted to dbmdz/bert-large-cased-finetuned-conll03-english and revision f2482bf (https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
Some weights of the model checkpoint at dbmdz/bert-large-cased-finetuned-conll03-english were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


{'entity_group': 'PER', 'score': 0.99793273, 'word': 'Rafi', 'start': 0, 'end': 4}
{'entity_group': 'ORG', 'score': 0.99857515, 'word': 'OpenAI', 'start': 23, 'end': 29}
{'entity_group': 'LOC', 'score': 0.99986136, 'word': 'Russia', 'start': 41, 'end': 47}


In [None]:
from transformers import pipeline

# Menggunakan model RoBERTa large
qa_pipeline = pipeline("question-answering", model="roberta-large")

# Konteks dan pertanyaan baru
context = "Mars adalah planet keempat dari Matahari dan dikenal sebagai planet merah. Planet ini memiliki dua bulan kecil yang bernama Phobos dan Deimos."
question = "Apa nama bulan-bulan Mars?"

# Mendapatkan jawaban dari model
result = qa_pipeline(question=question, context=context)

# Menampilkan jawaban
print(f"Jawaban: {result['answer']}")

config.json:   0%|          | 0.00/482 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

Some weights of RobertaForQuestionAnswering were not initialized from the model checkpoint at roberta-large and are newly initialized: ['qa_outputs.bias', 'qa_outputs.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


tokenizer_config.json:   0%|          | 0.00/25.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Jawaban: bernama Phobos dan Deimos


In [None]:
from transformers import pipeline

# Menggunakan model PubMedBERT
qa_pipeline = pipeline("question-answering", model="microsoft/BiomedNLP-PubMedBERT-base-uncased-abstract")

# Konteks dan pertanyaan baru
context = "Insulin adalah hormon yang diproduksi oleh pankreas. Ia berfungsi untuk mengatur kadar glukosa dalam darah dan penting bagi metabolisme karbohidrat."
question = "Apa fungsi insulin?"

# Mendapatkan jawaban dari model
result = qa_pipeline(question=question, context=context)

# Menampilkan jawaban
print(f"Jawaban: {result['answer']}")

Some weights of BertForQuestionAnswering were not initialized from the model checkpoint at microsoft/BiomedNLP-PubMedBERT-base-uncased-abstract and are newly initialized: ['qa_outputs.bias', 'qa_outputs.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Jawaban: berfungsi untuk mengatur kadar glukosa


In [None]:
from transformers import pipeline

# Inisialisasi pipeline untuk analisis sentimen
classifier = pipeline("sentiment-analysis")

# Teks yang dianalisis
result = classifier("The service at the restaurant was terrible and I was very disappointed.")

# Menampilkan hasil analisis sentimen
print(result)

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

[{'label': 'NEGATIVE', 'score': 0.9997593760490417}]


In [None]:
from transformers import pipeline

# Inisialisasi pipeline untuk rangkuman
summarizer = pipeline("summarization")

# Teks yang akan dirangkum
result = summarizer(
    """
    The rise of artificial intelligence (AI) has transformed various sectors, including healthcare,
    finance, and education. In healthcare, AI systems can analyze medical data and assist in diagnosing
    diseases more accurately than traditional methods. In finance, AI algorithms are used for fraud
    detection and managing investment portfolios, providing faster and more reliable insights.

    Moreover, the education sector has begun implementing AI-driven personalized learning experiences,
    tailoring educational content to meet the needs of individual students. However, these advancements
    raise ethical concerns regarding data privacy and the potential for job displacement. It is crucial
    for policymakers to address these challenges while promoting the beneficial aspects of AI technology.
    """
)

# Menampilkan hasil rangkuman
print(result)

No model was supplied, defaulted to sshleifer/distilbart-cnn-12-6 and revision a4f8f3e (https://huggingface.co/sshleifer/distilbart-cnn-12-6).
Using a pipeline without specifying a model name and revision in production is not recommended.


[{'summary_text': ' The rise of artificial intelligence (AI) has transformed various sectors, including healthcare, finance, and education . In healthcare, AI systems can analyze medical data and assist in diagnosing diseases more accurately than traditional methods . In finance, AI algorithms are used for fraud detection and managing investment portfolios .'}]


In [None]:
from transformers import pipeline

# Inisialisasi pipeline untuk terjemahan
translator = pipeline("translation", model="Helsinki-NLP/opus-mt-fr-en")  # Model untuk menerjemahkan dari Prancis ke Inggris

# Teks yang akan diterjemahkan
text_to_translate = "J'aime jouer à des jeux"  # Teks dalam bahasa Prancis yang berarti "Saya suka menggambar"
result = translator(text_to_translate)

# Menampilkan hasil terjemahan
print(result[0]['translation_text'])

config.json:   0%|          | 0.00/1.42k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/301M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/293 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/42.0 [00:00<?, ?B/s]

source.spm:   0%|          | 0.00/802k [00:00<?, ?B/s]

target.spm:   0%|          | 0.00/778k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.34M [00:00<?, ?B/s]

I like to play games


# **ANALISIS PRIBADI**

# 1. Zero-Shot Classification
Zero-shot classification adalah teknik NLP yang memungkinkan model untuk mengkategorikan teks tanpa perlu dilatih pada contoh spesifik untuk setiap kategori. Model ini dapat memprediksi label yang paling tepat sesuai dengan teks menggunakan konteks, sehingga sangat adaptif dalam mengklasifikasikan topik yang belum pernah terdeteksi sebelumnya. Berikut analisis dari contoh-contoh yang diberikan:

* **Contoh 1: Zero-Shot Classification Umum (Tanpa Model Tertentu)**
* Dalam contoh pertama, zero-shot classification pipeline dimulai tanpa model tertentu, yang secara default menggunakan facebook/bart-large-mnli. Teks input membahas bagaimana artificial intelligence mengubah berbagai industri, dan diberikan tiga label kandidat: "technology," "science," dan "entertainment". Pipeline ini tidak memiliki model spesifik, sehingga menggunakan model default untuk menilai kesesuaian antara teks dan label-labelnya. Dalam situasi ini, teknologi kemungkinan besar akan mendapatkan skor tertinggi karena terkait erat dengan AI dan transformasi industri. Markah tambahan untuk kata "sains" dan "hiburan" masih akan diberikan untuk menunjukkan tahap relevansinya yang lain.

*   **Contoh 2: Zero-Shot Classification dengan Model Spesifik**
* Dalam contoh kedua, model spesifik facebook/bart-large-mnli digunakan untuk menginisialisasi pipeline zero-shot classification. Menggunakan model tertentu dapat membawa kepastian pada hasilnya karena model tersebut dioptimalkan untuk analisis zero-shot dan cenderung lebih tepat. Teks input dalam contoh ini membicarakan tentang perubahan iklim dan kejadian cuaca ekstrem, dengan label kandidat tertentu yang menyoroti topik lingkungan: "global warming," "natural disasters," dan "public awareness." Dalam situasi ini, model akan mengevaluasi teks dan menentukan label yang paling tepat, kemungkinan besar "pemanasan global," berdasarkan konteks perubahan iklim. Memilih model yang tertentu membantu mempertahankan hasil yang konsisten dalam konteks tema yang sesuai.

* **Contoh 3: Klasifikasi dengan Satu Label Tunggal**
* Dalam contoh ketiga, model zero-shot classification dimulai dengan hanya satu label calon, yaitu "teknologi." Input text mengulas tentang bagaimana kecerdasan buatan (AI) mengubah berbagai sektor industri. Dalam situasi ini, model tidak perlu melakukan perbandingan dengan label lain karena hanya ada satu opsi yang tersedia. Model akan memberikan satu nilai skor relevansi untuk label "technology," yang menunjukkan seberapa besar probabilitas label tersebut sesuai dengan konteks teks. Ini menjadikan pendekatan tersebut lebih mudah dimengerti, karena yang terpenting adalah menunjukkan sejauh mana AI dihubungkan dengan teknologi dalam konteks revolusi industri, tanpa adanya persaingan antara label.

# 2. Text Generation
Pembuatan teks secara otomatis berdasarkan input yang diberikan dimungkinkan oleh model seperti GPT-2 dalam text generation. Pipeline text-generation ini bermanfaat dalam melanjutkan kalimat atau paragraf dengan konteks yang sesuai, serta bisa disesuaikan panjang dan jumlah hasilnya. Berikut adalah analisis untuk masing-masing contoh:
* **Contoh 1: Text Generation dengan Pengaturan Default**
* Pada contoh pertama, pipeline text-generation diinisialisasi dengan pengaturan default tanpa model tertentu, yang kemungkinan menggunakan GPT-2 dasar. Teks input "Through this tutorial, you will learn the basics of" diikuti oleh pengaturan max_length=50 untuk mengatur panjang maksimal teks yang dihasilkan, serta num_return_sequences=1 untuk menghasilkan satu teks. Karena model yang digunakan adalah default, hasil teksnya bisa lebih umum dan kurang spesifik dibandingkan dengan versi model yang lebih besar. Dengan hanya satu output, hasil ini cenderung singkat dan langsung, cocok untuk teks yang tidak memerlukan banyak variasi.

* **Contoh 2: Text Generation dengan Model GPT-2 (Basic)**
* Pada contoh kedua, pipeline menggunakan model spesifik GPT-2. Teks input adalah "This guide will show you how to start," diikuti dengan pengaturan max_length=40 dan num_return_sequences=5. Ini menghasilkan lima teks berbeda berdasarkan input yang sama, menunjukkan kemampuan model untuk menghasilkan berbagai versi teks dengan konteks serupa namun dengan variasi tertentu. Model GPT-2 ini lebih eksploratif dibandingkan default dan memungkinkan variasi output yang lebih kaya, menjadikannya cocok untuk skenario di mana berbagai kemungkinan hasil diperlukan.

* **Contoh 3: Text Generation dengan Model GPT-2 Medium**
* Pada contoh ketiga, pipeline menggunakan model GPT-2 Medium, yang merupakan versi lebih besar dari GPT-2. Teks input "In this tutorial, we will explore the basics of AI" diatur dengan max_length=50 dan menghasilkan satu teks (num_return_sequences=1). Versi GPT-2 Medium memiliki kapasitas untuk menghasilkan teks yang lebih kontekstual dan koheren dibandingkan model dasar, karena model ini memiliki lebih banyak parameter. Hasilnya biasanya lebih mendalam dan kaya konteks, cocok untuk teks yang memerlukan kesinambungan dengan input awal.

# 3. Fill-Mask
Fill-mask merupakan metode dalam bidang NLP yang memungkinkan model untuk menebak kata atau frase yang hilang dalam sebuah kalimat dengan mempertimbangkan konteks sekitarnya. Pemodelan yang sering digunakan dalam alur kerja ini ialah BERT (Bidirectional Encoder Representations from Transformers), yang dilatih untuk memahami konteks dengan baik dalam kedua arah (kiri dan kanan kata yang kosong), sehingga menghasilkan prediksi yang tepat untuk kata yang tidak ada.
* **Contoh Fill-Mask dengan Model**
* Pada contoh ini, pipeline fill-mask diinisialisasi menggunakan model "bert-base-uncased." Teks input adalah "Artificial intelligence can help in [MASK] various industries." dengan top_k=2, yang berarti model akan mengeluarkan dua prediksi terbaik untuk mengisi kata yang hilang di dalam tanda [MASK]. Model BERT secara khusus dirancang untuk menyelesaikan tugas seperti ini dengan memperhitungkan konteks penuh dari kalimat di kedua arah. Prediksi yang dihasilkan seperti "transforming" atau "revolutionizing" (misalnya) menunjukkan bagaimana model menangkap arti dari "Artificial intelligence can help in ..." dan konteks "various industries," yang sangat berkaitan dengan transformasi atau inovasi di bidang tersebut.

# 4. Ner
Pengenalan Entitas Bernama (NER) merupakan metode dalam Pengolahan Bahasa Alam (NLP) yang bertujuan untuk mengenali dan mengelompokkan entitas spesifik dalam teks, seperti nama orang, organisasi, lokasi, dan lainnya. Model NER sangat bermanfaat untuk menarik informasi kunci dan membuat visualisasi yang jelas dari teks yang berisi beragam jenis entitas.
* **Contoh Ner dengan Group Entitas True**
* Pada contoh ini, pipeline NER diinisialisasi dengan opsi grouped_entities=True, yang akan mengelompokkan entitas yang berhubungan, seperti nama lengkap atau multi-kata entitas. Teks input "Rafi is a scientist at OpenAI working in Russia." mengandung beberapa entitas yang dapat dikenali, seperti nama "Rafi," organisasi "OpenAI," dan lokasi "Russia." Model NER akan mengidentifikasi masing-masing entitas tersebut dan memberikan label yang relevan, seperti PER (Person), ORG (Organization), dan LOC (Location).
* Penggunaan grouped_entities=True membantu mengurangi redundansi, terutama jika ada entitas yang terdiri dari beberapa kata. Model ini sangat berguna dalam aplikasi yang memerlukan ekstraksi entitas terstruktur dari teks, seperti analisis data perusahaan, pemetaan lokasi, atau pelacakan nama dalam dokumen.

# 5. Question-Answering
Question-answering (QA) adalah teknik NLP yang memungkinkan model untuk memberikan jawaban berbasis konteks dari teks yang diberikan. Model QA mengolah informasi yang ada dan menemukan jawaban terbaik sesuai dengan pertanyaan yang diajukan. Metode ini sangat efektif dalam mengotomatisasi respon pertanyaan dan mengekstrak informasi tertentu dari teks yang panjang.
* **Contoh 1: Menggunakan Model RoBERTa Large**
* Di contoh pertama, model RoBERTa Large menjawab pertanyaan “Apa nama bulan-bulan Mars?” dengan konteks yang menggambarkan Mars sebagai planet keempat dengan dua bulan bernama Phobos dan Deimos. RoBERTa Large adalah model general-purpose yang memiliki pemahaman luas terhadap bahasa umum, sehingga cocok untuk pertanyaan berbasis pengetahuan umum seperti ini.

* **Contoh 2: Menggunakan Model PubMedBERT**
* Pada contoh kedua, model PubMedBERT digunakan untuk menjawab pertanyaan medis, yaitu “Apa fungsi insulin?” dengan konteks yang menjelaskan bahwa insulin adalah hormon yang mengatur glukosa darah. PubMedBERT merupakan model khusus dalam domain biomedis, dilatih pada teks medis dan ilmiah, sehingga lebih unggul dalam memahami konteks medis atau istilah teknis dibandingkan dengan model umum.

# 6. Sentiment-Analysis
Sentiment-analysis adalah teknik NLP yang digunakan untuk mengidentifikasi dan mengklasifikasikan emosi atau sikap dalam sebuah teks, seperti positif, negatif, atau netral. Model ini sangat penting dalam mengevaluasi respon atau tanggapan emosional terhadap topik, produk, atau layanan tertentu, membantu dalam pengambilan keputusan bisnis atau pengembangan produk.
* **Contoh Sentiment-Analysis**
* Pada contoh ini, pipeline sentiment-analysis diinisialisasi untuk mengevaluasi kalimat: "The service at the restaurant was terrible and I was very disappointed." Teks ini mengandung ungkapan negatif yang mencerminkan ketidakpuasan terhadap layanan restoran. Model sentiment-analysis akan menganalisis kata-kata dalam kalimat ini, mengidentifikasi sentimen yang mendominasi, dan mengklasifikasikannya sebagai "negative."
* Sentiment-analysis bekerja dengan baik dalam mengenali pola bahasa yang terkait dengan emosi. Misalnya, kata-kata seperti "terrible" dan "disappointed" menjadi indikator kuat bagi model untuk mendeteksi sentimen negatif. Hasil klasifikasi menunjukkan bagaimana teknologi NLP dapat digunakan untuk memahami perasaan pengguna atau pelanggan secara otomatis.

# 7. Summarization
Summarization ialah metode NLP yang didesain untuk menciptakan versi singkat dari teks yang panjang, sambil mempertahankan informasi krusial dan inti dari konten awal. Teknologi ini sangat bermanfaat dalam membantu pengguna memahami isi dokumen yang panjang dengan cepat dan tanpa kehilangan poin utama.
* **Contoh Summarization**
* Pada contoh ini, pipeline summarization digunakan untuk merangkum teks panjang yang membahas berbagai dampak AI pada sektor kesehatan, keuangan, dan pendidikan, serta tantangan etis yang terkait dengan privasi data dan dampak terhadap pekerjaan. Dengan menggunakan summarization, teks yang cukup panjang ini diringkas menjadi poin-poin utama, memberikan gambaran yang singkat namun padat tentang bagaimana AI memengaruhi beberapa industri dan pentingnya peran pembuat kebijakan dalam mengatasi tantangan yang muncul.
* Proses summarization menangkap inti dari setiap bagian teks, seperti manfaat AI di sektor-sektor tersebut dan isu-isu etika yang perlu diperhatikan. Ini memungkinkan pembaca untuk memahami fokus utama tanpa harus membaca keseluruhan teks secara detail.

# 8. Translation
Translation adalah teknik NLP yang bertujuan untuk menerjemahkan teks dari satu bahasa ke bahasa lain secara otomatis, memungkinkan komunikasi lintas bahasa dengan akurasi tinggi. Model terjemahan dilatih menggunakan informasi dari berbagai data bahasa, sehingga mampu memahami susunan dan situasi kalimat dalam bahasa asal dan menyalinnya ke dalam bahasa target dengan benar.
* **Contoh Translation dari Bahasa Prancis ke Bahasa Inggris**
* Pada contoh ini, pipeline translation menggunakan model Helsinki-NLP untuk menerjemahkan teks bahasa Prancis, "J'aime jouer à des jeux," ke dalam bahasa Inggris. Hasil terjemahan ini mengubah teks asli menjadi "I like playing games." Model ini berhasil mengidentifikasi makna dasar kalimat dalam bahasa Prancis dan menyusunnya kembali dalam bahasa Inggris dengan tata bahasa dan konteks yang tepat.
* Translation sangat berguna untuk berbagai aplikasi, seperti mendukung pengguna multibahasa, membantu pemahaman konten global, serta meningkatkan efisiensi terjemahan dokumen. Dengan kemampuan mengenali frasa, idiom, dan konteks yang lebih kompleks, model terjemahan NLP dapat menyediakan hasil yang alami dan mudah dipahami bagi pengguna.







