#Natural Language Processing with Hugging Face Transformers

**NLP (Natural Language Processing)** adalah cabang dari kecerdasan buatan (AI) yang berfokus pada interaksi antara komputer dan bahasa manusia. Tujuan utama NLP adalah untuk memungkinkan mesin memahami, menafsirkan, dan menghasilkan bahasa manusia dengan cara yang bermakna.

**Contoh Aplikasi NLP:**

Text Classification: Mengategorikan teks ke dalam kategori tertentu (misalnya, spam vs. non-spam).

Sentiment Analysis: Menganalisis emosi atau opini dari teks (positif, netral, negatif).

Text Generation: Menghasilkan teks berdasarkan input tertentu.

Named Entity Recognition (NER): Mengidentifikasi entitas dalam teks, seperti nama orang, tempat, atau organisasi.

Machine Translation: Menerjemahkan teks dari satu bahasa ke bahasa lain.

Question Answering: Menjawab pertanyaan berdasarkan teks yang diberikan.

Text Summarization: Merangkum teks panjang menjadi versi yang lebih ringkas.


##Instal Library


In [1]:
!pip install transformers torch pandas



fungsi tiap library :
1.   Transformers: Menyediakan model NLP canggih dan pipeline abstraksi.
2.   Torch: Menyediakan backend untuk komputasi tensor dan akselerasi GPU.
3.    Pandas: Mengelola, memanipulasi, dan menyimpan data hasil analisis.

##Import library

In [43]:
from transformers import pipeline

##Contoh 1 - Sentiment analysis

Analisis sentimen adalah teknik pemrosesan bahasa alami yang mengidentifikasi polaritas teks tertentu. Beberapa penggunaan praktis analisis sentimen yang paling umum adalah analisis tweet, ulasan produk, klasifikasi tiket dukungan, dan lainnya. Analisis sentimen memungkinkan pemrosesan cepat sejumlah besar data waktu nyata.

In [42]:
# Load Sentiment Analysis pipeline
sentiment_analysis = pipeline("sentiment-analysis", model="distilbert/distilbert-base-uncased-finetuned-sst-2-english")

# Example text
result = sentiment_analysis("I love using Hugging Face Transformers!")
print(result)

[{'label': 'POSITIVE', 'score': 0.9971315860748291}]


##Contoh 2 - Topic Classification

In [46]:
from transformers import pipeline

# Zero-shot Classification pipeline
topic_classifier = pipeline("zero-shot-classification",  model="facebook/bart-large-mnli")

# Example text and candidate labels
text = "Hugging Face Transformers are great for NLP tasks."
candidate_labels = ["technology", "health", "sports"]

# Classify text
result = topic_classifier(text, candidate_labels)
print(result)


{'sequence': 'Hugging Face Transformers are great for NLP tasks.', 'labels': ['technology', 'health', 'sports'], 'scores': [0.9802375435829163, 0.011585185304284096, 0.008177289739251137]}


##Contoh 3 - Text Generation

In [52]:
import logging
# Load Text Generation pipeline
text_generator = pipeline("text-generation", model="gpt2")

# Set logging level to ERROR to suppress warnings
logging.getLogger("transformers").setLevel(logging.ERROR)

# Example with truncation
result = text_generator("One day, have a girl sit in garden,", max_length=50, truncation=True)
print(result[0]["generated_text"])

One day, have a girl sit in garden, read her book, read some funny books, walk by the lake in forest to eat food, and when the sun reaches the horizon. Then stand next to a beautiful young man, a boy, and


##Contoh 4 - Named Entity Recognition (NER)

In [61]:
# Load NER pipeline
ner = pipeline("ner", grouped_entities=True)

# Set logging level to ERROR to suppress warnings
logging.getLogger("transformers").setLevel(logging.ERROR)

# Example text
result = ner("I Live in Indonesian")
print(result)

[{'entity_group': 'MISC', 'score': 0.99019414, 'word': 'Indonesian', 'start': 10, 'end': 20}]


##Contoh 5 - Question Answering

In [71]:
# Set logging level to ERROR to suppress warnings
logging.getLogger("transformers").setLevel(logging.ERROR)

# Load Question Answering pipeline
qa = pipeline("question-answering")

# Example question and context
question = "Dimana dia tinggal?"
context = "dia tinggal di Indonesia"
result = qa(question=question, context=context)
print(result)

{'score': 0.3130703866481781, 'start': 0, 'end': 24, 'answer': 'dia tinggal di Indonesia'}


##Contoh 6 - Text Summarization

In [77]:
# Load Summarization pipeline
summarizer = pipeline("summarization")

# Example text
long_text = """
Konsep kehidupan setelah kematian dapat berbeda-beda dalam berbagai budaya, agama, dan filosofi. Dalam Islam, kehidupan setelah kematian diyakini sebagai bentuk eksistensi yang berlanjut setelah kematian fisik. Berikut beberapa tahapan kehidupan setelah kematian dalam Islam:
Alam Barzakh: Alam kubur yang merupakan batas antara dunia dan akhirat. Di alam ini, ruh manusia menunggu penghakiman dan dihitung amal perbuatannya.
Yaumul Ba'ats: Hari kebangkitan, ketika Allah membangkitkan semua orang mati dari kubur.
Yaumul Mahsyar: Hari berkumpulnya semua makhluk, termasuk manusia, jin, dan hewan, untuk diadili.
Yaumul Mizan: Hari penimbangan.
Yaumul Hisab: Hari perhitungan, ketika setiap orang dimintai pertanggungjawaban atas perbuatannya.
Yaumul Sirat: Hari melewati jembatan untuk mencapai surga.
Surga atau Neraka: Nasib akhir setiap orang ditentukan, apakah akan masuk surga atau neraka.
Dalam Islam, kehidupan setelah kematian berfungsi sebagai pengingat untuk menjalani kehidupan yang benar dan mempersiapkan kehidupan akhirat.
"""
result = summarizer(long_text, max_length=100, min_length=50, do_sample=False)
print(result[0]["summary_text"])


 Konsep kehidupan setelah kematian dapat berbeda-beda dalam berbagai budaya, agama, dan filosofi . Di alam ini, ruh manusia menunggu penghakiman dan dihitung amal perbuatannya .


##Contoh 7 - Text Translation

In [86]:
# Load Translation pipeline
translator = pipeline("translation", model="Helsinki-NLP/opus-mt-en-id")

# Example text
result = translator("I miss you")
print(result[0]["translation_text"])

Aku merindukanmu


# Analisis

1. Sentiment analysis : Ini untuk mengetahui apakah sebuah teks berisi perasaan positif, negatif, atau netral.

2. Topic Classification : Ini untuk mengklasifikasikan teks ke dalam kategori tertentu, seperti teknologi atau olahraga. Model dapat menebak topik teks, bahkan tanpa pelatihan khusus.

3. Text Generation : Tugas ini membuat teks baru berdasarkan input yang diberikan. Misalnya, memberikan kalimat awal dan membiarkan model untuk melanjutkannya.

4. Named Entity Recognition (NER) : Ini untuk mengenali nama orang, tempat, atau hal penting lainnya dalam teks, seperti nama kota atau perusahaan.

5. Question Answering : Ini untuk menjawab pertanyaan berdasarkan informasi yang diberikan dalam teks.

6. Text Summarization : Tugas ini merangkum teks panjang menjadi lebih singkat tanpa kehilangan makna utamanya.

7. Text Translation : Ini untuk menerjemahkan teks dari satu bahasa ke bahasa lain.
