<a href="https://colab.research.google.com/github/Mardatillah/Hands-on-Machine-Learning-with-Scikit-Learn-Keras-and-TensorFlow/blob/main/Bab%209/Bab%209_Natural%20language%20processing%20with%20TensorFlow%3A%20Sentiment%20analysis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Chapter 9: Natural language processing with TensorFlow: Sentiment analysis
---
Bab 9 membahas **analisis sentimen** menggunakan **TensorFlow**, salah satu aplikasi dasar dalam **pemrosesan bahasa alami (Natural Language Processing, NLP)**. **Analisis sentimen** adalah tugas di mana model mencoba untuk mengklasifikasikan teks berdasarkan perasaan atau opini yang terkandung di dalamnya, misalnya apakah suatu ulasan produk bersifat **positif** atau **negatif**. Bab ini mengajarkan cara menggunakan **TensorFlow** dan **Keras** untuk membangun dan melatih model analisis sentimen, serta berbagai teknik untuk memproses dan memahami teks.

Berikut adalah penjelasan rinci mengenai isi dan pembahasan setiap bagian dalam bab ini:

### 1. Pengenalan Analisis Sentimen
Bagian ini memberikan gambaran umum tentang **analisis sentimen** sebagai tugas **NLP**. Analisis sentimen bertujuan untuk mengidentifikasi dan mengklasifikasikan **emosi** atau **perasaan** dalam teks, seperti positif, negatif, atau netral. Aplikasi analisis sentimen banyak digunakan dalam berbagai bidang, seperti:
*   **Ulasan produk:** Menilai apakah pelanggan merasa puas atau tidak dengan produk tertentu.
*   **Media sosial:** Mengidentifikasi sentimen publik terhadap isu atau peristiwa tertentu.
*   **Penerjemahan otomatis:** Menerjemahkan dan mempertahankan emosi dari teks asli.

### 2. Representasi Teks untuk Pemrosesan
Sebelum teks dapat digunakan dalam model deep learning, teks harus diubah menjadi **representasi numerik**. Bab ini membahas berbagai metode untuk mengubah teks menjadi format yang dapat diproses oleh model pembelajaran mesin:
*   **Tokenisasi:** Memecah teks menjadi bagian-bagian yang lebih kecil seperti **kata** atau **frase**.
*   **One-Hot Encoding:** Salah satu teknik sederhana untuk mengonversi teks ke format numerik di mana setiap kata diwakili sebagai vektor biner.
*   **Word Embeddings:** Menggunakan **Word2Vec**, **GloVe**, atau **FastText** untuk merepresentasikan kata dalam bentuk vektor berdimensi rendah yang menjaga makna semantik dari kata tersebut.
    *   **Contoh:** Kata "rajin" dan "kerja keras" akan memiliki representasi vektor yang saling berdekatan karena mereka memiliki makna yang mirip.

### 3. Mempersiapkan Data untuk Pelatihan
Sebelum membangun model, penting untuk mempersiapkan dataset teks yang akan digunakan untuk pelatihan. Bab ini menjelaskan cara mengambil data teks, memprosesnya, dan membaginya menjadi set pelatihan dan pengujian.
*   **Menggunakan Dataset:** Salah satu dataset yang umum digunakan untuk analisis sentimen adalah **IMDb movie reviews dataset**, yang berisi ulasan film yang telah diberi label positif atau negatif.
*   **Preprocessing Teks:** Langkah-langkah preprocessing yang dijelaskan mencakup menghapus kata-kata yang tidak berguna (seperti kata sambung), mengubah teks menjadi huruf kecil, dan menghapus tanda baca.

### 4. Membangun Model untuk Analisis Sentimen
Setelah data teks diproses, langkah berikutnya adalah membangun model deep learning untuk analisis sentimen. Bab ini membahas dua pendekatan utama untuk membangun model sentimen:
*   **Model menggunakan LSTM (Long Short-Term Memory):** LSTM adalah jenis **Recurrent Neural Network (RNN)** yang dirancang untuk menangani data sekuensial, seperti teks. Model LSTM sangat baik dalam menangani ketergantungan jangka panjang dalam teks, yang penting dalam memahami konteks kalimat.
    *   **Struktur Model LSTM:** Model ini biasanya terdiri dari embedding layer untuk representasi kata, diikuti oleh lapisan **LSTM** untuk menangkap urutan dan **dense layer** untuk klasifikasi.
*   **Model menggunakan CNN (Convolutional Neural Networks):** Meskipun CNN lebih sering digunakan untuk pengolahan gambar, CNN juga dapat digunakan untuk **analisis sentimen** dengan menganggap teks sebagai **sekuens data** dan mengonvolusinya untuk mengekstraksi fitur lokal yang relevan.
    *   **Struktur Model CNN:** CNN digunakan untuk menangkap pola lokal dalam teks, seperti kombinasi kata-kata yang sering muncul bersama-sama dalam ulasan positif atau negatif.

### 5. Melatih dan Mengevaluasi Model
Setelah model dibangun, langkah berikutnya adalah **melatih model** dan mengevaluasi performanya:
*   **Pelatihan Model:** Pembaca diajarkan bagaimana melatih model analisis sentimen menggunakan dataset yang sudah disiapkan. Proses pelatihan melibatkan memilih optimizer (misalnya, Adam) dan **loss function** yang sesuai (biasanya **binary crossentropy** untuk tugas klasifikasi biner).
*   **Evaluasi Model:** Model dievaluasi menggunakan metrik seperti **akurasi**, **precision**, **recall**, dan **F1-score** untuk menilai seberapa baik model memprediksi sentimen dari teks yang tidak terlihat.

### 6. Mengoptimalkan Model dan Meningkatkan Kinerja
Di bagian ini, bab ini membahas cara **mengoptimalkan model** untuk meningkatkan kinerja:
*   **Regularisasi:** Teknik seperti **dropout** dan **L2 regularization** digunakan untuk mencegah model overfitting pada data pelatihan.
*   **Hyperparameter Tuning:** Pembaca diajarkan bagaimana menyesuaikan hyperparameter model, seperti **jumlah lapisan LSTM**, **jumlah unit LSTM**, dan **learning rate**, untuk mencapai hasil terbaik.

### 7. Penerapan dan Penggunaan Model di Dunia Nyata
Setelah model dilatih dan dievaluasi, bab ini juga membahas bagaimana menerapkan model dalam **aplikasi dunia nyata**:
*   **Analisis Sentimen pada Media Sosial:** Menerapkan model untuk menganalisis **tweets** atau **komentar** di platform media sosial untuk mengidentifikasi sentimen pengguna terhadap produk, merek, atau isu tertentu.
*   **Analisis Sentimen pada Ulasan Produk:** Menggunakan model untuk menganalisis **ulasan produk** di situs belanja untuk menentukan apakah ulasan tersebut positif atau negatif.
*   **Chatbots dan Asisten Virtual:** Menggunakan model analisis sentimen dalam chatbot untuk memahami emosi pengguna dan memberikan respons yang lebih tepat.

## Kesimpulan Bab 9
Bab 9 memberikan pemahaman mendalam tentang cara menggunakan **TensorFlow** dan **Keras** untuk membangun dan melatih model analisis sentimen. Dengan memahami cara representasi teks, preprocessing data, serta membangun dan melatih model seperti **LSTM** dan **CNN**, pembaca dapat menerapkan teknik ini dalam berbagai aplikasi **pemrosesan bahasa alami**. Bab ini juga mengajarkan bagaimana mengoptimalkan model dan menerapkannya di dunia nyata untuk analisis sentimen dalam berbagai konteks, termasuk ulasan produk dan media sosial.