Pada era digital saat ini, data teks atau bahasa natural menjadi salah satu aset yang sangat berharga bagi perusahaan. Analisis sentimen atau klasifikasi emosi pada data teks dapat membantu perusahaan dalam memahami perasaan atau sentimen pelanggan terhadap produk atau layanan yang mereka tawarkan. Dengan demikian, perusahaan dapat mengambil tindakan yang tepat untuk meningkatkan pengalaman pelanggan dan memperbaiki produk atau layanan yang mereka miliki.
Masalah yang ingin diselesaikan dalam proyek ini adalah bagaimana menganalisis sentimen atau klasifikasi emosi pada data teks menggunakan metode klasifikasi NLP. Dengan melakukan analisis ini, diharapkan perusahaan dapat memahami perasaan atau sentimen pelanggan dengan lebih baik dan dapat mengambil tindakan yang tepat untuk meningkatkan kepuasan pelanggan.
Referensi :
- Memahami sentimen atau emosi pelanggan terhadap produk atau layanan yang ditawarkan.
- Meningkatkan pengalaman pelanggan dengan memahami perasaan atau sentimen mereka.
- Menganalisis sentimen atau emosi pelanggan pada data teks menggunakan metode klasifikasi NLP.
- Menggunakan hasil analisis sentimen untuk mengambil tindakan yang tepat guna meningkatkan kepuasan pelanggan.
Solusi untuk meraih goals tersebut adalah dengan melakukan analisis sentimen atau klasifikasi emosi pada data teks menggunakan metode klasifikasi NLP. Dalam proyek ini, akan digunakan pendekatan NLP dengan memanfaatkan layer LSTM (Long Short-Term Memory) dan RNN (Recurrent Neural Network) untuk memahami konteks dan pola-pola dalam teks yang berkaitan dengan emosi.
Dataset yang dipakai dalam proyek machine learning in merupakan Emotion Dataset dengan xx records data. Dataset tersebut bersifat open-source yang dapat diakses oleh siapa saja di Kaggle. Topik dari dataset ini adalah analisis sentimen yang berformat .csv (comma separated values) dengan ukuran 614.06 kB.
Proses data preparation yang dilakukan dalam proyek ini meliputi:
- Membersihkan data teks dari karakter-karakter yang tidak diperlukan seperti tanda baca, angka, dan karakter khusus.
- Melakukan tokenisasi untuk memecah teks menjadi kata-kata.
- Menghapus kata-kata yang tidak relevan atau stop words.
- Melakukan normalisasi teks seperti mengubah huruf besar menjadi huruf kecil.
- Melakukan encoding label emosi menjadi angka agar dapat digunakan dalam proses pemodelan.
Pada proyek ini, penggunaan algoritma machine learning NLP dengan layer LSTM (Long Short-Term Memory) dan RNN (Recurrent Neural Network).
- LSTM
- RNN