# Sentimen Analisis Review APK Play Store
Selamat datang dalam proyek Sentimen Analisis Review APK Play Store!  
Dalam proyek ini, kita akan mengeksplorasi ulasan pengguna di Google Play Store untuk memahami sentimen mereka.

## Studi Kasus
**Kasus:**  
Seorang pengembang aplikasi ingin mengetahui bagaimana pengguna menilai aplikasi mobile-nya di Google Play Store.  
Data ulasan dikumpulkan dan didokumentasikan menggunakan **aplikasi Lemon8**.

**Tujuan Analisis:**  
- Mengelompokkan ulasan menjadi positif, negatif, dan netral  
- Memahami masalah dan kelebihan aplikasi berdasarkan feedback pengguna  
- Memberikan rekomendasi perbaikan atau fitur baru  

## Langkah Proyek
1. Kumpulkan data ulasan dari Google Play Store (Lemon8 digunakan sebagai referensi visual)  
2. Bersihkan teks: hapus simbol, angka, stopwords, gabungkan token jadi kalimat  
3. Stemming: ubah kata berimbuhan menjadi kata dasar  
4. Analisis Sentimen: gunakan model machine learning dan deep learning (SVM/LSTM)  
5. Evaluasi & Visualisasi: distribusi ulasan, kata yang sering muncul, insight penting  

## Manfaat
- Mengetahui persepsi pengguna secara cepat  
- Membantu prioritas perbaikan fitur atau bug  
- Memperkuat strategi marketing dan engagement  
- Lemon8 memudahkan dokumentasi data dengan tampilan visual menarik


# **Import Library**

In [8]:
!pip install google-play-scraper



In [9]:
# Mengimpor pustaka google_play_scraper untuk mengakses ulasan dan informasi aplikasi dari Google Play Store.
from google_play_scraper import app, reviews, Sort, reviews_all

Perintah di atas akan mengunduh dan menginstal pustaka google_play_scraper serta dependensinya jika diperlukan. Setelah instalasi selesai, Anda dapat mengimpor dan menggunakannya dalam notebook Anda untuk mengambil data dari Play Store dan melanjutkan dengan analisis sentimen.

In [10]:
import pandas as pd  # Pandas untuk manipulasi dan analisis data
pd.options.mode.chained_assignment = None  # Menonaktifkan peringatan chaining
import numpy as np  # NumPy untuk komputasi numerik
seed = 0
np.random.seed(seed)  # Mengatur seed untuk reproduktibilitas
import matplotlib.pyplot as plt  # Matplotlib untuk visualisasi data
import seaborn as sns  # Seaborn untuk visualisasi data statistik, mengatur gaya visualisasi

import datetime as dt  # Manipulasi data waktu dan tanggal
import re  # Modul untuk bekerja dengan ekspresi reguler
import string  # Berisi konstanta string, seperti tanda baca
from nltk.tokenize import word_tokenize  # Tokenisasi teks
from nltk.corpus import stopwords  # Daftar kata-kata berhenti dalam teks

!pip install sastrawi
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory  # Stemming (penghilangan imbuhan kata) dalam bahasa Indonesia
from Sastrawi.StopWordRemover.StopWordRemoverFactory import StopWordRemoverFactory  # Menghapus kata-kata berhenti dalam bahasa Indonesia

from wordcloud import WordCloud  # Membuat visualisasi berbentuk awan kata (word cloud) dari teks




In [11]:
import nltk  # Import pustaka NLTK (Natural Language Toolkit).
nltk.download('punkt')  # Mengunduh dataset yang diperlukan untuk tokenisasi teks.
nltk.download('stopwords')  # Mengunduh dataset yang berisi daftar kata-kata berhenti (stop words) dalam berbagai bahasa.
nltk.download('punkt_tab') # Mengunduh dataset yang diperlukan untuk sentence tokenization.

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!


True

In [12]:
import re
import string
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory

# Scraping Dataset

Pada proyek ini, saya melakukan analisis sentimen terhadap ulasan dan pendapat pengguna terkait aplikasi **“Lemon8”** di Google Play Store. Tujuan dari analisis ini adalah untuk memahami bagaimana pengguna merasakan dan mengekspresikan pandangan mereka terhadap aplikasi tersebut, apakah cenderung **positif, negatif, atau netral**.

Aplikasi **Lemon8** merupakan platform berbagi konten gaya hidup yang dikembangkan oleh **ByteDance**, perusahaan yang juga berada di balik aplikasi TikTok. Aplikasi ini banyak digunakan oleh pengguna muda untuk membagikan ide seputar **fashion, kecantikan, kuliner, dan gaya hidup**. Karena popularitas serta jumlah penggunanya yang besar, Lemon8 menjadi pilihan studi kasus yang menarik untuk dianalisis dari sisi persepsi dan kepuasan penggunanya.


In [13]:
# Scraping 15.000 ulasan dari aplikasi Lemon8
hasil, _ = reviews(
    'com.bd.nproject',
    lang='id',               # Bahasa Indonesia
    country='id',            # Negara Indonesia
    sort=Sort.MOST_RELEVANT, # Urutkan ulasan berdasarkan relevansi
    count=15000              # Jumlah ulasan yang ingin diambil
)

In [14]:
# Menyimpan ulasan dalam file CSV
import csv

# Ubah ke DataFrame
df = pd.DataFrame(hasil)

# Simpan ke file CSV
df.to_csv('lemon8_reviews_raw.csv', index=False, encoding='utf-8-sig')