# Proyek Analisis Sentimen
- **Nama:** Audy Nadira Ramadanti
- **Email:** audynadiraramdanti@gmail.com
- **ID Dicoding:** audy_nadira_ramadanti_zWZ9

In [1]:
!pip install google-play-scraper



Perintah !pip install google-play-scraper saya gunakan untuk mengunduh library yang terkait dengan scraping data dari Play Store. Begitu perintah tersebut dijalankan di Jupyter Notebook, pip—manajer paket Python—akan mencari library tersebut di repositori resmi PyPI dan memeriksa versi terbaru beserta dependensi yang dibutuhkan. Setelah itu, library diunduh dalam bentuk file arsip (.tar.gz atau .whl), kemudian diekstrak dan diinstal secara otomatis ke lingkungan Python saya. Proses ini memastikan bahwa semua komponen yang diperlukan telah siap digunakan untuk mengambil data seperti ulasan, rating, dan informasi lain dari Play Store secara efisien.

In [2]:
from google_play_scraper import Sort, reviews_all
import pandas as pd

Baris kode *from google_play_scraper import Sort, reviews_all* saya gunakan untuk mengambil komponen-komponen penting dari library yang berperan dalam proses pengambilan data ulasan aplikasi dari Play Store. Komponen **Sort** membantu menentukan urutan tampilan data ulasan, misalnya apakah diurutkan berdasarkan tanggal terbaru atau lama, sehingga memudahkan saya dalam mengatur serta menampilkan informasi sesuai kebutuhan. Sementara itu, fungsi **reviews_all** memungkinkan saya untuk mengumpulkan seluruh data ulasan aplikasi secara otomatis tanpa harus mengambil satu per satu, menjadikan proses scraping lebih efisien dan menyeluruh. Selain itu, perintah *import pandas as pd* saya gunakan untuk mengimpor library *pandas* dengan alias *pd*, yang sangat berguna dalam memanipulasi data yang telah diambil, mengubahnya ke dalam format tabel atau dataframe, serta melakukan analisis data secara lebih lanjut. Gabungan perintah-perintah ini memastikan bahwa seluruh komponen penting untuk melakukan scraping data dan pengolahan informasi siap digunakan dalam lingkungan Python saya.

In [None]:
from google_play_scraper import reviews, Sort

all_reviews = []
total_reviews = 15000
scores = range(1, 6)
per_score_limit = total_reviews // len(scores)  # 3000 per skor

for score in scores:
    review_batch, _ = reviews(
        "com.garena.game.codm",
        lang="id",
        country="id",
        sort=Sort.MOST_RELEVANT,
        count=per_score_limit,
        filter_score_with=score
    )
    all_reviews.extend(review_batch)

Total review diambil: 15000


Pada proses ini, saya mengumpulkan data ulasan dari aplikasi **Call of Duty: Mobile** (dengan ID aplikasi *"com.garena.game.codm"*) yang tersedia di Google Play Store, berdasarkan skor ulasan dari 1 hingga 5. Pertama, saya mendeklarasikan sebuah list kosong bernama **all_reviews** yang berfungsi sebagai wadah untuk menyimpan seluruh data ulasan yang dikumpulkan. Target total ulasan yang ingin saya ambil adalah sebanyak **15.000 ulasan**, yang kemudian dibagi rata ke dalam lima kelompok berdasarkan skor (1 sampai 5), sehingga masing-masing skor dikumpulkan sebanyak **3.000 ulasan**.

Dalam proses pengambilan data, dilakukan perulangan menggunakan skor dari 1 hingga 5. Di setiap iterasi, saya menggunakan fungsi **reviews** dari library `google_play_scraper` untuk mengambil ulasan dengan parameter yang telah ditentukan, yaitu:
- ID aplikasi: *"com.garena.game.codm"*
- Bahasa: *"id"* (Bahasa Indonesia)
- Negara: *"id"* (Indonesia)
- Urutan: *Sort.MOST_RELEVANT* (mengambil ulasan yang paling relevan)
- Jumlah ulasan: *3.000* (per skor)
- Filter skor: sesuai dengan nilai skor pada iterasi saat itu (1 sampai 5)

Setiap kumpulan ulasan yang berhasil diambil akan langsung ditambahkan ke dalam list **all_reviews** menggunakan metode `extend()`. Dengan pendekatan ini, saya dapat memastikan bahwa data ulasan yang diperoleh mencakup berbagai variasi skor secara merata, dan total keseluruhan ulasan yang dikumpulkan mencapai **15.000 ulasan**, sehingga data siap untuk dianalisis atau diproses lebih lanjut.

In [4]:
df = pd.DataFrame(all_reviews)
df.to_csv("data/codm_reviews.csv", index=False, encoding="utf-8")

Pada proses ini, data ulasan yang telah dikumpulkan dalam list secara otomatis dikonversi menjadi format tabel menggunakan struktur DataFrame. Proses ini memungkinkan data tersebut menjadi lebih mudah untuk dianalisis dan dimanipulasi, karena DataFrame menyajikan data dalam bentuk baris dan kolom yang terstruktur. Setelah data berada dalam format DataFrame, langkah selanjutnya adalah menyimpannya ke dalam sebuah file CSV, yang merupakan format file yang umum digunakan untuk penyimpanan dan pertukaran data. File CSV ini disimpan dalam direktori yang ditentukan, dengan pengaturan yang memastikan indeks DataFrame tidak ikut tersimpan agar file bersih dari informasi tambahan yang tidak diperlukan. Selain itu, dengan menggunakan encoding UTF-8, proses penyimpanan menjamin bahwa semua karakter, termasuk karakter khusus atau non-ASCII, ditulis dengan benar sehingga data tetap akurat dan mudah dibaca saat digunakan kembali.