# Proyek Analisis Sentimen
- **Nama:** Audy Nadira Ramadanti
- **Email:** audynadiraramdanti@gmail.com
- **ID Dicoding:** audy_nadira_ramadanti_zWZ9

In [1]:
!pip install google-play-scraper



Perintah !pip install google-play-scraper saya gunakan untuk mengunduh library yang terkait dengan scraping data dari Play Store. Begitu perintah tersebut dijalankan di Jupyter Notebook, pip—manajer paket Python—akan mencari library tersebut di repositori resmi PyPI dan memeriksa versi terbaru beserta dependensi yang dibutuhkan. Setelah itu, library diunduh dalam bentuk file arsip (.tar.gz atau .whl), kemudian diekstrak dan diinstal secara otomatis ke lingkungan Python saya. Proses ini memastikan bahwa semua komponen yang diperlukan telah siap digunakan untuk mengambil data seperti ulasan, rating, dan informasi lain dari Play Store secara efisien.

In [2]:
from google_play_scraper import Sort, reviews_all
import pandas as pd

Baris kode *from google_play_scraper import Sort, reviews_all* saya gunakan untuk mengambil komponen-komponen penting dari library yang berperan dalam proses pengambilan data ulasan aplikasi dari Play Store. Komponen **Sort** membantu menentukan urutan tampilan data ulasan, misalnya apakah diurutkan berdasarkan tanggal terbaru atau lama, sehingga memudahkan saya dalam mengatur serta menampilkan informasi sesuai kebutuhan. Sementara itu, fungsi **reviews_all** memungkinkan saya untuk mengumpulkan seluruh data ulasan aplikasi secara otomatis tanpa harus mengambil satu per satu, menjadikan proses scraping lebih efisien dan menyeluruh. Selain itu, perintah *import pandas as pd* saya gunakan untuk mengimpor library *pandas* dengan alias *pd*, yang sangat berguna dalam memanipulasi data yang telah diambil, mengubahnya ke dalam format tabel atau dataframe, serta melakukan analisis data secara lebih lanjut. Gabungan perintah-perintah ini memastikan bahwa seluruh komponen penting untuk melakukan scraping data dan pengolahan informasi siap digunakan dalam lingkungan Python saya.

In [3]:
from google_play_scraper import reviews, Sort

all_reviews = []
total_reviews = 15000
scores = range(1, 6)
per_score_limit = total_reviews // len(scores)  # 3000 per skor

for score in scores:
    review_batch, _ = reviews(
        "com.garena.game.codm",
        lang="id",
        country="id",
        sort=Sort.MOST_RELEVANT,
        count=per_score_limit,
        filter_score_with=score
    )
    all_reviews.extend(review_batch)

print(f"Total review diambil: {len(all_reviews)}")

Total review diambil: 15000


Pada proses ini, saya mengumpulkan semua data ulasan dari aplikasi "Call of Duty: Mobile" (dengan ID aplikasi "com.garena.game.codm") yang tersedia di Play Store berdasarkan skor ulasan yang berbeda. Pertama-tama, saya menyiapkan sebuah list kosong bernama **all_reviews** sebagai tempat untuk menyimpan semua data ulasan yang akan dikumpulkan. Selanjutnya, saya menjalankan perulangan dengan menggunakan rentang skor dari 1 hingga 5, yang berarti data ulasan dikumpulkan untuk setiap skor dari satu hingga lima. Di dalam setiap iterasi, fungsi **reviews_all** dipanggil dengan parameter yang telah ditetapkan, seperti kode aplikasi, bahasa yang digunakan ("id"), negara ("id"), serta metode pengurutan ulasan berdasarkan relevansi melalui *Sort.MOST_RELEVANT*. Selain itu, fungsi ini juga diberi filter untuk menyaring ulasan berdasarkan skor yang sedang diproses pada iterasi tersebut. Hasil dari pemanggilan fungsi tersebut, yaitu data ulasan yang sesuai dengan filter skor, kemudian dikumpulkan dan ditambahkan ke dalam list **all_reviews** menggunakan metode *extend*. Dengan cara ini, secara bertahap, seluruh ulasan dari skor 1 hingga 5 berhasil dikumpulkan ke dalam satu list, sehingga siap untuk dianalisis atau diolah lebih lanjut.

In [4]:
df = pd.DataFrame(all_reviews)
df.to_csv("data/codm_reviews.csv", index=False, encoding="utf-8")

Pada proses ini, data ulasan yang telah dikumpulkan dalam list secara otomatis dikonversi menjadi format tabel menggunakan struktur DataFrame. Proses ini memungkinkan data tersebut menjadi lebih mudah untuk dianalisis dan dimanipulasi, karena DataFrame menyajikan data dalam bentuk baris dan kolom yang terstruktur. Setelah data berada dalam format DataFrame, langkah selanjutnya adalah menyimpannya ke dalam sebuah file CSV, yang merupakan format file yang umum digunakan untuk penyimpanan dan pertukaran data. File CSV ini disimpan dalam direktori yang ditentukan, dengan pengaturan yang memastikan indeks DataFrame tidak ikut tersimpan agar file bersih dari informasi tambahan yang tidak diperlukan. Selain itu, dengan menggunakan encoding UTF-8, proses penyimpanan menjamin bahwa semua karakter, termasuk karakter khusus atau non-ASCII, ditulis dengan benar sehingga data tetap akurat dan mudah dibaca saat digunakan kembali.