In [1]:
import pandas as pd
from google_play_scraper import reviews, Sort
import time

# --- Konfigurasi ---
app_id = 'com.roblox.client' # ID aplikasi Roblox di Play Store
jumlah_target = 15000        # Jumlah ulasan yang ingin diambil
nama_file = 'roblox_reviews_10k.csv' # Nama file output

print(f"Memulai proses scraping untuk aplikasi: {app_id}")
print(f"Target jumlah ulasan: {jumlah_target}")

# --- Proses Scraping ---
# Kita akan mengambil ulasan dalam bahasa Indonesia ('id')
# dan mengurutkannya berdasarkan yang TERBARU (Sort.NEWEST)
# Ini penting agar data Anda relevan dengan sentimen saat ini.
try:
    hasil_scrape, continuation_token = reviews(
        app_id,
        lang='id',           # Bahasa Indonesia
        country='id',        # Negara Indonesia
        sort=Sort.NEWEST,    # Urutkan dari yang terbaru
        count=jumlah_target, # Jumlah ulasan yang diinginkan
        filter_score_with=None # Ambil semua skor (bintang 1 s/d 5)
    )
    
    # Jika hasil scrape kosong atau kurang dari yang diharapkan
    if not hasil_scrape:
        print("Scraping tidak mengembalikan data. Periksa app_id atau koneksi.")
    else:
        # --- Konversi ke DataFrame ---
        df = pd.DataFrame(hasil_scrape)
        
        # --- Simpan ke CSV ---
        # Gunakan encoding 'utf-8-sig' agar file CSV bisa dibaca 
        # dengan benar di Excel (terutama untuk karakter non-latin)
        df.to_csv(nama_file, index=False, encoding='utf-8-sig')
        
        print("\n--- PROSES SELESAI ---")
        print(f"Berhasil mengunduh {len(df)} ulasan.")
        print(f"Data telah disimpan ke file: {nama_file}")
        
        # Tampilkan 5 baris pertama dari data
        print("\nContoh 5 data pertama:")
        print(df.head())

except Exception as e:
    print(f"Terjadi kesalahan saat scraping: {e}")

Memulai proses scraping untuk aplikasi: com.roblox.client
Target jumlah ulasan: 15000

--- PROSES SELESAI ---
Berhasil mengunduh 15000 ulasan.
Data telah disimpan ke file: roblox_reviews_10k.csv

Contoh 5 data pertama:
                               reviewId         userName  \
0  a9e6894b-9291-44da-9236-d78210a1f861  Pengguna Google   
1  c0c56b79-61db-46bb-be06-224f0fc8f0c1  Pengguna Google   
2  70b3d32d-4687-438a-8a98-108ba53a0fa7  Pengguna Google   
3  9194e7df-9521-4ebf-9fd0-3cc0f486e1f9  Pengguna Google   
4  e94f3667-5110-4a52-9cb7-7b8db6492914  Pengguna Google   

                                           userImage  \
0  https://play-lh.googleusercontent.com/EGemoI2N...   
1  https://play-lh.googleusercontent.com/EGemoI2N...   
2  https://play-lh.googleusercontent.com/EGemoI2N...   
3  https://play-lh.googleusercontent.com/EGemoI2N...   
4  https://play-lh.googleusercontent.com/EGemoI2N...   

                                             content  score  thumbsUpCount  \
0  se