### Instalasi dan Import Library untuk Scraping

Pada tahap ini, dilakukan instalasi library `google-play-scraper` yang digunakan untuk mengambil data ulasan dari aplikasi Android yang tersedia di Google Play Store. Setelah itu, dilakukan import library yang dibutuhkan, yaitu:

- `pandas` untuk manipulasi dan penyimpanan data dalam bentuk DataFrame.
- `reviews_all` dan `reviews` dari `google_play_scraper`, yang berfungsi untuk mengambil seluruh ulasan atau sebagian ulasan aplikasi dari Play Store.
- `Sort` digunakan untuk mengatur urutan ulasan (misalnya berdasarkan ulasan terbaru atau ulasan dengan rating tertinggi).

In [3]:
# Instalasi library google-play-scraper
!pip install google-play-scraper

# Import library yang akan digunakan
import pandas as pd
from google_play_scraper import reviews_all, reviews, Sort



### Scraping Data Ulasan Aplikasi Grab

Tahapan ini digunakan untuk mengambil data ulasan dari aplikasi Grab yang tersedia di Google Play Store.  
Proses ini dilakukan menggunakan fungsi `reviews` dari `google_play_scraper` dengan konfigurasi berikut:

- `com.grabtaxi.passenger` adalah ID atau package name aplikasi Grab.
- `lang='id'` menandakan bahwa ulasan yang diambil harus berbahasa Indonesia.
- `country='id'` menunjukkan bahwa ulasan berasal dari pengguna di Indonesia.
- `count=20000` menargetkan pengambilan maksimal 20.000 ulasan.
- `sort=Sort.NEWEST` memastikan urutan ulasan diambil dari yang paling baru.

Data hasil scraping dikonversi ke dalam bentuk DataFrame menggunakan `pandas`.  
Kemudian hanya dua kolom yang diambil, yaitu:
- `content`: berisi teks atau isi ulasan dari pengguna.
- `score`: berisi nilai rating dari masing-masing ulasan.

Data akhirnya disimpan dalam file CSV bernama `grab_reviews.csv` di dalam folder `Datasets`, yang diasumsikan berada satu tingkat di atas folder `Notebooks` tempat notebook ini dijalankan (`../Datasets/`).

In [6]:
# Fungsi scraping ulasan aplikasi Grab dari Google Play Store
def scraping():
    # Mengambil data ulasan
    app_reviews, _ = reviews(
        'com.grabtaxi.passenger',  # ID aplikasi Grab
        lang='id',                 # Bahasa Indonesia
        country='id',              # Lokasi: Indonesia
        count=20000,               # Jumlah maksimal ulasan
        sort=Sort.NEWEST           # Urutan ulasan: terbaru
    )

    # Konversi hasil scraping ke DataFrame
    df = pd.DataFrame(app_reviews)

    # Ambil kolom isi ulasan dan rating
    df = df[['content', 'score']]

    # Simpan file CSV ke folder Datasets (path relatif dari folder Notebooks)
    df.to_csv('../Datasets/grab_reviews.csv', index=False)
    print("Data successfully saved to ../Datasets/grab_reviews.csv")

# Jalankan fungsi
scraping()

Data successfully saved to ../Datasets/grab_reviews.csv
