Nama : Indri Windriasari <br>
Email : indriwindriasari2511@gmail.com

# Scraping Data : PLN Mobile Review from Google Play Store

Scraping data dilakukan terhadap ulasan dan pendapat pengguna terkait aplikasi "PLN Mobile" dari Google Play Store.

## Langkah 1: Install library `google-play-scraper`
`google-play-scraper` merupakan library yang dibutuhkan untuk mengambil ulasan dari Google Play Store.

In [1]:
!pip install google-play-scraper

Collecting google-play-scraper
  Downloading google_play_scraper-1.2.7-py3-none-any.whl.metadata (50 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/50.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.2/50.2 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading google_play_scraper-1.2.7-py3-none-any.whl (28 kB)
Installing collected packages: google-play-scraper
Successfully installed google-play-scraper-1.2.7


## Langkah 2: Import libraries
Import semua library yang diperlukan untuk scraping dan manajemen file.

In [2]:
from google_play_scraper import app, reviews, Sort, reviews_all
import pandas as pd
import os

## Langkah 3: Mount Google Drive
Menghubungkan Google Colab dengan Google Drive agar file bisa disimpan.

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## Langkah 4: Menentukan path penyimpanan file

In [4]:
Base = '/content/drive/MyDrive/Colab Notebooks/Dicoding/Sentiment'

## Langkah 5: Scraping Ulasan Aplikasi

In [5]:
scrapreview = reviews_all(
    app_id='com.icon.pln123', # ID aplikasi
    lang='id',                  # Bahasa ulasan
    country='id',               # Negara
    sort=Sort.MOST_RELEVANT,    # Sortir berdasarkan ulasan paling relevan
    filter_score_with=None      # Mengambil semua skor ulasan
)

## Langkah 6: Mengubah hasil ulasan menjadi DataFrame
Konversi hasil scraping menjadi DataFrame memudahkan pengelolaan data.

In [7]:
pln_reviews_df = pd.DataFrame(scrapreview)
pln_reviews_df.head(3)

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt,appVersion
0,1c880134-d6f2-43f1-8b5d-c81ecb342fd6,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"Update datanya sedikit lambat, tagihan listrik...",5,87,5.2.9,2021-12-21 09:57:14,Hi Kak. Makasih buat penilaiannya. Semoga PLN ...,2021-12-22 07:13:23,5.2.9
1,d65d043f-4903-4fe0-913b-a31da9391360,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,Aplikasi yang sangat luar biasa. User - friend...,5,38,5.2.61,2024-08-29 05:32:51,Waw Kak Mista . Waaah banget nih penilaian ama...,2024-08-30 05:35:06,5.2.61
2,9acba62a-7662-43b1-9cdc-1b69e52b3b06,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"Aplikasi yang sangat user-friendly, Informatif...",5,39,5.2.61,2024-08-28 04:10:24,Seneng banget deh baca ulasan positif Kakak. T...,2024-08-29 14:24:53,5.2.61


In [8]:
pln_reviews_df.shape

(184500, 11)

## Langkah 7: Membuat direktori dataset (jika belum ada)

In [9]:
dataset_dir = os.path.join(Base, 'dataset')
os.makedirs(dataset_dir, exist_ok=True)

## Langkah 8: Menyimpan data ke file CSV

In [10]:
csv_file_path = os.path.join(dataset_dir, 'pln-mobile.csv')
pln_reviews_df.to_csv(csv_file_path, index=None, header=True)