# Scrapping Dataset

Pada proyek ini, kita akan melakukan analisis sentimen terhadap ulasan dan pendapat pengguna terkait aplikasi "BCA mobile" di Play Store. Analisis sentimen ini bertujuan untuk memahami bagaimana pengguna merasakan dan mengungkapkan pandangan mereka terhadap layanan yang disediakan oleh aplikasi perbankan digital ini.

Dengan memanfaatkan berbagai teknik pemrosesan teks (text preprocessing) dan algoritma machine learning, kita akan mengkategorikan ulasan pengguna ke dalam sentimen positif, negatif, atau netral. Hasil dari analisis ini dapat memberikan wawasan berharga bagi pengembang aplikasi "BCA mobile" untuk mengetahui kelebihan dan kekurangan yang dirasakan pengguna, serta menjadi dasar perbaikan dan pengembangan fitur ke depan.

# 0.&nbsp; Import

In [1]:
!pip install google-play-scraper

Collecting google-play-scraper
  Downloading google_play_scraper-1.2.7-py3-none-any.whl.metadata (50 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.2/50.2 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading google_play_scraper-1.2.7-py3-none-any.whl (28 kB)
Installing collected packages: google-play-scraper
Successfully installed google-play-scraper-1.2.7


In [2]:
# Mengimport pustaka
import pandas as pd
import time
import csv
from google_play_scraper import app, Sort, reviews_all

# 1.&nbsp; Data Scrap Pipeline

In [None]:
# Mengambil semua ulasan dari aplikasi dengan ID 'com.bca' di Google Play Store.
scrapreview = reviews_all(
    'com.bca',          # ID aplikasi
    lang='id',             # Bahasa ulasan (default: 'en')
    country='id',          # Negara (default: 'us')
    sort=Sort.MOST_RELEVANT, # Urutan ulasan (default: Sort.MOST_RELEVANT)
    count=1000             # Jumlah maksimum ulasan yang ingin diambil
)

# 2.&nbsp; Scrapping Dataset Preview

In [4]:
# Menampilkan hasil dalam bentuk DataFrame
df_reviews = pd.DataFrame(scrapreview)

In [5]:
df_reviews.head(10)

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt,appVersion
0,5adb3e71-2577-4f04-a220-3451de82d7d1,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"u/ versi 4.62 Di menu transfer sesama Bank, un...",4,8,4.6.2,2025-04-20 03:07:19,Mohon maaf atas ketidaknyamanan yang Bapak/Ibu...,2025-04-20 03:09:47,4.6.2
1,c14a1950-d6c7-4fbf-a652-5467d8b31a19,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,saya beralih dari myBCA ke aplikasi BCA mobile...,2,2,4.6.3,2025-04-21 09:08:18,Mohon maaf atas ketidaknyamanannya. Saran dan ...,2025-04-21 09:21:54,4.6.3
2,b5e7c8f8-ee5c-4716-994b-cd4665309edb,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"parah nih aplikasi, setelah update untuk menu ...",1,72,4.6.2,2025-04-18 12:00:59,Mohon maaf atas ketidaknyamanan yang Bapak/Ibu...,2025-04-18 12:13:27,4.6.2
3,9e4acabb-824d-4e77-a1cc-480882b994a8,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"Saat mau transfer, nama tujuan rekening tidak ...",5,81,4.6.3,2025-04-21 07:23:24,"Mohon maaf atas ketidaknyamanannya, saat ini s...",2025-04-21 07:32:36,4.6.3
4,bf905aaf-d767-4c59-a610-ebe2d445097e,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,Aplikasi bagus dan interfacenya sederhana sehi...,5,4,4.6.3,2025-04-22 03:12:57,Mohon maaf atas ketidaknyamanannya. Saran dan ...,2025-04-22 04:15:27,4.6.3
5,a3f3e225-e9f0-487b-9119-daa7c19a2b86,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"tolong segera diperbaiki ya, Bank BCA, agar ti...",2,3,4.6.2,2025-04-20 06:29:29,Mohon maaf atas ketidaknyamanan yang Bapak/Ibu...,2025-04-20 07:22:56,4.6.2
6,bf846fcc-e17f-4613-ac56-d225b772da95,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,kenapa rekening terdaftar dimenu transfer anta...,4,97,4.6.2,2025-04-17 04:44:45,Mohon maaf atas ketidaknyamanannya. Saat ini t...,2025-04-17 04:54:23,4.6.2
7,4382e9a4-b8d3-4c53-bd59-d029a97a18cf,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"setelah update bukannya tambah simpel, malah r...",1,2,4.6.2,2025-04-19 00:54:05,"Mohon maaf atas ketidaknyamanannya, saat ini s...",2025-04-19 02:07:15,4.6.2
8,4a2d5cb3-e64e-4f06-8d96-473bfcf6423e,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"ada bug di pencarian nama rekening, harus scro...",5,43,4.6.2,2025-04-19 14:06:26,Mohon maaf atas ketidaknyamanannya. Saran dan ...,2025-04-19 18:02:32,4.6.2
9,cd2fe4d4-357a-4575-9760-17164910d399,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,Aplikasi saya begitu mencari nomor rekening te...,1,46,4.6.2,2025-04-19 03:04:21,"Mohon maaf atas ketidaknyamanannya, saat ini s...",2025-04-19 03:32:05,4.6.2


In [6]:
print(f"Total data akan disimpan: {len(scrapreview)}")

Total data akan disimpan: 112500


In [7]:
df_reviews.shape

(112500, 11)

In [9]:
df_reviews.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 112500 entries, 0 to 112499
Data columns (total 11 columns):
 #   Column                Non-Null Count   Dtype         
---  ------                --------------   -----         
 0   reviewId              112500 non-null  object        
 1   userName              112500 non-null  object        
 2   userImage             112500 non-null  object        
 3   content               112500 non-null  object        
 4   score                 112500 non-null  int64         
 5   thumbsUpCount         112500 non-null  int64         
 6   reviewCreatedVersion  92389 non-null   object        
 7   at                    112500 non-null  datetime64[ns]
 8   replyContent          107699 non-null  object        
 9   repliedAt             107699 non-null  datetime64[ns]
 10  appVersion            92389 non-null   object        
dtypes: datetime64[ns](2), int64(2), object(7)
memory usage: 9.4+ MB


# 3.&nbsp; Save Result to CSV file

In [11]:
# Definisikan nama kolom
fieldnames = [
    'reviewId',
    'userName',
    'userImage',
    'content',
    'score',
    'thumbsUpCount',
    'reviewCreatedVersion',
    'at',
    'replyContent',
    'repliedAt',
    'appVersion'
]

# Simpan hasil scrape ke CSV
with open('ulasan_BCAmobile.csv', mode='w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    for review in scrapreview:
        writer.writerow(review)

print(f"Berhasil menyimpan {len(scrapreview)} ulasan ke dalam 'ulasan_BCAmobile.csv'")

Berhasil menyimpan 112500 ulasan ke dalam 'ulasan_BCAmobile.csv'
