# Scapping Dataset

Pada proyek ini, analisis sentimen akan dilakukan terhadap ulasan dan pendapat pengguna terkait aplikasi Gojek di Play Store. Analisis sentimen ini akan membantu dalam memahami bagaimana pengguna merasakan dan mengungkapkan pandangan mereka terhadap aplikasi tersebut.

Dengan menggunakan berbagai teknik pemrosesan teks dan algoritma machine learning, proses ini akan mencoba mengidentifikasi apakah ulasan pengguna terhadap aplikasi Gojek cenderung positif, negatif, atau netral. Hasil analisis sentimen ini dapat memberikan wawasan berharga kepada pengembang aplikasi untuk meningkatkan pengalaman pengguna dalam permainan.

Selanjutnya, eksplorasi ulasan pengguna dan analisis sentimen di sekitar aplikasi Gojek akan dilakukan secara lebih mendalam.

Dalam proses scraping dataset Gojek, menggunakan pustaka google-play-scraper untuk mengambil ulasan pengguna dari Google Play Store. Dengan menentukan ID aplikasi Gojek (com.gojek.app), tahapan penumpulan data hingga 10.000 ulasan berbahasa Indonesia dari pengguna di Indonesia. Data yang diperoleh mencakup berbagai aspek, seperti rating, komentar, tanggal ulasan, dan informasi lainnya. Ulasan yang dikumpulkan kemudian dikonversi ke dalam bentuk DataFrame Pandas untuk mempermudah analisis lebih lanjut, seperti eksplorasi data, preprocessing teks, dan analisis sentimen guna memahami persepsi pengguna terhadap layanan Gojek.

In [None]:
%pip install google-play-scraper

Collecting google-play-scraper
  Downloading google_play_scraper-1.2.7-py3-none-any.whl.metadata (50 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/50.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.2/50.2 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading google_play_scraper-1.2.7-py3-none-any.whl (28 kB)
Installing collected packages: google-play-scraper
Successfully installed google-play-scraper-1.2.7


In [None]:
from google_play_scraper import app, reviews
import pandas as pd
import os

In [None]:
# Menentukan ID aplikasi Gojek
app_id = 'com.gojek.app'

# Mengambil ulasan
reviews_data, _ = reviews(
    app_id,
    lang='id',
    country='id',
    count=10000
)

# Konversi ke DataFrame
reviews_df = pd.DataFrame(reviews_data)
reviews_df

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt,appVersion
0,9ab8279b-f217-4514-9ca6-0a8102ea6f45,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,baik sangat membantu sekali,5,0,5.13.1,2025-04-20 16:13:51,,NaT,5.13.1
1,e9e37f46-0444-4a72-b377-fec0a7f580c1,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,halo pihak gojek saya mau daftar jadi gojek gi...,5,0,5.17.1,2025-04-20 16:02:20,,NaT,5.17.1
2,f1232d63-700d-4b39-af95-a5ad0533b7a3,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,mantap,5,0,,2025-04-20 15:55:19,,NaT,
3,c5de759d-9397-4500-ac26-575f28cc4338,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,"akun tiba2 tersuspen, pasti gara2 kasih bad re...",1,0,,2025-04-20 15:55:15,"Hai, Kak Muhammad. Mohon maaf atas kendala yan...",2025-04-20 16:07:30,
4,9c8d6711-ddda-4eb4-8ccb-5fdea198e02b,Pengguna Google,https://play-lh.googleusercontent.com/EGemoI2N...,mantap,1,0,,2025-04-20 15:49:10,,NaT,
...,...,...,...,...,...,...,...,...,...,...,...
9995,4289f498-ba31-4e7b-a30b-6b573f901bf5,Ilalang Setiawan,https://play-lh.googleusercontent.com/a-/ALV-U...,Udah sejam nyari kurir ga nemu nemu,1,1,4.21.1,2025-02-28 16:27:30,"Mohon maaf atas ketidaknyamanannya, Kak Setiaw...",2025-03-01 07:40:51,4.21.1
9996,f70cf072-daac-4baf-9b24-1a90ef15711c,Aulia Indahwardhani,https://play-lh.googleusercontent.com/a-/ALV-U...,gojek sangat membantu apalagi gofood nya yang ...,4,11,5.12.1,2025-02-28 16:21:38,,NaT,5.12.1
9997,bfc9ed23-051f-4c8a-916e-9ad30f9b3609,Riski Savitri,https://play-lh.googleusercontent.com/a-/ALV-U...,Makin parah ini aplikasi gofood nya. Sy udah n...,1,2,5.11.1,2025-02-28 16:20:17,"Hai Kak Riski, mohon maaf atas ketidaknyamanan...",2025-03-01 07:38:04,5.11.1
9998,9f76e2f2-20d6-4a7c-a928-a727c002fcd3,Fahrizal Husain,https://play-lh.googleusercontent.com/a/ACg8oc...,"Mesen gocar, dapet driver susah bener. Ada yan...",1,12,5.10.1,2025-02-28 16:10:16,"Hai Kak Fahrizal, mohon maaf atas ketidaknyama...",2025-03-01 07:32:14,5.10.1


In [None]:
# menyimpan ke file CSV
reviews_df.to_csv('reviews_gojek.csv', index=False)