# **Import Library**

In [1]:
!pip install google-play-scraper

Collecting google-play-scraper
  Downloading google_play_scraper-1.2.7-py3-none-any.whl.metadata (50 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/50.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.2/50.2 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading google_play_scraper-1.2.7-py3-none-any.whl (28 kB)
Installing collected packages: google-play-scraper
Successfully installed google-play-scraper-1.2.7


In [2]:
from google_play_scraper import reviews, Sort
import pandas as pd
import numpy as np
import time

# **Scraping Dataset**

In [3]:
# Inisialisasi variabel
app_id = 'id.tix.android'  # ID aplikasi TIX ID
lang = 'id'                 # Bahasa ulasan
country = 'id'              # Negara
max_count = 100000          # Jumlah maksimum ulasan yang diinginkan
batch_size = 10000          # Jumlah ulasan per batch
all_reviews = []            # Menyimpan semua ulasan yang diambil

# Iterasi untuk mengambil ulasan secara bertahap
for i in range(0, max_count, batch_size):
    try:
        print(f"Sedang mengambil ulasan dari {i} hingga {i + batch_size}...")
        reviews_batch, _ = reviews(
            app_id,
            lang=lang,
            country=country,
            sort=Sort.MOST_RELEVANT,
            count=batch_size,
            filter_score_with=None,
            continuation_token=None
        )

        all_reviews.extend(reviews_batch)  # Menambahkan ulasan ke daftar utama
        time.sleep(1)  # Menghindari pembatasan Google Play Store

    except Exception as e:
        print(f"Terjadi kesalahan pada batch {i}: {e}")
        time.sleep(5)  # Penundaan lebih lama jika terjadi error

# Konversi ke DataFrame
df_TIX = pd.DataFrame(all_reviews)

# Menghapus duplikasi ulasan
df_TIX = df_TIX.drop_duplicates()

# Mengecek jumlah ulasan yang diperoleh
print(f"Jumlah ulasan yang diperoleh: {len(df_TIX.index)}")

Sedang mengambil ulasan dari 0 hingga 10000...
Sedang mengambil ulasan dari 10000 hingga 20000...
Sedang mengambil ulasan dari 20000 hingga 30000...
Sedang mengambil ulasan dari 30000 hingga 40000...
Sedang mengambil ulasan dari 40000 hingga 50000...
Sedang mengambil ulasan dari 50000 hingga 60000...
Sedang mengambil ulasan dari 60000 hingga 70000...
Sedang mengambil ulasan dari 70000 hingga 80000...
Sedang mengambil ulasan dari 80000 hingga 90000...
Sedang mengambil ulasan dari 90000 hingga 100000...
Jumlah ulasan yang diperoleh: 10000


In [4]:
# Melihat 5 data teratas
df_TIX.head()

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt,appVersion
0,bdb47f2c-3fef-46b1-b07c-7b2298f9bb0c,Himawan kresna premana,https://play-lh.googleusercontent.com/a-/ALV-U...,Ini knp y baru instal gk bisa dibuka. Udah leb...,1,1,3.14.0,2025-04-13 03:50:40,"Hi TIX Hunter, mohon maaf atas ketidaknyamanan...",2025-04-13 04:41:14,3.14.0
1,e0e7abae-25f1-470a-85dc-ffe85bb05fa0,berlian fauziyyah,https://play-lh.googleusercontent.com/a-/ALV-U...,"Sebenernya sih udah bagus, tapi sayang belum d...",3,10,3.14.0,2025-04-08 16:32:52,"Hi TIX Hunter, terima kasih atas review & sara...",2025-04-09 02:59:27,3.14.0
2,1e00cc55-92c2-452d-8877-99fcd38b5479,Khusnul Khotimah,https://play-lh.googleusercontent.com/a/ACg8oc...,Buat Emak2 Gaptek yg mager ngantri jam tayang ...,5,3,3.14.0,2025-04-13 08:23:19,"Hi TIX Hunter, terima kasih atas review yang d...",2025-04-13 09:05:53,3.14.0
3,32334a6c-415e-4274-860d-3dfad2f59b3d,Inda Permata Sari,https://play-lh.googleusercontent.com/a-/ALV-U...,Susah amat buat pesan tiketnya. Bukan susah gu...,3,1,3.14.0,2025-04-13 04:42:16,"Hi TIX Hunter, mohon maaf atas ketidaknyamanan...",2025-04-13 06:35:12,3.14.0
4,d6f86acf-0f7a-4c7b-b180-141d810f2b01,Husnul Khotimah,https://play-lh.googleusercontent.com/a-/ALV-U...,"Totally ok, tapi tolong akses untuk memesan ti...",5,52,3.14.0,2025-04-08 04:40:40,"Hi TIX Hunter, untuk jadwal film dan pre-sale ...",2025-04-08 04:56:56,3.14.0


In [5]:
# Membuat salinan dataFrame asli
df_TIX = df_TIX.copy()

# Memilih kolom yang relevan
df_TIX = df_TIX[['content', 'score', 'thumbsUpCount', 'at']]

# Mengubah nama kolom
df_TIX.rename(columns={'content': 'comment', 'score': 'rating'}, inplace=True)

# Mengurutkan dari terbaru ke terlama berdasarkan waktu ulasan
df_TIX = df_TIX.sort_values(by='at', ascending=False)

# Menampilkan hasil
df_TIX.head()

Unnamed: 0,comment,rating,thumbsUpCount,at
5478,ok semoga sukses selalu..,5,0,2025-04-13 14:19:27
9268,bagusss sekaliii,5,0,2025-04-13 13:29:29
554,Kenapa aku gak bisa beli tiket yg 1Get 1 ya,4,0,2025-04-13 11:28:39
543,"pas promo sering error, terkadang udah waktuny...",1,0,2025-04-13 11:22:14
56,saya mau daftar kok ga bisa weyy.... edit: sud...,5,0,2025-04-13 08:44:14


In [6]:
# Simpan hasil ke file CSV
df_TIX.to_csv("ulasan_TIXID.csv", index=False)
print("Data ulasan berhasil disimpan ke 'ulasan_TIXID.csv'")

Data ulasan berhasil disimpan ke 'ulasan_TIXID.csv'
