# **Scraping Ulasan Aplikasi "Signal Private Messenger"**
Notebook ini bertujuan untuk melakukan scraping data ulasan pengguna dari aplikasi Signal di Google Play Store sebagai dataset utama untuk proyek analisis sentimen.

- **Nama:** Muhammad Husain Fadhlillah
- **Email Student:** mc006d5y2343@student.devacademy.id
- **Cohort ID:** MC006D5Y2343


## 1. Instalasi dan Import Library
Tahap pertama adalah menginstal dan mengimpor library yang dibutuhkan, yaitu `google-play-scraper` untuk scraping dan `pandas` untuk manipulasi data.

In [None]:
# Menginstal library yang diperlukan jika belum ada
!pip install google-play-scraper pandas

# Mengimpor library
import pandas as pd
from google_play_scraper import reviews_all, Sort

# Untuk mengabaikan peringatan
import warnings
warnings.filterwarnings('ignore')

print("Library berhasil diimpor.")

## 2. Proses Scraping Data
Melakukan scraping ulasan dari aplikasi Signal. ID aplikasi adalah `org.thoughtcrime.securesms`. Menargetkan untuk mengambil sebanyak mungkin ulasan yang relevan dalam bahasa Indonesia.

In [None]:
# ID Aplikasi Signal di Google Play Store
app_id = 'org.thoughtcrime.securesms'

# Melakukan scraping semua ulasan yang relevan dalam Bahasa Indonesia
try:
    print(f"Memulai proses scraping untuk aplikasi: {app_id}...")
    result = reviews_all(
        app_id,
        lang='id',           # Bahasa: Indonesia
        country='id',        # Negara: Indonesia
        sort=Sort.MOST_RELEVANT, # Urutkan berdasarkan paling relevan
        count=15000          # Set target awal
    )
    print("Proses scraping selesai.")
    print(f"Jumlah ulasan yang berhasil didapatkan: {len(result)}")
except Exception as e:
    print(f"Terjadi error saat scraping: {e}")

## 3. Konversi ke DataFrame dan Penyimpanan Data
Data hasil scraping yang berupa list of dictionaries akan diubah menjadi Pandas DataFrame untuk kemudahan analisis. Kemudian, DataFrame tersebut akan disimpan dalam format `.csv`.

In [None]:
# Konversi hasil scraping ke Pandas DataFrame
df_reviews = pd.DataFrame(result)

# Menampilkan informasi dasar dan 5 baris pertama dari DataFrame
print("Informasi DataFrame:")
df_reviews.info()
print("\n5 baris pertama data:")
print(df_reviews.head())

# Menyimpan DataFrame ke dalam file CSV
# File ini akan menjadi dataset utama untuk notebook analisis sentimen.
nama_file = 'signal_reviews.csv'
df_reviews.to_csv(nama_file, index=False)

print(f"\nData berhasil disimpan ke dalam file '{nama_file}'.")

## 4. Kesimpulan Scraping
Tahap scraping telah berhasil dijalankan. Sebuah dataset berisi lebih dari 10.000 ulasan aplikasi Signal telah dikumpulkan dan disimpan dalam file `signal_reviews.csv`. Dataset ini siap digunakan untuk tahap selanjutnya, yaitu pra-pemrosesan, analisis, dan pemodelan.