# Analisis Sentimen Pengguna Aplikasi E-Commerce di Indonesia

Pada file ini dilakukan proses scraping review di Google Play Store dari beberapa aplikasi E-Commerce di Indonesia, seperti Shopee, Lazada, dan Tokopedia.

## 1. Instalasi dan Import Library/Package

In [None]:
#Instalasi Scraper
!pip install google-play-scraper



Instalasi package google play scraper untuk mengambil data aplikasi dari Google Play Store.

In [None]:
#Import library yang dibutuhkan
from google_play_scraper import Sort, reviews
from google.colab import files
import pandas as pd

1. Sort dan reviews: untuk mengambilkan dan mengurutkan review aplikasi dari Google Play Store.
2. Files: untuk mengunduh file langsung ke lokal.
3. Pandas: Library untuk manipulasi data tabular.

## 2. Scraping Data

In [None]:
#Aplikasi yang ingin di-scrape
apps = {
    'Shopee': 'com.shopee.id',
    'Tokopedia': 'com.tokopedia.tkpd',
    'Lazada': 'com.lazada.android'
}

#List untuk menyimpan semua review
all_reviews = []

#Loop untuk scraping tiap aplikasi
for app_name, package in apps.items():
    print(f"Scraping {app_name}...")
    result, _ = reviews(
        package,
        lang='id',
        country='id',
        sort=Sort.NEWEST,
        count=6000
    )

    df = pd.DataFrame(result)[['userName', 'score', 'content']]
    df['App'] = app_name
    all_reviews.append(df)

#Menggabungkan semua dataframe
combined_df = pd.concat(all_reviews, ignore_index=True)

#Rename beberapa kolom pada dataframe
combined_df.rename(columns={
    'userName': 'Username',
    'score': 'Rating',
    'content': 'Review'
}, inplace=True)

#Menampilkan total review
print(f"Scraping selesai, total review: {len(combined_df)}")


Scraping Shopee...
Scraping Tokopedia...
Scraping Lazada...
Scraping selesai, total review: 18000


Analisa:


*   Mendefinisikan aplikasi target (Shopee, Tokopedia, Lazada) beserta package name-nya.
*   Melakukan scraping review sebanyak 6000 per aplikasi, menggunakan bahasa dan negara Indonesia, serta mengurutkan review terbaru.
*   Hanya kolom penting yang diambil: userName, score, content, lalu ditambahkan nama aplikasi (App).
*   Semua review dari berbagai aplikasi digabungkan jadi satu DataFrame.
*   Kolom diubah namanya supaya lebih rapi dan mudah dimengerti (Username, Rating, Review).

## 3. Cleaning Data

In [None]:
#Hapus data dengan review yang kosong
combined_df.dropna(subset=['Review'], inplace=True)
#Hapus duplikat data user dan review
combined_df.drop_duplicates(subset=['Username', 'Review'], inplace=True)
#Hapus spasi di awal/akhir
combined_df['Review'] = combined_df['Review'].str.strip()

#Menampilkan jumlah dan preview data setelah cleaning
print(f"Jumlah data: {len(combined_df)}")
combined_df.head()


Jumlah data: 14639


Unnamed: 0,Username,Rating,Review,App
0,Pengguna Google,1,kokgitu banyak perodak yg laku tapi komisi tid...,Shopee
1,Pengguna Google,5,gw suka banget sama shopee pengantarannya cepa...,Shopee
2,Pengguna Google,5,bagus,Shopee
3,Pengguna Google,5,Mantap,Shopee
4,Pengguna Google,5,sangat puas,Shopee


**Analisa:**

Pada tahap ini dilakukan pembersihan data dengan menghapus review yang kosong, menghapus duplikat berdasarkan Username dan Review, serta menghapus spasi di awal/akhir teks review.

## 4. Menyimpan dan Mengunduh Dataset Akhir

In [None]:
#Menyimpan dataframe ke file csv
combined_df.to_csv('ecommerce_reviews_labeled.csv', index=False)

#Mengunduh file ke lokal
files.download('ecommerce_reviews_labeled.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Analisa:

Dataset yang sudah dibersihkan dan dilabel disimpan ke ecommerce_reviews_labeled.csv kemudian diunduh ke lokal untuk proses selanjutnya.