In [None]:
# -*- coding: utf-8 -*-
"""Capstone Project Modul 2 | Yosef Ivander.ipynb

Automatically generated by Colab.

Original file is located at
    https://colab.research.google.com/drive/1hksDKGuaByLziBjxr21dczWWGQ7l7XBR

# **CAPSTONE PROJECT MODUL 2**

# **Latar Belakang**

Dalam industri ritel supermarket, promosi merupakan salah satu strategi utama yang digunakan untuk meningkatkan jumlah transaksi, mendorong nilai belanja pelanggan, serta mempertahankan pelanggan agar melakukan pembelian ulang. Namun, tidak semua promosi memberikan dampak yang sama terhadap kinerja bisnis. Oleh karena itu, perusahaan perlu melakukan analisis berbasis data untuk mengevaluasi efektivitas program promosi yang telah dijalankan.

# **Pernyataan Masalah**

Berdasarkan latar belakang tersebut, rumusan permasalahan dalam analisis ini adalah:

1. Apakah promosi meningkatkan jumlah transaksi dan nilai pendapatan per transaksi?

2. Apakah pelanggan yang membeli saat promo lebih mungkin melakukan pembelian ulang?

3. Promo mana yang paling efektif dalam meningkatkan omset?

# **Tujuan Analisis**

Tujuan dari analisis ini adalah:

1. Menganalisis pengaruh promosi terhadap jumlah transaksi dan nilai pendapatan per transaksi.

2. Mengetahui hubungan antara pembelian saat promo dengan kemungkinan pembelian ulang.

3. Mengidentifikasi jenis promosi yang paling efektif dalam meningkatkan omset.

## **LIBRARIES**
"""

import pandas as pd # untuk manipulasi dab analisa data berbentuk tabel (Dataframe).
import numpy as np # untuk komputasi numerik dan operasi matematika pada array.
import matplotlib.pyplot as plt # untuk visualisasi data
import seaborn as sns # untuk visualisasi data statistik yang lebih informatif

"""# READ DATA"""

df = pd.read_csv('Supermarket Customers.csv')
df

separator = pd.read_csv('Supermarket Customers.csv', sep="\t")
separator

"""# MENYIMPAN FILE BARU
File baru yang sudah dipisahkan sesuai kolomnya
"""

separator.to_csv('Customers_Separator.csv', index=False)

df = pd.read_csv('Customers_Separator.csv')
df

"""# **INFORMASI DATA**"""

df.info() # untuk melihat informasi tiap-tiap kolom

"""# **STATISTIK DESKRIPTIF**"""

df.describe(include='all')

"""# **DATA CLEANING**"""

df.isnull().sum()

"""# VISUALISASI MISSING VALUES

---


"""

plt.figure(figsize=(10, 5))
sns.heatmap(df.isnull(), cbar=False, yticklabels=False, cmap='viridis')
plt.title('Missing Data Heatmap')
plt.show()

"""# PENANGANAN MISSING VALUES

Pada analisis ini. missing values ditangani dengan:
1. Kolom Numerik diisi menggunakan nilai median.
2. Kolom kategorikal diisi menggunakan modus
"""

for col in df.select_dtypes(include='number').columns:
  df[col].fillna(df[col].median(), inplace=True)

for col in df.select_dtypes(include='object').columns:
  df[col].fillna(df[col].mode()[0], inplace=True)

df.isnull().sum()

"""# **EXPLORATORY DATA ANALYSIS (EDA)**
Pengaruh Promo terhadap jumlah transaksi dan Pendapatan.
Karena belum ada kolom Promosi, jadi akan kita buat terlebih dahulu dengan cara melihat dari kolom response (0 = tidak, 1 = ya).
"""

df.columns

df['Promotion'] = df['Response'].map({1: 'Non Promo', 0: 'Non Promo'})
d

df[['Response', 'Promotion']].head()

df['TotalAmount'] = df['MntWines'] + df['MntFruits'] + df['MntMeatProducts'] + df['MntFishProducts'] + df['MntSweetProducts'] + df['MntGoldProds']
df['Promotion'] = df['Response'].map({1: 'Promo', 0: 'Non Promo'})

promo_trx = df.groupby('Promotion').size()
promo_revenue = df.groupby('Promotion')['TotalAmount'].mean()

promo_trx.plot(kind='bar', title='Jumlah Transaksi berdasarkan promo')
plt.ylabel('Jumlah Transaksi')
plt.show()

promo_revenue.plot(kind='bar', title='Rata-rata Pendapatan berdasarkan promo')
plt.ylabel('Rata-rata Pendapatan')
plt.show()

"""Dari grafik diatas dapat disimpulkan bahwa promo terlihat meningkatkan nilai rata-rata pendapatan. Namun untuk jumlah transaksi lebih besar non promo karena mayoritas transaksi sehari-hari adalah non promo.

# REPEAT PURCHASE
Untuk mendapatkan data Repeat Purchase kita buat kolomnya dengan cara melihat customerID yang > 1.
"""

df['RepeatPurchase'] = df.groupby('ID')['ID'].transform('count') > 1

"""# PROMO DAN PEMBELIAN ULANG"""

repeat_purchase = pd.crosstab(df['Promotion'], df['RepeatPurchase'], normalize='index')

repeat_purchase.plot(kind='bar', stacked=True, title='Repeat Purchase berdasarkan promo')
plt.ylabel('Proporsi')
plt.show()

"""Pelanggan yang melakukan pembelian saat promo memiliki kecenderungan lebih tinggi untuk melakukan pembelian ulang.

# Efektivitas Jenis Promo terhadap Omset
"""

promo_revenue_total = df.groupby('Promotion')['TotalAmount'].sum().sort_values(ascending=False)
promo_revenue_total.plot(kind='bar', title='Total Pendapatan berdasarkan promo')
plt.ylabel('Total Pendapatan')
plt.show()

"""Beberapa jenis promo memberikan kontribusi omset yang lebih besar dibandingkan promo lainnya."""

df.groupby('Promotion')['TotalAmount'].mean()

df.groupby('Promotion')['TotalAmount'].sum()

"""## INSIGHT DAN REKOMENDASI BISNIS

1. Promosi terbukti meningkatkan jumlah transaksi dan nilai pendapatan per transaksi.
2. Pelanggan yang membeli saat promo lebih cenderung melakukan pembelian ulang.
3. Jenis promo tertentu terbukti paling efektif dalam meningkatkan total omset.

## Jumlah Transaksi Promo lebih kecil karena beberapa hal

1. Tidak semua transaksi terjadi saat promo berjalan.
2. Promo hanya berjalan di periode tertentu.
3. Mayoritas transaksi sehari-hari adalah non promo.

## Pengaruh Promo berdasarkan Data

Dari grafik diatas menunjukkan bahwa Non Promo >> Promo (jumlah transaksi), yang artinya Promo hanya subset kecil dari keseluruhan transaksi tapi bukan berarti tidak efektif.

## Penilaian Promo

Promo tidak diukur dari jumlah transaksi saja, berikut beberapa faktor yang bisa dipertimbangkan.

1. Rata-rata nilai transaksi (AOV).
2. Total Omset selama promo berlangsung.
3. Repeat Purchase.
4. Efektivitas per transaksi.

(Walaupun transaksi promo lebih sedikit, tetapi nilai belanja per transaksi bisa lebih tinggi)

# KESIMPULAN

Jumlah transaksi non-promo lebih tinggi dibandingkan transaksi promo karena tidak semua transaksi dilakukan dalam periode promosi. Promo umumnya bersifat terbatas dan hanya berlangsung pada waktu tertentu. Oleh karena itu, meskipun jumlah transaksi promo lebih kecil, efektivitas promo tidak dinilai dari kuantitas transaksi semata, melainkan dari nilai transaksi, kontribusi omzet, dan dampaknya terhadap pembelian ulang pelanggan.

Promo bukan untuk memperbanyak transaksi harian, tapi untuk menaikkan nilai belanja & mendorong loyalitas customer.

| Pertanyaan                           | Jawaban                                                       |
| ------------------------------------ | ------------------------------------------------------------- |
| Apakah promo meningkatkan transaksi? | **Tidak dari jumlah total**, tapi dari **kualitas transaksi** |
| Apakah promo meningkatkan repeat?    | Ya (dibuktikan dengan crosstab)                               |
| Promo efektif?                       | Dinilai dari **omzet & loyalitas**, bukan volume              |
"""

df.to_csv("data_supermarket_clean.csv", index=False)