<a href="https://colab.research.google.com/github/AnnaSyah/DataScienceProjectHandbook/blob/main/DS_Project_Handbook.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Studi Kasus 2.1: Analisis Data Pelanggan E-Commerce**


Suatu perusahaan e-commerce ingin menganalisis data pelanggan berdasarkan usia, kota tempat tinggal, dan kategori produk yang dibeli.



**Solusi:**

**1. Pemahaman Studi Kasus**

    Perusahaan e-commerce ingin menganalisis data pelanggan berdasarkan:
    *   Usia pelanggan
    *   Kota tempat tinggal pelanggan
    *   Kategori produk yang dibeli

    Struktur data yang digunakan:
    List → Menyimpan data pelanggan dalam bentuk daftar.
    Tuple → Menyimpan kategori produk yang bersifat tetap.
    Dictionary → Menyimpan jumlah pembelian per pelanggan dalam format key-value.
    Set → Menyimpan daftar kota unik tempat tinggal pelanggan untuk menghindari duplikasi.



**2. Implementasi Python**

Berikut adalah implementasi kode Python berdasarkan studi kasus:

In [None]:
# Data pelanggan dalam List (nama, usia, kota, produk yang dibeli)
pelanggan = [
    ("Andi", 25, "Jakarta", "Elektronik"),
    ("Budi", 30, "Bandung", "Fashion"),
    ("Citra", 27, "Surabaya", "Kosmetik"),
    ("Dewi", 35, "Jakarta", "Elektronik"),
    ("Eka", 29, "Bandung", "Elektronik"),
    ("Fajar", 40, "Surabaya", "Fashion"),
    ("Gita", 22, "Jakarta", "Kosmetik"),
    ("Hadi", 31, "Bandung", "Fashion"),
]

# Tuple untuk kategori produk yang tersedia (bersifat tetap)
kategori_produk = ("Elektronik", "Fashion", "Kosmetik")

# Dictionary untuk menyimpan jumlah pembelian per pelanggan
jumlah_pembelian = {
    "Andi": 5,
    "Budi": 2,
    "Citra": 3,
    "Dewi": 4,
    "Eka": 1,
    "Fajar": 6,
    "Gita": 3,
    "Hadi": 2
}

# Set untuk menyimpan kota unik tempat tinggal pelanggan
kota_unik = {pelanggan[i][2] for i in range(len(pelanggan))}

# Menampilkan hasil analisis
print("Kategori Produk yang Tersedia:", kategori_produk)
print("Jumlah Pembelian per Pelanggan:", jumlah_pembelian)
print("Kota Tempat Tinggal Pelanggan (Unik):", kota_unik)


**3. Penjelasan Kode**

    a) Menyimpan Data Pelanggan dengan List
        Data pelanggan disimpan dalam List dengan format Tuple (nama, usia, kota, produk).
        Contoh: ("Andi", 25, "Jakarta", "Elektronik")

    b) Menyimpan Kategori Produk dengan Tuple
        Tuple digunakan karena kategori produk tidak akan berubah.
        Contoh: kategori_produk = ("Elektronik", "Fashion", "Kosmetik")

    c) Menyimpan Jumlah Pembelian dengan Dictionary
        Dictionary digunakan untuk mencatat jumlah pembelian setiap pelanggan dalam format key-value.
        Contoh: "Andi": 5 menunjukkan Andi membeli 5 item.

    d) Menyimpan Kota Pelanggan Unik dengan Set
        Set digunakan untuk menyimpan daftar kota unik tempat tinggal pelanggan tanpa duplikasi.
        Penggunaan Set Comprehension memastikan hanya kota yang unik yang disimpan.

# **Studi Kasus 2.2: Analisis Skor Sentimen Ulasan Pelanggan**

Dalam analisis data, kita sering kali menghadapi kumpulan teks seperti ulasan pelanggan. Salah satu tugas umum adalah membersihkan dan mengubah teks menjadi format numerik yang lebih mudah dianalisis.

Di sini, kita akan menggunakan **List Comprehension** dan **Dictionary Comprehension** untuk:


1.   Membersihkan teks ulasan pelanggan (mengubah huruf menjadi kecil dan menghapus tanda baca).
2.   Mengonversi ulasan menjadi skor sentimen berdasarkan jumlah kata positif dan negatif dalam setiap ulasan.


    Dataset Ulasan Pelanggan
    +-----+---------+--------------------------------------------------+
    | ID  |  NAMA   |                      ULASAN                      |
    +=====+=========+==================================================+
    | 101 | Anna    | Produk ini sangat bagus! Kualitasnya luar biasa. |
    +-----|---------+--------------------------------------------------+
    | 102 | Beny    | Pelayanan buruk, saya sangat kecewa.             |
    +-----+---------+--------------------------------------------------+
    | 103 | Cakra   | Harga terjangkau dan pengiriman cepat.           |
    +-----+---------+--------------------------------------------------+
    | 104 | Dessy   | Kualitasnya jelek dan tidak sesuai ekspektasi.   |
    +-----+---------+--------------------------------------------------+
    | 105 | Ellan   | Layanan pelanggan sangat membantu!               |
    +-----+---------+--------------------------------------------------+



**Solusi:**

Kode Program Python:

In [None]:
import string

# Data ulasan pelanggan (List)
ulasan_pelanggan = [
    "Produk ini sangat bagus! Kualitasnya luar biasa.",
    "Pelayanan buruk, saya sangat kecewa.",
    "Harga terjangkau dan pengiriman cepat.",
    "Kualitasnya jelek dan tidak sesuai ekspektasi.",
    "Layanan pelanggan sangat membantu!"
]

# List kata positif & negatif (Tuple)
kata_positif = ("bagus", "luar biasa", "terjangkau", "cepat", "membantu")
kata_negatif = ("buruk", "kecewa", "jelek", "tidak sesuai")

# Preprocessing: Membersihkan teks menggunakan List Comprehension
ulasan_bersih = [
    " ".join(kata.strip(string.punctuation).lower() for kata in ulasan.split())
    for ulasan in ulasan_pelanggan
]

# Menghitung skor sentimen dengan Dictionary Comprehension
skor_sentimen = {
    i+1: sum(1 for kata in ulasan.split() if kata in kata_positif) -
         sum(1 for kata in ulasan.split() if kata in kata_negatif)
    for i, ulasan in enumerate(ulasan_bersih)
}

# Output hasil analisis
print("Ulasan setelah diproses:", ulasan_bersih)
print("Skor sentimen:", skor_sentimen)


**Penjelasan:**

    List Comprehension → membersihkan teks, menghapus tanda baca, dan mengubah huruf menjadi kecil.
    Dictionary Comprehension → menghitung skor sentimen dengan menjumlahkan kata positif dan negatif dalam setiap ulasan.
    Skor sentimen → ditentukan berdasarkan perbandingan jumlah kata positif dan negatif:
    *   Positif: Jika jumlah kata positif lebih banyak daripada kata negatif.
    *   Negatif: Jika jumlah kata negatif lebih banyak daripada kata positif.
    *   Netral: Jika jumlah kata positif dan negatif seimbang.

# **Studi Kasus 2.3: Analisis Pola Pembelian Pelanggan di E-Commerce**

Dalam e-commerce, memahami pola pembelian pelanggan dapat membantu perusahaan menyajikan rekomendasi produk yang tepat dan menjaga loyalitas pelanggan. Studi kasus ini akan menganalisis daftar transaksi pelanggan menggunakan fungsi **Lambda**, **Map**, **Filter**, dan **Reduce**.

    Dataset Transaksi Pelanggan
    +--------------+-----------------------------+---------------------+
    | PELANGGAN ID |           PRODUK            | TOTAL BELANJA (RP.) |
    +==============+=============================+=====================+
    |       1      | Laptop, Mouse               |          15.500.000 |
    +--------------+-----------------------------+---------------------+
    |       2      | Keyboard, Mouse             |             700.000 |
    +--------------+-----------------------------+---------------------+
    |       3      | Monitor, Mouse, Flash Drive |           3.200.000 |
    +--------------+-----------------------------+---------------------+
    |       4      | Laptop, Monitor             |          18.000.000 |
    +--------------+-----------------------------+---------------------+
    |       5      | Flash Drive                 |              90.000 |
    +--------------+-----------------------------+---------------------+






In [None]:
# Data transaksi pelanggan (List of Dictionaries)
transaksi = [
    {"PELANGGAN ID": 1, "produk": ["Laptop", "Mouse"], "TOTAL BELANJA (RP.)": 15500000},
    {"PELANGGAN ID": 2, "produk": ["Keyboard", "Mouse"], "TOTAL BELANJA (RP.)": 700000},
    {"PELANGGAN ID": 3, "produk": ["Monitor", "Mouse", "Flash Drive"], "TOTAL BELANJA (RP.)": 3200000},
    {"PELANGGAN ID": 4, "produk": ["Laptop", "Monitor"], "TOTAL BELANJA (RP.)": 18000000},
    {"PELANGGAN ID": 5, "produk": ["Flash Drive"], "TOTAL BELANJA (RP.)": 90000}
]

**Solusi:**

**1. Penerapan Lambda**

Menggunakan **lambda** untuk menghitung jumlah produk yang dibeli oleh setiap pelanggan.

In [None]:
# Menggunakan Lambda untuk menghitung jumlah produk yang dibeli per transaksi
hitung_produk = lambda transaksi: {**transaksi, "jumlah_produk": len(transaksi["produk"])}

# Contoh penerapan untuk satu transaksi
contoh_transaksi = hitung_produk(transaksi[0])
print(contoh_transaksi)

**2. Penerapan Map()**

Menggunakan **map()** untuk menambahkan jumlah produk dalam setiap transaksi.

In [None]:
# Menambahkan jumlah produk yang dibeli oleh setiap pelanggan
transaksi_dengan_jumlah_produk = list(map(lambda x: {**x, "jumlah_produk": len(x["produk"])}, transaksi))

print(transaksi_dengan_jumlah_produk)

**3. Penerapan Filter()**

Menggunakan **filter()** untuk mendapatkan daftar pelanggan yang melakukan pembelian di atas Rp1.000.000.

In [None]:
# Menyaring pelanggan yang total belanjanya lebih dari Rp1.000.000
pelanggan_premium = list(filter(lambda x: x["TOTAL BELANJA (RP.)"] > 1000000, transaksi_dengan_jumlah_produk))

print(pelanggan_premium)

**4. Penerapan Reduce()**

Menggunakan **reduce()** untuk menghitung total keseluruhan belanja semua pelanggan.

In [None]:
from functools import reduce

# Menghitung total belanja semua pelanggan
total_semua_transaksi = reduce(lambda acc, x: acc + x["TOTAL BELANJA (RP.)"], transaksi_dengan_jumlah_produk, 0)

print(f"Total keseluruhan belanja pelanggan: Rp{total_semua_transaksi:,.2f}")

**Kesimpulan**

    Dengan menerapkan Lambda, Map, Filter, dan Reduce, kita dapat melakukan analisis pola pembelian pelanggan dengan cepat:
    *   Lambda menghitung jumlah produk dalam satu transaksi.
    *   Map menambahkan atribut jumlah produk dalam setiap transaksi pelanggan.
    *   Filter menyeleksi pelanggan dengan total belanja di atas Rp1.000.000
    *   Reduce menghitung total semua transaksi pelanggan dalam e-commerce.

    Penerapan ini membantu bisnis dalam mengidentifikasi pelanggan potensial dan mengoptimalkan strategi pemasaran.