# **Bank marketing campaigns**

## Disusun Oleh: 
###             1. CHRISTIAN TJOPUTERA
###             2. Ahmad Zaid Makarim
###             3. Ronny Sahat Martua Purba

## **1. Business Problem Statement**

### **1.1. Latar Belakang**

Dalam industri perbankan, penawaran produk melalui kampanye pemasaran seperti telemarketing merupakan salah satu strategi utama untuk meningkatkan pendapatan dan mempertahankan hubungan dengan nasabah. Namun, pendekatan yang kurang terarah dapat menyebabkan pemborosan sumber daya, rendahnya tingkat keberhasilan kampanye, dan ketidakpuasan pelanggan akibat komunikasi yang tidak relevan.

Salah satu produk yang ditawarkan melalui kampanye ini adalah **deposito berjangka (*term deposit*)**. Meskipun produk ini memiliki nilai yang tinggi bagi bank, hanya sebagian kecil nasabah yang merespon positif terhadap tawaran tersebut. Oleh karena itu, diperlukan pendekatan yang lebih **berbasis data** agar strategi pemasaran menjadi lebih efektif dan efisien.

### **1.2. Permasalahan Utama**
Bank menghadapi tantangan dalam menentukan **nasabah mana yang paling berpotensi untuk menerima tawaran deposito berjangka**. Tanpa sistem yang mampu memprediksi respons nasabah, bank cenderung menghabiskan banyak waktu dan biaya untuk menghubungi nasabah yang kemungkinan besar tidak tertarik, yang berdampak pada rendahnya ***Return on Investment (ROI)*** dari kampanye pemasaran.

### **1.3. Rumusan Masalah**
1. Bagaimana memprediksi apakah seorang nasabah akan menerima tawaran deposito berjangka sehingga bank dapat mengoptimalkan upaya pemasaran, meningkatkan efisiensi kampanye, dan mengurangi biaya operasional?
2. Nasabah seperti apa yang sebaiknya ditargetkan untuk meningkatkan tingkat keberhasilan kampanye pemasaran produk deposito berjangka dan memaksimalkan **ROI**?

### **1.4. Tujuan**
1. **Mengembangkan model prediktif berbasis *machine learning*** untuk memproyeksikan kemungkinan seorang nasabah menerima tawaran produk deposito.

2. **Mengidentifikasi karakteristik nasabah yang memiliki potensi tinggi untuk berlangganan**, guna menyusun strategi segmentasi dan targeting yang lebih efektif.

3. **Memberikan *insight* berbasis data** untuk mendukung pengambilan keputusan dalam perencanaan dan pelaksanaan kampanye pemasaran.

### **1.5. Manfaat Bisnis**
1. **Meningkatkan rasio konversi** dari kampanye telemarketing.

2. **Mengurangi biaya** operasional dan sumber daya yang terbuang untuk nasabah yang tidak potensial.

3. **Meningkatkan kepuasan pelanggan** dengan komunikasi yang lebih relevan dan personal.

4. **Memaksimalkan laba atas investasi (*ROI*)** dari aktivitas pemasaran.

## **2. Data Understanding**

### **2.1. Sumber Data**

Sumber data
1. Tautan: https://www.kaggle.com/datasets/volodymyrgavrysh/bank-marketing-campaigns-dataset/code
2. Judul: ***Bank marketing campaigns dataset | Opening Deposit***

Dataset ini berisi data hasil kampanye pemasaran yang dilakukan oleh sebuah bank di **Portugal**. Kampanye tersebut sebagian besar dilakukan melalui **telepon langsung (*telemarketing*)** kepada nasabah, dengan tujuan untuk menawarkan produk **deposito berjangka (*term deposit*)**.

Jika setelah seluruh upaya pemasaran nasabah menyetujui untuk membuka deposito, maka **variabel target** diberi label `yes`, dan jika tidak, maka diberi label `no`.

### **2.2. Dimesi Data**

In [40]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import Markdown, display
from tabulate import tabulate

In [41]:
file_path = "../data/bank-additional-full.csv"
df = pd.read_csv(file_path, sep=';') 

In [42]:
df_shape = df.shape
df_dtypes = df.dtypes
df_head = df.head()

In [43]:
baris, kolom = df.shape
display(Markdown(f"**Dataset ini mempunyai:**\n- Jumlah data/baris: `{baris}`\n- Jumlah atribut/kolom: `{kolom}`"))

**Dataset ini mempunyai:**
- Jumlah data/baris: `41188`
- Jumlah atribut/kolom: `21`

### **2.3. Informasi Atribut**

In [44]:
df_dtypes

age                 int64
job                object
marital            object
education          object
default            object
housing            object
loan               object
contact            object
month              object
day_of_week        object
duration            int64
campaign            int64
pdays               int64
previous            int64
poutcome           object
emp.var.rate      float64
cons.price.idx    float64
cons.conf.idx     float64
euribor3m         float64
nr.employed       float64
y                  object
dtype: object

| Attribute        | Data Type | Jenis Data  | Deskripsi                                                  |
| ---------------- | --------- | ----------- | ---------------------------------------------------------- |
| `age`            | `int64`   | Numerik     | Usia klien                                                 |
| `job`            | `object`  | Kategorikal | Jenis pekerjaan klien                                      |
| `marital`        | `object`  | Kategorikal | Status pernikahan klien                                    |
| `education`      | `object`  | Kategorikal | Tingkat pendidikan klien                                   |
| `default`        | `object`  | Kategorikal | Status kredit klien                                        |
| `housing`        | `object`  | Kategorikal | Apakah klien memiliki pinjaman perumahan                   |
| `loan`           | `object`  | Kategorikal | Apakah klien memiliki pinjaman pribadi                     |
| `contact`        | `object`  | Kategorikal | Jenis komunikasi pada kontak terakhir                      |
| `month`          | `object`  | Kategorikal | Bulan kontak terakhir dilakukan                            |
| `day_of_week`    | `object`  | Kategorikal | Hari dalam minggu saat kontak terakhir dilakukan           |
| `duration`       | `int64`   | Numerik     | Durasi kontak terakhir dalam detik                         |
| `campaign`       | `int64`   | Numerik     | Jumlah kontak selama kampanye untuk klien ini              |
| `pdays`          | `int64`   | Numerik     | Jumlah hari sejak kontak terakhir dari kampanye sebelumnya |
| `previous`       | `int64`   | Numerik     | Jumlah kontak dari kampanye sebelumnya                     |
| `poutcome`       | `object`  | Kategorikal | Hasil dari kampanye pemasaran sebelumnya                   |
| `emp.var.rate`   | `float64` | Numerik     | Tingkat variasi pekerjaan                                  |
| `cons.price.idx` | `float64` | Numerik     | Indeks harga konsumen                                      |
| `cons.conf.idx`  | `float64` | Numerik     | Indeks kepercayaan konsumen                                |
| `euribor3m`      | `float64` | Numerik     | Tingkat Euribor 3 bulan                                    |
| `nr.employed`    | `float64` | Numerik     | Jumlah karyawan                                            |
| `y`              | `object`  | Kategorikal | Apakah klien telah berlangganan deposito berjangka?        |


In [48]:
# 1. Ambil tipe data asli dari DataFrame
df_dtypes = pd.DataFrame(df.dtypes, columns=['Data Type']).reset_index()
df_dtypes.columns = ['Attribute', 'Data Type']

# 2. Buat deskripsi tambahan manual (dari informasi yang Anda berikan)
deskripsi_manual = [
    ["age", "Numerik", "Usia klien"],
    ["job", "Kategorikal", "Jenis Pekerjaan Klien"],
    ["marital", "Kategorikal", "Status Pernikahan Klien"],
    ["education", "Kategorikal", "Tingkat pendidikan klien"],
    ["default", "Kategorikal", "Status kredit klien"],
    ["housing", "Kategorikal", "Status apakah klien memiliki pinjamanan perumahan"],
    ["loan", "Kategorikal", "Status apakah klien memiliki pinjaman pribadi"],
    ["contact", "Kategorikal", "Jenis komunikasi kontak terakhir"],
    ["month", "Kategorikal", "Bulan kontak terakhir dengan klien dalam tahun ini"],
    ["day_of_week", "Kategorikal", "Hari dalam seminggu kontak terakhir dengan klien"],
    ["duration", "Numerikal", "Durasi kontak terakhir dengan klien dalam detik"],
    ["campaign", "Numerikal", "Jumlah kontak yang dilakukan selama kampanye ini dan untuk klien ini"],
    ["pdays", "Numerikal", "Jumlah hari sejak klien terakhir kali dihubungi dari kampanye sebelumnya"],
    ["previous", "Numerikal", "Jumlah kontak yang dilakukan sebelum kampanye ini dan untuk klien ini"],
    ["poutcome", "Kategorikal", "Hasil dari kampanye pemasaran sebelumnya"],
    ["emp.var.rate", "Numerikal", "Tingkat variasi pekerjaan"],
    ["cons.price.idx", "Numerikal", "Indeks harga konsumen"],
    ["cons.conf.idx", "Numerikal", "Indeks kepercayaan konsumen"],
    ["euribor3m", "Numerikal", "Tingkat euribor 3 bulan"],
    ["nr.employed", "Numerikal", "Jumlah karyawan"],
    ["y", "Kategorikal", "Status apakah klien telah berlangganan deposito berjangka?"]
]

df_deskripsi = pd.DataFrame(deskripsi_manual, columns=["Attribute", "Jenis Data", "Deskripsi"])

# 3. Gabungkan kedua DataFrame berdasarkan kolom 'Attribute'
df_info_akhir = pd.merge(df_dtypes, df_deskripsi, on="Attribute", how="left")

# 4. Tampilkan hasil
df_info_akhir


TypeError: merge() got an unexpected keyword argument 'showindex'

## **3. Exploratory Data Analysis**

sd

## **4. Preprocessing**

### **4.1. Missing Value**

### **4.2. Casting**

### **4.3. Inconsistent Variable**

### **4.4. Remove data duplication**

### **4.5. Feature Engineering**

## **5. Methodology (Modeling/Analysis)**

### **5.1. Analysis Paradigm**

### **5.2. Analysis Structure**

### **5.3. Expected Analysis Results**

## **6. Conclusion and Recommendation**

### **6.1. Conclusion**

### **6.2. Recommendation**