# Artificial Neural Networks

Artificial Neural Networks (ANN) adalah model komputasi yang terinspirasi oleh jaringan saraf biologis. Mereka terdiri dari neuron terhubung dalam lapisan yang menerima input, melakukan pemrosesan, dan menghasilkan output. ANN digunakan untuk mempelajari pola kompleks dalam data, seperti pengenalan pola, pengenalan gambar, dan prediksi. Proses pelatihan ANN melibatkan propagasi maju untuk membuat prediksi dan propagasi balik untuk memperbarui bobot agar prediksi semakin akurat.

In [None]:
# Installisasi tensorflow
!pip install tensorflow

In [1]:
# Memeriksa veri tensorflow
import tensorflow as tf
print(tf.__version__)

2.15.0


**Dataset yang digunakan adalah Data_bank_chun.csv. Bisa di akses di folder Soal1.**

Informasi yang kita miliki adalah;

1. RowNumber menunjukkan ia baris ke berapa.
2. CustomerId adalah identitas unik setiap costumer.
3. Surname adalah nama belakang pelanggan.
4. CreditScore adalah skor kredit yang diberikan oleh bank. Hanya bank yang tahu cara menghitung skor ini.
5. Geography adalah negara domisili nasabah.
6. Gender adalah jenis kelamin.
7. Age adalah usia.
8. Tenure adalah berapa lama (dalam tahun) mereka sudah menjadi nasabah bank.
9. Balance adalah tabungan nasabah saat ini (atau saat terakhir sebelum keluar sebagai nasabah).
10. NumberOfProduct adalah berapa banyak produk bank yang dimiliki oleh nasabah pada saat ini (atau saat terakhir).
11. HasCrCard adalah kondisi apakah saat ini nasabah memiliki kartu kredit di bank ini (1) atau tidak (0).
12. IsActiveMember adalah kondisi apakah pelanggan saat ini aktif (1) menjadi member aktif atau tidak (0). Hanya bank yang tahu cara membuat status ini, misal apakah nasabah aktif melakukan transaksi di bulan terakhir, apakah memiliki pinjaman di bulan terakhir, dan seterusnya.
13. EstimatedSalary adalah estimasi gaji yang dibuat oleh bank. Tentu saja bank tidak tahu gaji asli dari nasabah, tapi bank sudah membuat perkiraan gaji berdasarkan pola keluar masuknya uang nasabah tersebut.
14. Exited adalah status apakah nasabah ini tetap di bank (0) atau keluar dari bank (1).

In [2]:
# Mengimpor library yang diperlukan
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# EDA

In [3]:
# Mengimpor dataset
dataset = pd.read_csv('Data_bank_churn.csv')
#melakukan slicing untuk variabel independen X. Kita memerlukan kolom ke 3-12
X = dataset.iloc[:, 3:13].values
#melakukan slicing untuk variabel dependen y,
#yaitu kolom terakhir yang menunjukkan status keluar/tidaknya pegawai.
y = dataset.iloc[:, 13].values

# Processing Data

In [4]:
# Mengonversi data kategori jenis kelamin menjadi numerik
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer
labelencoder = LabelEncoder() #buat label

# merubah kolom ke 2 (Gender) menjadi nilai 0, atau
X[:, 2] = labelencoder.fit_transform(X[:, 2])
# Membuat dummy variable untuk kolom negara

columnTransformer = ColumnTransformer([('encoder', OneHotEncoder(), [1])], remainder='passthrough')
X = np.array(columnTransformer.fit_transform(X), dtype=np.float64)


In [5]:
# Menghilangkan 1 dummy variabel di kolom negara
X = X[:, 1:]
# Membagi data ke test dan training set
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)

In [6]:
# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)


# Pembangunan Model

In [7]:
# Mengimpor library Keras dan turunannya
# Sekarang menggunakan TensorFlow
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Inisialisasi ANN
MesinKlasifikasi = Sequential()

# Menambah input layer dan hidden layer pertama
MesinKlasifikasi.add(Dense(units = 6, kernel_initializer = 'uniform', activation = 'relu', input_dim = 11))
# Menambah hidden layer kedua
MesinKlasifikasi.add(Dense(units = 6, kernel_initializer = 'uniform', activation = 'relu'))
# Menambah output layer
MesinKlasifikasi.add(Dense(units = 1, kernel_initializer = 'uniform', activation = 'sigmoid'))

# Evaluasi dan Pengujian

In [8]:
# Meenjalankan ANN
MesinKlasifikasi.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
# Fitting ANN ke training set
MesinKlasifikasi.fit(X_train, y_train, batch_size = 10, epochs = 100)
# Memprediksi hasil test set
y_pred = MesinKlasifikasi.predict(X_test)
y_pred = (y_pred > 0.5)
# Membuat confusion matrix
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)

# Mencetak confusion matrix
print("Confusion Matrix:")
print(cm)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Dari hasil training model Artificial Neural Network (ANN) dengan 100 epochs, diperoleh informasi bahwa:

Loss function (binary crossentropy) semakin menurun seiring dengan berjalannya epoch, menunjukkan bahwa model semakin optimal dalam meminimalkan error.
Accuracy model semakin meningkat seiring dengan berjalannya epoch, menunjukkan bahwa performa model dalam memprediksi semakin baik.
Dalam 100 epochs, terlihat bahwa loss function dan accuracy model stabil setelah beberapa iterasi, menunjukkan bahwa model telah konvergen ke kondisi yang optimal.
Dengan demikian, kesimpulan yang dapat diambil adalah bahwa model Artificial Neural Network (ANN) yang telah dilatih mampu memprediksi dengan akurasi sekitar 83.55% pada dataset uji.

\
Dari confusion matrix tersebut, dapat dilihat bahwa:

True Positive (TP): 138
True Negative (TN): 1545
False Positive (FP): 50
False Negative (FN): 267
Dengan demikian, kesimpulannya adalah model memiliki kemampuan yang baik dalam memprediksi kelas positif (138 True Positive), namun masih memiliki kesalahan dalam memprediksi kelas negatif (50 False Positive) dan kelas positif yang sebenarnya (267 False Negative).

# Kesimpulan


Kesimpulannya adalah bahwa model Artificial Neural Network (ANN) yang telah dilatih dengan 100 epochs mampu mencapai akurasi sekitar 83.55% pada dataset uji. Meskipun demikian, dari confusion matrix, terlihat bahwa model masih memiliki kesalahan dalam memprediksi beberapa kelas, seperti False Positive dan False Negative. Oleh karena itu, meskipun akurasinya tinggi, model perlu diperbaiki lebih lanjut untuk mengurangi kesalahan prediksi pada kelas-kelas tertentu.