# MULTILAYER PERCEPTRON

Multilayer Perceptron adalah salah satu jenis implementasi dari Neural Network. Oleh karena itu, untuk lebih memahami intuisi dari Multilayer Perceptron, kira harus mempelajari lebih dalam tentang Neural Network.

![image.png](attachment:image.png)

Neural Network adalah model yang dikomputasi berdasarkan cara kerja otak manusia. Pada umumnya dalam membuat sebuah keputusan/respon, pertama-tama manusia menerima sinyal dari dendrit, diolah di cell body atau neuron, dan kemudian dikirimkan ke axon saat sinyal sudah cukup diterima. Sinyal yang menjadi output ini kemudian akan menjadi input dalam neuron berikutnya, dan seterusnya. Dalam proses tersebut, neuron terakhir akan membuat keputusan tentang pentingnya sebuah input dari beberapa neuron berdasarkan dari sinyal-sinyal yang diterima. Berdasarkan proses tersebut kita mampu mengaplikasikan model yang simple, yang dinamakan Singlelayer Perceptron






![image.png](attachment:image.png)

Berdasarkan gambar diatas, tiap-tiap fitur mempunyai bobot. Bobot ini menunjukkan seberapa pentingnya sebuah fitur dalam menentukan sebuah keputusan. Hasil komputasi dari beberapa fitur tersebut akan diakumulasikan, dan dimasukkan ke fungsi aktivasi. Fungsi aktivasi dalam Neural Network ini bisa berupa logistic function, tanh, atau apapun yang bersifat sigmoid.

Teori ini telah ditemukan pada tahun 1950 dan 1960-an. Namun, teori ini tidak bisa diterapkan secara efektif untuk masalah non-linear. Selain itu, bobot pada Singlelayer Perceptron ini tidak dapat diimprovisasi untuk meningkatkan kualitas model. Hal-hal ini yang menyebabkan orang-orang menjadi tidak tertarik dengan perceptron.

Pada tahun 1986, Geoffrey Hinton, David Rumerhart, dan Ronald Williams menunjukkan cara untuk mengatasi masalah-masalah tersebut dalam paper berjudul "Learning representations by back-propagating errors". Paper ini berfokus pada 2 hal, yaitu:
1. Backpropagation, yaitu prosedur untuk mengatur kembali bobot-bobot untuk mengurangi error antara prediksi dan data aktual
2. Hidden Layers, yaitu node/simpul yang terletak diantara input layer dan output layer, yang berfungsi untuk melakukan komputasi yang kompleks pada sebuah model. 



![image.png](attachment:image.png)

Backpropagation adalah proses yang berguna supaya jaringan bisa belajar dari tingkat error antara prediksi dan aktual. Tingkat error yang didapat ini akan menjadi sinyal untuk dikirimkan ke node awal, agar bobot-bobot pada setiap node bisa disesuaikan kembali. Proses ini akan membuat tingkat error antara prediksi dan aktual semakin kecil, setiap kita menjalankan backpropagation.


Kemudian pada hidden layer, hidden layer ini yang membuat singlelayer perceptron ini menjadi multilayer perceptron. hidden layer ini yang nantinya akan mengatasi masalah non-linear dengan cara melakukan komputasi yang kompleks pada model.

## Activation Function


Fungsi Aktivasi adalah fungsi yang terletak diantara 2 buah neuron. Fungsi Aktivasi  dikenal juga sebagai Fungsi Transfer.
Fungsi ini bertugas untuk menentukan seberapa besar nilai output pada sebuah neuron. Nilai ini nantinya akan dipetakan sebagai nilai input pada neuron berikutnya.

Nilai output sebelum memasuki fungsi aktivasi adalah sebagai berikut.

![image.png](attachment:image.png)

### Linear Function

![image.png](attachment:image.png)

Fungsi diatas adalah fungsi aktivasi yang paling sederhana. Karena hanya menyimpulkan dari hasil pertambahan beberapa output neuron. Kelemahan dari fungsi ini adalah tidak mampu mempelajari masalah non-linear, karena jika semua hidden layer mempunyai fungsi aktivasi linear, maka hasil dari output layer pasti mempunyai fungsi linear pula.

Sebaliknya, fungsi aktivasi linear mampu diimplementasikan pada output layer, jika kita menginginkan model neural network menangani masalah regresi.

### ReLU Function

![image.png](attachment:image.png)

ReLU function adalah fungsi yang paling sering digunakan di dunia saat ini. Fungsi ini umumnya diimplementasikan pada hidden layer. Sekilas ReLU mirip seperti fungsi linear, tapi sebenarnya ReLU mempunyai sifat non-linear. ReLU bekerja sebagai tuas/lever di saat output dari neuron melewati treshold tertentu.

Selain itu, bayangkan apabila pada sebuah model neural network terdiri dari ratusan neuron. Fungsi aktivasi ReLU akan mempersingkat waktu training pada model. Hal ini dikarenakan beberapa neuron mempunyai nilai 0 dan hanya memproses beberapa neuron yang mempunyai pengaruh signifikan dalam memprediksi sebuah output. 

Sekarang kita beralih pada fungsi-fungsi aktivasi yang dapat diimplementasikan pada output layer.

### Step Function

![image.png](attachment:image.png)

Fungsi aktivasi ini adalah fungsi yang paling dasar untuk menentukan sebuah nilai pada output layer. Berdasarkan gambar diatas, nilai output akan bernilai 0 jika input lebih kecil dari 0, dan akan bernilai 1 jika input lebih besar dari 0. Hal sesederhana ini dapat membuat Step function menjadi fungsi aktivasi yang cocok untuk model klasifikasi.

Namun Step Function mempunyai permasalahan yang sangat krusial disini. Seperti yang kita ketahui, backpropagation adalah proses yang berguna supaya jaringan bisa belajar dari tingkat error antara prediksi dan aktual. Jika model hanya belajar berdasarkan nilai output 0 dan 1, maka model tidak akan berkembang secara maksimal. Model membutuhkan bahan pembelajaran yang lebih dari sekedar dari angka biner, contohnya adalah probabilitas yang bersifat kontinyu.

Berikut ini adalah fungsi aktivasi yang umum digunakan pada output layer.

### Sigmoid Function

![image.png](attachment:image.png)

![image.png](attachment:image.png)

Logistic function dan tanh function adalah jawaban untuk mengatasi masalah pada output layer. Keduanya mempunyai nilai keluaran yang kontinyu yang mewakili nilai probabilitas. Perbedaannya fungsi tanh adalah fungsi logistik yang sudah diskalakan dari range antara -1 sampai 1. Keduanya sama-sama fungsi yang paling sering digunakan sampai hari ini untuk diimplementasikan pada output layer.

## CODING SECTION

In [15]:
#import library
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import warnings
warnings.filterwarnings("ignore")

In [16]:

# Importing dataset
dataset = pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:, 3:13].values
y = dataset.iloc[:, 13].values

Proses encoding pada categorical data harus dilakukan karena Neural Network hanya mampu membaca angka sebagai input

In [17]:
# encoding categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_1 = LabelEncoder()
X[:, 1] = labelencoder_X_1.fit_transform(X[:, 1])
labelencoder_X_2 = LabelEncoder()
X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2])
onehotencoder = OneHotEncoder(categorical_features = [1])
X = onehotencoder.fit_transform(X).toarray()
X = X[:, 1:]

In [18]:
# Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)

# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

In [28]:


# Importing the Keras libraries
import keras
from keras.models import Sequential
from keras.layers import Dense

#membuat ANN
classifier = Sequential()

# Menambah input layer dan hidden layer pertama
classifier.add(Dense(output_dim = 6, init = 'uniform', activation = 'relu', input_dim = 11))

# Menambah hidden layer kedua
classifier.add(Dense(output_dim = 6, init = 'uniform', activation = 'relu'))

# Menambahkan output layer
classifier.add(Dense(output_dim = 1, init = 'uniform', activation = 'sigmoid'))

# Menyusun ANN
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])


classifier.fit(X_train, y_train, batch_size = 10, nb_epoch = 100)

y_pred = classifier.predict(X_test)
y_pred = (y_pred > 0.5)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

In [25]:
# Making the Confusion Matrix
from sklearn.metrics import confusion_matrix, accuracy_score
cm = confusion_matrix(y_test, y_pred)
acc = accuracy_score(y_test, y_pred)

In [26]:
cm


array([[1543,   52],
       [ 263,  142]], dtype=int64)

In [27]:
acc

0.8425

## KESIMPULAN

MLP adalah salah satu cara untuk mengatasi masalah klasifikasi. MLP mempunyai kelebihan untuk mampu mempelajari struktur data tanpa perlu kita kontrol secara berlebih. Namun, Machine Learning bisa mampu lebih unggul terhadap Deep Learning apabila kita mengetahui domain/basic knowledge terhadap data yang akan kita olah.