# 1. MLP


## 1.1. Mạng thần kinh nơ ron

![](https://appliedgo.net/media/perceptron/neuron.png)

Não bộ sẽ xử lý thông tin như thế nào ?

Các tín hiệu đầu vào sẽ được truyền qua dendrites, nhân của mạng nơ ron là nucles làm nhiệm vụ tổng hợp thông tin từ dendrites, sau đó lan truyền thông tin qua các axon và sau cùng thông tin output được truyền ra ở axon terminals.

Kiến trúc mạng thần kinh nơ ron là khởi nguồn thiết kế cho kiến trúc mạng nơ ron.

## 1.2. Kiến trúc của mạng nơ ron

![](https://machinelearningcoban.com/assets/14_mlp/multi_layers.png)

Các tín hiệu đầu vào được truyền vào Input layer, mỗi một node hình tròn được gọi là unit và được coi như biến đầu vào.

Sau đó dữ liệu tiếp tục được truyền qua các hidden layers để biến đổi thông tin và đưa ra quyết định ở output layer.

Với một mạng nơ ron chúng ta có thể thiết kế bao nhiêu hidden layers tùy ý và số lượng các unit ở mỗi layer cũng được thay đổi tùy ý.

## 1.3 Activation function

Từ hình vẽ ta có thể thấy, mỗi một unit ở một hidden layer sẽ được kết nối toàn bộ tới những thông tin ở layer trước đó. Các liên kết này là tổ hợp tuyến tính:

![](https://machinelearningcoban.com/assets/14_mlp/mlp_notation.png)

Ví dụ giả sử đầu vào là các unit $a_i^{(l-1)}$ của layer trước (layer thứ $l-1$). Giá trị của layer $l$ sẽ là:

$$\begin{eqnarray}
z_j & = & b_0 + w_1*a_1^{(l-1)} + \dots + w_n*a_n^{(l-1)} \\
 & = & b_0 + {\mathbf{w}_{j}^{(l)}}^\intercal{}\mathbf{a}^{(l-1)}
\end{eqnarray}$$

Như vậy với một mạng nơ ron chúng ta có thể tạo ra vô số các features dựa vào những biến đổi tuyến tính ngẫu nhiên.

Tuy nhiên nếu **chỉ áp dụng** các biến đổi tuyến tính thì kết quả cuối cùng sẽ đơn thuần là một phương trình tuyến tính của những input.

Lúc này Activation sẽ đóng vai trò như các hàm biến đổi phi tuyến để thay đổi tính chất tuyến tính đơn thuần của dữ liệu. Vai trò của activation rất quan trọng đối với một mô hình mạng nơ ron, nó có tác dụng như một bộ _kích hoạt_ các thay đổi bên trong từ _tuyến tính_ sang _phi tuyến_ nên nó được gọi là activation function.


Các hàm activation chủ yếu.

![](https://dwaithe.github.io/images/activationFunctions.png)

## 1.4. Thực hành huấn luyện Model

Ngày nay, các mạng nơ ron được huấn luyện rất dễ dàng nhờ sự hỗ trợ của các framework deep learning cực mạnh. Chỉ một vài dòng code chúng ta có thể tạo và huấn luyện được một mạng nơ ron theo ý muốn. Các bước huấn luyện một mạng nơ ron sẽ như sau:

* Khởi tạo kiến trúc: Chúng ta sẽ phải khai báo đâu là input layer, hidden layers và output layer. Sắp xếp chồng lấn các layers này theo thứ tự để  output của layer trước là input cho layer sau.

* Khai báo loss function: Hàm loss function chính là mục tiêu để chúng ta tối thiểu hóa. Mô hình sẽ càng tốt nếu loss function của nó càng nhỏ. Loss function phổ biến đối với classification là `categorical_crossentropy` cho nhiều hơn 2 nhãn hoặc `binary_categorical_crossentropy` cho 2 nhãn. Hàm loss function là `MSE` được áp dungj cho các bài toán prediction.

* Khai báo optimizer: Tối ưu loss function sẽ dựa trên phương pháp gradient descent. Có nhiều kỹ thuật khác nhau để cập nhật gradient descent và optimizer là việc chúng ta khai báo sử dụng phươn pháp cập nhật gradient descent nào với bộ dữ liệu của chúng ta.

* Huấn luyện mô hình: Chúng ta sẽ huấn luyện trên bao nhiêu lượt? Mỗi lượt với batch size là bao nhiêu? Tập train là gì và validation là gì? Chỉ số nào được tracking trong suốt quá trình huấn luyện mô hình ?

Bên dưới chúng ta sẽ lần lượt thực hiện các bước này để xây dựng mô hình classification trên bộ dữ liệu iris.



In [None]:
import tensorflow as tf
import pandas as pd
import os
from sklearn import datasets
from sklearn.model_selection import train_test_split

# Download dữ liệu
iris = datasets.load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.33, random_state=42)

In [None]:
# Khởi tạo kiến trúc
from tensorflow.keras.layers import Input, Dense, Activation
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.optimizers import Adam

inpt = Input(shape = (4))
hidden_1 = Dense(10)(inpt)
act1 = Activation('relu')(hidden_1)
hidden_2 = Dense(10)(act1)
act2 = Activation('relu')(hidden_2)
hidden_3 = Dense(3)(act2)
output = Activation('softmax')(hidden_3)
model = Model(inputs = [inpt], outputs = [output])
model.summary()

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_2 (InputLayer)         [(None, 4)]               0         
_________________________________________________________________
dense_3 (Dense)              (None, 10)                50        
_________________________________________________________________
activation_2 (Activation)    (None, 10)                0         
_________________________________________________________________
dense_4 (Dense)              (None, 10)                110       
_________________________________________________________________
activation_3 (Activation)    (None, 10)                0         
_________________________________________________________________
dense_5 (Dense)              (None, 3)                 33        
_________________________________________________________________
activation_4 (Activation)    (None, 3)                 0   

In [None]:
# Khai baos loss function vaf khowi taoj optimizer
opt = Adam()
model.compile(optimizer=opt, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [None]:
# Huaan luyen model
model.fit(X_train, y_train,
          validation_data = (X_test, y_test),
          epochs = 100,
          batch_size = 8)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<tensorflow.python.keras.callbacks.History at 0x7f8e058ab208>

# 2. Bài tập về nhà : 

Huấn luyện mô hình neural network đối với cuộc thi phân loại thu nhập Income Classification
