# 8. TensorFlow 2.0 and Keras
* TensorFlow 2.0 có một số cải tiến thú vị, nó để eager execution mode làm default và sử dụng Keras làm API chính để xây dựng các model deep learning. Nó cũng tương thích ngược với các phiên bản TensorFlow 1.x.
  
## 8.1. Bonjour Keras 
* Keras là một thư viện dành cho deep learning rất phổ biến khác và dc phát triển tại Google. Nó nổi tiếng với việc xây dựng các model trở thành một công việc đơn giản.
* Để build một model trong Keras bao gồm bốn bước quan trọng:
  * Defining the model
  * Compiling the model
  * Fitting the model
  * Evaluating the model

### 8.1.1. Defining the model
* Keras cung cấp hai API khác nhau để define model:
  * The sequential API
  * The functional API

#### 8.1.1.1. Defining a sequential model
* Trong sequential model, chúng ta sẽ xếp chồng các layer lên nhau.

In [9]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

* Trước tiên, chúng ta cần xác định một `Sequential()` model như sau:

In [4]:
model = Sequential()

* Hãy định nghĩa cho layer đầu tiên như sau:

In [5]:
model.add(Dense(13, input_dim=7, activation='relu'))

* Trong đây, `13` là số neuron, `Dense` ngụ ý rằng một layer đã dc kết nối, `input_dim` có nghĩa là số chiều của input, và `activation` dùng để chỉ định cho activation function mà chúng ta cần sử dụng. Và bây giờ chúng ta cứ việc xếp chồng các layer lên nhau.
* Tiếp theo ta sẽ định nghĩa một layer tiếp theo.

In [6]:
model.add(Dense(7, activation='relu'))

* Bây giờ chúng ta sẽ định nghĩa cho output layer với sigmoid activation function.

In [7]:
model.add(Dense(1, activation='sigmoid'))

* Đây là toàn bộ quá trình của chúng ta:
  ```python
  model = Sequential()
  model.add(Dense(13, input_dim=7, activation='relu'))
  model.add(Dense(7, activation='relu'))
  model.add(Dense(1, activation='sigmoid'))
  ```

#### 8.1.1.2. Defining a functional model
* Functional model cung cấp tính linh hoạt hơn so với Sequential model. Ví dụ, trong functional model chúng ta có thể kết nối bất kì layer nào với một layer khác, trong khi ở sequential model thì các layer phải dc xếp chồng lên nhau.
* Functional model rất hữu ích khi ta xây dựng các model phức tạp, với nhiều giá trị đầu vào, nhiều giá trị đầu ra và nhiều shared layer. Bây giờ chúng ta sẽ xây dựng một functional model.
* Trước tiên chúng ta cần khai báo `Input()` object, nó đơn thuần là số chiều của data input

In [10]:
input = keras.Input(shape=(2,))

* Bây giờ chúng ta sẽ định nghĩa layer đầu tiên của chúng ta bao gồm 10 neuron và sử dụng relu activation function.

In [11]:
layer1 = Dense(10, activation='relu')

* ...
  * Chúng ta đã định nghĩa `layer1`, nhưng dữ liệu input cho layer này lấy vào từ đâu? Để chỉ định input cho layer, ta chỉnh code trên lại như code dưới đây:

In [12]:
layer1 = Dense(10, activation='relu')(input)

* Bây giờ chúng ta sẽ định nghịa cho layer tiếp theo là `layer2` bao gồm 10 neuron và cũng sử dụng hàm relu activation function. Và vì `input` đi vào `layer1` trc sau đó mới đi vào `layer2` nên ta phải thực hiện như sau:

In [13]:
layer2 = Dense(10, activation='relu')(layer1)

* Cuối cùng chúng ta sẽ định nghĩa cho `output` layer và sử dụng sigmoid activation function như sau:

In [14]:
output = Dense(1, activation='sigmoid')(layer2)

* Sau khi chúng ta đã xác định tất cả các layer, chúng ta cần định nghĩa một model bằng cách sử dụng class `Model`, ở đây chúng ta cần chỉ định cho hai tham số là `inputs` và `outputs` như sau:

In [15]:
model = keras.Model(inputs=input, outputs=output)

* Code hoàn chỉnh của functional model như sau:
  ```python
  input = Input(shape=(2,))
  layer1 = Dense(10, activation='relu')(input)
  layer2 = Dense(10, activation='relu')(layer1)
  output = Dense(1, activation='sigmoid')(layer2)
  model = Model(inputs=input, outputs=output)
  ```

### 8.1.2. Compiling the model
* Vừa rồi chúng ta đã xác định model, bước tiếp theo chúng ta cần biên dịch nó. Trong giai đoạn này, chúng ta sẽ thiết lập model sẽ học như thế nào. Chúng ta cần xác định ba tham số khi biên dịch model.
  * Tham số `optimizer`: dùng để định nghĩa thuật toán optimize cho model, ví dụ gradient descent.
  * Tham số `loss`: đầy là hàm mất mất mà chúng ta đang cố gắng minimize nó xuống, ví dụ mean squared error hoặc cross-entropy.
  * Tham số `metric`: đây là số liệu mà chúng ta muốn đánh giá hiệu suất của model, ví dụ accuracy. Chúng ta có thể chỉ định nhiều hơn một metric cho tham số này.
* Cuối cùng, để biên dịch model, hãy thử chạy code dưới đây: 

In [16]:
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['accuracy'])

### 8.1.3. Training the model
* Sau khi biên dịch model, bây giờ chúng ta cần training model. Training model có thể được thực hiện thông qua hàm `fit`. Chúng ta cần chỉ định các features `x` và labels `y`, số lượng `epochs` mà chúng ta cần train và `batch_size`, như sau:
  ```python
  model.fit(x=data, y=labels, epochs=100, batch_size=10)
  ```

### 8.1.4. Evaluating the model
* Sau khi training model, chúng ta cần đánh giá hiệu suất của model trên tập test data như sau:
  ```python
  model.evaluate(x=data_test, y=labels_test)
  ```
* Chúng ta cũng có thể đánh giá model trên tập train data, điều này giúp cho chúng ta hiểu rõ hơn về training accuracy:
  ```python
  model.evaluate(x=data, y=labels)
  ```

## 8.2. MNIST digit classification using TensorFlow 2.0
* Bây giờ, chúng ta đã có thể xây dựng bài toán phân loại chữ số viết tay MNIST bằng TensorFlow 2.0, nó chỉ có một vài dòng code khác biệt so với TensorFlow version 1.x.
* Bây giờ hãy load dataset MINIST lên:

In [18]:
mnist = keras.datasets.mnist

* Tạo ra tập train và test data:

In [20]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

* Normalize (chuẩn hóa) dữ liệu bằng cách chia cho giá trị lớn nhất, vì đây là ảnh grayscale nên giá trị lớn nhất là $255$.

In [21]:
x_train, x_test = tf.cast(x_train/255., tf.float32), tf.cast(x_test/255., tf.float32)
y_train, y_test = tf.cast(y_train, tf.int64), tf.cast(y_test, tf.int64)

* Định nghĩa sequential model như sau:

In [22]:
model = Sequential()

* Add các layer vào model, chúng ta sẽ sử dụng ba layer và sử dụng relu activation function ở tất cả các layer và riêng layer cuối ta sử dụng softmax activation function.

In [23]:
model.add(keras.layers.Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))

* Bây giờ biên dịch model như sau:

In [24]:
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

* Training model

In [25]:
model.fit(x_train, y_train, batch_size=32, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f9be69421d0>

* Đánh giá model

In [26]:
model.evaluate(x_test, y_test)



[0.302305895537138, 0.9151]