# 1. What is TensorFlow? [TensorFlow là gì?]
###### Cài đặt TensorFlow
* Trong chương này sẽ sử dụng **TensorFlow** version `1.13.1`, yêu cầu với version này là **Python** chạy version `3.6.8`.
* Cài đặt Python bản `3.6.8` trên Anaconda và nhập lệnh sau:
  ```
  # terminal
  conda create -n python3.6 python=3.6.8 anaconda
  
  # activate python3.6 env
  conda activate python3.6

  # install pip package
  conda install pip

  # install tensorflow package
  pip install tensorflow==1.13.1
  ```
* Có thể xem chi tiết hơn [tại đây](https://uoa-eresearch.github.io/eresearch-cookbook/recipe/2014/11/20/conda/).

###### Vài dòng code với TensorFlow
* Kiểm tra `tensorflow` có dc cài đặt thành công hay ko.

In [1]:
import tensorflow as tf

hello = tf.constant("Hello TensorFlow!")
sess = tf.Session()

print(sess.run(hello))

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


b'Hello TensorFlow!'


# 2. Understanding computational graphs and sessions [Hiểu về Computational Graph và Session]
* **Computational Graph** hay còn dc hiểu là **biểu đổ tính toán**.
* Mọi phép tính trong TensorFlow dc biểu thị bằng một computational graph, chúng gồm một số node và edge. Trong đó edge là các operation chẳng hạn như cộng trừ nhân chia, còn các cạnh là các tensor.
* Một tensor là một mảng nhiều chiều.
* Một computational graph bao gồm vài phép toán trên TensorFlow, dc sắp xếp trong một đồ thị của các node.
* Chúng ta có thể trực quan hóa computational graph bằng **TensorBoard**.
* Hãy xem xét phép tính cộng đơn giản dưới đây.

In [2]:
import tensorflow as tf

x = 2
y = 3
z = tf.add(x, y, name='Add')

* Lúc này đồ thị tính toán của đoạn code trên sẽ dc trực quan hóa như thế này:<br>
  ![](./images/02.00.png)

<hr>

* Một computation graph rất hữu ích để chúng ta hiểu dc kiến trúc của network, nhất là đối vs các neural network phức tạp. Ví dụ, hãy xem xét layer sau:
  $$h = Relu(\mathbf{WX} + \mathbf{b})$$
  * Computation graph của công thức trên như sau:<br>
    ![](./images/02.01.png)

<hr>

* Có hai loại phụ thuộc trong một computational graph là:
  * **Direct dependency** [phụ thuộc trực tiếp]: Giả sử ta có một node `b` và node này phụ thuộc vào kết quả đầu ra của node `a`, thì đây chính là direct dependency.
    ```python
    a = tf.multiply(8, 5)
    b = tf.multiply(a, 1)
    ```
  * **Indirect dependency** [phụ thuốc gián tiếp]: Khi việc tính toán một node `b` nào đó ko phụ thuộc vào đầu ra của node `a`.
    ```python
    a = tf.multiply(8, 5)
    b = tf.multiply(4, 3)
    ```

<hr>

* Bất cứ khi nào chúng ta import thư viện TensorFlow, thì một **defaul graph** [biểu đồ mặc định] sẽ dc khởi tạo tự động ngay lập tức và tất cả các node mà ta tạo ra sẽ liên kết trực tiếp đến default graph này.
* Chúng ta cũng có thể tự tạo cho mình một graph bằng các sử dụng `tf.Graph()`, dưới đây là code demo:
  ```python
  graph = tf.Graph()

  with graph.as_default():
      z = tf.add(x, y, name='Add')
  ```
* Nếu chúng ta muốn xóa default graph (nghĩa là muốn xóa các biến và các phép tính đã dc định nghĩa trc đó) thì có thể sử dụng code sau để làm điều này:
  ```python
  tf.reset_default_graph()
  ```

## 2.1. Sessions
* Để thực thi một computation graph với các phép tính trên các node và các tensor của nó, lúc này chúng ta sẽ sử dụng **TensorFlow Session** để làm điều này.
* Một TensorFlow session có thể dc tạo ra bằng dòng lệnh `tf.Session()` và nó dc cấp phát bộ nhớ và lưu vào một biến, ví dụ:
  ```python
  sess = tf.Session()
  ```
* Sau khi tạo một sessin, chúng ta có thể thưc thi graph bằng phương thức `sess.run()`.
* Mọi phép tính trong TensorFlow dc biểu diễn bằng một computational graph vậy nên chúng ta phải chạy (`run()`) các computational graph này khi chúng ta thực hiện các phép tính. Nói chung, khi chúng ta muốn tính toán bất kì thứ gì trên TensorFlow, chúng ta cần phải tạo ra một TensorFlow session.
* Dưới đây là đoạn code dùng để nhân hai số:

In [3]:
a = tf.multiply(3, 3)

print(a)

Tensor("Mul:0", shape=(), dtype=int32)


* ...
  * Thay vì in ra:
    > 9
    
    đoạn code trên in ra một TensorFlow object:
    > Tensor("Mul:0", shape=(), dtype=int32)
    
* Như đã đề cập trc đây, bất cứ khi nào chúng ta import thư viện TenforFlow, một default graph sẽ dc tự động tạo ra và tất cả các node sẽ được liên kết đến default graph này. Vậy nên khi chúng ta dùng lệnh:
  ```python
  print(a)
  ```
  thì nó sẽ chỉ trả về một TensorFlow object vì lúc này giá trị của `a` vẫn chưa dc tính toán, vì computational graph vẫn chưa dc thực thi, tức `run()`.
* Để thực thi một graph, chúng ta cần phải `run()` TensorFlow session như sau:

In [4]:
a = tf.multiply(3, 3)

with tf.Session() as sess:
    print(sess.run(a))

9


* ...
  * Lúc này kết quả đã in ra đúng như những gì chúng ta mong đợi.
    > 9

# 3. Variables, constants, and placeholders
* **Variable**, **constant** và **placeholder** là  các yếu tố cơ bản của TensorFlow. Tuy nhiên, luôn có sự nhầm lẫn giữa ba yếu tố này. Bây giờ hãy xem xét từng yếu tố và tìm hiểu sự khác biệt giữa chúng.

## 3.1. Variables
* Variable là các vùng chứa để lưu các giá trị. Các variable dc sử dụng làm đầu vào input cho các phép tính trên computational graph.
* Một variable có thể dc tạo ra bằng đoạn code dưới đây:

In [5]:
x = tf.Variable(13)

Instructions for updating:
Colocations handled automatically by placer.


* Hãy tạo ra một biến `W` bằng `tf.Variable()` như sau:

In [6]:
W = tf.Variable(tf.random_normal([500, 111], stddev=0.35), name='weights')

* ...
  * Đoạn code trên dc dùng để tạo ra biến `W` bằng cách lấy ngẫu nhiên các giá trị từ phân phối chuẩn với độ lệch chuẩn là $0.35$.
  * Tham số `name` được sử dụng để định danh cho variable trong computational graph. Với đoạn code trên, Python lưu variable `W` của chúng ta bên trong TensorFlow graph với tên định danh là `weights`.

<hr>

* Chúng ta có thể khởi tạo một variable mới với giá trị từ một biến khác bằng cách sử dụng `initialized_value()`. Ví dụ, nếu chúng ta muốn tạo ra một variable mới có định danh là `weights_2`, chúng ta có thể sử dụng variable dc định danh là `weights` từ trc như sau:

In [7]:
W2 = tf.Variable(W.initialized_value(), name='weights_2')

<hr>

* Đôi khi chúng ta muốn tạo ra một variable mà nó bao gồm tất cả các variable trong đã có trong computational graph, thì có thể sử dụng ` tf.global_variables_initializer()`.
* Khi chúng ta tạo ra một session. Trước tiên chúng ta cần chạy tất cả các variable đã dc định nghĩa trong computational graph trước, sau đó chúng ta mới có thể chạy các phép tính khác, như sau:

In [8]:
x = tf.Variable(1212)
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    print(sess.run(x))

1212


<hr>

* Chúng ta cũng có thể tạo một TensorFlow variable bằng cách sử dụng `tf.get_variable()` bao gồm ba tham số quan trọng là `name`, `shape` và `initializer`.
* Không giống như `tf.Variable()`, chúng ta phải truyền giá trị thông qua tham số `initializer`. Có một số `initializer` phổ biến dùng để khởi tạo các giá trị. Ví dụ `tf.constant_initializer(<value>)` - khởi tạo variable với giá trị ko đổi và `tf.random_normal_initializer(<mean>, <stddev>)` - khởi tạo variable bằng cách lấy ngẫu nhiên các giá trị từ phân phối chuẩn với giá trị trung bình `<mean>` và độ lệch chuẩn `<stddev>` được chỉ định.
* Khi một variable được tạo ra bằng `tf.Variable(0)`, tức lúc này một variable mới dc tạo ra. Nhưng nếu một variable dc tạo ra bằng `tf.get_variable()` nó sẽ kiểm tra computational graph đã tồn tại variable đó thông qua định dạnh `name` chưa, nếu chưa thì nó sẽ tạo ra variable mới với định danh này, còn nếu đã tồn tại rồi, thì nó sẽ sử dụng lại.

In [9]:
W3 = tf.get_variable(name='weights', shape=[500, 111], initializer=tf.random_normal_initializer())

<hr>

* Bởi vì `tf.get_variable()` có thể sử dụng lại các biến đã định nghĩa trc đây. Nhưng có một vấn đề xảy ra là bị **xung đột** về định danh, và để tránh vấn đề này chúng ta sử dụng `tf.variable_scope()` như code dưới đây

In [10]:
with tf.variable_scope('scope'):
    a = tf.get_variable('x', [2])
    print(a)
    
with tf.variable_scope('scope', reuse=True): # lưu ý tham số `reuse`
    b = tf.get_variable('x', [2])
    print(b)

<tf.Variable 'scope/x:0' shape=(2,) dtype=float32_ref>
<tf.Variable 'scope/x:0' shape=(2,) dtype=float32_ref>


In [11]:
print(a.name)
print(b.name)

scope/x:0
scope/x:0


* ...
  * Bạn có thể thấy rằng khi chạy các dòng code trên khi ta sử dụng tham số `reuse` thì các biến này chia sẻ chung vùng nhớ với nhau.

## 3.2. Constant
* Các constant ko giống như các variable, ko thể thay đổi giá trị của chúng, chúng bất biến.
* Chúng ta có thể tạo ra một constant bằng `tf.constant()` như đoạn mã dưới đây:
  ```python
  x = tf.constant(13)
  ```

## 3.3. Placeholder and feed dictionaries
* Chúng ta có thể hình dung placeholder như variable vậy, nơi chúng ta chỉ định kiểu dữ liệu và số chiều nhưng ko cung cấp giá trị cho nó. Chúng ta cung cấp dữ liệu cho computational graph bằng cách sử dụng placeholder. Nói chung placeholde ko có giá trị.
* Một placeholder có thể dc xác định bằng `tf.placeholder()`. Nó nhận vào một tham số là `shape` và tham số này dùng để chỉ định số chiều của dữ liệu. Nếu `shape` là `None` thì chúng ta có thể cung cấp dữ liệu cho computational graph ở bất kì kích thước nào.
* Một placeholder có thể dc định nghĩa như sau:
  ```python
  x = tf.placeholder('float', shape=None)
  ```
* Hãy thử một ví dụ sau:

```python
x = tf.placeholder('float', None)
y = x + 3

with tf.Session() as sess:
    result = sess.run(y)
    print(result)
```

* ...
  * Đoạn code trên nếu biên dịch sẽ bị lỗi vì chúng ta đang cố tính toán cho biến `y` trong khi trong khi `x` là placeholder và nó ko có giá trị.
* Chúng ta nên lưu ý placeholder chỉ dc chỉ định giá trị trong lúc chạy.
* Chúng ta có thể gán giá trị cho placeholder bằng tham số `feed_dict`, tham số này là một từ điển trong đó key đại diện cho tên của placeholder và value đại diện cho giá trị của placeholder.
* Đoạn code phía trên có thể chỉnh sửa lại như dưới đây để ko bị lỗi:

In [12]:
x = tf.placeholder('float', None)
y = x + 3

with tf.Session() as sess:
    result = sess.run(y, feed_dict={x:5})
    print(result)

8.0


* Vậy điều gì sẽ xảy ra nếu ta khai báo `x` bao gồm nhiều giá trị. Hãy nhớ placeholder có một tham số là `shape` và nếu ta chỉ định nó là `None` thì lúc này ta có thể chỉ định `feed_dict` là bất kì giá trị nào, như đoạn code dưới đây:

In [13]:
x = tf.placeholder('float', None)
y = x + 3

with tf.Session() as sess:
    result = sess.run(y, feed_dict={x:[3, 6, 9]})
    print(result)

[ 6.  9. 12.]


<hr>

* Bây giờ chạy code sau:

In [14]:
x = tf.placeholder('float', [None, 2]) # chú ý ngay đây
y = x + 3

with tf.Session() as sess:
    x_val = [[1, 2], [3, 4], [5, 6], [7, 8]]
    result = sess.run(y, feed_dict={x: x_val})
    print(result)

[[ 4.  5.]
 [ 6.  7.]
 [ 8.  9.]
 [10. 11.]]


* ...
  * Lúc này ta định nghĩa `x` có `shape` là một ma trận mà ko có số dòng dc chỉ định nhưng phải có chính xác 2 cột.

# 4. Introducing TensorBoard
* Bây giờ chúng ta sẽ xây dựng một computational graph cơ bản và visualize nó trên TensorBoard, hãy thử đoạn code dưới đây:

In [15]:
tf.reset_default_graph() # clear default 

x = tf.constant(1, name='x')
y = tf.constant(2, name='y')
a = tf.constant(3, name='a')
b = tf.constant(3, name='b')

* Bây giờ ta sẽ nhân `x` cho `y`, `a` cho `b` và lần lượt lưu chúng vào hai biến là `prod1` và `prod2`, như sau:

In [16]:
prod1 = tf.multiply(x, y, name='prod1')
prod2 = tf.multiply(a, b, name='prod2')

* Bây giờ ta cộng `prod1` và `prod2` lại với nhau và lưu vào biến `sum`:

In [17]:
sum = tf.add(prod1, prod2, name='sum')

* Bây giờ chúng ta sẽ visualize cái đồng này lên TensorBoard bằng cách sử dụng `tf.summary.FileWriter()`, hàm này nhận vào hai tham số là `logdir` - đường dẫn nơi muốn lưu graph lại và `graph` - graph mà ta cần visualize, hãy thử code dưới đây:

In [18]:
with tf.Session() as sess:
    writer = tf.summary.FileWriter(logdir="./graphs/02_00", graph=sess.graph)
    print(sess.run(sum))

11


* Để chạy TensorBoard, mở terminal lên và đi đến thư mục làm việc (tại đây là _Chapter 02. Getting to Know TensorFlow_), ghõ lệnh sau:
  ```shell
  tensorboard --logdir=graphs/02_00 --port=8000
  ```
  * Ở đây tham số `--logdir` là thư mực chứa file dùng để vẽ, `--port` là cổng.
* Tiếp theo, ta mở trình duyệt và đi đến URL: [http://localhost:8000/](http://localhost:8000/).
  ![](images/02.02.png)
* Dưới đây là hình cắt ra của computational graph:
  ![](./images/02.03.png)

## 4.1. Creating a name scope [Tạo phạm vi tên]
* Scope thường dc sử dụng để giảm độ phức tạp và giúp chúng ta hiểu rõ hơn về một model bằng cách **nhóm** các node liên quan lại với nhau. Việc đặt một **scope name** giúp chúng ta nhóm các phép tính tương tự trong một graph. Nó rất hữu ích khi chúng ta xây dựng một cấu trúc mạng phức tạp.
* Scope có thể dc tạo ra bằng `tf.name_scope()`. Trong đoạn code trc, chúng ta thực hiện hai phép tính là multiply và một phép tính add. Bây giờ chúng ta sẽ tạo ra một scope là `Product` dùng để khoanh vùng hai phép multiply và `sum` để khoanh vùng cho phép tính add, theo dõi code dưới đây:

In [19]:
tf.reset_default_graph() # clear default 

x = tf.constant(1, name='x')
y = tf.constant(2, name='y')
a = tf.constant(3, name='a')
b = tf.constant(3, name='b')

In [20]:
with tf.name_scope("Product"):
    with tf.name_scope('prod1'):
        prod1 = tf.multiply(x, y, name='prod1')
    
    with tf.name_scope('prod2'):
        prod2 = tf.multiply(a, b, name='prod2')

In [21]:
with tf.name_scope('sum'):
    sum = tf.add(prod1, prod2, name='sum')

In [22]:
with tf.Session() as sess:
    writer = tf.summary.FileWriter("./graphs/02_01", sess.graph)
    print(sess.run(sum))

11


* Trực quan hóa lên bằng lệnh dưới đây trong thư mục _Chapter 02. Getting to Know TensorFlow_:
  ```shell
  tensorboard --logdir=graphs/02_01 --port=8000
  ```
  ![](./images/02.04.gif)
  ![](./images/02.05.png)