# **Tensorflow 簡介**
Tensorflow 是一個機器學習的開發平台，提供使用者實現 MLP, CNN, RNN 等等的深度學習演算法，以下會介紹 Tensorflow 達到深度學習演算法所需的基本概念。

## 本章節內容大綱
* ### [建構支援數值計算的高維度矩陣（Tensor, Multidimensional-array）](#Tensor,Multidimensional-array)
* ### [自動計算微分值（Automatic differentiation）](#AutomaticDifferentiation)
* ### [模型建置以及訓練（Model construction, training）](#ModelConstruction,training)

---

In [None]:
# 匯入套件
import tensorflow as tf
import numpy as np

<a name="Tensor,Multidimensional-array"></a>
## 建構支援數值計算的高維度矩陣（Tensor, Multidimensional-array）
Tensorflow 張量（Tensor），寫法與 numpy 陣列類似，也能任意從 scalar，list，或 ndarray 的型態轉換成 Tensor

In [None]:
a = tf.constant([1, 2, 3, 4, 5], dtype='float32')
print(a)

b = tf.constant(np.array([1, 2, 3, 4, 5]), dtype='float32')
print(b)

c = tf.convert_to_tensor([1, 2, 3, 4, 5], dtype='float32')
print(c)

In [None]:
# tf.Tensor -> ndarray
a.numpy()

* ### Tensor 性質

In [None]:
t = tf.random.normal((1, 2, 4))

print('數據類型：', t.dtype)   # 數據類型
print('形狀：', t.shape)       # 形狀
print('維度數：', t.ndim)      # 維度數

* ### Tensor 操作

* #### slice
從 Tensor 中選取部分內容

In [None]:
t = tf.constant([[0, 1, 2, 3, 4],
                 [5, 6, 7, 8, 9],
                 [10, 11, 12, 13, 14],
                 [15, 16, 17, 18, 19]])

print(t[1:3, 2:])
print(tf.slice(t, begin=[1, 2], size=[2, 3]))

In [None]:
t = tf.constant([[[1, 3, 5, 7],
                  [9, 11, 13, 15]],
                 [[17, 19, 21, 23],
                  [25, 27, 29, 31]]])

print(t[1:2, 1:2, 0:2])
print(tf.slice(t, begin=[1, 1, 0], size=[1, 1, 2]))

* #### gather
從 Tensor 中依據＂軸向＂（axis）以及＂索引＂（index）選取部分內容

In [None]:
t = tf.constant([0, 1, 2, 3, 4, 5, 6, 7])

print(tf.gather(t,
                indices=[0, 3, 6]))

In [None]:
t = tf.constant([[0, 5],
                 [1, 6],
                 [2, 7],
                 [3, 8],
                 [4, 9]])

print(tf.gather_nd(t,
                   indices=[[2], [3], [0]]))

In [None]:
t = tf.constant([[[0, 1, 2],
                  [3, 4, 5],
                  [6, 7, 8]],
                 [[9, 10, 11],
                  [12, 13, 14],
                  [15, 16, 17]]])

print(tf.gather_nd(t,
                   indices=[[0, 0], [0, 2], [1, 0], [1, 2]]))

* #### reshape
將 Tensor 改變成指定的形狀

In [None]:
t = [[1, 2, 3],
     [4, 5, 6]]
print(tf.reshape(t, shape=[6]))

In [None]:
t = [[1, 2, 3],
     [4, 5, 6]]

print(tf.reshape(t, shape=[3, 2]))

* #### expand_dims
增加 Tensor 維度

In [None]:
t = tf.random.normal((2, 2, 3))

print(tf.expand_dims(t, axis=0))

In [None]:
t = tf.random.normal(shape=(2, 2, 3))

print(tf.expand_dims(t, axis=-1))

* #### squeeze
壓縮 Tensor 維度

In [None]:
t = tf.random.normal((2, 2, 1))

print(tf.squeeze(t, axis=-1))

In [None]:
t = tf.random.normal((2, 1, 3, 1))

print(tf.squeeze(t, axis=[1, 3]))

* #### transpose
轉置 Tensor

In [None]:
t = [[1, 2, 3],
     [4, 5, 6]]

tf.transpose(t, perm=[1, 0])

* #### math
數學計算，包括加乘除

In [None]:
a = tf.constant([[1, 2],
                 [3, 4]])
b = tf.constant([[1, 1],
                 [1, 1]])

In [None]:
print(a + b, '\n')  # element-wise addition
print(a - b, '\n')  # element-wise subtraction
print(a * b, '\n')  # element-wise multiplication
print(a @ b, '\n')  # matrix multiplication

In [None]:
print(tf.add(a, b), "\n")       # element-wise addition
print(tf.subtract(a, b), '\n')  # element-wise subtraction
print(tf.multiply(a, b), "\n")  # element-wise multiplication
print(tf.matmul(a, b), "\n")    # matrix multiplication

In [None]:
c = tf.constant([[4.0, 5.0], [10.0, 1.0]])

# Find the largest value
print(tf.reduce_max(c))
# Compute the average value
print(tf.reduce_mean(c))
# Find the index of the largest value
print(tf.math.argmax(c))

-------------

Tensorflow 張量與 Numpy 陣列不同的是，又可分為兩種
* 無法指派新的值的型態 Tensor
* 可以指派新的值的型態 Variable

In [None]:
# numpy 陣列
a = np.ones((1, 2))
print(a)

In [None]:
# Numpy 陣列可接受指派新的值
a[0, 0] = 0
print(a)

In [None]:
# Tensorflow 張量
b = tf.ones((1, 2))
print(b)

In [None]:
# Tensorflow 張量不接受指派新的值（以下程式碼會發生錯誤）
b[0, 0] = 0
print(b)

In [None]:
# Tensorflow 僅能使用 Variable 指派新的值
v = tf.Variable(tf.ones((1, 2)))
print(v)

v.assign(tf.zeros((1, 2)))
print(v)

在類神經網絡中，可以訓練的變數都會以 Variable 的形式存在，才能更新數值。

------------------

<a name="AutomaticDifferentiation"></a>
## 自動計算微分值（Automatic Differentiation）
在深度學習演算法當中，很重要的部分就是如何做模型的更新，其中牽涉到對變數做偏微分。

>若此函數 $f(x) = x^2+3x-5$ 對 $x$ 做偏微分，則能得到 $f^\prime(x) = 2x+3$
>
>將 $x = 1$ 代入函數，得到 $f(x)=-1$，$f^\prime(x) = 5$


In [None]:
def f(x):
    y = x ** 2 + 3 * x - 5
    return y


x = tf.Variable(1.0)
f(x)

In [None]:
with tf.GradientTape() as tape:
    y = f(x)
g_x = tape.gradient(y, x)  # g(x) = f'(x) = dy/dx

g_x

<a name="ModelConstruction,training"></a>
## 模型建置以及訓練（Model Construction, Training）

![](https://i.imgur.com/56AmkSC.png)

* ### 適合新手：

以 tf.keras 的方式建構模型以及訓練模型，能夠更快速的完成整個機器學習過程，將會在 Part2，Part3 接續課程中介紹。
* ### 適合專家：

可以更客製化的建置模型、訓練過程等等，於 Part4 做介紹。（在本課程中將會列為選修內容）