# Tensorflow

Tensorflow 為 Google 開發，採用資料流程圖，用於數值運算的開源深度學習框架。相較於其他深度學習框架，tensorflow 主要有高度靈活性、可攜性與多語言支援等特性。

* 高度靈活性: 使用者可以封裝自訂的上層函式庫，亦可以撰寫 C++ 程式來豐富底層操作。
* 可攜性: 可以在 CPU 與 GPU 裝置下混和調用來進行深度學習外，可以在不同的平台、雲端、容器或開發版(如 Raspberry Pi 等)等環境下執行。
* 多語言支援: Tensorflow 提供多種程式語言 API，包含 Python、C++、Java、GO 或 Javascript 等。


## Reference

* Official Website: https://www.tensorflow.org/
* Github: https://github.com/tensorflow

## NVidia Installation

Tensorflow 可以自動調用 NVIDIA 顯示卡 (GPU) 來加速深度學習，底下是必要安裝組件。GPU 可用於加速深度學習，不僅是減少訓練時間，在測試與佈署產品時都能有效提升效率，但並非為深度學習所必備，相關內容已有相當多的資源可以參考，但最有趣的還是一影片可以讓你了解 CPU 與 GPU 在圖像上的計算差異，參考網址 https://www.youtube.com/watch?v=-P28LKWTzrI 。

### 安裝組件

1. 於 NVIDIA 官網 (http://www.nvidia.com.tw/Download/index.aspx) 下載目前最新的驅動程式。
2. 下載並安裝 CUDA SDK (https://developer.nvidia.com/cuda-downloads)，CUDA 為 NVIDIA 提供的 SDK 可對顯示卡進行程式設計。
3. 下載並安裝 cuDNN (https://developer.nvidia.com/rdp/cudnn-archive)，cuDNN 為一使用 CUDA 的深度神經網路函式庫。
4. 設置底下環境變數

```shell
# windows example
setx PATH "C:\Program Files\NVIDIA Corporation\NVSMI;%PATH%"
setx PATH "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin;%PATH%"
setx PATH "C:\local\cudnn-9.0-v7.0\cuda\bin;%PATH%"
```

### 限制

* 顯卡限制: 需要注意 Tensorflow 有最低支援的顯示卡要求，需要 compute capability >= 3.0 的顯卡，可以至官網 https://developer.nvidia.com/cuda-gpus 查詢 (此限制與其他深度學習框架，如 CNTK 相同)。


## 安裝環境


### 安裝 Anaconda

Anaconda 為基於 Python 用於資料科學、機器學習等領域使用的 IDE，不僅提供如 jupyter notebook 線上互動開發環境、spyder 大量程式碼開發等環境，更已包含許多常用的工具 (如 pip) 與函式庫 (numpy, scipy) 等，相當適合想要進入人工智慧、資料科學等領域的人使用。可以至網頁 https://www.anaconda.com/download/ 下載安裝。

建議安裝 python 3.5 以上的環境，此環境可以與其他深度學習框架併用，如 CNTK 等。可以透過底下方式檢驗是否已安裝 anaconda，

```shell
# 於 CLI 下，輸入 python 或 pip --version 等
# 應出現如 Python 3.5.4 |Anaconda custom (64-bit) 或 pip 9.0.2 等資訊
$ python
$ pip --version
```

底下的操作皆以 Anaconda 及其相關工具作為主要 IDE 進行開發。

### 安裝其他建議套件

Tensorflow 會使用如 numpy, scipy, matplotlib, jupyter, scikit-image, librosa, nltk, keras, tflearn 或 pandas 等套件，需要確認是否皆已安裝，如下範例:

| package_name | description |
| -- | -- |
| numpy | 用來儲存與處理大型矩陣的科學計算套件 |
| scipy | 包含大量的數學工具包，如最佳化、線性代數、積分、訊號處理或圖像處理等 |
| matplotlib | 繪圖函式庫 |
| jupyter | Ipython 升級版，於瀏覽器中建立和共用程式，jupyter 本身便是一個 web 應用程式，使用 MQ 進行訊息管理 |
| scikit-image (skimage, imported name) | 圖像處理演算法，利於影像前處理 |
| librosa | 音訊特徵分析 |
| nltk | 自然語言處理工作包 |
| keras | tensorflow 中高階封裝的架構，利於快速建立模型 |
| tflearn | 另一 tensorflow 中高階封裝的架構，利於快速建立模型 |
| pandas | 提供高效資料結構與資料分析的函式庫 |

可以透過指令 `pip list` 來確認是否有安裝上述函式庫，若無可以透過 `pip install <package> --upgrade` 指令來安裝。

### [Optional] 準備沙盒環境

安裝 tensorflow 前，可以先透過 `virtualenv` 來建立獨立運行的 python 執行環境，之後可在沙盒裡建立 tensorflow，並可以依需求預設許多執行環境設定 (如同環境變數)，之後可以簡易透過不同沙盒來達成轉換執行環境，且可以確保不會影響外部 python 環境。

可以先透過 pip 安裝 virtualenv，

```shell
$ pip install virtualenv --upgrade
```

可以於想要的位置建立沙盒環境，

```shell
$ cd ~
$ virtualenv --system-site-package ~/tensorflow
```

可以進入該目錄，並啟動沙盒，

```shell
$ cd ~/tensorflow
$ source bin/activate
```

之後便可以接續底下的 tensorflow 安裝，**需要注意的是此步驟並非絕對需要**，視個人狀況而定。另外亦須注意，**若將 tensorflow 建立於沙盒中，則之後每次啟動皆須先啟動沙盒**。

### 安裝 Tensorflow

可以參考網頁 https://www.tensorflow.org/install/ 來下載並安裝 tensorflow，須注意底下安裝為針對伺服器、筆記型電腦、桌上型電腦等安裝方法，CPU 架構屬於 x86_64, amd64 等硬體，而若屬於開發版如 ARM 架構等硬體，需從 Source Code 進行編譯與安裝，若甚至於下載非官方優化的 tensorflow 套件來安裝等。Tensorflow 與其他深度學習的框架相同，可分成 CPU 與 GPU 兩種函式庫，此須視硬體規格來決定，而 GPU 版則可以透過如 `tf.device("/cpu:0")` 方式來切換使用 CPU 進行訓練。

此外，若有需要安裝其他語言的 tensorflow 函式庫，如 Java (https://www.tensorflow.org/install/install_java)、Go (https://www.tensorflow.org/install/install_go) 等亦須參考其他網址來安裝。

* [Optional] 創建 Python 3.x 的環境

可以直接下載 python 3.5.x 的 anaconda 來安裝，或是直接下載原生 python 3.5.x 來安裝皆可使用。

```shell
# create a python 3.5 environment
$ conda create -n tensorflow python=3.5
```

* 安裝 CPU 版本的核心函式庫

可以透過 `conda` 或 `pip` 來安裝，安裝方式分別如下:

```shell
# install the tensorflow over conda
$ conda install -c conda-forge tensorflow

# install the tensorflow over pip
$ pip install tensorflow
```

* 安裝 GPU 版本的核心函式庫，需要先安裝 CUDA SDK 與 cuDNN 套件

```shell
$ pip install tensorflow-gpu
```

### 更新 Tensorflow

可以透過底下指令更新 tensorflow 函式庫

```shell
# CPU 版本
$ pip install --ignore-installed --upgrade tensorflow 

# GPU 版本
$ pip install --ignore-installed --upgrade tensorflow-gpu 
```

## 安裝於其他環境

### 安裝於 Java (透過 JDK 方式使用 Tensorflow)

#### 安裝於 Linux 或 MacOS

* 下載 **libtensorflow.jar** (https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow-1.7.0.jar)。
* 依需求下載 CPU 或 GPU 版本之 Java Native Interface (JNI)，如下以 CPU 為範例：

```shell
TF_TYPE="cpu" # Default processor is CPU. If you want GPU, set to "gpu"
OS=$(uname -s | tr '[:upper:]' '[:lower:]')
mkdir -p ./jni
curl -L \
    "https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow_jni-${TF_TYPE}-${OS}-x86_64-1.7.0.tar.gz" |
    tar -xz -C ./jni
```

#### 安裝於 Windows

* 下載 **libtensorflow.jar** (https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow-1.7.0.jar)。
* 下載 Java Native Interface (JNI): https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow_jni-cpu-windows-x86_64-1.7.0.zip ，並解壓縮出 `.jni`檔案。

#### 驗證是否安裝成功

* 將下列內容存成 `HelloTF.java` 檔案

```java
import org.tensorflow.Graph;
import org.tensorflow.Session;
import org.tensorflow.Tensor;
import org.tensorflow.TensorFlow;

public class HelloTF {
  public static void main(String[] args) throws Exception {
    try (Graph g = new Graph()) {
      final String value = "Hello from " + TensorFlow.version();

      // Construct the computation graph with a single operation, a constant
      // named "MyConst" with a value "value".
      try (Tensor t = Tensor.create(value.getBytes("UTF-8"))) {
        // The Java API doesn't yet include convenience functions for adding operations.
        g.opBuilder("Const", "MyConst").setAttr("dtype", t.dataType()).setAttr("value", t).build();
      }

      // Execute the "MyConst" operation in a Session.
      try (Session s = new Session(g);
           Tensor output = s.runner().fetch("MyConst").run().get(0)) {
        System.out.println(new String(output.bytesValue(), "UTF-8"));
      }
    }
  }
}
```

* 編譯此檔案

```shell
javac -cp libtensorflow-1.7.0.jar HelloTF.java
```

* 執行此編譯後檔案

```shell
# linux/macOS
java -cp libtensorflow-1.7.0.jar:. -Djava.library.path=./jni HelloTF

# windows
# notice the jni represents the file path of tensorflow_jni.dll
# java -cp libtensorflow-1.7.0.jar;. -Djava.library.path=jni HelloTF
cd /path/to/jni
java -cp libtensorflow-1.7.0.jar;. -Djava.library.path=.\ HelloTF
```


## Tensorflow 快速導覽

### 驗證 Tensorflow 安裝與版本

In [1]:
import tensorflow as tf
print(tf.__version__)

1.7.0


### 偵測 CPU/GPU

In [3]:
# check supported devices
from tensorflow.python.client import device_lib
device_lib.list_local_devices()

[name: "/device:CPU:0"
 device_type: "CPU"
 memory_limit: 268435456
 locality {
 }
 incarnation: 3003868865581207446]

### 第一個簡單範例

In [4]:
hello = tf.constant('Hello, Tensorflow!')
sess = tf.Session()
print(sess.run(hello))

b'Hello, Tensorflow!'


## Tensorflow 快速導覽

底下為建立資料集 iris 的深度學習分類器的範例。

### 資料內容

第一列為 (總筆數),(資料特徵維度),(類別0:setosa),(類別1:versicolor),(類別2:virginica)

第二列後 (sepal length),(sepal width),(petal length),(petal width),species (label)

* 訓練資料集

```text
120,4,setosa,versicolor,virginica
6.4,2.8,5.6,2.2,2
5.0,2.3,3.3,1.0,1
4.9,2.5,4.5,1.7,2
4.9,3.1,1.5,0.1,0
5.7,3.8,1.7,0.3,0
4.4,3.2,1.3,0.2,0
5.4,3.4,1.5,0.4,0
```

* 測試資料集

```text
30,4,setosa,versicolor,virginica
5.9,3.0,4.2,1.5,1
6.9,3.1,5.4,2.1,2
5.1,3.3,1.7,0.5,0
6.0,3.4,4.5,1.6,1
5.5,2.5,4.0,1.3,1
6.2,2.9,4.3,1.3,1
5.5,4.2,1.4,0.2,0
6.3,2.8,5.1,1.5,2
5.6,3.0,4.1,1.3,1
```

### 資料準備

In [6]:
import pandas as pd
import tensorflow as tf

TRAIN_URL = "http://download.tensorflow.org/data/iris_training.csv"
TEST_URL = "http://download.tensorflow.org/data/iris_test.csv"

CSV_COLUMN_NAMES = ['SepalLength', 'SepalWidth',
                    'PetalLength', 'PetalWidth', 'Species']
SPECIES = ['Setosa', 'Versicolor', 'Virginica']

def maybe_download():
    train_path = tf.keras.utils.get_file(TRAIN_URL.split('/')[-1], TRAIN_URL)
    test_path = tf.keras.utils.get_file(TEST_URL.split('/')[-1], TEST_URL)

    return train_path, test_path

def load_data(y_name='Species'):
    """Returns the iris dataset as (train_x, train_y), (test_x, test_y)."""
    train_path, test_path = maybe_download()

    train = pd.read_csv(train_path, names=CSV_COLUMN_NAMES, header=0)
    train_x, train_y = train, train.pop(y_name)

    test = pd.read_csv(test_path, names=CSV_COLUMN_NAMES, header=0)
    test_x, test_y = test, test.pop(y_name)

    return (train_x, train_y), (test_x, test_y)


def train_input_fn(features, labels, batch_size):
    """An input function for training"""
    # Convert the inputs to a Dataset.
    dataset = tf.data.Dataset.from_tensor_slices((dict(features), labels))

    # Shuffle, repeat, and batch the examples.
    dataset = dataset.shuffle(1000).repeat().batch(batch_size)

    # Return the dataset.
    return dataset


def eval_input_fn(features, labels, batch_size):
    """An input function for evaluation or prediction"""
    features=dict(features)
    if labels is None:
        # No labels, use only features.
        inputs = features
    else:
        inputs = (features, labels)

    # Convert the inputs to a Dataset.
    dataset = tf.data.Dataset.from_tensor_slices(inputs)

    # Batch the examples
    assert batch_size is not None, "batch_size must not be None"
    dataset = dataset.batch(batch_size)

    # Return the dataset.
    return dataset


# The remainder of this file contains a simple example of a csv parser,
#     implemented using a the `Dataset` class.

# `tf.parse_csv` sets the types of the outputs to match the examples given in
#     the `record_defaults` argument.
CSV_TYPES = [[0.0], [0.0], [0.0], [0.0], [0]]

def _parse_line(line):
    # Decode the line into its fields
    fields = tf.decode_csv(line, record_defaults=CSV_TYPES)

    # Pack the result into a dictionary
    features = dict(zip(CSV_COLUMN_NAMES, fields))

    # Separate the label from the features
    label = features.pop('Species')

    return features, label


def csv_input_fn(csv_path, batch_size):
    # Create a dataset containing the text lines.
    dataset = tf.data.TextLineDataset(csv_path).skip(1)

    # Parse each line.
    dataset = dataset.map(_parse_line)

    # Shuffle, repeat, and batch the examples.
    dataset = dataset.shuffle(1000).repeat().batch(batch_size)

    # Return the dataset.
    return dataset

### Tensorflow 模型

建立一個 DNN 網路由 4 層組成，第 1 層為輸入層，第 2 與 3 層為隱藏層，第 4 層為輸出層，隱藏層各有 10 節點，輸出層輸出 3 個類別，分別代表 setosa, versicolor, virginica。每次用 100 `batch_size` 資料來做訓練，共進行 1000 次循環 (epochs, `train_steps`)。透過 `train` 函式對子資料進行訓練，透過 evaluate 函式對測試資料進行驗證。產生 3 筆各 4 維特徵的資料，並透過剛訓練的分類器進行預測。

In [11]:
"""An Example of a DNNClassifier for the Iris dataset."""
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import argparse
import tensorflow as tf

# save the above code into the file
# and put it on the same directory with this notebook
import iris_data

parser = argparse.ArgumentParser()
parser.add_argument('--batch_size', default=100, type=int, help='batch size')
parser.add_argument('--train_steps', default=1000, type=int, help='number of training steps')

def main(argv):
    args = parser.parse_args(argv[1:])

    # Fetch the data
    (train_x, train_y), (test_x, test_y) = iris_data.load_data()

    # Feature columns describe how to use the input.
    my_feature_columns = []
    for key in train_x.keys():
        my_feature_columns.append(tf.feature_column.numeric_column(key=key))

    # Build 2 hidden layer DNN with 10, 10 units respectively.
    classifier = tf.estimator.DNNClassifier(
        feature_columns=my_feature_columns,
        # Two hidden layers of 10 nodes each.
        hidden_units=[10, 10],
        # The model must choose between 3 classes.
        n_classes=3)

    # Train the Model.
    classifier.train(
        input_fn=lambda:iris_data.train_input_fn(train_x, train_y, args.batch_size),
        steps=args.train_steps)

    # Evaluate the model.
    eval_result = classifier.evaluate(
        input_fn=lambda:iris_data.eval_input_fn(test_x, test_y, args.batch_size))

    print('\nTest set accuracy: {accuracy:0.3f}\n'.format(**eval_result))

    # Generate predictions from the model
    expected = ['Setosa', 'Versicolor', 'Virginica']
    predict_x = {
        'SepalLength': [5.1, 5.9, 6.9],
        'SepalWidth': [3.3, 3.0, 3.1],
        'PetalLength': [1.7, 4.2, 5.4],
        'PetalWidth': [0.5, 1.5, 2.1],
    }

    predictions = classifier.predict(
        input_fn=lambda:iris_data.eval_input_fn(predict_x,
                                                labels=None,
                                                batch_size=args.batch_size))

    template = ('\nPrediction is "{}" ({:.1f}%), expected "{}"')

    for pred_dict, expec in zip(predictions, expected):
        class_id = pred_dict['class_ids'][0]
        probability = pred_dict['probabilities'][class_id]

        print(template.format(iris_data.SPECIES[class_id], 100 * probability, expec))

# run the code        
main([])

INFO:tensorflow:Using default config.
INFO:tensorflow:Using config: {'_session_config': None, '_keep_checkpoint_max': 5, '_is_chief': True, '_save_checkpoints_secs': 600, '_task_id': 0, '_save_checkpoints_steps': None, '_model_dir': 'C:\\Users\\ACER47~1\\AppData\\Local\\Temp\\tmpi90xy9wu', '_num_ps_replicas': 0, '_keep_checkpoint_every_n_hours': 10000, '_save_summary_steps': 100, '_tf_random_seed': None, '_service': None, '_evaluation_master': '', '_master': '', '_num_worker_replicas': 1, '_task_type': 'worker', '_cluster_spec': <tensorflow.python.training.server_lib.ClusterSpec object at 0x0000021A1F5EFE48>, '_global_id_in_cluster': 0, '_log_step_count_steps': 100}
INFO:tensorflow:Calling model_fn.
INFO:tensorflow:Done calling model_fn.
INFO:tensorflow:Create CheckpointSaverHook.
INFO:tensorflow:Graph was finalized.
INFO:tensorflow:Running local_init_op.
INFO:tensorflow:Done running local_init_op.
INFO:tensorflow:Saving checkpoints for 1 into C:\Users\ACER47~1\AppData\Local\Temp\tmpi9