# Using Slim to define your models

在開始之前，我先介紹一下 Slim。  
他是 Tensorflow 眾多 wrapper 的一個。  
在安裝 Tensorflow 的時候就已經內建。非常好用。  
早期沒有 wrapper 的時候，我還得自己寫 Xavier initializer  
還有每層的 w, b 也都要寫。相當繁複。
有了 slim ，少下的功夫不知道有多少... QQ  
另外，slim 回傳的東西都是 tf 物件。所以跟 Tensorflow 的 interoperability 非常高!

Slim 一個強大的功能是：slim.arg_scope  
他是用來預先填寫 arguments 用的，可以為你省下極多工夫。  
我們直接看下列的例子就知道。

## DNN

In [11]:
from tensorflow.contrib import slim
import tensorflow as tf


def dnn_transform(x, shapes):
    with slim.arg_scope(
        [slim.fully_connected],
        activation_fn=tf.nn.relu):
        for fan_out in shapes:
            x = slim.fully_connected(x, fan_out)
    return x


x = tf.placeholder(dtype=tf.float32, shape=[None, 513])
y = dnn_transform(x, [1024, 1024, 10])

print(y)

Tensor("fully_connected_11/Relu:0", shape=(?, 10), dtype=float32)


這樣你就有一個 feed-forward DNN 了。  
他有兩層 1024-node 的 hidden，output dimension 為 10。  
要多深有多深，反正你自己給定 shape 就是了。

你可能會覺得奇怪：
1. 為什麼一個 weight matrix 都沒看到? 那我以後要怎麼使用 model?  
   A: 我們可以 load 整個 model。屆時，個別的 w 長什麼樣根本不重要。  
2. 中間那些 hidden layer 怎麼都不見了?
   A: 在大多數的情況下，hidden 是什麼根本不重要；  
      你想要的話，把他們加入 return 吧。  
      或者你也可以直接從 graph 攔截。  
      (我沒打算寫這個部分，因為我從來沒用到過)

你可以進一步透過 TensorBoard 來看你的架構。
但 TensorBoard 的用法，容我之後再說。

注意：
1. 這邊把 dnn 寫成一個 function  
   如果你呼叫他 N 次，你會得到 N 個「不同的」DNN  
   如果這不是你要的，請使用 `tf.make_template`。(我們底下的例子會講)  
1. 另一個要提醒的是：我們通常會把 network architecture 放在一個 json 檔裡。  
   但以下為了方便都沒有這樣做。

## CNN

In [10]:
def cnn_encoder(x, shapes, is_training=False):
    with slim.arg_scope(
        [slim.batch_norm],
        scale=True,
        updates_collections=None,
        is_training=is_training,
        scope='BN'):
        with slim.arg_scope(
            [slim.conv2d],
            kernel_size=[3, 3],
            stride=[2, 2],
            normalizer_fn=slim.batch_norm,  # BN here
            activation_fn=tf.nn.relu):
            for fan_out in shapes:
                x = slim.conv2d(x, fan_out)
    return x


x = tf.placeholder(dtype=tf.float32, shape=[None, 64, 32, 3])
y = cnn_encoder(x, [64, 128, 256])

print(y)

Tensor("Conv_8/Relu:0", shape=(?, 8, 4, 256), dtype=float32)


就這樣，其實和定義 fully-connected layer 幾乎一樣。  

注意  
1. 圖片預設的維度是 [batch size, height, width, color channel]  
   而 kernel size 和 stride 都是對 [height, width] 去定義的。  
2. stride 就是 down-/up-sampling rate。
   當你使用 conv2d 的時候，stride 對應的就是 down-sampling rate  
   當你使用 conv2d_transpose 的時候，stride 對應的就是 up-sampling rate  
3. kernel size 就是 num of filter taps

### Batch Normalization (BN)
在這個例子中，我另外也展示了 batch normalization (BN) layer 的用法。  
由於 SLIM 都幫我們包好了，我們只要在 conv2d 裡面啟用 batch_norm 即可。  
需注意的是：凡使用 BN 必定要指定是否是 training (因為 BN 在 training 和 testing 的行為不同)。  
因此一定要注意 is_training 這個 argument 有沒有設對。  
注意：  
1. operation 的順序：
  1. convolution
  2. bias or BN
  3. activation
2. updates_collections = None 是最簡便的方式。
   最好的方式是要去設定 control flow，運算會比較快，但我不會弄 QQ
3. 當你用 normalizer_fn 的時候，bias 會自動被 disable 掉 (因為 BN 也有 bias term)。


## GAN
OK，到這邊為止，創建 model 的部分就告終了。  
現在你已經有能力可以創建一個 DNN、CNN。  
那我們就來測試一下怎麼實作一個 GAN model 吧

首先，GAN有什麼部件?  
z --G--> xh --D--> T/F
只有一個 generator 和一個 discriminator。  
最多就是還要一個 sampler 讓你可以產生 random sample  
因此API就是  
1. generate: xh = G(z)  
2. discriminate: likelihood ratio = D(x)  
3. sample  


In [12]:
class GAN(object):
    def __init__(self, arch, is_training):
        pass
    def generate(self, z):
        pass
    def discriminate(self, x):
        pass
    
    

**To Be Continued after I'm back from Jeju**