## __Kerasのクラス・関数まとめ__

### __dataset__

`tensorflow.keras.datasets`モジュール https://www.tensorflow.org/api_docs/python/tf/keras/datasets

- `boston_housing`: ボストンの住宅価格 (回帰)

- `cifar10`: CIFAR10 (画像分類)

- `cifar100`: CIFAR100 (画像分類)

- `fashion_mnist`: Fashion-MNIST (画像分類)

- `imdb`: IMDB感情分類 (文章分類)

- `mnist`: MNIST 手書き文字 (画像分類)

- `reuters`: ロイター通信の文章トピック分類 (文章分類)

In [5]:
from tensorflow.keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/reuters.npz


### __layers__

`tensorflow.keras.layers`モジュール

- `Dense`: 全結合層

    - `units`: 出力ベクトルの次元数

- `Activation`: 活性化関数

    - 活性化関数名を指定〜`"relu"`、`"softmax"`、`"sigmoid"`、`"tanh"`、...

    - 他のlayerの`activation`引数でも指定可能

- `Flatten`: 1次元化

- `Reshape`: 変形

    - `target_shape`: サイズをリストで指定

- `Add`: 足し算

    - 足し算したい値をリストで指定

- `BatchNormalization`: バッチ正則化

- `Dropout`: ドロップアウト

    - `rate`: ドロップアウトの割合 (0〜1)

    - `seed`: シード値

- `Conv2D`: CNN

    - `filters`: 出力チャンネル数

    - `kernel_size`: カーネルサイズ

    - `strides`: ストライド

    - `padding="valid"`: パディング

        - `"valid"`: パディングなし

        - `"same"`: パディングあり

- `MaxPooling2D`: マックスプーリング

    - `pool_size`: プールサイズ

    - `strides`: ストライド

    - `padding`: パディング

- `SimpleRNN`: RNN

    - `units`: 出力ベクトルの次元数

    - `return_sequences`: `False`なら系列の最後の出力を返す。`True`なら全系列を返す

    - `return_state`: Trueのときは出力とともに最後の状態を返す

- `LSTM`: LSTM

    - 引数は`SimpleRNN`と基本的に同じ

- `GRU`: GRU

    - 引数は`SimpleRNN`と基本的に同じ

__よく使われるオプション引数__

- `activation`: 活性化関数

- `use-bias`: バイアス項あり/なし

- `kernel_regularizer`: 正則化項

    - `tensorflow.keras.regularizers.l1(l1)`: L1正則化

    - `tensorflow.keras.regularizers.l2(l2)`: L2正則化

    - `tensorflow.keras.regularizers.l1_l2(l1, l2)`: ElasticNet

- `kernel_initializer`: 初期値

    - `"glorot_uniform"`, `"glorot_normal"`: Glorot(Xavier)の初期値 (一様分布・正規分布)
        - sigmoid関数やtanh関数で使用

    - `"he_uniform"`, `"he_normal"`: Heの初期値 (一様分布・正規分布)
        - ReLU関数で使用


### __最適化関数__

- `SGD`: SGDとMomentum

    - 確率的勾配降下法

    - `lr=0.001`: 学習率

    - `momentum=0.0`: 前ステップの使用割合。Momentumで使用(0.9が一般的)

- `Adagrad`: Agagrad

    - 学習率を過去の勾配の全蓄積で割ることで、以前勾配が大きかった方向の学習率を下げ、小さかった方向の学習率を大きめに取る

    - 一度大きな勾配を取ると、それ以降の学習率が非常に小さくなり、学習が止まってしまうという問題がある

    - `lr=0.001`: 学習率

- `RMSprop`: RMSprop (Root Mean Square)

    - 過去の勾配の2乗の指数移動平均で学習率を割る (Adagradの改善)

    - `lr=0.001`: 学習率

    - `rho=0.9`: 指数移動平均の減衰率

- `Adadelta`: Adadelta

    - 勾配の2乗の指数移動平均と更新量の2乗の指数移動平均の比とする (Adagradの改善)

    - `lr=0.001`: 学習率 (`rho`の値から自動的に決定されるため設定は不要)

    - `rho=0.95`: 指数移動平均の減衰率。0.95が推奨値

- `Adam`: Adam

    - 勾配自体を指数移動平均による推定値に置き換える (Adagradの改善)

    - `lr=0.001`: 学習率

    - `beta_1=0.9`, `beta_2=0.999`: 過去の勾配・勾配の2乗の採用割合。基本的にデフォルト値でOK

### __コールバック関数__

`tensorflow.keras.callbacks`モジュール

- `EarlyStopping`: アーリーストッピング

    - `monitor="val_loss"`: 監視対象のスコア

    - `patience=0`: スコアの悪化を何回まで許容するか

- `TensorBoard`: TensorBoard

    - `log_dir`: logファイルを書き出すディレクトリの指定

### __コンパイル__

```python
model.compile(
    optimizer='rmsprop',
    loss='sparse_categorical_crossentropy'
    metrics=["accuracy"]
)
```

 いずれも文字列かインスタンスで指定

- `optimizer`: 最適化関数

- `loss`: 損失関数

- `metrics`: 評価関数

    

### __学習__

```python
model.fit(
    X_train,
    Y_train,
    batch_size=128,
    epochs=20,
    verbose=0,
    validation_data=(X_test, Y_test),
    callbacks=[]
)
```

- `batch_size`: バッチサイズ
    
- `epochs`: エポック数
    
- `verbose`: ログの出力

    - 0: しない、1： バーで出力、2: エポックごとに出力

- `validation_split`/`validation_data`: （いずれかのみ指定可能）

    - 検証用に用いるデータの割合（0～１の実数）、または検証用データそのもの

- `shuffle`： シャッフルする/しない

- `callbacks`： callback関数

### __モデルの可視化__

```python
from tensorflow.keras.utils import plot_model
plot_model(
    model,
    show_shapes=True,
    to_file='model.png',
)
```