# Kerasとは

Keras は元々はTheano、TensorFLowなど複数のフレームワークを扱いやすくする ラッパー として登場したライブラリでしたが、後にTensorFLowの 高レベルAPI として使われるようになりました。


TensorFLowに含まれる形のKerasであるtf.kerasを主に使っていきます。


**《ラッパーとは》**


ラッパーはもともとのプログラムの機能を利用して、より使いやすいものを提供します。TensorFlowはニューラルネットワークに必要な計算を効率的に行う機能を提供しますが、初期のころはモデルを構築して学習を行うとなると手間がかかる部分もありました。そのため、TensorFlowをラップして、扱いやすくするKerasが登場しました。


**《高レベルAPIとは》**


大きな単位で機能を簡単に扱えるように作られたものが高レベルAPIです。対義語として、細かい単位で機能をいじれるが、扱いがその分大変な低レベルAPIがあります。


TensorFlow自体でもニューラルネットワークのモデル構築や学習を行いやすくするために、高レベルAPIの充実が進められています。tf.Kerasはそのひとつです。

# ロジスティック回帰によるANDゲートの実装

In [1]:
import numpy as np
# ANDゲートの学習データを用意
x_train = np.array([[0,0],[0,1],[1,0],[1,1]])
y_train = np.array([[0],[0],[0],[1]])

## Sequential モデル

ロジスティック回帰を作るために、全結合層のクラス、tf.keras.layers.Denseを使います。引数に出力のユニット数、活性化関数、入力のユニット数を入れます。

In [2]:
import tensorflow as tf
model = tf.keras.Sequential([tf.keras.layers.Dense(1, activation = tf.nn.sigmoid, input_shape=(2,))])



作成したモデルの構造はsummaryメソッドで確認することができます。層ごとの出力のshapeとパラメータ数が併記されます。

In [3]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 3         
Total params: 3
Trainable params: 3
Non-trainable params: 0
_________________________________________________________________


構造が記述できたら、モデルをコンパイルします。コンパイル時に損失関数と最適化手法、評価関数を指定します。損失関数は名前をstringで指定します。ここでは2値分類のため、binary_crossentropyとなります。多値分類の場合はcategorical_crossentropy、回帰の場合はmean_squared_errorのようになります。

In [5]:
model.compile(loss='binary_crossentropy',
              optimizer=tf.optimizers.Adam(learning_rate=0.01),
              metrics=['accuracy'])

そして学習を行います。scikit-learn同様にfitメソッドを使う設計になっています。verboseは学習過程の可視化方法のパラメータで、デフォルトの1ではバッチごとに更新されるプログレスバーが表示されます。verboseが0の場合は表示を行わず、2の場合はエポック毎の表示になります。

In [7]:
history = model.fit(x_train, y_train,
                    batch_size=1,
                    epochs=1000,
                    verbose=2)

Epoch 1/1000
4/4 - 0s - loss: 0.0930 - accuracy: 1.0000
Epoch 2/1000
4/4 - 0s - loss: 0.0930 - accuracy: 1.0000
Epoch 3/1000
4/4 - 0s - loss: 0.0929 - accuracy: 1.0000
Epoch 4/1000
4/4 - 0s - loss: 0.0926 - accuracy: 1.0000
Epoch 5/1000
4/4 - 0s - loss: 0.0926 - accuracy: 1.0000
Epoch 6/1000
4/4 - 0s - loss: 0.0924 - accuracy: 1.0000
Epoch 7/1000
4/4 - 0s - loss: 0.0922 - accuracy: 1.0000
Epoch 8/1000
4/4 - 0s - loss: 0.0921 - accuracy: 1.0000
Epoch 9/1000
4/4 - 0s - loss: 0.0920 - accuracy: 1.0000
Epoch 10/1000
4/4 - 0s - loss: 0.0920 - accuracy: 1.0000
Epoch 11/1000
4/4 - 0s - loss: 0.0918 - accuracy: 1.0000
Epoch 12/1000
4/4 - 0s - loss: 0.0917 - accuracy: 1.0000
Epoch 13/1000
4/4 - 0s - loss: 0.0914 - accuracy: 1.0000
Epoch 14/1000
4/4 - 0s - loss: 0.0914 - accuracy: 1.0000
Epoch 15/1000
4/4 - 0s - loss: 0.0913 - accuracy: 1.0000
Epoch 16/1000
4/4 - 0s - loss: 0.0912 - accuracy: 1.0000
Epoch 17/1000
4/4 - 0s - loss: 0.0910 - accuracy: 1.0000
Epoch 18/1000
4/4 - 0s - loss: 0.0908 - 

今は用意していませんが、検証用データがある場合は、引数validation_dataに与えることで、エポック毎の検証も可能です。

In [9]:
'''
history = model.fit(x_train, y_train,
                    batch_size=1,
                    epochs=1000,
                    verbose=1,
                    validation_data=(x_train, y_train))
'''

'\nhistory = model.fit(x_train, y_train,\n                    batch_size=1,\n                    epochs=1000,\n                    verbose=1,\n                    validation_data=(x_train, y_train))\n'

推定もscikit-learn同様にpredictメソッドを使います。

In [10]:
y_pred_proba = model.predict(x_train)[:, 0]
# 確率を0, 1に変換
y_pred = np.where(y_pred_proba >0.5, 1, 0)
print("y_pred_proba", y_pred_proba)
print("y_pred", y_pred)

y_pred_proba [7.4209252e-06 1.7194748e-02 1.7244279e-02 9.7639751e-01]
y_pred [0 0 0 1]


結果がいらず、評価のみ行う場合はevaluateメソッドも便利です。

In [11]:
score = model.evaluate(x_train, y_train, verbose=0)
print('Train loss:', score[0])
print('Train accuracy:', score[1])

Train loss: 0.014657963067293167
Train accuracy: 1.0


### Sequentialモデルのもうひとつの書き方

Sequentialモデルでは、コンストラクタで層のクラスを渡さず、addメソッドを使って記述する方法もよく使われます。

In [12]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(1, activation = tf.nn.sigmoid, input_shape=(2,)))

複数層の場合

ロジスティック回帰ではなく、2層のニューラルネットワークの場合は以下のように記述できます。2層目以降はinput_shapeを与える必要がありません。tf.kerasが自動的に計算するためです。

In [13]:
model = tf.keras.Sequential([
            tf.keras.layers.Dense(10, activation = tf.nn.relu, input_shape=(2,)),
            tf.keras.layers.Dense(1, activation = tf.nn.sigmoid)])

addメソッドを使えば次のようになります。

In [14]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(10, activation = tf.nn.relu, input_shape=(2,)))
model.add(tf.keras.layers.Dense(1, activation = tf.nn.sigmoid))

## Functional API

Functional APIを使えばより自由度の高いモデル構築が行えます。Sequentialクラスの代わりにModelクラスを使用します。


入力から出力までの流れを記述していき、最後にModelクラスに入力層と出力層のインスタンスを渡します。

In [15]:
input_data = tf.keras.layers.Input(shape=(2,)) # 入力層
output = tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)(input_data) # 出力層
model = tf.keras.Model(inputs=input_data, outputs=output)

モデル構造の記述以降はSequentialモデルと全く同じです。

In [18]:
model.summary()
model.compile(loss='binary_crossentropy',
              optimizer=tf.optimizers.Adam(learning_rate=0.01),
              metrics=['accuracy'])
history = model.fit(x_train, y_train,
                    batch_size=1,
                    epochs=1000,
                    verbose=1)

Model: "functional_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 2)]               0         
_________________________________________________________________
dense_6 (Dense)              (None, 1)                 3         
Total params: 3
Trainable params: 3
Non-trainable params: 0
_________________________________________________________________
Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000

複数層の場合

4層のニューラルネットワークは以下のように記述できます。

In [19]:
input_data = tf.keras.layers.Input(shape=(2,))
x = tf.keras.layers.Dense(10, activation=tf.nn.relu)(input_data)
x = tf.keras.layers.Dense(10, activation=tf.nn.relu)(x)
x = tf.keras.layers.Dense(10, activation=tf.nn.relu)(x)
output = tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)(x)
model = tf.keras.Model(inputs=input_data, outputs=output)

この記述方法では枝分かれを表現することもできます。以下は3層目で2つに枝分かれし、次の層で結合している例です。

In [20]:
input_data = tf.keras.layers.Input(shape=(2,))
x = tf.keras.layers.Dense(10, activation=tf.nn.relu)(input_data)
x = tf.keras.layers.Dense(10, activation=tf.nn.relu)(x)
y1 = tf.keras.layers.Dense(10, activation=tf.nn.relu)(x)
y2 = tf.keras.layers.Dense(10, activation=tf.nn.relu)(x)
z = tf.keras.layers.concatenate([y1, y2])
output = tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)(z)
model = tf.keras.Model(inputs=input_data, outputs=output)