# 実習08-1 Kerasによるモデル構築
---
基本的な手順はscikit-learnの時と同じだが、データの準備、モデルの作成、scikit-learnの場合とは異なる部分に気を付けて作成していこう。

基本的な手順は以下である。
1. 学習用データセットの準備
2. モデルを決める
3. モデルを訓練する
4. モデルを評価する
5. モデルを保存する

今回は、簡単のためXORの判定を、分類/回帰のそれぞれでモデル作成する。
* [0,0]を入力すると0を出力
* [0,1]を入力すると1を出力
* [1,0]を入力すると1を出力
* [1,1]を入力すると0を出力

## 1. 分類問題
### 1-1. データセットの準備
入力と出力を、それぞれ変数X, yに代入しておく。
```
# 教師データの入力X、出力y
# list型を入力できなくなっているので、np.arrayにする
import numpy as np
x = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,0])
```

In [None]:
# 教師データの入力x、出力y
import numpy as np
x = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,0])

### 1-2. モデルの構成（分類問題）

入力層、中間層1、中間層2、出力層の構成で作成してみる。

* 入力層：ノード数 2 （入力は2つ）
* 中間層1：ノード数は10～100ぐらいで自由に、活性化関数はrelu
* 中間層2：ノード数は10～100ぐらいで自由に、活性化関数はrelu
* 出力層：ノード数1にする。二値分類なので、活性化関数は**[　sigmoid　]**を使用する

**出力層の活性化関数は、sigmoid、linear、softmaxのうちどれですか。**

※kerasでは出力ノード数や活性化関数を自分で指定しなければならないので注意する。<br>
（scikit-learnでは、訓練用データの出力から自動的に決定）


#### 1-2-1. モデルの作成方法1：Sequential()で一度にすべて記述する方法

Sequential()の引数として、各層のリストを入力することによりモデルを作成することが出来る。<br>
```
# tensorflowのインポート
# 毎回tensorflow.keras.layers.Denseなどと書くのが面倒なので
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense

# モデルの作成1 Sequentialを使用する場合
clf1 = keras.Sequential([
  Input(shape=(入力ノード数,)),
  Dense(中間層1ノード数, activation='活性化関数'),
  Dense(中間層2ノード数, activation='活性化関数'),
  Dense(出力層ノード数, activation='活性化関数')
])
# サマリを表示する
clf1.summary()
```

In [None]:
# 毎回keras.layers.Denseと書くのが面倒なので
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense

# モデルを用意する
clf1 = keras.Sequential([
  Input(shape=(2,)),
  Dense(100, activation='relu'),
  Dense(50, activation='relu'),
  Dense(1, activation='sigmoid')
])

# サマリの表示
clf1.summary()

#### 1-2-2. モデルの作成方法2：Sequential()で作成したものに、add()で層を追加していく方法

Sequential()で作成したモデルにadd()で層を追加していくことでモデルを作成することができる。

```
# モデルの作成2 Sequentialにaddで追加する方法
clf2 = keras.Sequential()
clf2.add(Input(入力ノード数,)),
clf2.add(Dense(中間層1ノード数, activation='活性化関数'))
clf2.add(Dense(中間層2ノード数, activation='活性化関数'))
clf2.add(Dense(出力層ノード数, activation='活性化関数'))
# サマリを表示する
clf2.summary()
```

In [None]:
# モデルの作成2 Sequentialにaddで追加する方法
clf2 = keras.Sequential()
clf2.add(Input(shape=(2,),)),
clf2.add(Dense(100, activation='relu'))
clf2.add(Dense(100, activation='relu'))
clf2.add(Dense(1, activation='sigmoid'))
# サマリを表示する
clf2.summary()

#### 1-2-3. モデルの作成方法3：Functional APIを使用する方法
関数のように、前の層の出力を次の層の入力に引数のように記述する。
Functional APIを使用すると、複数入力や複数出力に対応でき、より複雑なモデルを作成することができる。

```
# モデルの作成3 Functional APIでモデルを作成する方法
# わざわざkeras.layers、keras.modelsと書くのが面倒なので
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model

# 入力の形式をInput(shape=)で指定する
inputs = Input(shape=(入力ノード数,))

# 前の層を関数の引数のようにして渡していく
#（変数名を適切に変更しておくと複雑なモデルも可能）
h = Dense(中間層ノード1, activation='活性化関数')(inputs)
h = Dense(中間層ノード2, activation='活性化関数')(h)
outputs = Dense(出力層ノード数, activation='活性化関数')(h)

# Modelの引数として入力（inputs）と出力（outputs）を指定してモデルを作成する
clf3 = Model(inputs=inputs, outputs=outputs)

# サマリを表示する
clf3.summary()
```

In [20]:
# モデルの作成3 Functional APIでモデルを作成する方法
# 上でimport済ならimportは不要
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model

# 入力の形式をInput(shape=)で指定する
inputs = Input(shape=(2,))

# 前の層を関数の引数のようにして渡していく
# 変数名を適切に変更しておくと複雑なモデルも可能
h = Dense(100, activation='relu')(inputs)
h = Dense(50, activation='relu')(h)
outputs = Dense(1, activation='sigmoid')(h)

# Modelの引数として入力（inputs）と出力（outputs）を指定してモデルを作成する
clf3 = Model(inputs=inputs, outputs=outputs)

# サマリを表示する
clf3.summary()

### 1-2-4. コンパイルしてモデル作成（分類問題）
.compile()を使用してモデルを作成する。ここでは3つの引数を指定する。

* 損失関数（loss）：モデルが最小化しようとする目的関数
* 最適化アルゴリズム（optimizer）：最適化手法
* 評価関数のリスト（metrics）：訓練には使用しないが値は計算する

```
# 例
model.compile(loss='binary_crossentropy',                         #損失関数はbinary_crossentropy
                optimizer= 'adam', #最適化はAdam
                metrics=['accuracy'])                    # 正解率
 ```


In [21]:
# コンパイルしてモデル作成
clf1.compile(loss='binary_crossentropy',
                optimizer= 'adam',
                metrics=['accuracy'])

clf2.compile(loss='binary_crossentropy',
                optimizer= 'adam',
                metrics=['accuracy'])

clf3.compile(loss='binary_crossentropy',
                optimizer= 'adam',
                metrics=['accuracy'])

### 1-3 モデルを訓練する（分類問題）
fitを使用してモデルを訓練する。
エポック数は初期値の1では全く学習が進まないので、今回はとりあえず100ぐらいにしておく。また、lossが0.1より小さくなるぐらいまで実行を繰り返してみる。

```
model.fit(入力, 出力, epochs=エポック数)
```


In [None]:
# 分類モデル1
clf1.fit(x,y,epochs=100)

In [17]:
# 分類モデル2
clf2.fit(x,y,epochs=100)

Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step - accuracy: 0.7500 - loss: 0.7103
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - accuracy: 0.5000 - loss: 0.7019
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - accuracy: 0.5000 - loss: 0.6940
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 0.7500 - loss: 0.6867
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.7500 - loss: 0.6805
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.7500 - loss: 0.6745
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.7500 - loss: 0.6686
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.7500 - loss: 0.6630
Epoch 9/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m

<keras.src.callbacks.history.History at 0x78f334313370>

In [22]:
# 分類モデル3
clf3.fit(x,y,epochs=100)

Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - accuracy: 0.5000 - loss: 0.6976
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - accuracy: 0.5000 - loss: 0.6917
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.5000 - loss: 0.6859
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 0.5000 - loss: 0.6802
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.7500 - loss: 0.6748
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - accuracy: 0.7500 - loss: 0.6696
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 0.7500 - loss: 0.6648
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - accuracy: 0.7500 - loss: 0.6601
Epoch 9/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m

<keras.src.callbacks.history.History at 0x78f3360872b0>

### 1-4. モデルを評価する
predict()を使用して、正しく分類できるかを確認する。
*   引数として、np.array([[0,0],[1,0]])など、複数の入力を一度に計算可能
*   入力は整数でなくても可（[0.2,0.7]など）
*   1つの入力でも、[[0,0]]のようにリストのリストで書く
*   2値分類では、結果が0～1で出力されるので、必要に応じて四捨五入したり整数に変換する。

```
# 例
model.predict(入力) #そのまま出力
model.predict(入力).round() #四捨五入まで
model.predict(入力).round().astype(int) # 整数変換まで

```

In [28]:
clf1.evaluate(x,y)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 26ms/step - accuracy: 1.0000 - loss: 0.1904


[0.1904112994670868, 1.0]

In [31]:
# predict()により正しく分類できるか確認
clf1.predict(np.array([[0,0],[1,0]])) #そのまま出力

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step


array([[0.3779329],
       [0.9061253]], dtype=float32)

## 2. 回帰問題
### 2-1. データセットの準備
入力と出力を、それぞれ変数X, yに代入しておく。（上で実施済みなら不要）
```
# 上で実施済みなら不要
import numpy as np
x = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,0])
```

In [None]:
# 上で実施済みなら不要

### 2-2. モデルの構成（回帰問題）

回帰問題としてモデルを作成してみよう。

入力層、中間層1、中間層2、出力層の構成で作成してみる。

* 入力層：ノード数 2 （入力は2つ）
* 中間層1：ノード数は10～100ぐらいで自由に、活性化関数はrelu
* 中間層2：ノード数は10～100ぐらいで自由に、活性化関数はrelu
* 出力層：ノード数1にする。回帰問題なので、活性化関数は**[　linear　]**を使用する

**出力層の活性化関数は、sigmoid、linear、softmaxのうちどれですか。**


#### 2-2-1. モデルの作成方法1：Sequential()に直接すべて記述する方法

これまでに行ってきたように、Sequential()の引数として、各層のリストを入力することによりモデルを作成することが出来る。

```
# モデルの作成1 Sequentialを使用する場合
reg1 = keras.Sequential([
 ・・・
])
# サマリを表示する

```

In [33]:
# モデルの作成1 Sequentialを使用する場合
reg1 = keras.Sequential([
  Input(shape=(2,)),
  Dense(100, activation='relu'),
  Dense(20, activation='relu'),
  Dense(1, activation='linear')
])

# サマリを表示する
reg1.summary()

#### 2-2-2. モデルの作成方法2：Sequential()モデルに、add()で層を追加していく方法

Sequential()で作成したモデルにadd()で層を追加していくことでモデルを作成することができる。層の構成をforループなどで記述したい場合はこちらの方が良いかもしれない。

```
# モデルの作成2 Sequentialにaddで追加する方法
reg2 = keras.Sequential()
・・・
# サマリを表示する
reg2.summary()
```

In [51]:
# モデルの作成2 Sequentialにaddで追加する方法
reg2 = keras.Sequential()
reg2.add(Input(shape=(2,),)),
reg2.add(Dense(100, activation='relu'))
reg2.add(Dense(20, activation='relu'))
reg2.add(Dense(1, activation='linear'))

# サマリを表示する
reg2.summary()

#### 2-2-3. モデルの作成方法3：Functional APIを使用する方法

Functional APIを使用して作成する。

```
# モデルの作成3 Functional APIでモデルを作成する方法
# わざわざtensorflow.keras.layers、keras.modelsと書くのが面倒なので
from tensorflow.keras.layers import Input, Dense
from tensorflow.models import Model

# 入力の形式をInput(shape=)で指定する
inputs = Input(shape=(入力ノード数,))

# 前の層を関数の引数のようにして渡していく
# 変数名を適切に変更しておくと複雑なモデルも可能

# Modelの引数として入力（inputs）と出力（outputs）を指定してモデルを作成する

# サマリを表示する

```

In [52]:
# モデルの作成3 Functional APIでモデルを作成する方法
# わざわざkeras.layers、keras.modelsと書くのが面倒なので
# from tensorflow.keras.layers import Input, Dense
# from tensorflow.models import Model

# 入力の形式をInput(shape=)で指定する
inputs = Input(shape=(2,))

# 前の層を関数の引数のようにして渡していく
# 変数名を適切に変更しておくと複雑なモデルも可能
h = Dense(100, activation='relu')(inputs)
h = Dense(50, activation='relu')(h)
outputs = Dense(1, activation='linear')(h)

# Modelの引数として入力（inputs）と出力（outputs）を指定してモデルを作成する
reg3 = Model(inputs=inputs, outputs=outputs)

# サマリを表示する
reg3.summary()

#### 2-2-4. コンパイルしてモデル作成（回帰問題）
.compile()を使用してモデルを作成する。ここでは3つの引数を指定する。

* 損失関数（loss）：モデルが最小化しようとする目的関数
* 最適化アルゴリズム（optimizer）：最適化手法
* 評価関数のリスト（metrics）：訓練には使用しないが値は計算する

**分類と回帰では、損失関数や評価関数が異なります。**
 ```
# 例
model_reg.compile(loss='mse',                         #損失関数はmse（平均二乗誤差）
                optimizer= 'adam', #最適化はAdam
                metrics=['mae'])                    #評価関数はmae（平均絶対値誤差）
 ```


In [53]:
# コンパイル
reg1.compile(loss='mse',optimizer= 'adam',metrics=['mae'])
reg2.compile(loss='mse',optimizer= 'adam',metrics=['mae'])
reg3.compile(loss='mse',optimizer= 'adam',metrics=['mae'])

fitを使用してモデルを訓練する。
今回、エポック数は初期値の1では全く学習が進まないので、とりあえず100ぐらいにしておく。

```
model.fit(入力, 出力, epochs=エポック数)


In [54]:
# 回帰モデル1
reg1.fit(x,y,epochs=100)

Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - loss: 0.0919 - mae: 0.2941
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step - loss: 0.0912 - mae: 0.2927
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.0898 - mae: 0.2902
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - loss: 0.0884 - mae: 0.2876
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.0871 - mae: 0.2850
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - loss: 0.0859 - mae: 0.2827
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - loss: 0.0847 - mae: 0.2803
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.0834 - mae: 0.2778
Epoch 9/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step - loss: 0.0822

<keras.src.callbacks.history.History at 0x78f32e6211e0>

In [55]:
# 回帰モデル2
reg2.fit(x,y,epochs=300)

Epoch 1/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - loss: 0.5160 - mae: 0.5105
Epoch 2/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - loss: 0.4972 - mae: 0.5009
Epoch 3/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step - loss: 0.4790 - mae: 0.4963
Epoch 4/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.4626 - mae: 0.4919
Epoch 5/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.4481 - mae: 0.4883
Epoch 6/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 0.4340 - mae: 0.4846
Epoch 7/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - loss: 0.4201 - mae: 0.4808
Epoch 8/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - loss: 0.4074 - mae: 0.4774
Epoch 9/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step - loss: 0.3961

<keras.src.callbacks.history.History at 0x78f32e296aa0>

In [41]:
# 回帰モデル3
reg3.fit(x,y,epochs=100)

Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - loss: 0.2435 - mae: 0.4934
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - loss: 0.2407 - mae: 0.4905
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - loss: 0.2379 - mae: 0.4876
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - loss: 0.2351 - mae: 0.4847
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - loss: 0.2323 - mae: 0.4817
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 42ms/step - loss: 0.2295 - mae: 0.4788
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step - loss: 0.2273 - mae: 0.4765
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - loss: 0.2254 - mae: 0.4745
Epoch 9/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - loss: 0.2234

<keras.src.callbacks.history.History at 0x78f32ed0d450>

predict()を使用して、正しく予測できるかを確認する。回帰問題では数値を推定するので、四捨五入等は必要ない。

In [56]:
# predict()を使用して確認
reg1.evaluate(x, y)
reg1.predict(np.array([[0,0],[1,0]]))



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 149ms/step - loss: 0.0247 - mae: 0.1282
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step


array([[0.28591537],
       [0.92583823]], dtype=float32)

In [57]:
reg2.evaluate(x, y)
reg2.predict(np.array([[0,0],[1,0]]))



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 201ms/step - loss: 4.0714e-10 - mae: 1.5853e-05




[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 81ms/step


array([[8.326024e-06],
       [9.999974e-01]], dtype=float32)

In [58]:
reg3.evaluate(x, y)
reg3.predict(np.array([[0,0],[1,0]]))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 252ms/step - loss: 0.4907 - mae: 0.4977




[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 53ms/step


array([[0.        ],
       [0.00041681]], dtype=float32)

## 提出物など

**以下の2点が記入されているか確認すること。**
*   分類問題の出力層の活性化関数
*   回帰問題の出力層の活性化関数


その後、ファイルが保存されているかを確認し、「ファイル＞ダウンロード＞.ipynbをダウンロード」を順にクリックして.ipynbファイルをダウンロードして提出すること。