#  深層学習の実践

- **[1.1 深層学習の概要](#1.1-深層学習の概要)**
    - **[1.1.1 深層学習を体験してみよう](#1.1.1-深層学習を体験してみよう)**
    - **[1.1.2 深層学習とは](#1.1.2-深層学習とは)**
    - **[1.1.3 深層学習を用いた分類の流れ](#1.1.3-深層学習を用いた分類の流れ)**
<br><br>
- **[1.2 手書き数字の分類](#1.2-手書き数字の分類)**
    - **[1.2.1 分類までの流れ](#1.2.1-分類までの流れ)**
    - **[1.2.2 ディープニューラルネットワーク](#1.2.2-ディープニューラルネットワーク)**
    - **[1.2.3 Kerasの導入](#1.2.3-Kerasの導入)**
    - **[1.2.4 データの用意](#1.2.4-データの用意)**
    - **[1.2.5 モデルの生成](#1.2.5-モデルの生成)**
    - **[1.2.6 モデルの学習](#1.2.6-モデルの学習)**
    - **[1.2.7 モデルの評価](#1.2.7-モデルの評価)**
    - **[1.2.8 モデルによる分類](#1.2.8-モデルによる分類)**
<br><br>
- **[1.3 添削問題](#1.3-添削問題)**

***

## 1.1 深層学習の概要

### 1.1.1 深層学習を体験してみよう

それでは、始めにこの講座のゴール地点を体験してみましょう。<br>
この講座を最後まで受講すると **課題のような、手書き数字画像データから数字を判別できるコードを書けるようになります。**

本講座では、ディープラーニングのなかでも最も基本的な、 **全結合層のみで作られる多層ニューラルネットワーク** を扱います。**全結合層**については、**1.2.2 ディープニューラルネットワーク** で解説します。<br>
また、ライブラリは **Keras + Tensorflow** を利用しています。 **Tensorflow** とは、Google社製のディープラーニング用ライブラリであり、最も人気のあるディープラーニングライブラリの一つです。 **Keras** とは、 Tensorflowを扱いやすくするためのライブラリです。<br>
コードの各内容についてはこの後のセッションで詳しく説明していきます。<br>

#### 問題

次のコードを **RUN(実行)** してエポック数が上がるにつれて**訓練データに対する正解率** `acc` と**テストデータに対する正解率**`val_acc`が上がっている様子を確認してみましょう。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense, Dropout
from keras.models import Sequential, load_model
from keras import optimizers
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dropout(rate=0.5))
model.add(Dense(10))
model.add(Activation("softmax"))

sgd = optimizers.SGD(lr=0.1)
model.compile(optimizer=sgd, loss="categorical_crossentropy", metrics=["accuracy"])

# epochs数は5を指定
history = model.fit(X_train, y_train, batch_size=500, epochs=5, verbose=1, validation_data=(X_test, y_test))

#acc, val_accのプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.plot(history.history["val_acc"], label="val_acc", ls="-", marker="x")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.legend(loc="best")
plt.show()

#### ヒント

- エポック数とは学習データを何回繰り返し学習させるかを表します。

#### 解答例

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense, Dropout
from keras.models import Sequential, load_model
from keras import optimizers
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dropout(rate=0.5))
model.add(Dense(10))
model.add(Activation("softmax"))

sgd = optimizers.SGD(lr=0.1)
model.compile(optimizer=sgd, loss="categorical_crossentropy", metrics=["accuracy"])

# epochs数は5を指定
history = model.fit(X_train, y_train, batch_size=500, epochs=5, verbose=1, validation_data=(X_test, y_test))

#acc, val_accのプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.plot(history.history["val_acc"], label="val_acc", ls="-", marker="x")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.legend(loc="best")
plt.show()

***

### 1.1.2 ディープラーニングとは？

- ディープラーニングの概要
- ニューロンの概要
- ディープラーニングの分野
（DNN/CNN/RNN)<br>
**※修正事項**<br>
動画内で「2012年にこのディープラーニングというアルゴリズムが発見された」と説明していますが、正確には2012年はディープラーニングが注目されるきっかけを生んだ年であり、ディープラーニングのアルゴリズムそのものは2012年以前から存在しています。

#### 問題

- 次の動画をみてください。

https://www.youtube.com/embed/M7exy0SSWfk

***

### 1.1.3 深層学習とは(1)

 **<font color=#AA0000>深層学習</font>** は日常生活の多くの場面で利用されています。
例えば、画像認識、映像解析を利用した自動運転技術や、音声解析で実現するスマートスピーカー（「LINE Clova」や「Google Home」など）や「Siri」などが挙げられます。

深層学習とは、動物の神経ネットワークを参考にした **ディープニューラルネットワーク** というモデルを使い、データの分類や回帰を行う手法です。 **深層学習は機械学習の一手法である** ことに注意しましょう。ディープニューラルネットワークの発想の起点は神経ネットワークにありますが、脳の神経ネットワークの再現を目標にはしておらず、現在は純粋に画像や音声などの認識精度を高めるような研究が盛んにされています。

<img src='https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_10.png'>

**<center>図1.1.3-1 神経ニューラルネットワーク</center>**

なぜここまで深層学習が注目されているかと言うと、従来の手法では人手がかかる作業が自動化され、かつ認識精度が高いためです。<br>
例えば、車を検出するタスクを考えます。従来では、車の検出に重要と思われる特徴部分(タイヤやフロントガラスなど)をあらかじめ人間が決めて、それを重点的に捉えられるようなモデルを考えます。しかし、深層学習はそのような特徴を **自動** で見つけます。

<img src='https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/car.png'>

**<center>図1.1.3-2 車を検出する場合</center>**


#### 問題

- 深層学習、ニューラルネットワークについて正しい記述を選択してください。

- ディープニューラルネットワークは動物の脳を完全に再現したモデルである。
- ニューラルネットワークでは、人間がプログラムに注目すべき特徴を指定する必要がある。
- ニューラルネットワークが注目されている理由は、人間のように知能を持つからである。
- 深層学習は、機械学習の一手法である。

#### ヒント

- 深層学習と機械学習の関係性をよく考えましょう。

#### 解答

- 深層学習は、機械学習の一手法である。

***

### 1.1.4 ニューロンの計算方法と学習方法

- ニューロンの内部の処理
- 活性化関数の処理の例

#### 問題

- 次の動画をみてください。

https://www.youtube.com/embed/2xxc9n0G3OA

***

### 1.1.5 深層学習とは(2)

近年、盛んに耳にするニューラルネットワークですが、発想自体は1950年代から存在しました。下の図がニューラルネットワークの基本となるニューロンです。
$x_1, x_2$が入力で$w_1, w_2$が **重みパラメータ** です。$x_1w_1 + x_2w_2$の値が 閾値$\theta$よりも高ければこのニューロンは発火して1を出力し、そうでなければ0を出力する、というモデルです。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_30.png">

**<center>図1.1.5-1 ニューロン</center>**

このニューロンですが、これだけではあまり複雑な問題を解くことができませんでした。しかし下図のように層を積み重ねることで複雑な問題を扱えるようになりました。
これが **ディープニューラルネットワーク** です。ディープと言われる所以は層が積み重なっており、深い構造をしているためです。<br>
近年急激にディープニューラルネットワークが注目された理由は、層が深くてもうまく学習できるような手法が発見され、かつ学習できるような計算環境が整ったからです。

ニューラルネットワークは、入力X（ベクトルや行列など）を受け取ると連鎖的に反応を起こし、最終的にある値y（スカラーやベクトルなど）を出力します。
例えば画像認識では、画像のピクセルのデータを入力することで、カテゴリ(ネコ、イヌ、ライオン...)に属する確率が得られます。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_20.gif">

**<center>図1.1.5-2 ニューラルネットワーク</center>**

深層学習では、 **各ニューロンの重みパラメータを機械的に調整する** ことで分類モデルや回帰モデルを作ります。

> 出典：http://www.opennn.net/

#### 問題

- 次のうち、ニューラルネットワーク、深層学習についての正しい説明を選んでください。 

- ディープラーニングが急激に盛んになったのは、高性能な計算機の登場が理由の一つに挙げられる。
- ディープニューラルネットワークはニューロンを積み重ねて作られている。
- ディープラーニングでは、重みパラメータが学習される。
- 上記のすべて

#### ヒント

- ディープラーニングが注目されているのは、計算環境が整い、ニューロンを積み重ねても重みパラメータがうまく学習できるようになったためです。

#### 解答

- 上記のすべて

***

### 1.1.6 深層学習を用いた分類の流れ

- **ネットワークモデルを作る**

いくつかのニューロンを束ねた層を図のように重ねていくことで深いネットワークを構築します。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_40.gif">

**<center>図1.1.6-1 ディープニューラルネットワーク</center>**

はじめの内は、各ニューロンは入力に対してランダムに反応するので、でたらめな値を出力をします。



- **モデルに訓練用のデータを与え、学習を行う**


モデルはXを入力として受け取り、yを出力します。  
このとき出力yと正解データ(教師ラベル)Tの間の差$ΔE$を小さくするように、誤差逆伝播法という方法で自動的に各ニューロンの重みを調整します。  
**多量の画像などの生データXと正解データTを与えることで繰り返し重みが調整され、次第に求めたい出力が得られるようになります。**

<img src='https://aidemyexstorage.blob.core.windows.net/aidemycontents/1539649698690986.png'>

**<center>図1.1.6-2 モデルにトレーニングデータを渡す</center>**

うまく学習が進むと、適切な予測値を返すモデルができあがります。

- **分類したいデータをモデルに渡す**

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_70.png">

**<center>図1.1.6-3 学習データを渡す</center>**

以上のような流れで、深層学習による分類ができます。

深層学習において、各ニューロンが何に反応しているかは調べないとわかりません。  
逆に言うと、深層学習を用いれば具体的な分類の手順がわからなくても分類や回帰のモデルが作れるため、とても便利な手法であると言えます。

> 出典:http://opencv.jp/

#### 問題

- 以下のうち、ニューラルネットワークモデルを用いた分類についての正しい説明を選んでください。

- ニューラルネットワークモデルは分類モデルしか作ることができない。
- ニューラルネットワークモデルは構築されてすぐ、入力に対して期待する反応を示す。
- ニューラルネットワークモデルの各重みを自動的に更新する手法はない。
- ニューラルネットワークモデルを使って様々な分類、回帰モデルを構築することができる。

#### ヒント

ニューラルネットワークモデルでは大量のデータの入力によって繰り返し重みが調整され、次第に求めたい出力が得られるようになります。

#### 解答

- ニューラルネットワークモデルを使って様々な分類、回帰モデルを構築することができる。

***

## 1.2 手書き数字の分類

### 1.2.1 分類までの流れ

このchapterでは、KerasというPythonのライブラリを使って実際に以下のようなニューラルネットワークモデルを実装し、  
深層学習の入門として定番の手書き数字の分類を行います。

流れとしては、
1. データを用意
1. ニューラルネットワークモデルの構築
1. モデルにデータを与え学習させる
1. モデルの分類精度を評価 

です。最後に実際に手書き数字の画像を渡して予測される値を見てみます。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_80.png">

**<center>図1.2.1-1 分類までの流れ</center>**

#### 問題

- 以下のうち、今回行う分類において必要ない作業を選んでください。

- データを用意する
- データを分類する上で注目すべき部分を抽出する方法を考え、実装する
- ネットワークモデルにデータを与え、学習を行う
- 上記のすべて

#### ヒント

ニューラルネットワークモデルを用います。前のセッションの内容を踏まえましょう。

#### 解答

- データを分類する上で注目すべき部分を抽出する方法を考え、実装する

***

### 1.2.2 ディープニューラルネットワーク

今回は以下のような形のニューラルネットワークを作ります。  
このニューラルネットワークは、全てのニューロンが前の層のニューロンに結合している **全結合層** と呼ばれる層を2つもっただけの、シンプルなネットワーク構造になっています。  このネットワークの
このようなある程度深さのあるニューラルネットワークを、 **<font color=#AA0000>ディープニューラルネットワーク</font>** と呼びます。
入力を請け負う層を **入力層** 、 出力をする層を **出力層** 、入力層と出力層の間の層を **隠れ層** と言います。

今回のモデルでは、入力には28x28のモノクロ画像を一次元配列に平坦化した784次元のベクトルを渡します。  
出力は10次元のベクトルです。 この縦に並んだベクトルのひとつひとつの要素を **ノード** と呼び、その次元数のことを **ノード数** と呼びます。
手書き数字を0~9の連続値に分類するのではなく、0~9の10個のクラスに分類すると考えるのが自然であるため、出力ユニットの数を1でなく10にします。

正解が7の画像データに対する教師データtは図のように、クラスラベルが7のところだけ値が1となり、それ以外の値が0となります。このようなデータのことを **<font color=#AA0000>one-hot ベクトル</font>** と言います。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_90.png">

**<center>図1.2.2-1 one-hot ベクトル</center>**

#### 問題

- 次のうち、説明文中のモデルの説明として間違ったものを選んでください。

- 入力層のノード数は784
- 出力層のノード数は1
- 隠れ層の数は1

#### ヒント

- 手書き数字を0~9の連続値に分類するのではなく、0~9の10個のクラスに分類すると考えるのが自然です。

#### 解答例

- 出力層のノード数は1

***

### 1.2.3 Keras+Tensorflow

- Tensorflowとは？
- Kerasとは？
- Kerasのメリットとデメリット

#### 問題

- 次の動画をみてください。

https://www.youtube.com/embed/0ObCbapKWIs

***

### 1.2.3 Kerasの導入

このchapterでは、 **<font color=#AA0000>Keras</font>** というPythonのライブラリを使います。  
KerasはTensorFlowのラッパーライブラリで、TensorFlowをそのまま使うよりも **直感的でより簡潔にコードを書くこと** ができます。  
TensorFlowはGoogle社によって開発された、機械学習用のオープンソースソフトウェアライブラリです。  
ラッパーというのは、もともとある他のシステムに対し、そのシステムを内包してより使いやすくしたもののことをいいます。

#### 問題

- Kerasの説明として正しいものを1つ選んでください。

- KerasはTensorflowのラッパーライブラリである。
- Tensorflowのコア部分はC++で実装されているので、Kerasはpythonで使うことはできない。
- Kerasは高水準なライブラリであるため、月々の使用料が発生する。
- Kerasはオープンソースライブラリなので、著作権を気にせずに誰でも自由に使って良い。

#### ヒント

- オープンソースライブラリでも、著作権は発生します。

#### 解答例

- KerasはTensorflowのラッパーライブラリである。

***

### 1.2.5 データの概要

- 画像データをどのように扱うのか？
- 画像データをどのように数値に変換するのか

#### 問題

- 次の動画をみてください。

https://www.youtube.com/embed/VY3m1gfABcc

***

### 1.2.6 データの用意

手書き数字のデータセットにはMNISTというデータセットを用います。  
MNISTには、膨大な数の手書き数字画像とそれぞれの画像に対し「０～９」で示された正解ラベルが含まれています。  
MNISTは[Yann LeCun's website](http://yann.lecun.com/exdb/mnist/)で公開されていますが、  
Kerasで以下のコードを実行することで比較的簡単にローカル（ご自身のPC）にダウンロードできます。
```python
from keras.datasets import mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()
```
このコードは、はじめて実行する際はネットからデータのダウンロードを行います。  
すでにローカルにダウンロードされた状態で実行すると、ローカルからデータの読み込みが行えます。

Xが大量の画像データ、yが大量の教師ラベルのデータを意味します。  
trainはモデルの学習用のデータ、testはモデルの性能を評価する際に使うデータです。  
ただしtrainデータとtestデータには、データとして本質的な違いはありません。

#### 問題

- X_train、y_train、X_test、y_test はすべてnumpy.ndarray型です。
- X_train、y_train、X_test、y_test について、 **それぞれの大きさを出力する** ように変更してください。

In [None]:
from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

#---------------------------
#次の一行を変更してください
print(X_train, y_train, X_test, y_test) 
#---------------------------

#### ヒント

numpy.ndarray型は以下で大きさが取得できます。
```python
import numpy as np
A = np.array([[1,2], [3,4], [5,6]])
A.shape 
# 出力結果
(3, 2)
```

#### 解答例

In [None]:
from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

#---------------------------
#次の一行を変更してください
print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)       
#---------------------------

***

### 1.2.7 モデルの生成

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_100.gif">

**<center>図1.2.7-1 ニューラルネットワーク</center>**

Kerasでは、まずモデルを管理するインスタンスを作り、addメソッドで層を一層ずつ定義していきます。

インスタンスを作ります。
```python
model = Sequential()
```
以下のようにaddメソッドを用いてモデルの層を一層ずつ定義します。  
ユニット数128の全結合層を定義しています。
```python
model.add(Dense(128))
```
各全結合層の出力には、次のようにして **活性化関数** と呼ばれる関数を適用します。   
これは本来動物の神経の発火に相当するような仕組みです。シグモイド関数 `sigmoid` やReLU関数 `relu` などを設定できます。詳しくはchapter2で扱います。

```python
model.add(Activation("sigmoid"))
```
最後にコンパイルメソッド `compile()` を用いてどのような学習処理を行うのかを設定して、モデルの生成が終了します。  
様々なパラメータがありますが詳しくはchapter2で扱います。
```python
model.compile(optimizer=sgd, loss="categorical_crossentropy", metrics=["accuracy"])
```

はじめはネットワークモデルの構築のイメージがよくわからないと思うので、次の問題を見て流れを理解してください。

#### 問題

- 以下のコードでは、隠れ層1つのネットワークモデルを生成しています。空欄を埋めて、隠れ層を2つ持つ、下図のようなモデルが生成されるようにしてください。活性化関数にはReLU関数 `relu` を用いてください。

<img src="https://aidemyexcontentspic.blob.core.windows.net/contents-pic/5090_dnn/dnn_chap1_110.png" width=30%>

**<center>図1.2.7-2 モデル</center>**

In [None]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.utils.vis_utils import plot_model
from keras.utils.np_utils import to_categorical
import matplotlib.pyplot as plt

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
# 入力ユニット数は784, 1つ目の全結合層の出力ユニット数は256
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))

# 2つ目の全結合層の出力ユニット数は128
#---------------------------
#        ここを書いて下さい


#---------------------------

# 3つ目の全結合層（出力層）の出力ユニット数は10
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

# モデル構造の出力
plot_model(model, "model125.png", show_layer_names=False)
# モデル構造の可視化
image = plt.imread("model125.png")
plt.figure(dpi=150)
plt.imshow(image)
plt.show()

#### ヒント

- 以下の文でモデルの構造png画像に出力しています。  
```python
plot_model(model, "model125.png", show_layer_names=False)
```
出力画像が上の図と一致するように、モデルを定義してください。

#### 解答例

In [None]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.utils.vis_utils import plot_model
from keras.utils.np_utils import to_categorical
import matplotlib.pyplot as plt

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
# 入力がユニット数は784, 1つ目の全結合層の出力ユニット数は256
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))

# 2つ目の全結合層の出力ユニット数は128
#---------------------------
#        ここを書いて下さい
model.add(Dense(128))
model.add(Activation("relu"))
#---------------------------

# 3つ目の全結合層（出力層）の出力ユニット数は10
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

# モデル構造の出力
plot_model(model, "model125.png", show_layer_names=False)
# モデル構造の可視化
image = plt.imread("model125.png")
plt.figure(dpi=150)
plt.imshow(image)
plt.show()

***

### 1.2.8 モデルの学習

モデルに訓練データを渡して学習を行います。以下のようにfitメソッドを使います。
```python
model.fit(X_train, y_train, verbose=1, epochs=3)
```
X_train、y_trainは、学習用の入力データと教師データです。  
`verbose` は指定した数字によって学習の進捗度合いを表示するかしないかを指定でき、 `verbose=1` と入力することで、学習等の進捗度合いを出力し `verbose=0` にすると進捗度合いを出力しません。  
`epochs`で、同じデータセットを使って何回繰り返し学習を行うかを指定します。詳しくは、chapter2の反復学習についてのセッションで学びます。  
fitメソッドでは、学習用のデータ（トレーニングデータ）を順にモデルに入力し、 **出力と教師データとの間の差が小さくなるよう少しずつ各ニューロンの重みを更新します。**  
これによって誤差が減少していき、モデルの予測精度が向上します。

#### 問題

- 空欄を埋めて実際に学習を行ってください。また徐々に正解率 `acc：` が上がっていることを確認してください。

In [None]:
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential
from keras import optimizers
from keras.utils.np_utils import to_categorical
import matplotlib.pyplot as plt

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])
#---------------------------
#        ここを書いて下さい
#---------------------------
#acc, val_accのプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.legend(loc="best")
plt.show()

#### ヒント

- `model.fit(...)` の出力 `acc:` の後に正解率が表示されています。

#### 解答例

In [None]:
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential
from keras import optimizers
from keras.utils.np_utils import to_categorical
import matplotlib.pyplot as plt

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])
#---------------------------
history = model.fit(X_train, y_train, verbose=1, epochs=3)
#---------------------------
#acc, val_accのプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.legend(loc="best")
plt.show()

***

### 1.2.9 モデルの評価

訓練データを用いて学習を行い、モデルのチューニングが無事に進みました。<br>
しかし、モデルが、訓練データのみに通用する手法を学習してしまっている可能性もあるため、<br>
これだけではモデルの性能を正しく評価することはできません。<br>

そこで、ここでは **学習に用いなかったテストデータを用いてモデルに分類をさせ、モデルの評価** を行います。<br>
モデルにテストデータを渡した時の分類の精度を、 <font color=#AA0000>汎化精度</font> といいます。<br>

汎化精度の計算には以下のように **`evaluateメソッド`** を使います。
```python
score = model.evaluate(X_test, y_test, verbose=1)
```
`X_test, y_test` は評価用の入力データと教師データです。<br>
`evaluateメソッド` では、損失関数の値と正解率が取得でき、上の例の場合両方ともscoreに格納されます。<br>

テストデータは汎化精度の計算のためにあり、テストデータで学習を行うことは望ましくありません。

#### 問題

- 空欄を埋めて実際に汎化精度を計算してださい。訓練データを用いた時の正解率とテストデータを用いた時の正解率が異なることを確認してください。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential, load_model
from keras import optimizers
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:10000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:10000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(X_train, y_train, verbose=1)

#---------------------------
#        ここを書いて下さい
#---------------------------
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

#### ヒント

`model.evaluate()`を用いて汎化制度の評価が行えます。

#### 解答例

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense, Dropout
from keras.models import Sequential, load_model
from keras import optimizers
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(X_train, y_train)

#---------------------------
score = model.evaluate(X_test, y_test, verbose=1)
#---------------------------
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

### 1.2.10 モデルによる分類

modelの **`predictメソッド`** を使って予測値を取得できます。  
例えば `X_test` の初めの画像１枚の数字を予測するには以下のようにします。
(`predict` は複数枚の画像を引数に取ることを想定しているため、画像一枚を予測させる場合は次元に注意する必要があります。）
```python
pred = np.argmax(model.predict([X_test[0]]))
print("予測値 :" + str(pred))
```
`predictメソッド` の出力は10次元あるので、 `argmax関数` を使って、一番大きい値を返すニューロンの場所を取得しています。

#### 問題

- 学習を行った上で、test[0:10]の予測値を出力をしてください。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential, load_model
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(X_train, y_train, verbose=1)

score = model.evaluate(X_test, y_test, verbose=0)
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

# テストデータの最初の10枚を表示します
for i in range(10):
    plt.subplot(1, 10, i+1)
    plt.imshow(X_test[i].reshape((28,28)), "gray")
plt.show()

# X_testの最初の10枚の予測されたラベルを表示しましょう
#---------------------------
#        ここを書いて下さい
#---------------------------

#### ヒント

`model.predict()`を用いて予測を行うことができます。
`argmax()`関数で行列の軸を指定するのを忘れないようにしましょう。
`axis=1`を引数に指定することで行ごとの最大値のインデックスを取得できます。

#### 解答例

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential, load_model
from keras.utils.np_utils import to_categorical

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:6000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:6000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(X_train, y_train, verbose=1)

score = model.evaluate(X_test, y_test, verbose=0)
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

# テストデータの最初の10枚を表示します
for i in range(10):
    plt.subplot(1, 10, i+1)
    plt.imshow(X_test[i].reshape((28,28)), "gray")
plt.show()

# X_testの最初の10枚の予測されたラベルを表示しましょう
#---------------------------
pred = np.argmax(model.predict(X_test[0:10]), axis=1)
print(pred)
#---------------------------

***

## 1.3 添削問題

ここまでで簡単な深層学習手法が使えるようになりました。  
添削問題で復習をします。

#### 問題

- 以下は、MNISTの分類のコードです。  
コードを読んで、モデルの生成、学習、モデルによる分類、がどの行（複数行選択可）で行われいるかを答えてください。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential, load_model
from keras.utils.np_utils import to_categorical

# データセットの読み込み
(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:10000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:10000]
y_test = to_categorical(y_test)[:1000]

model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(X_train, y_train, verbose=1)

score = model.evaluate(X_test, y_test, verbose=0)
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

for i in range(10):
    plt.subplot(1, 10, i+1)
    plt.imshow(X_test[i].reshape((28,28)), "gray")
plt.show()

pred = np.argmax(model.predict(X_test[0:10]), axis=1)
print(pred)

#### ヒント

- modelに着目してみてください。

#### 解答例

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.layers import Activation, Dense
from keras.models import Sequential, load_model
from keras.utils.np_utils import to_categorical

# データセットの読み込み
(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 784)[:10000]
X_test = X_test.reshape(X_test.shape[0], 784)[:1000]
y_train = to_categorical(y_train)[:10000]
y_test = to_categorical(y_test)[:1000]

#1.  モデルの生成
model = Sequential()
model.add(Dense(256, input_dim=784))
model.add(Activation("sigmoid"))
model.add(Dense(128))
model.add(Activation("sigmoid"))
model.add(Dense(10))
model.add(Activation("softmax"))

model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

#2. 学習
model.fit(X_train, y_train, verbose=1)

score = model.evaluate(X_test, y_test, verbose=0)
print("evaluate loss: {0[0]}\nevaluate acc: {0[1]}".format(score))

for i in range(10):
    plt.subplot(1, 10, i+1)
    plt.imshow(X_test[i].reshape((28,28)), "gray")
plt.show()

# 3.　モデルによる分類
pred = np.argmax(model.predict(X_test[0:10]), axis=1)
print(pred)

***