In [1]:
# ライブラリのインポート
import tensorflow as tf
import tflearn
import numpy as np

# CNNの作成、学習に必要なライブラリのインポート
from tflearn.layers.core import input_data, dropout, fully_connected
from tflearn.layers.conv import conv_2d, max_pool_2d
from tflearn.layers.normalization import local_response_normalization
from tflearn.layers.estimator import regression

tf.logging.set_verbosity(tf.logging.ERROR) # 警告を非表示にする

curses is not supported on this machine (please install/reinstall curses for an optimal experience)


In [2]:
# Fashion-MNISTをダウンロードしてdata/fashionに格納
import tensorflow.examples.tutorials.mnist.input_data as input_d

fashion = input_d.read_data_sets(
    'data/fashion', # 格納先のフォルダーを作成
    source_url='http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/',
    one_hot=True    # ラベルをワンホット表現にする
)

Extracting data/fashion\train-images-idx3-ubyte.gz
Extracting data/fashion\train-labels-idx1-ubyte.gz
Extracting data/fashion\t10k-images-idx3-ubyte.gz
Extracting data/fashion\t10k-labels-idx1-ubyte.gz


In [3]:
# 訓練用データをすべて抽出
x_trains, y_trains = fashion.train.next_batch(60000)
print(x_trains.shape)  #出力：(60000, 784)
print(y_trains.shape)  #出力：(60000, 10)

(60000, 784)
(60000, 10)


In [4]:
# 画像データの前処理

# (55000,784)の2階テンソルを(None,28,28,1)の4階テンソルに変換
x_trains = x_trains.reshape([-1, 28, 28, 1])

In [5]:
# 畳み込みネットワークの構築

## 初期化
tf.reset_default_graph()

## 入力層
net = input_data(shape=[None, 28, 28, 1])

## 中間層
# 畳み込み層
# （第1層）畳み込み層1
# ニューロン数：16
# 出力：1ニューロンあたり(28, 28, 1)の3階テンソルを16個出力
net = conv_2d(incoming=net,     # 直前の層を設定
              nb_filter=16,     # フィルターの数は16
              filter_size=3,    # 3×3のフィルターを使用
              padding='same',   # ゼロパディングを行う
              activation='relu' # 活性化関数はReLU
             )

# （第2層）畳み込み層2
# ニューロン数：32
# 出力：1ニューロンあたり(28, 28, 1)の3階テンソルを32個出力
net = conv_2d(incoming=net,     # 直前の層を設定
              nb_filter=32,     # フィルターの数は32
              filter_size=3,    # 3×3のフィルターを使用
              padding='same',   # ゼロパディングを行う
              activation='relu' # 活性化関数はReLU
             )


# （第3層）プーリング層1
# ユニット数：32
# 出力：1ユニットあたり(14, 14, 1)の3階テンソルを32個出力
net = max_pool_2d(incoming=net, # 直前の層を設
                  kernel_size=2 # 縮小対象の領域は2×2
                 )

# （第4層）畳み込み層3
# ニューロン数：64
# 出力：1ニューロンあたり(14, 14, 1)の3階テンソルを64個出力
net = conv_2d(incoming=net,     # 直前の層を設定
              nb_filter=64,     # フィルターの数
              filter_size=3,    # 3×3のフィルターを使用
              padding='same',          # ゼロパディングを行う
              activation='relu' # 活性化関数はReLU
             )

# （第5層）プーリング層2
# 出力：1ユニットあたり(7, 7, 1)の3階テンソルを64個出力
net = max_pool_2d(incoming=net, # 直前の層を設定
                  kernel_size=2 # 縮小対象の領域は2×2
                 )

# ドロップアウト
net = dropout(incoming=net,    # 直前の層を設定
              keep_prob=0.5    # ドロップアウトは50％
             )

# （第6層）全結合層
# ニューロン数：128
# 出力：要素数(128)の1階テンソルを出力
# 全結合層
net = fully_connected(incoming=net,     # 直前の層を設定
                      n_units=128,      # ニューロンの数
                      activation='relu' # 活性化関数はReLU
                     )

# （第7層）出力層
# ニューロン数：10
# 出力：要素数(10)の1階テンソルを出力
net = tflearn.fully_connected(
    incoming=net,                  # 直前の層を設定
    n_units=10,                    # ニューロンの数
    activation='softmax'           # 活性化関数はソフトマックス
)

# 学習条件の設定
net = tflearn.regression(
    incoming=net,                  # 対象のモデルを設定
    optimizer='adam',              # 最適化の手法はAdam
    learning_rate=0.001,           # 学習率
    loss='categorical_crossentropy'# 誤差関数は交差エントロピー
)

In [6]:
# モデルの作成と学習の実行
model = tflearn.DNN(net)      # 作成したCNNと学習条件をセット
model.fit(x_trains,           # 訓練データ(画像)
          y_trains,           # 訓練データ(ラベル)
          n_epoch=10,         # 学習回数
          batch_size=100,     # ミニバッチのサイズ
          validation_set=0.2, # 訓練データの20%をテストデータに使用
          show_metric=True    # 各ステップごとに精度を出力
         )

Training Step: 4799  | total loss: [1m[32m0.13860[0m[0m | time: 75.962s
| Adam | epoch: 010 | loss: 0.13860 - acc: 0.9481 -- iter: 47900/48000
Training Step: 4800  | total loss: [1m[32m0.13548[0m[0m | time: 82.371s
| Adam | epoch: 010 | loss: 0.13548 - acc: 0.9493 | val_loss: 0.19633 - val_acc: 0.9320 -- iter: 48000/48000
--
