# VGG16をkerasで実装

### ここでは、ImageNetで使っている重みそのままを使用。
Keras Docsより詳細(https://keras.io/ja/applications/)

In [1]:
from keras.applications.vgg16 import VGG16
model = VGG16(include_top=True, weights='imagenet', input_tensor=None, input_shape=None)

Using TensorFlow backend.






Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_tf_dim_ordering_tf_kernels.h5








In [2]:
model.summary()
# 最後の(None, 1000)は1000クラス分類であることを示す。
# Noneは入力サンプル数（入力バッチ数）が決まってないことを意味する。

Model: "vgg16"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 224, 224, 3)       0         
_________________________________________________________________
block1_conv1 (Conv2D)        (None, 224, 224, 64)      1792      
_________________________________________________________________
block1_conv2 (Conv2D)        (None, 224, 224, 64)      36928     
_________________________________________________________________
block1_pool (MaxPooling2D)   (None, 112, 112, 64)      0         
_________________________________________________________________
block2_conv1 (Conv2D)        (None, 112, 112, 128)     73856     
_________________________________________________________________
block2_conv2 (Conv2D)        (None, 112, 112, 128)     147584    
_________________________________________________________________
block2_pool (MaxPooling2D)   (None, 56, 56, 128)       0     

In [4]:
#自分で画像を入力し、学習済みのVGG16にクラスの予測をさせる
from keras.applications.vgg16 import VGG16, preprocess_input, decode_predictions
from keras.preprocessing import image
import numpy as np

# 学習済みのVGG16をロード
# 構造とともに学習済みの重みも読み込まれる
model = VGG16(weights='imagenet')

# 引数で指定した画像ファイルを読み込む
# サイズはVGG16のデフォルトである224x224にリサイズされる
filename = "tundem_bicycle.jpg"
img = image.load_img("tundem_bicycle.jpg", target_size=(224, 224))

# 読み込んだPIL形式の画像をarrayに変換
x = image.img_to_array(img)
print(x.shape)

# 3次元テンソル（rows, cols, channels) を
# 4次元テンソル (samples, rows, cols, channels) に変換
# 入力画像は1枚なのでsamples=1でよい
x = np.expand_dims(x, axis=0)
print(x.shape)

# Top-5のクラスを予測する
# predict()の戻り値はNNの出力であり1000クラスの確率値
# VGG16の1000クラスはdecode_predictions()で文字列に変換される
preds = model.predict(preprocess_input(x))
results = decode_predictions(preds, top=5)[0]

for result in results:
    print(result)
    
# 結果として(WordNet ID, クラス名, 確率)が表示される

(224, 224, 3)
(1, 224, 224, 3)
Downloading data from https://storage.googleapis.com/download.tensorflow.org/data/imagenet_class_index.json
('n02835271', 'bicycle-built-for-two', 0.52718633)
('n03792782', 'mountain_bike', 0.14911012)
('n04336792', 'stretcher', 0.067174084)
('n02950826', 'cannon', 0.03331815)
('n03967562', 'plow', 0.031549867)
