# ImageNet

ImageNetは画像認識用データセットです。

+ 1,400万枚超の画像
+ 画像に写っている物体名(クラス名)を付与
+ 物体名(クラス名)は2万種類超

# 転移学習

ファインチューニング(fine tuning)とも呼ばれ、既存のモデルの一部を再利用して、新しいモデルを構築する手法。

Kerasが所有する学習済みモデルは、全てがImageNetを学習用データセットとして使用しています。

|モデル名|学習データ|Default入力ベクトルサイズ|ライセンス|
|:---|:---|:---|:---|
|Xception|ImageNet|299×29|MIT|
|VGG16|ImageNet|224×224|CC|
|VGG19|ImageNet|224×224|CC|
|ResNet50|ImageNet|224×224|MIT|
|InceptionV3|ImageNet|299×299|Apache|
|InceptionResNetV2|ImageNet|299×299|Apache|
|MobileNet|ImageNet|224×224|Apache|
|DenseNet|ImageNet|224×224|三条項BSD|
|NASNetLarge|ImageNet|331×331|Apache|
|NASNetMobile|ImageNet|224×224|Apache|
|MobileNetV2|ImageNet|224×224|Apache|

がある。

参照：https://keras.io/ja/applications/

### ResNet50を使用した推論サンプル

<img src="./data/elephant.jpg" style="position:relative;left:-40%;">

In [2]:
#  ResNet50学習済みモデルを読み込む
from keras.applications.resnet50 import ResNet50
model = ResNet50(weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(224,224,3) ==>> (1,224,224,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.resnet50 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.resnet50 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n02504458', 'African_elephant', 0.7703732), ('n01871265', 'tusker', 0.19408885), ('n02504013', 'Indian_elephant', 0.035537306)]


### VGG16を使用した推論サンプル

In [3]:
#  VGG16学習済みモデルを読み込む
from keras.applications.vgg16 import VGG16
model = VGG16(weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(224,224,3) ==>> (1,224,224,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.vgg16 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.vgg16 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n01871265', 'tusker', 0.6817723), ('n02504458', 'African_elephant', 0.3063876), ('n02504013', 'Indian_elephant', 0.011840123)]


### ResNet50を使用した推論サンプル

入力ベクトル変更ばバージョン

<img src="./data/elephant_640_480.jpg" style="position:relative;left:-20%;">

In [4]:
# 入力ベクトルの定義
from keras.layers import Input
input_tensor = Input(shape=(640, 480, 3)) 

#  ResNet50学習済みモデルを読み込む
from keras.applications.resnet50 import ResNet50
model = ResNet50(input_tensor=input_tensor,weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant_640_480.jpg'
img = image.load_img(img_path, target_size=(640, 480))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(640,480,3) ==>> (1,640,480,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.resnet50 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.resnet50 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n02504458', 'African_elephant', 0.62510407), ('n01871265', 'tusker', 0.17816585), ('n02504013', 'Indian_elephant', 0.097056195)]
