# ImageNet

ImageNetは画像認識用データセットです。

+ 1,400万枚超の画像
+ 画像に写っている物体名(クラス名)を付与
+ 物体名(クラス名)は2万種類超

# 転移学習

ファインチューニング(fine tuning)とも呼ばれ、既存のモデルの一部を再利用して、新しいモデルを構築する手法。

Kerasが所有する学習済みモデルは、全てがImageNetを学習用データセットとして使用しています。

+ Xception：データ/ImageNet　サイズ/299×299　ライセンス/MIT
+ VGG16：データ/ImageNet　サイズ/224×224　ライセンス/CC
+ VGG19：データ/ImageNet　サイズ/224×224　ライセンス/CC
+ ResNet50：データ/ImageNet　サイズ/224×224　ライセンス/MIT
+ InceptionV3：データ/ImageNet　サイズ/299×299　ライセンス/Apache
+ InceptionResNetV2：データ/ImageNet　サイズ/299×299　ライセンス/Apache
+ MobileNet：データ/ImageNet　サイズ/224×224　ライセンス/Apache
+ DenseNet：データ/ImageNet　サイズ/224×224　ライセンス/三条項BSD
+ NASNetLarge：データ/ImageNet　サイズ/331×331　ライセンス/Apache
+ NASNetMobile：データ/ImageNet　サイズ/224×224　ライセンス/Apache
+ MobileNetV2：データ/ImageNet　サイズ/224×224　ライセンス/Apache

がある。（https://keras.io/ja/applications/）

### ResNet50を使用した推論サンプル

In [11]:
#  ResNet50学習済みモデルを読み込む
from keras.applications.resnet50 import ResNet50
model = ResNet50(weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(224,224,3) ==>> (1,224,224,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.resnet50 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.resnet50 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n02504458', 'African_elephant', 0.87788874), ('n01871265', 'tusker', 0.06699309), ('n02504013', 'Indian_elephant', 0.054916885)]


### VGG16を使用した推論サンプル

In [17]:
#  VGG16学習済みモデルを読み込む
from keras.applications.vgg16 import VGG16
model = VGG16(weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(224,224,3) ==>> (1,224,224,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.vgg16 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.vgg16 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n02504458', 'African_elephant', 0.8740792), ('n01871265', 'tusker', 0.07707865), ('n02504013', 'Indian_elephant', 0.048668653)]


### ResNet50を使用した推論サンプル

入力ベクトル変更ばバージョン

In [14]:
# 入力ベクトルの定義
from keras.layers import Input
input_tensor = Input(shape=(640, 426, 3)) 

#  ResNet50学習済みモデルを読み込む
from keras.applications.resnet50 import ResNet50
model = ResNet50(input_tensor=input_tensor,weights='imagenet')

# 画像データを読み込む
from keras.preprocessing import image
img_path = './data/elephant_640_426.jpg'
img = image.load_img(img_path, target_size=(640, 426))
x = image.img_to_array(img) # 配列化
import numpy as np
x = np.expand_dims(x, axis=0) # CNN用に拡張する(224,224,3) ==>> (1,224,224,3)

# 画像の正規化などを自動的に行ってくれる
from keras.applications.resnet50 import preprocess_input
x = preprocess_input(x)

# 予測値の算出
prediction = model.predict(x)

# 予測値からクラス名を呼び出す
from keras.applications.resnet50 import decode_predictions
class_acc = decode_predictions(prediction, top=3)[0]
print(class_acc)

[('n02504458', 'African_elephant', 0.073723026), ('n02437312', 'Arabian_camel', 0.055587716), ('n02504013', 'Indian_elephant', 0.03208736)]
