# 画像認識による乗り物分類レシピ

https://axross-recipe.com/recipes/1

### Flickr API の準備

以下の３つの乗り物の画像を分類する
- 電車
- 車
- 自転車

In [15]:
import glob
import os
import time

from urllib.request import urlretrieve
from flickrapi import FlickrAPI
import numpy as np
from PIL import Image
from sklearn import model_selection

In [13]:
# APIキー情報
FLICKR_KEY = os.environ['FLICKR_KEY']
FLICKR_SECRET = os.environ['FLICKR_SECRET']

# 乗り物の名前
VEHICLES = ["train", "car", "bicycle"]

# 乗り物をループしてデータを取得
for vehicle in VEHICLES:
    # 保存フォルダの指定
    save_dir = os.path.join("datasets", vehicle)
    os.makedirs(save_dir, exist_ok=True)

    # Flickr APIの初期化
    flickr = FlickrAPI(FLICKR_KEY, FLICKR_SECRET, format="parsed-json")
    
    # 乗り物の名前を指定して100件の画像情報を取得
    result = flickr.photos.search(text=vehicle,
                                                      per_page=100,
                                                      media="photos",
                                                      sort="relavance",
                                                      safe_search=1,
                                                      extras="url_q, licence")
    
    # 画像情報から実際の画像ファイルを取得
    photos = result["photos"]
    for photo in photos["photo"]:
        # 画像のURL
        url_q = photo["url_q"]
        # 画像のダウンロード先
        filepath = os.path.join(save_dir, photo["id"] + ".jpg")
        # 画像を指定したパスにダウンロードして保存
        urlretrieve(url_q, filepath)
        # クローリング先のサーバーに負荷を与えない
        time.sleep(1)

### データセットを交差検証用に分割する

In [18]:
# 乗り物の名前
VEHICLES = ["train", "car", "bicycle"]
# データセットのフォルダパス
DATASET_DIR = os.path.join("datasets")

datasets = []
labels = []

for index, label in enumerate(VEHICLES):
    # 画像の読み込み
    photos_dir = os.path.join(DATASET_DIR, label)
    filepaths = glob.glob(os.path.join(photos_dir, "*.jpg"))
    
    # 画像を順次処理してデータセットを作成
    for i, filepath in enumerate(filepaths):
        # 各乗り物のデータを100に揃える
        if i >= 100:
            break
        
        # 画像の読み込み
        image = Image.open(filepath)
        # RGBの3色に変換
        image = image.convert("RGB")
        # 画像のサイズを統一
        image = image.resize((50, 50))
        # 画像を数値の配列に変換
        dataset = np.asarray(image)
        # データセットを追加
        datasets.append(dataset)
        # ラベルを追加
        labels.append(index)

# Tensorflow がデータを処理しやすいように numpy の array に変換
datasets = np.array(datasets)
labels = np.array(labels)

# データセットとラベルの両方を学習データとテストデータに分類
dataset_train, dataset_test, label_train, label_test = model_selection.train_test_split(datasets, labels)

# 分類したデータをファイルに保存
data = (dataset_train, dataset_test, label_train, label_test)
np.save(os.path.join(DATASET_DIR, "vehicle.npy"), data)

### モデルのトレーニング

In [20]:
import keras
from keras.layers import (Activation, Conv2D, Dense, Dropout, Flatten, MaxPooling2D)
from keras.models import Sequentialfrom keras.utils import np_utils

In [21]:
# 乗り物の名前
VEHICLES = ["train", "car", "bicycle"]
# データセットのフォリダパス
DATASET_DIR = os.path.join("datasets")

# データセットの読み込み
dataset_train, dataset_test, label_train, label_test = np.load(os.path.join(DATASET_DIR, "vehicle.npy"), allow_pickle=True)