# 日産コンテスト 画像認識

名前：ク　レンイ

学部：経済学部PEARLプログラム

学年：３

## 手順１：事前準備

#### パッケージのインポート

In [1]:
import Augmentor
import glob
import random
import keras
import os
import cv2
import shutil
import splitfolders

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from PIL import Image
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Dropout, Flatten, Dense

Using TensorFlow backend.


#### パラメーターの設定

In [2]:
batch_size = 128
epochs = 20
w = 1920
h = 1080

## 手順２：画像の読み込み

JupyterHubでやってみましたが、色々な問題が出ました。

以下のように、駐車場の画像数と街の画像数を受けました。

```{python}
parking_list = list(map(Image.open, glob.glob('train/parking/*.png')))
street_list = list(map(Image.open, glob.glob('train/street/*.png')))
print('Number of Parking Images: ',len(parking_list))
print('Number of Street Images:  ',len(street_list))
print('Shape of each image:      ',np.array(parking_list[11]).shape)
```

```
Number of Parking Images:  3346
Number of Street Images:   26597
Shape of each image:       (1080, 1920, 3)
```

街の画像数(26597)に比べて、駐車場の画像数(3346)が少ないので、このままで続くとバイアスがありますでしょう。駐車場データの水増しが必要と思いますが、JupyterHub内のデータはread-onlyなので、kerasのImageDataGenerator以外の方法でどうしても水増しができませんでした。ImageDataGeneratorを使ったら、駐車場データだけの水増しではなく、全データセットの水増しになるので、JupyterHubでいい結果が出ないと判断しました。

なので、Boxからビデオデータをダウンロードし、自分でffmpegでビデオデータを画像データに変えました。

私のパソコンはSurface Pro 6なので、1920x1080の画像データの処理は大変時間が掛かります。以下で1920x1080の画像データを480x270に変え、駐車場の画像のみを水増ししました。

#### 画像データのresize

In [3]:
# # 一回のみ
# for image in os.listdir('parking'):
#     im = Image.open('parking'+r'/'+image)
#     im = im.resize((480,270))
#     im.save('resized'+r'/'+image)
# print('done')

#### 駐車場画像の水増し

In [4]:
# # 一回のみ
# p = Augmentor.Pipeline("train/parking")
# p.flip_left_right(0.5)
# p.zoom_random(0.5,0.3)
# p.random_distortion(0.5,4,4,8)
# p.random_brightness(0.5,0.7,1.3)
# p.skew(0.5,0.5)
# p.sample(18000)
# print('done')

#### 画像枚数の確認

In [6]:
# 画像データをもう分けましたので、これをコメントしています。
# total_parking=len(os.listdir('data/parking'))
# print('Number of Parking Images: {}'.format(total_parking))
# total_street=len(os.listdir('data/street'))
# print('Number of Street Images: {}'.format(total_street))
# total_data=total_parking+total_street
# print('Total Images: {}'.format(total_data))

total_train = len(os.listdir('data/train/parking')+os.listdir('data/train/street'))
total_val = len(os.listdir('data/val/parking')+os.listdir('data/val/street'))
total_test = len(os.listdir('data/test/parking')+os.listdir('data/test/street'))
total_parking = len(os.listdir('data/train/parking')+os.listdir('data/val/parking')+os.listdir('data/test/parking'))
total_street = len(os.listdir('data/train/street')+os.listdir('data/val/street')+os.listdir('data/test/street'))
print("Number of Parking Images: ",total_parking)
print("Number of Street Images:  ",total_street)
print("Total Number of Images:   ",total_parking+total_street)
print("")
print("Number of Train Images:   ",total_train)
print("Number of Val Images:     ",total_val)
print("Number of Test Images:    ",total_test)

今、駐車場の画像数(21544)と街の画像数(21612)は大体同じになりました。

```{python}
# 試み1
directory = "train/"
images = []
labels = np.array([])

for label in os.listdir(directory):
    if label == 'parking':
        code = 0
    elif label == 'street':
        code = 1

    for img in os.listdir(directory+label):
        image = cv2.imread(directory+label+r'/'+img)
        np.append(images, image, axis=0)
        np.append(labels, label, axis=0)
```

```{python}
# 試み２
parking_list = list(map(cv2.imread, glob.glob('train/parking/*.png')))
street_list = list(map(cv2.imread, glob.glob('train/street/*.png')))
X = np.array(parking_list+street_list)
y = [1]*len(parking_list)+[0]*len(street_list)
```

train_test_splitのため、cv2で以上のように読み込んでみましたが、resizeしても四万枚画像を数値arrayに変える事は時間が掛かるので、cross validationができないと判断し、trainsetとtestsetをマニュアル作成しました。

#### データセットのマニュアル作成

In [None]:
# # 一回のみ
# splitfolders.ratio('Data', output="Data", seed=123, ratio=(.8,0.1,0.1)) 

#### 画像の読み込み

In [None]:
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_data = train_datagen.flow_from_directory('data/train',
                                              batch_size = batch_size,
                                              classes = ['parking','street'],
                                              shuffle = True,
                                              target_size = (h,w),
                                              class_mode = 'binary')

val_data = test_datagen.flow_from_directory('data/val',
                                              batch_size = batch_size,
                                              classes = ['parking','street'],
                                              shuffle = True,
                                              target_size = (h,w),
                                              class_mode = 'binary')

#### 画像の可視化

In [None]:
sample_imgs, _ = next(train_data)
fig, axes = plt.subplots(1,5,figsize=(20,20))
axes = axes.flatten()
for img, ax in zip(sample_imgs[:5], axes):
    ax.imshow(img)
    ax.axis('off')
plt.tight_layout()
plt.show()

## 手順３：モデル

In [None]:
def get_model():
    model = Sequential([
        Conv2D(128, 3, activation='relu', input_shape=(h,w,3)),
        Dropout(0.2),
        MaxPooling2D(),
        Conv2D(64, 3, activation='relu'),
        Dropout(0.2),
        MaxPooling2D(),
        Conv2D(32, 3, activation='relu'),
        Dropout(0.2),
        MaxPooling2D(),
        Flatten(),
        Dense(16, activation='relu'),
        Dense(1, activation='sigmoid')
    ])
    return model

In [None]:
model = get_model()
model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy'])
model.summary()

In [23]:
history = model.fit(train_data,
                    steps_per_epoch=total_train // batch_size,
                    epochs=epochs,
                    validation_data=val_data,
                    validation_steps=total_val // batch_size)

Epoch 1/20


AttributeError: 'ProgbarLogger' object has no attribute 'log_values'