In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import glob
import cv2
import tensorflow as tf
from tensorflow import keras
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout, BatchNormalization
from keras.models import Sequential
from sklearn.metrics import accuracy_score
import os

Using TensorFlow backend.


In [5]:
%%time
#Чтобы не терять время на препроцессинг, просто загрузим ранее приготовленные данные
training_fruit_img = np.load('training_fruit_img.npy')
test_fruit_img = np.load('test_fruit_img.npy')
training_label_id = np.load('training_label_id.npy')
test_label_id = np.load('test_label_id.npy')

Wall time: 19.3 s


In [4]:
#Исходная архетиктура сети, состоящая из 4х свёрточных слоёв и двух полносвязных.
model = Sequential()
model.add(Conv2D(16, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(64, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Flatten())
model.add(Dense(256, activation = "relu"))
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [6]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 1min 20s


<keras.callbacks.callbacks.History at 0x2397ad0dd08>

In [7]:
#Валидация на тесте
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9755600814663951

In [68]:
#Попробуем использовать свёрточные слои предобученной сети VGG16
from keras.applications import VGG16
image_size = 64
vgg_conv = VGG16(weights='imagenet', include_top=False, input_shape=(image_size, image_size, 3))
for layer in vgg_conv.layers[:-2]:
    layer.trainable = False

model = Sequential()
model.add(vgg_conv)
model.add(Flatten())
model.add(Dense(128, activation='relu', )) 
model.add(Dense(120, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='Adam', metrics=['accuracy'])

In [69]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 4min 7s


<keras.callbacks.callbacks.History at 0x23b78ae40c8>

In [70]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9798273688294055

In [71]:
#Мы добились незначительного роста точности, потеряв время на обучение

In [45]:
#Добавим в исходную архитектуру дропаут-слои
model = Sequential()
model.add(Conv2D(16, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(Dropout(0.5))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(Dropout(0.5))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(64, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Flatten())
model.add(Dense(256, activation = "relu"))
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [46]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 1min 48s


<keras.callbacks.callbacks.History at 0x23b752b3788>

In [47]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9380758413344972

In [None]:
#Дропауты явно только ухудшили точность предсказания. Это свидетельствует об отсутствии переобучения в исходной модели.

In [48]:
#Упростим архитектуру сети, исключив 1 свёрточный слой.
model = Sequential()
model.add(Conv2D(16, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))


model.add(Flatten())
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [49]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 1min 14s


<keras.callbacks.callbacks.History at 0x23b7582c248>

In [50]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9709048588885656

In [51]:
#Мы упростили архитектуру сети, что не привело к ухудшению точности на тесте. Попробуем упростить ещё сильнее

In [53]:
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(BatchNormalization())
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(64, (3, 3), padding = "same", activation = "relu"))
model.add(BatchNormalization())
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Flatten())
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [54]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 4min 6s


<keras.callbacks.callbacks.History at 0x23b761156c8>

In [55]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9818155368053535

In [56]:
#Точность возрасла. Проверим гипотизу о том, что в данной ситуации большую роль сыграла батч-нормализация

In [57]:
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(64, (3, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Flatten())
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [58]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 1min 38s


<keras.callbacks.callbacks.History at 0x23b76805c08>

In [59]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9709048588885656

In [60]:
#В данном эксперименте точность предсказания без батч-нормализации упала.
#С другой стороны не следует исключать элемент случайности в первоначальной генерации весов. Эксперименты показывают,
# что при многократном повторе обучения, точность на тесте варьируется в пределах не более 0.01.
#При использовании GPU невозможно полностью исключить случайность

In [7]:
#Попробуем ещё сильнее упростить архитектуру сети.
#Батч-нормализацию берём в качестве компенсации предполагаемой потери точности.
model = Sequential()
model.add(Conv2D(64, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(BatchNormalization())
model.add(MaxPooling2D(pool_size = (4, 4)))


model.add(Flatten())
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [8]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 4min 50s


<keras.callbacks.callbacks.History at 0x264fbb3d2c8>

In [63]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9821549801183203

In [64]:
#На данный момент мы получили лучшее лучшую точность, используя всего 1 свёрточный слой.
#Исходя из полученных данных можно сделать вывод о том, что для данного набора изображений
#не обязательно использовать сложную многослойную архитектуру нейронной сети, которая может приводить к переобучению.
#Сохраним модель вместе с весами
model.save('best_model.h5')

In [65]:
#Сделаем заключительный тест без батч-нормализации, что позволит значительно сократить время обучения
model = Sequential()
model.add(Conv2D(64, (3, 3), input_shape = (64, 64, 3), padding = "same", activation = "relu"))
model.add(MaxPooling2D(pool_size = (4, 4)))

model.add(Flatten())
model.add(Dense(120, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = 'Adam', metrics = ['accuracy'])

In [66]:
%%time
model.fit(training_fruit_img, training_label_id, batch_size = 256, epochs = 10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Wall time: 1min 39s


<keras.callbacks.callbacks.History at 0x23b78846608>

In [67]:
predicted_classes = model.predict_classes(test_fruit_img)
accuracy_score(predicted_classes, test_label_id)

0.9713897779070895