# Свёрточные сети для классификации фруктов

Прежде чем приступить к задаче, ознакомьтесь с рекомендациями:

- Сначала обучите простую сеть на одной эпохе без аугментации. Добейтесь значения точности не менее 30%. Так вы убедитесь, что основной код работает правильно.

- Не применяйте сразу повороты: они значительно увеличивают время обучения. И без них можно добиться нужного качества. 

- Время обучения однослойной сети и архитектуры из 7–8 слоёв может быть одинаковым. Это нормально и связано с особенностями GPU.

Сначала ваш код должен пройти предварительную проверку, а затем его поставят в очередь на обучение. В это время вы можете вернуться в основной курс и продолжить изучать уроки о компьютерном зрении. Когда пройдёт 2–3 часа, загляните в этот урок и проверьте, не завершилось ли обучение модели. Перейти к следующей задаче вы сможете только после того, как решите эту. 

Постройте и обучите свёрточную нейронную сеть на наборе данных с фруктами. Для этого создайте в коде три функции:

- загрузки обучающей выборки load_train() (теперь она вернёт загрузчик данных),
- создания модели create_model(),
- запуска модели train_model().

Добейтесь того, чтобы значение accuracy на тестовой выборке было не меньше **90%**.

У вас есть ограничение: модель должна обучиться за час.

**Подсказка**


Попробуйте:

- Добавить несколько свёрточных слоёв к LeNet и уменьшить размеры полносвязных слоёв.
- Снизить learning rate в алгоритме Adam.
- Увеличить количество эпох.

In [1]:
# Подключение библиотеки
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.layers import Dense
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.layers import Conv2D, Flatten, Dense, AvgPool2D, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator

import matplotlib.pyplot as plt
import numpy as np

In [2]:
# Загрузка обучающей выборки
def load_train(path):
    train_datagen = ImageDataGenerator(validation_split=0.25, rescale=1./255)

    
    train_datagen_flow = train_datagen.flow_from_directory(
        path,
        target_size=(150, 150),
        batch_size=16,
        class_mode='sparse',
        subset='training',
        seed=12345
    )
    
    return train_datagen_flow

In [3]:
# Создание модели
def create_model(input_shape):
    # Инициализируем модель машинного обучения
    model = Sequential()
    # Устанавливаем параметры нейронной сети как c input_shape слоями:
    # Первый входной слой с 6 нейронами и ReLU активацией
    model.add(Conv2D(filters=6, kernel_size=(5, 5), activation="relu", input_shape=input_shape, padding='same'))
    # Второй скрытй слой с уменьшением изображений в 2 раза
    model.add(AvgPool2D(pool_size=(2, 2)))
    # Третий скрытй слой 
    model.add(Conv2D(filters=16, kernel_size=(5, 5), activation="relu", input_shape=input_shape))
    # Четвертый скрытй слой с уменьшением изображений в 2 раза
    model.add(AvgPool2D(pool_size=(2, 2)))
    # Пятый скрытй слой
    model.add(Flatten())
    # Шестой скрытй слой
    model.add(Dense(units=50, activation='relu'))
    # Седьмой скрытй слой
    model.add(Dense(units=25, activation='relu'))
    # Восьмой выходной слой
    model.add(Dense(units=12, activation='softmax'))
    
    # Для настройки гиперпараметров: Основной настраиваемый гиперпараметр в алгоритме Adam — скорость обучения (learning rate). 
    # Это шаг градиентного спуска, с которого алгоритм стартует.
    # По умолчанию он равен 0.001. Уменьшение шага иногда может замедлить обучение, но улучшить итоговое качество модели.
    optimizer_adam = Adam(lr=0.0001)
    
    # Также устанавливаем параметры, отвечающие за обучение
    model.compile(optimizer=optimizer_adam, loss='sparse_categorical_crossentropy', metrics=['acc'])
    
    return model

In [4]:
# Запуск модели
def train_model(model, train_data, test_data, batch_size=None, epochs=10, steps_per_epoch=None, validation_steps=None):      
    model.fit(train_data, 
              validation_data=test_data,
              batch_size=batch_size, epochs=epochs,
              steps_per_epoch=steps_per_epoch,
              validation_steps=validation_steps,
              verbose=2, shuffle=True)
 
    return model

# Вывод на консольное окно

```
2023-05-13 09:57:09.469689: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libnvinfer.so.6

2023-05-13 09:57:09.986521: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libnvinfer_plugin.so.6

2023-05-13 09:57:32.504417: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcuda.so.1

2023-05-13 09:57:33.042889: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1555] Found device 0 with properties: 
pciBusID: 0000:8b:00.0 name: Tesla V100-SXM2-32GB computeCapability: 7.0


coreClock: 1.53GHz coreCount: 80 deviceMemorySize: 31.75GiB deviceMemoryBandwidth: 836.37GiB/s

2023-05-13 09:57:33.042976: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library 
libcudart.so.10.1

2023-05-13 09:57:33.043009: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10

2023-05-13 09:57:34.023002: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcufft.so.10

2023-05-13 09:57:34.083905: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcurand.so.10

2023-05-13 09:57:34.868170: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcusolver.so.10

2023-05-13 09:57:34.946302: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcusparse.so.10

2023-05-13 09:57:34.946416: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7

2023-05-13 09:57:34.955351: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1697] Adding visible gpu devices: 0

Using TensorFlow backend.

Found 17554 images belonging to 12 classes.

Found 7804 images belonging to 12 classes.

2023-05-13 09:57:49.011940: I tensorflow/core/platform/cpu_feature_guard.cc:142] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 AVX512F FMA

2023-05-13 09:57:49.019159: I tensorflow/core/platform/profile_utils/cpu_utils.cc:94] CPU Frequency: 2099995000 Hz

2023-05-13 09:57:49.019674: I tensorflow/compiler/xla/service/service.cc:168] XLA service 0x4cb5c50 initialized for platform 

Host (this does not guarantee that XLA will be used). Devices:

2023-05-13 09:57:49.019701: I tensorflow/compiler/xla/service/service.cc:176]   StreamExecutor device (0): Host, Default Version

2023-05-13 09:57:49.162753: I tensorflow/compiler/xla/service/service.cc:168] XLA service 0x4acc750 initialized for platform CUDA (this does not guarantee that XLA will be used). Devices:

2023-05-13 09:57:49.162789: I tensorflow/compiler/xla/service/service.cc:176]   StreamExecutor device (0): Tesla V100-SXM2-32GB, Compute Capability 7.0

2023-05-13 09:57:49.165173: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1555] Found device 0 with properties: 

pciBusID: 0000:8b:00.0 name: Tesla V100-SXM2-32GB computeCapability: 7.0

coreClock: 1.53GHz coreCount: 80 deviceMemorySize: 31.75GiB deviceMemoryBandwidth: 836.37GiB/s

2023-05-13 09:57:49.165235: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudart.so.10.1

2023-05-13 09:57:49.165245: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10

2023-05-13 09:57:49.165278: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcufft.so.10

2023-05-13 09:57:49.165289: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcurand.so.10

2023-05-13 09:57:49.165299: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcusolver.so.10

2023-05-13 09:57:49.165309: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcusparse.so.10

2023-05-13 09:57:49.165316: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7

2023-05-13 09:57:49.169573: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1697] Adding visible gpu devices: 0

2023-05-13 09:57:49.169631: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudart.so.10.1

2023-05-13 09:57:52.904018: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1096] Device interconnect StreamExecutor with strength 1 edge matrix:

2023-05-13 09:57:52.904068: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1102]      0 

2023-05-13 09:57:52.904079: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] 0:   N 

2023-05-13 09:57:52.910951: W tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.cc:39] Overriding allow_growth setting because the TF_FORCE_GPU_ALLOW_GROWTH environment variable is set. Original config value was 0.

2023-05-13 09:57:52.911017: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1241] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 10240 MB memory) -> physical GPU (device: 0, name: Tesla V100-SXM2-32GB, pci bus id: 0000:8b:00.0, compute capability: 7.0)

<class 'tensorflow.python.keras.engine.sequential.Sequential'>

WARNING:tensorflow:sample_weight modes were coerced from
  ...
    to  
  ['...']
WARNING:tensorflow:sample_weight modes were coerced from
  ...
    to  
  ['...']

Train for 1098 steps, validate for 488 steps

Epoch 1/10

2023-05-13 09:58:10.391380: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10

2023-05-13 09:58:16.746058: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7

1098/1098 - 535s - loss: 1.4707 - acc: 0.5493 - val_loss: 0.9113 - val_acc: 0.7291
Epoch 2/10

1098/1098 - 127s - loss: 0.6677 - acc: 0.7984 - val_loss: 0.5808 - val_acc: 0.8150
Epoch 3/10

1098/1098 - 133s - loss: 0.4479 - acc: 0.8598 - val_loss: 0.4946 - val_acc: 0.8450
Epoch 4/10

1098/1098 - 133s - loss: 0.3389 - acc: 0.8906 - val_loss: 0.4041 - val_acc: 0.8584
Epoch 5/10

1098/1098 - 134s - loss: 0.2702 - acc: 0.9124 - val_loss: 0.3306 - val_acc: 0.8862
Epoch 6/10

1098/1098 - 126s - loss: 0.2171 - acc: 0.9303 - val_loss: 0.2969 - val_acc: 0.8975
Epoch 7/10

1098/1098 - 120s - loss: 0.1776 - acc: 0.9432 - val_loss: 0.2782 - val_acc: 0.9050
Epoch 8/10

1098/1098 - 120s - loss: 0.1452 - acc: 0.9546 - val_loss: 0.2573 - val_acc: 0.9100
Epoch 9/10

1098/1098 - 124s - loss: 0.1198 - acc: 0.9624 - val_loss: 0.2305 - val_acc: 0.9221
Epoch 10/10

1098/1098 - 133s - loss: 0.1012 - acc: 0.9695 - val_loss: 0.2413 - val_acc: 0.9158
WARNING:tensorflow:sample_weight modes were coerced from
  ...
    to  
  ['...']
488/488 - 42s - loss: 0.2413 - acc: 0.9158
```