## Компьютерное зрение | Дополнение данных
Чтобы сеть лучше обучалась на небольшом наборе данных, можно использовать дополнение данных — технику изменения изображений в обучающем наборе и добавление их в набор. Так, сеть получит больше различных примеров для обучения и, соответственно, будет показывать лучшие результаты.

- Папка с папкой для изображений: "Dataset" (можно изменить в train_dir)
- Размер выходных изображений: 150x150 (можно изменить в img_width, img_height)
- Количество выходных изображений: 9 (можно изменить в number_output_images)


- Редактировать параметры изменения изображений можно в train_datagen.
- Чтобы убрать инвертирование в функции random_invert_img поставте параметр p = 0

## Настройки
Укажем пути к папкам с изображениями, их нужный размер, параметры для обучения

In [1]:
# Путь от этого файла до папки содержащей ТОЛЬКО папку с изображениями
train_dir = F'Dataset'
# Размер выходных изображений
img_width, img_height = 150, 150
# Количество выходных изображений
number_output_images = 9

## Подключение библиотек

In [2]:
# Библиотека для генератора (его можно использовать для обучения и тестирования)
from tensorflow.python.keras.preprocessing.image import ImageDataGenerator
# Библиотека для работы с изображениями
from tensorflow.random import uniform
from tensorflow.keras.preprocessing.image import save_img
import os

## Создаем генератор изображений
Генератор изображений создается на основе класса ImageDataGenerator. Генератор делит значения всех пикселов изображения на 255. Для тестовых данных он дополняет изменёнными изображениями.

In [3]:
# Генератор для обучения
train_datagen = ImageDataGenerator(rotation_range = 180, # Поворот изображения
                                   width_shift_range = 0.1, # Сдвиг по горизонтали
                                   height_shift_range = 0.1, # Сдвиг по вертикали
                                   zoom_range = 0.1, # Увеличение/уменьшение
                                   horizontal_flip = False, # Отражение
                                   fill_mode = 'nearest') # Режим заполнения за границами исходного изображения

Генератор данных для обучения, проверки и тестирования на основе изображений из каталога

In [4]:
# Генератор
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size = (img_width, img_height),
    batch_size = 1)

Found 3 images belonging to 1 classes.


In [5]:
# Фукнкция случайного инвертирования цвета
def random_invert_img(x, p=0.5):
  if  uniform([]) < p:
    x = (255-x)
  else:
    x
  return x

### Сохранение аугментированных изображений

In [6]:
result_path = F'AugmentedDataset'
try:
    os.rmdir(result_path)
except:
    print("Warning: Can't remove dir")
try:
    os.mkdir(result_path)
except:
    print("Warning: Can't create dir")
i = 0 
for augmented_image, num_channels in train_generator:
    filename = result_path+'/'+str(i)+".jpg"
    save_img(filename, random_invert_img(augmented_image[0]))
    i+=1
    if i>=number_output_images:
        break;

