# Аугментация. ООП.

Аугментация (от англ. "augment" - "расширять") - это процесс увеличения размера выборки за счет преобразования имеющихся изображений. Например, одним из самых простых способов аугментации является зеркальное отображение картинки. Таким образом, можно из N картинок получить 2\*N изображений.

<tr>
<td><img style="transform: scaleX(-1); width:30%" alt="Drawing" src="./imgs/puppy-dog.jpg " /></td>
<td><img style="width:30%" alt="Drawing" src="./imgs/puppy-dog.jpg" /></td>
</tr>

## Но сначала: как загрузить картинку?
Есть несколько способов считать изображение и представить его в виде массива пикселей (например, это может быть numpy массив). Рассмотрим каждый из них по порядку, импортировав перед этим пакет matplotlib.pyplot, который поможет выводить массив пикселей в виде изображения. Строка "%matplotlib inline" - указывает jupyter notebook-у выводить изображения сразу под ячейкой, в которой используется matplotlib (это позволяет нам не писать явно plt.show( ) в каждой ячейке).

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

### OpenCV

In [None]:
import cv2

In [None]:
img = cv2.imread('./imgs/raccoon.jpg')
print(type(img), img.shape)

In [None]:
plt.imshow(img)

По умолчанию, openCV предполагает, что каналы в картинке расположены в порядке Blue Green Red, поэтому изображение выглядит не естественно. Чтобы конвертировать картинку из BGR в RGB, воспользуемся функцией cv2.cvtColor( )

In [None]:
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img)

### PIL.Image

In [None]:
import PIL
import numpy as np

In [None]:
pil_img = PIL.Image.open('./imgs/raccoon.jpg')
print(type(pil_img), img.shape)

Плюс PIL.Image изображений в том, что их можно отобразить при помощи встроенной функции display, сохраняя исходный размер изображения.

In [None]:
display(pil_img)

Но функци plt.imshow( ) также может принимать PIL картинку, но размер изображения, возможно, придется корректировать.

In [None]:
plt.figure(figsize=(10, 16)) # изменим размер графического окна
plt.imshow(pil_img)
plt.axis('off'); # удалим ось Х и ось У

Конвертировать PIL изображение в numpy.ndarray можно при помощи функции np.asarray( )

In [None]:
img = np.asarray(pil_img)
print(type(img), img.shape)

---

## Аугментация

### pytorch transforms

In [None]:
import torch
from torchvision.transforms import (Compose, RandomAffine, RandomVerticalFlip, ToTensor)

In [None]:
rotate_aug = RandomAffine(degrees=45, fillcolor=(255, 255, 255))

In [None]:
auged_img = rotate_aug(pil_img)
plt.imshow(auged_img)

In [None]:
type(auged_img)

### albumentations
[github репозиторий](https://github.com/albu/albumentations)

In [None]:
import albumentations as alb

In [None]:
brightness_aug = alb.RandomBrightness(limit=0.5, always_apply=False, p=1)

In [None]:
auged_img = brightness_aug(image=img)['image']
plt.imshow(auged_img)

### imgaug
[github репозиторий](https://github.com/aleju/imgaug)

In [None]:
import imgaug.augmenters as iaa

In [None]:
coarse_dropout_aug = iaa.CoarseDropout(p=0.5, size_percent=0.5, per_channel=True)

In [None]:
auged_img = coarse_dropout_aug.augment_image(img)
plt.imshow(auged_img)

---
## ООП

### Синтетический пример

In [None]:
class Human():

### Свой класс для аугментации
Создадим свой класс для аугментации, который будет включать в себя все три приведенных выше библиотеки и иметь API сходное с torchvision.transforms.

API - (Application Programming Interface - программный интерфейс программирования) это в каком-то смысле синоним слову "протокол". АПИ (как говорят программисты из России) - определяет функционал приложения или класса. Вот как в контексте общения двух программистов используется понятие АПИ:

-(П1): Я хочу чтобы ты написал скрипт, в котором есть функция summ(array), которая принимает на вход список или numpy массив, а на выходе возвращает число, которое является суммой всех элементов

-(П2): Принято, сделаю

In [None]:
class MyAUG():