In [None]:
!wget https://pbs.twimg.com/media/E167M0tWQAgC23h.jpg

In [None]:
import cv2
import numpy as np

import matplotlib.pyplot as plt

In [None]:
IMG_PATH = 'E167M0tWQAgC23h.jpg'

# Считывание изображений

Считать изображение с диска можно с помощью функции imread:

In [None]:
img = cv2.imread(IMG_PATH)

отобразим изображение:

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img)

Как видно, цвета изображения неправильные. Это потому, что функция imread считывает изображения в формате BGR (blue, green, red). Чтобы перейти к более привычному представлению RGB (reg, green, blue), который ожидает matplotlib, можно воспользоваться встроенной функцией cvtColor:

In [None]:
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_rgb)

# Работа с изображением

Загруженное цветное изображение является обычным numpy массивом с тремя размерностями, каждый элемент которого - целое беззнаковое 8-ми битное число, представляющее квантованную на 256 уровней интенсивность одного из цветов (RGB: 0 - красный, 1 - зеленый, 2 - синий):

In [None]:
print('type(img_rgb) = ', type(img_rgb))
print('img_rgb.shape = ', img_rgb.shape)
print('img_rgb.dtype = ', img_rgb.dtype)

Над изображением можно выполнять те же операции, что и над обычным массивом. Например, рассчитать статистики:

In [None]:
print('img_rgb.min() = ', img_rgb.min())
print('img_rgb.max() = ', img_rgb.max())
print('img_rgb.mean() = ', img_rgb.mean())
print('img_rgb.std() = ', img_rgb.std())
print('np.median(img_rgb) = ', np.median(img_rgb))

присвоить какое-либо значение блоку(пикселю):

In [None]:
img_rgb_2 = img_rgb.copy()
img_rgb_2[100:200, 100:200] = 0

plt.figure(figsize=[10, 10])
plt.imshow(img_rgb_2)

прибавить какое-либо значение блоку(пикселю):

In [None]:
img_rgb_3 = img_rgb.copy()
img_rgb_3[100:200, 100:200, 0] += 40
img_rgb_3[100:200, 200:300, 1] += 40
img_rgb_3[100:200, 300:400, 2] += 40

plt.figure(figsize=[10, 10])
plt.imshow(img_rgb_3)

## Вопрос 1

Что произошло с цветами на изображении img_rgb_2? Почему так произошло?

**Ответ:**

## Упражнение 1 BGR -> RGB
Реализуйте функцию преобразования изображения в формате BGR в формат RGB

In [None]:
def convert_color_bgr_to_rgb(img_bgr):
    # your code here

In [None]:
assert((img_rgb == convert_color_bgr_to_rgb(img)).all())

## Упражнение 2 Изменение яркости
Одним из простейших преобразований изображения является изменение уровня яркости, задаваемое следующим образом:
$$
f'(x, y) = \alpha f(x, y) + \beta
$$

В данном упражнении необходимо реализовать это преобразование, а также исследовать работу при различных значениях параметров. Какую физическую интерпретацию можно дать этому преобразованию?

In [None]:
def change_intensity(img, alpha=1, beta=0):
    # your code here

In [None]:
alpha = 1.2
beta = 10

img_out_cv = np.zeros_like(img_rgb)
cv2.convertScaleAbs(img_rgb, img_out_cv, alpha, beta)

img_out_my = change_intensity(img_rgb, alpha, beta)

assert((img_out_cv == img_out_my).all())

## Упражнение 3 Смешивание изображений $\alpha - blend$

Другим простым преобразованием является смешивание двух изображений, задаваемое как:

$$
    f'(x, y) = \alpha f_1(x, y) + (1 - \alpha) f_2(x, y)
$$

Реализуйте данную операцию и продеменстрируйте ее работу на примере. Изображения можно загрузить так же, как это сделано в начале тетрадки.

Приведите примеры, для каких задач может понадобиться данная операция. 

Как она может быть обобщена на большее количество изображений? Выпишите формулу.

# Нанесение текста и фигур

С помощью OpenCV можно добавить дополнительные элементы на изображение, такие как текст, простые геометрические фигуры и т.д. (см. https://docs.opencv.org/4.x/dc/da5/tutorial_py_drawing_functions.html)

In [None]:
TEXT = 'Shlepa 0.99'
UL_CORNER = (250, 300)  # верхний левый угол
FONT = 0                # шрифт
SCALE = 3               # размер
COLOR = (255, 0, 0)     # цвет - красный
THICKNESS = 5           # толшина линий

img_rgb_4 = img_rgb.copy()

cv2.putText(img_rgb_4, TEXT, UL_CORNER, FONT, SCALE, COLOR, THICKNESS)
cv2.rectangle(img_rgb_4, UL_CORNER, (550, 600), COLOR, THICKNESS)
None

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_rgb_4)

## Вопрос 2

Зачем может понадобиться рисовать на изображении?

**Ответ**:

# Фильтр Байера

Сырые изображения, приходящие с камеры, являются байеризованными. Они представлены в виде двумерного массива, где отдельные пиксели кодируют интенсивность синего, зеленого, красного цветов. 

![Фильтр Байера](https://gadget-news.net/wp-content/uploads/2019/12/slide-16.jpg)

OpenCV позволяет преобразовывать такие изображения в привычные трехканальные изображения. Этот процесс называется дебайеризация или демозаикинг.


## Вопрос 3

Почему на фильтре Байера зеленых пикселей в 2 раза больше чем синих или красных? Можно ли сделать иначе?

**Ответ:**

## Упражнение

Преобразуйте RGB изображение в байеризованное, как на картинке выше, разделив три канала на четыре смежных пикселя

In [None]:
def rgb_to_bayer(img_rgb):
    # your code here

посмотрим на кусочек изображения вблизи:

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_rgb[300:400, 300:400])

Получим его байеризованную версию:

In [None]:
img_bayer = rgb_to_bayer(img_rgb)

Байеризованное изображение должно содержать характерный мазайчный узор:

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_bayer[600:800, 600:800], cmap='Greys_r')

Для дебайеризации можно воспользоваться функцией из OpenCV:

In [None]:
img_debayer = cv2.cvtColor(img_bayer, cv2.COLOR_BAYER_RG2RGB)

Если все сделано верно, то дебайеризованное изображение будет похоже на исходное. Однако точного совпадения не будет. Попытайтесь предположить, почему?

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_debayer[600:800, 600:800])

# Сжатие/расжатие изображений

Изображения в формате JPEG являются сжатыми изображениями и на диске могут занимать существенно меньше места, чем после загрузки в оперативную память. Чтобы загрузить изображения в сжатом формате, можно просто прочитать файл в бинарном режиме:

In [None]:
with open(IMG_PATH, 'rb') as f:
    img_bytes = f.read()

In [None]:
print('type(img_bytes) = ', type(img_bytes))

Считанные данные нужно преобразовать в массив байт для возможности дальнейшего расжатия:

In [None]:
img_buf = np.asarray(bytearray(img_bytes), dtype=np.uint8)

In [None]:
img_buf.shape, img_buf.dtype

In [None]:
img_buf_size = np.array(img_buf.shape).prod()
print('Размер сжатого изображения: {:.3f} МБ'.format(img_buf_size / 1024 / 1024))

Как видим, в сжатом виде изображение занимает мало места и в оперативной памяти. Разожмем его с помощью средств OpenCV:

In [None]:
img = cv2.imdecode(img_buf, cv2.IMREAD_COLOR)

In [None]:
img.shape, img.dtype

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img[:, :, ::-1])

In [None]:
img_size = np.array(img.shape).prod()
print('Размер изображения: {:.3f} МБ'.format(img_size / 1024 / 1024))

Как видим в несжатом представлении изображение занимает существенно больше памяти. Рассчитаем коэффициент сжатия:

In [None]:
print('Коэффициент сжатия: {:.1f}'.format(img_size / img_buf_size))

Изображение можно сжать обратно следующим образом:

In [None]:
ok, img_buf_2 = cv2.imencode('.jpg', img, (cv2.IMWRITE_JPEG_QUALITY, 10))

In [None]:
img_buf_2_size = np.array(img_buf_2.shape).prod()
print('Размер сжатого изображения: {:.3f} МБ'.format(img_buf_2_size / 1024 / 1024))

Алгоритм сжатия определяется указанным расширением, кроме того имеет различные параметры: https://vovkos.github.io/doxyrest-showcase/opencv/sphinxdoc/enum_cv_ImwriteFlags.html. Наиболее используемым является качество сжатия.

Декодируем сжатое с качеством 10 изображение:

In [None]:
img_2 = cv2.imdecode(img_buf_2, cv2.IMREAD_COLOR)

In [None]:
plt.figure(figsize=[10, 10])
plt.imshow(img_2[:, :, ::-1])

## Вопрос 4

Зачем может понадобиться хранить в оперативной памяти сжатые изображения?