# Цифровая обработка изображений

© Бибиков С.А., к.т.н., доцент кафедры суперкомпьютеров и общей информатики, Самарский университет  
© Петров М.В., старший преподаватель кафедры суперкомпьютеров и общей информатики, Самарский университет

## Практика 2. Работа с изображениями

### Содержание

1. [Библиотеки работы с изображениями](#2.1-Библиотеки-для-работы-с-изображениями)
2. [Получение изображений](#2.2-Получение-изображений)
3. [Работа с RAW изображениями](#2.3-Работа-с-RAW-изображениями)


### 2.1 Библиотеки для работы с изображениями

Библиотеки Python для работы с изображениями:
- `OpenCV`  
  [OpenCV](https://opencv.org/) – библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом. Реализована на C/C++, также разрабатывается для Python, Java, Ruby, Matlab, Lua и других языков. Может свободно использоваться в академических и коммерческих целях — распространяется в условиях лицензии BSD. Первая версия OpenCV была написана на C, начиная со второй версии был осуществлён переход на C++. Все новые разработки и алгоритмы появляются в API C++. Поддерживается привязки на Python, Java и MATLAB/Octave. Значительная часть проекта разработана российской компанией `Itseez`, поглощённой в мае 2016 года корпорацией `Intel`.
- `Scikit-image`  
  [Scikit-image](https://scikit-image.org/) - библиотека, написанная на Python, для обработки изображений. Она обеспечивает ввод/вывод изображений, преобразование, фильтрацию, сегментацию, выделение признаков, восстановление изображений и геометрические преобразования.
- `SciPy`  
  [SciPy](https://scipy.org/) – библиотека, предназначенная для выполнения научных и инженерных расчётов. Модуль `ndimage` предназначен для работы с многомерными изображениями. В библиотеке реализованы функции для выполнения фильтрации, морфологии, измерения объектов и B-сплайновой интерполяции.
- `Pillow`  
  [Pillow](https://pillow.readthedocs.io/en/stable/) является наследником проекта Python Imaging Library (PIL). PIL была библиотекой для работы с изображениями в Python. Однако, она работала только с Python 2 версии, разработка была прекращена в 2011 году. Pillow является fork'ом проекта PIL. Она поддерживает чтение изображений из различных форматов файлов в собственное внутреннее представление.  
  Гайд: [Обработка изображений с помощью библиотеки Python Pillow @ Хабр](https://habr.com/ru/articles/681248/)


#### OpenCV

Библиотека состоит из отдельных модулей с более узкой специализацией:
- `opencv_core` — основная функциональность, включает в себя базовые структуры, вычисления (математические функции, генераторы случайных чисел) и линейную алгебру, DFT, DCT, ввод-вывод для XML и YAML.
- `opencv_imgproc` — обработка изображений (фильтрация, геометрические преобразования, преобразование цветовых пространств).
- `opencv_highgui` — простой интерфейс, ввод-вывод изображений и видео.
- `opencv_ml` — модели машинного обучения (SVM, деревья решений, обучение со стимулированием и т. д.).
- `opencv_features2d` — распознавание и описание плоских примитивов (SURF, FAST и другие, включая специализированный фреймворк).
- `opencv_video` — анализ движения и отслеживание объектов (оптический поток, шаблоны движения, устранение фона).
- `opencv_objdetect` — обнаружение объектов на изображении (нахождение лиц с помощью алгоритма Виолы-Джонса, распознавание людей HOG).
- `opencv_calib3d` — калибровка камеры, поиск стерео-соответствия и элементы обработки трёхмерных данных.
- `opencv_flann` — библиотека быстрого поиска ближайших соседей (FLANN 1.5) и обёртки OpenCV.
- `opencv_contrib` — сопутствующий код, ещё не готовый для применения.
- `opencv_legacy` — устаревший код, сохранённый ради обратной совместимости.
- `opencv_gpu` — ускорение некоторых функций OpenCV за счет CUDA, создан при поддержке NVIDIA.

Установка базовой версии:

```bash
pip install opencv-python
```

или вместе с `contrib`:

```bash
pip install opencv-contrib-python
```

> Некоторые алгоритмы библиотеки являются проприетарной разработкой, поэтому они не включены в базовую поставку. Сборку библиотеки с non-free модулями необходимо производить самостоятельно из исходников. В результате компиляции библиотеки (C++ dll'ки) можно сгенерировать Python обертку при указании соответствующих флагов компиляции.

Туториалы:
- [OpenCV Python tutorial](https://docs.opencv.org/4.x/d6/d00/tutorial_py_root.html)
- [OpenCV Tutorial: A Guide to Learn OpenCV @ PyImageSearch](https://pyimagesearch.com/2018/07/19/opencv-tutorial-a-guide-to-learn-opencv/)
- [Шпаргалка по OpenCV — Python @ Tproger](https://tproger.ru/translations/opencv-python-guide)

### 2.2 Получение изображений

In [None]:
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
from scipy import io as sio
my_dpi = 96

In [None]:
image = cv.imread("data/IMG_1836_2048.png")
(h, w, d) = image.shape
type(image), image.shape, image.dtype

In [None]:
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image)

In [None]:
# Преобразование BGR в RGB
image = cv.cvtColor(image, cv.COLOR_BGR2RGB)
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image)

In [None]:
# Преобразование RGB в полутоновое
image_gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY)
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image_gray)

In [None]:
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image_gray, cmap='gray')

In [None]:
image_gray_01 = image_gray.astype(np.float32) / 255.0
image_gray_01.dtype, image_gray_01.min(), image_gray_01.max()

In [None]:
image_f = image.astype(np.float32)
image_f.dtype

In [None]:
image_f1 = cv.cvtColor(image_f, cv.COLOR_RGB2BGR)

> Зачастую алгоритмы обработки изображений требуют приведение значения пикселя на изображении в диапазон $[0.0, 1.0]$. Так как обертка на питоне под капотом вызывает функции dll, написанной на C++, то необходимо для вызова некоторых функций библиотеки принудительно приводить тип данных к C++'ному float, который является 32 битным (4 байта). float в питоне по умолчанию является 64 битным.

In [None]:
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image)

In [None]:
image.shape

In [None]:
# Изменение размера с сохранением соотношения сторон
(h, w, d) = image.shape
w_new = 1024
r = float(w_new) / w
dim = (w_new, int(h * r))
image_resized = cv.resize(image, dim)
(hn, wn, dn) = image_resized.shape
fig, axs = plt.subplots(figsize=(wn/my_dpi, hn/my_dpi), dpi=my_dpi)
plt.imshow(image_resized)

In [None]:
# Сохранение изображения
image_resized_bgr = cv.cvtColor(image_resized, cv.COLOR_RGB2BGR)
# JPG
compression_option = [int(cv.IMWRITE_JPEG_QUALITY), 100]
# PNG
#compression_option = [int(cv.IMWRITE_PNG_COMPRESSION), 1]
cv.imwrite("data/image_resized.jpg", image_resized_bgr, compression_option)

### 2.3 Работа с RAW изображениями

Датасет - [INTEL-TAU](https://etsin.fairdata.fi/dataset/f0570a3f-3d77-4f44-9ef1-99ab4878f17c):
- Сет `Sony_IMX135.zip` - разрешение $3264\times2448$
- RAW Image: 2 bytes per pixel raw format, storing the actual raw Bayer layout, the values can be read as uint16. Extension: '.plain16'.

Статья: https://ieeexplore.ieee.org/document/9371681

In [None]:
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
from scipy import io as sio
my_dpi = 96

#### Загрузка метаинформации о RAW изображениях

In [None]:
frame_format = sio.loadmat('data/frame_format_sonyimx135.mat')
frame_format

In [None]:
w, h = frame_format['width'][0, 0], frame_format['height'][0, 0]
bpp = frame_format['bpp'][0, 0]
sat_point = frame_format['satpoint'][0, 0]
# uint16 -> int
w = w.astype(int)
h = h.astype(int)
bpp = bpp.astype(int)

#### Чтение RAW

In [None]:
with open('data/S_IMX135_field3cam_013.plain16', 'rb') as fd:
    data_raw = np.fromfile(fd, dtype=np.uint16, count=w * h)
print(f"shape: {data_raw.shape}")
print(f"min, max: {data_raw.min()}, {data_raw.max()}")

#### Решейп

In [None]:
image_raw = data_raw.reshape((h, w))
image_raw.shape

#### Нормализация - приведение к диапазону [0, 1]

In [None]:
image_raw = image_raw.astype(float) / (2 ** bpp - 1)
image_raw.shape, image_raw.dtype

In [None]:
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image_raw, cmap='gray')

#### Поворот

In [None]:
image_raw_rot = image_raw[::-1, ::-1]
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_rot, cmap='gray')

#### Фрагмент

In [None]:
image_raw_roi = image_raw_rot[800:1000, 1400:1800]
hr, wr = image_raw_roi.shape
fig, axs = plt.subplots(figsize=(wr/my_dpi, hr/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_roi, cmap='gray')

#### Увеличенный фрагмент

In [None]:
m_factor = 3
fig, axs = plt.subplots(figsize=(m_factor * wr/my_dpi, m_factor * hr/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_roi, cmap='gray')
plt.show()

#### Дебайеризация средствами OpenCV

In [None]:
image_raw_roi_rgb8 = (image_raw_roi * 255.0).astype(np.uint8)
image_raw_roi_rgb8 = cv.cvtColor(image_raw_roi_rgb8, cv.COLOR_BayerGBRG2RGB)
fig, axs = plt.subplots(figsize=(m_factor * wr/my_dpi, m_factor * hr/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_roi_rgb8)

In [None]:
image_raw_roi_rgb8 = (image_raw_roi * 255.0).astype(np.uint8)
image_raw_roi_rgb8 = cv.cvtColor(image_raw_roi_rgb8, cv.COLOR_BayerGR2RGB)
fig, axs = plt.subplots(figsize=(wr/my_dpi, hr/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_roi_rgb8)

In [None]:
image_raw_rgb8 = (image_raw_rot * 255.0).astype(np.uint8)
image_raw_rgb8 = cv.cvtColor(image_raw_rgb8, cv.COLOR_BayerGR2RGB)
# image_raw_rgb[:, :, 1] = (image_raw_rgb[:, :, 1].astype(float) / 2).astype(np.uint8)
# image_raw_rgb = (image_raw_rgb.astype(float) * 1.3).astype(np.uint8)
fig, axs = plt.subplots(figsize=(w/my_dpi, h/my_dpi), dpi=my_dpi)
plt.imshow(image_raw_rgb8)

#### 10 бит -> 16 бит

In [None]:
image_raw_rgb16 = (image_raw_rot * 65535.0).astype(np.uint16)
image_raw_rgb16 = cv.cvtColor(image_raw_rgb16, cv.COLOR_BayerGR2RGB)

#### Сохранение изображения

In [None]:
# Сохранение изображения
# JPG
# compression_option = [int(cv.IMWRITE_JPEG_QUALITY), 100]
# PNG
compression_option = [int(cv.IMWRITE_PNG_COMPRESSION), 1]
cv.imwrite('data/S_IMX135_field3cam_013_ocv.png', cv.cvtColor(image_raw_rgb8, cv.COLOR_RGB2BGR), compression_option)
cv.imwrite('data/S_IMX135_field3cam_013_ocv_16.png', cv.cvtColor(image_raw_rgb16, cv.COLOR_RGB2BGR), compression_option)

#### Метаинформация
##### Настройки камеры

In [None]:
with open('data/S_IMX135_field3cam_013.meta', 'r') as f:
    meta_info_str = f.read()
meta_info_str

In [None]:
meta_info_str = meta_info_str.replace('\t', ' ')
meta_info = meta_info_str.split('\n')
meta_info

##### Точка белого
> Ground truth: This file contains the white point in [R/G, B/G] format. Extension: '.wp'.

In [None]:
with open('data/S_IMX135_field3cam_013.wp', 'r') as f:
    wp_str = f.read()
wp_str

In [None]:
wp = np.fromstring(wp_str, sep='\t')
wp

##### Матрица перехода из RGB в sRGB
> Color Correction Matrix: The color correction matrix from sensor RGB to sRGB. It is stored as a 1x9 vector. Extension: '.ccm'.

In [None]:
with open('data/S_IMX135_field3cam_013.ccm', 'r') as f:
    ccm_str = f.read()
ccm_str

In [None]:
ccm = np.fromstring(ccm_str, sep='\t')
ccm

##### Точка белого и матрицы перехода для разных источников света
> Стандартный источник света (также: стандартный осветитель) — это теоретический источник видимого света с опубликованным спектральным распределением мощности. Стандартные источники света служат основой для сравнения изображений или цветов, записанных при разном освещении.

In [None]:
wps = sio.loadmat('data/reference_wps_ccms_sonyimx135.mat')
wps

In [None]:
# Спектральный отклик
# sr = sio.loadmat('data/sr_sonyimx135.mat')
# sr

#### Конечный ожидаемый результат

In [None]:
image_cc = cv.imread('data/S_IMX135_field3cam_013.jpg')
image_cc = cv.cvtColor(image_cc, cv.COLOR_BGR2RGB)
fig, axs = plt.subplots(1, 2, figsize=(13, 13), dpi=my_dpi)
axs[0].imshow(image_raw_rgb8)
axs[1].imshow(image_cc)