# Лекция 2. Введение в анализ изображений

* Базовые понятия: изображение как структура данных, модель формирования цифрового изображения.
* Основные операции над изображениями. Яркостные преобразования, геометрические преобразования, распознавание объектов и особенностей.
* Введение в программирование методов обработки изображений на языке Python: основные инструменты.
* ~~Введение в методы визуализации изображений: автоконтраст, эквализация гистограммы, цветовые шкалы.~~

[(ссылка на программу)](https://docs.google.com/document/d/18ghaT0KEZB5n47RfNCpCz3jSNBuSZo_Yv2v3E_bimjw)

## Введение: Компьютерное зрение vs. Обработка изображений

* Смежные области → нет четких границ

### Деление 1, онтологическое

* Image Processing — подраздел Signal Processing, где сигналом являются изображения.
* Computer Vision — подраздел Artificial Intelligence, исполюзующий преимущественно зрительные данные.

### Деление 2, эмпирическое

* Image Processing — работа с изображениями "вне контекста", т.е. с минимальным использованием информации, что изображение представляет собой проекцию реального трехмерного мира, а также с минимальным использованием свойств этого мира, помимо явным образом наблюдаемых на изображении.
* Computer Vision — работа с изображениями как проекциями трехмерного мира с целью реконструкции свойств этого мира или с их существенным учетом.

## Изображение как структура данных

* Векторные и растровые изображения
* Мы рассматриваем только растровые
* Работаем на примере 2d-случая, хотя в 3d тоже встречается

## Изображение как структура данных

    #pragma pack(push, 1)
    typedef struct MinImg {
      int32_t        width;         ///< The image width in pixels.
      int32_t        height;        ///< The image height in pixels.
      int32_t        stride;        ///< Difference in bytes between addresses of adjacent rows.
      int32_t        channels;      ///< The number of channels per pixel.
      MinTyp         scalar_type;   ///< The channel element type.

      int32_t        address_space; ///< Address space enumerator.
      uint8_t       *p_zero_line;   ///< The pointer to the first pixel of the first row.
      struct MinImg *p_landlord;    ///< The pointer to the object actually owning the memory.
                                    ///  NULL for memory not owned by any MinImg.
    } MinImg;
    #pragma pack(pop)    


## Изображение как структура данных

    struct Pix  // From Leptonica library
    {
        l_uint32             w;         /*!< width in pixels                   */
        l_uint32             h;         /*!< height in pixels                  */
        l_uint32             d;         /*!< depth in bits (bpp)               */
        l_uint32             spp;       /*!< number of samples per pixel       */
        l_uint32             wpl;       /*!< 32-bit words/line                 */
        l_uint32             refcount;  /*!< reference count (1 if no clones)  */
        l_int32              xres;      /*!< image res (ppi) in x direction    */
                                        /*!< (use 0 if unknown)                */
        l_int32              yres;      /*!< image res (ppi) in y direction    */
                                        /*!< (use 0 if unknown)                */
        l_int32              informat;  /*!< input file format, IFF_*          */
        l_int32              special;   /*!< special instructions for I/O, etc */
        char                *text;      /*!< text string associated with pix   */
        struct PixColormap  *colormap;  /*!< colormap (may be null)            */
        l_uint32            *data;      /*!< the image data                    */
    };
    typedef struct Pix PIX;

## Смысл значения пиксела: модель формирования цифрового изображения

R. Szeliski, *Computer Vision: Algorithms and Applications*, http://szeliski.org/Book/

![Screenshot%20from%202020-01-28%2018-02-42.png](attachment:Screenshot%20from%202020-01-28%2018-02-42.png)

## Смысл значения пиксела: модель формирования цифрового изображения

R. Szeliski, *Computer Vision: Algorithms and Applications*, http://szeliski.org/Book/

![Screenshot%20from%202020-01-28%2018-03-33.png](attachment:Screenshot%20from%202020-01-28%2018-03-33.png)

## Форматы хренания (сериализации) растровых изображений

* Без потерь, с произвольным типом данных, низкая степень сжатия
    * tiff
    * npy, npz (форматы numpy) и подобные им (h5, joblib)
* Без потерь, оптимизированные под графику
    * png
    * webp
* С потерями, оптимизированные под фотографию
    * jpeg
    * webp
    * jpeg2000
    * openexr


[(не забыть отметить посещаемость)](https://docs.google.com/spreadsheets/d/12-7F1gtaIRur6ylIVVUoqcxped31-q0D9WvByhTnTD0/edit?usp=sharing)

## Инструментарий работы с изображениями

* Python 3.6+
    * numpy
    * scipy
    * skimage
    * imageio
    * etc.
    * opencv *if really needed*
* C++
    * opencv
    * Eigen
    * CUDA etc. GPU frameworks
    * in-house libraries


In [None]:
# IO-related
import os.path as osp
import imageio
from PIL import Image

# image processing
import numpy as np
import skimage as ski
import skimage.morphology as skm
import skimage.measure as skmeas
import scipy.ndimage as ndi
import scipy.signal as scs

# visualization
import plotly.graph_objects as go
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns


## Основные виды операций над изображениями

* Попиксельные преобразования значений
* Фильтрация
* Геометрические преобразования
* Редукции и проекции (статистики, гистограммы, проекции на ось)
* Детекция, распознавание и классификация локальных особенностей и фрагментов изображений

### В следующей серии:

* Примеры использования инструментария:
    * арифметика, визуализация, геометрические преобразования
* Базовые операции анализа и обработки изображений:
    * Фильтрация изображений. Линейные фильтры. Фильтры, сохраняющие границы.
    * Морфологический анализ изображений. Серая морфология: зрозия, дилатация и производные операции. Бинарная морфология: анализ компонент связности. Примеры: выделение фона, локальное контрастирование, удаление шума.
    * Выделение линейных особенностей. Виды линейных особенностей. Алгоритм Кэнни.


# Лекция 3. Базовые операции анализа и обработки изображений

* Введение в программирование методов обработки изображений на языке Python: основные инструменты.
* Введение в методы визуализации изображений: автоконтраст, эквализация гистограммы, цветовые шкалы.
* Фильтрация изображений. Линейные фильтры. Фильтры, сохраняющие границы.
* Морфологический анализ изображений:
    * Серая морфология: зрозия, дилатация и производные операции. 
    * Бинарная морфология: анализ компонент связности. Примеры: выделение фона, локальное контрастирование, удаление шума.
* Выделение линейных особенностей. Виды линейных особенностей. Алгоритм Кэнни.


In [None]:
import imageio

im1 = imageio.imread('example1.jpg')
im1.shape

In [None]:
import matplotlib.pyplot as plt
plt.imshow(im1)

# matplotlib works, but somewhat complicated

In [None]:
from PIL import Image
def view(img):
    if img.dtype != np.uint8:
        img = (img * 255).astype(np.uint8)
    return Image.fromarray(img)

# PIL Image objects are displayed as-is, in full size

In [None]:
view(im1)

In [None]:
# plot.ly makes great interactive graphs, but can be very slow with images
import plotly.express as px
px.imshow(im1)

In [None]:
# Let's look at a grayscale image

im2 = imageio.imread('example2.jpg')
im2.shape

In [None]:
plt.imshow(im2)

In [None]:
view(im2)

In [None]:
px.imshow(im2)

### В чем проблема с серыми картинками?

* По умолчанию 1-канальные картинки визуализируются не как картинки, а как 2d данные общего вида
* Для облегчения восприятия автоматически выбирается диапазон значений и применяется раскраска для обеспечения сравнимости значений в различных точках изображения
    * Человек гораздо лучше видит абсолютную цветность, чем абсолютную яркость
* Можно экспериментировать с раскрасками для лучшего восприятия информации, создавать свои шкалы
* Для plotly: https://plot.ly/python/builtin-colorscales/
* Для matplotlib: https://matplotlib.org/examples/color/colormaps_reference.html

In [None]:
plt.imshow(im2, cmap='rainbow')

In [None]:
px.imshow(im2, color_continuous_scale='rainbow')

* Если нужно показать одноканальную картинку как серую "как есть", используем шкалу `gray`
* И принудительно выставляем диапазон значений

In [None]:
plt.imshow(im2, cmap='gray', vmin=0, vmax=255)

In [None]:
px.imshow(im2, color_continuous_scale='gray', zmin=0, zmax=255)

### Как из цветного сделать одноканальное

* Усреднить каналы
* Выбрать один из каналов
* Просуммировать с весами
* Использовать любую другую предметно-специфичную конструкцию

In [None]:
im1_gray1 = im1[:, :, 1]  # take green channel
im1_gray2 = np.mean(im1, axis=2) # mean channel value
px.imshow(im1).show()
px.imshow(im1_gray1, color_continuous_scale='jet').show()
px.imshow(im1_gray2, color_continuous_scale='jet').show()

### Улучшение изображения

In [None]:
im3 = imageio.imread('example3.png')
view(im3)

In [None]:
def autocontrast(img, fixed_zero=True):
    if not fixed_zero:
        img = img - np.min(img)
    return img / np.max(img)

view(autocontrast(im3))

In [None]:
def autocontrast(img, fixed_zero=True, qmax=0.99, qmin=0.01):
    if not fixed_zero:
        img = img - np.quantile(img, qmin)
    return np.clip(img / np.quantile(img, qmax), 0, 1)

view(autocontrast(im3))

In [None]:
def equalize(img, npoints=11):
    quantiles = np.linspace(0, 1, npoints)
    return np.interp(img, np.quantile(img, quantiles), quantiles)

view(equalize(im3))

In [None]:
# More examples here: https://scikit-image.org/docs/dev/auto_examples/color_exposure/plot_equalize.html
import skimage.exposure
view(skimage.exposure.equalize_hist(im3))

In [None]:
view(skimage.exposure.equalize_hist(im1_gray1))

In [None]:
# Contrast Limited Adaptive Histogram Equalization (CLAHE)
# Nonconsistent in value domain!
view(skimage.exposure.equalize_adapthist(im1_gray1))

In [None]:
skimage.exposure.equalize_adapthist?

In [None]:
view(skimage.exposure.equalize_adapthist(im3, clip_limit=0.1, kernel_size=100))

(!) В отличие от автоконтраста, эквализация — существенно нелинейное преобразование, так что применять ее в предобработке входов алгоритмов обработки изображений нужно с осторожностью

In [None]:
?px.line

In [None]:
vals = im1_gray1.ravel()
argsort = np.argsort(vals)
vals_eq = skimage.exposure.equalize_hist(im1_gray1).ravel()
vals_clahe = skimage.exposure.equalize_adapthist(im1_gray1).ravel()

# using matplotlib for performance
plt.plot(vals[argsort], vals_clahe[argsort], 'r.')
plt.plot(vals[argsort], vals_eq[argsort], 'b-')

# warning: very heavy plot
# fig = go.Figure()
# fig.add_trace(go.Scattergl(x=vals[argsort], y=vals_clahe[argsort], name='CLAHE', mode='markers'))
# fig.add_trace(go.Scatter(x=vals[argsort], y=vals_eq[argsort], name='hist eq', mode='lines'))

_(К слову: если сохранять этот ноутбук со всем выводом, он будет весить **~250 МБ**)_