# OpenCV. Техническое зрение робота 

## 1. Основы компьютерного зрения

Компьютерное зрение - это область искусственного интеллекта, которая занимается обработкой и анализом изображений. Основной целью компьютерного зрения является получение информации из изображений и использование ее для принятия решений.

Методы

- `cv2.imread()`: чтение изображения из файла

  - `filename`: Имя файла, из которого нужно прочитать изображение. Это может быть строка или байтовая строка.
  - `flags`: Необязательный флаг, который указывает цветовой формат изображения. Возможные значения:
  `cv2.IMREAD_COLOR`: Загружает изображение в цветовом формате BGR (по умолчанию).
  `cv2.IMREAD_GRAYSCALE`: Загружает изображение в формате оттенков серого.
  `cv2.IMREAD_UNCHANGED`: Загружает изображение в его исходном формате.
  - Возвращает: 3-мерный массив `NumPy`, представляющий изображение.


- `cv2.imshow()`: вывод изображения на экран
- `cv2.waitKey()`: ожидание нажатия клавиши

  `delay` - время ожидания нажатия клавиши в миллисекундах. Если `delay` равен 0, функция будет ожидать бесконечно.

- `cv2.destroyAllWindows()`: закрытие всех окон

In [1]:
import cv2

img = cv2.imread('image.jpg')
cv2.imshow('Image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

[ WARN:0@0.022] global loadsave.cpp:248 findDecoder imread_('image.jpg'): can't open/read file: check file path/integrity


error: OpenCV(4.8.1) /io/opencv/modules/highgui/src/window.cpp:971: error: (-215:Assertion failed) size.width>0 && size.height>0 in function 'imshow'


## 1.2. Создание изображений

Изображения можно создавать с помощью библиотеки NumPy.

Методы: 

- `np.zeros()`: создание массива нулей
- `np.full()`: создание массива с заданным значением

In [2]:
import numpy as np
import cv2

# Создание черного изображения размером 200x200
img = np.zeros((200, 200, 3), np.uint8)

# Создание белого изображения размером 200x200
img = np.full((200, 200, 3), 255, np.uint8)

# Вывод изображения на экран
cv2.imshow('Image', img)
cv2.waitKey(5000)
cv2.destroyAllWindows()

## 1.3. Фильтры изображений
Фильтры изображений используются для обработки изображений и удаления шума.

- `cv2.blur()` - Простое размытие изображения
Параметры:
  - `src`: исходное изображение
  - `ksize`: размер ядра размытия (например, (5, 5) для размытия 5x5 пикселей)
Возвращает: размытое изображение
Пример: cv2.blur(img, (5, 5))

- `cv2.medianBlur()` - Медианный фильтр
Параметры:
  - `src`: исходное изображение
  - `ksize`: размер ядра медианного фильтра (например, 5 для медианного фильтра 5x5 пикселей)
Возвращает: изображение после применения медианного фильтра
Пример: cv2.medianBlur(img, 5)

- `cv2.GaussianBlur()` - Размытие по Гауссу
Параметры:
  - `src`: исходное изображение
  - `ksize`: размер ядра размытия по Гауссу (например, (5, 5) для размытия 5x5 пикселей)
  - `sigmaX`: стандартное отклонение по оси X (по умолчанию 0)
  - `sigmaY`: стандартное отклонение по оси Y (по умолчанию 0)
Возвращает: размытое изображение


In [None]:
import cv2

img = cv2.imread('image.jpg')

# Простое размытие изображения
blurred_img = cv2.blur(img, (5, 5))

# Медианный фильтр
median_blurred_img = cv2.medianBlur(img, 5)

# Размытие по Гауссу
gaussian_blurred_img = cv2.GaussianBlur(img, (5, 5), 0)

# Вывод изображений на экран
cv2.imshow('Original', img)
cv2.imshow('Blurred', blurred_img)
cv2.imshow('Median Blurred', median_blurred_img)
cv2.imshow('Gaussian Blurred', gaussian_blurred_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 1.4. Сглаживание изображений
Сглаживание изображений используется для удаления шума и улучшения качества изображения.

Методы

`cv2.bilateralFilter()`: двусторонний фильтр

In [None]:
import cv2

img = cv2.imread('image.jpg')

# Двусторонний фильтр
bilateral_filtered_img = cv2.bilateralFilter(img, 5, 50, 50)

# Вывод изображений на экран
cv2.imshow('Original', img)
cv2.imshow('Bilateral Filtered', bilateral_filtered_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 1.5. Обработка изображений в реальном времени
Обработка изображений в реальном времени - это процесс обработки изображений в режиме реального времени, например, с помощью камеры.

Методы

- `cv2.VideoCapture()`: чтение видеопотока из файла или камеры
- `cv2.imshow()`: отображение изображения в окне
- `cv2.waitKey()`: ожидание нажатия клавиши

In [None]:
import cv2

# Чтение видеопотока из камеры
cap = cv2.VideoCapture(0)

while True:
    # Чтение кадра из видеопотока
    ret, frame = cap.read()

    # Обработка кадра
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # Отображение кадра
    cv2.imshow('Кадр', gray)

    # Ожидание нажатия клавиши
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Закрытие окна
cv2.destroyAllWindows()

## Работаем самостоятельно

### Задача №1.1

С помощью средств библиотек OpenCV и NumPy создайте изображение шахматной доски шириной в 5 клетки и длиной в 5 клеток. Пусть верхний левый квадрат будет фиолетовым, а его сосед справа - белым. Дальше чередуйте эти цвета в шахматном порядке. Сохраните его на компьютере (с помощью `imwrite`).

In [None]:
## TODO

### Задача №1.2

Используя известные Вам фильтры, очистить изображение от белых точек

<p align="center">
  <img width="600" height="480" src="/home/work/catkin_ws/src/ETU_RoboHub/assets/opencv/img_to_clean_opencv.png">
</p>


In [None]:
## TODO

## 2.1. Пороговая обработка

Пороговая обработка - это процесс преобразования изображения в бинарное изображение, где пиксели имеют значения либо 0 (чёрный), либо 255 (белый). Это полезно для отделения объектов от фона.

Методы

- `cv2.threshold()`: порог к изображению
- `cv2.THRESH_BINARY`: бинарный порог
- `cv2.THRESH_BINARY_INV`: инверсный бинарный порог
- `cv2.THRESH_TRUNC`: обрезает значения пикселей выше порога
- `cv2.THRESH_TOZERO`: устанавливает значения пикселей ниже порога в 0
- `cv2.THRESH_TOZERO_INV`: устанавливает значения пикселей выше порога в 0

In [None]:
import cv2

img = cv2.imread('image.jpg')

# Применение бинарного порога
_, thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# Применение инверсного бинарного порога
_, thresh_inv = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)

# Отображение результатов
cv2.imshow('Оригинал', img)
cv2.imshow('Пороговое', thresh)
cv2.imshow('Инверсное пороговое', thresh_inv)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 2.2. Адаптивная пороговая обработка

Адаптивная пороговая обработка - это процесс пороговой обработки изображения на основе локальных значений пикселей. Это полезно для изображений с переменными условиями освещения.

Методы

- `cv2.adaptiveThreshold()`:  адаптивный порог к изображению
- `cv2.ADAPTIVE_THRESH_MEAN_C`: использует среднее значение соседних пикселей как порог
- `cv2.ADAPTIVE_THRESH_GAUSSIAN_C`: использует взвешенную сумму соседних пикселей как порог


In [None]:
import cv2

# Чтение изображения
img = cv2.imread('image.jpg')

# Применение адаптивного порога с использованием среднего значения
thresh_mean = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)

# Применение адаптивного порога с использованием взвешенной суммы
thresh_gaussian = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)

# Отображение результатов
cv2.imshow('Оригинал', img)
cv2.imshow('Адаптивное пороговое (среднее)', thresh_mean)
cv2.imshow('Адаптивное пороговое (взвешенная сумма)', thresh_gaussian)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 2.3. Обнаружение границ
Обнаружение границ - это процесс нахождения границ между объектами на изображении.

Методы

- `cv2.Canny()`: применяет алгоритм обнаружения границ Кенни
- `cv2.Sobel()`: применяет алгоритм обнаружения границ Собеля

In [None]:
import cv2

# Чтение изображения
img = cv2.imread('image.jpg')

# Применение алгоритма обнаружения границ Кенни
edges_canny = cv2.Canny(img, 50, 150)

# Применение алгоритма обнаружения границ Собеля
edges_sobel = cv2.Sobel(img, cv2.CV_8U, 1, 0, ksize=3)

# Отображение результатов
cv2.imshow('Оригинал', img)
cv2.imshow('Границы Кенни', edges_canny)
cv2.imshow('Границы Собеля', edges_sobel)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 2.4. Обнаружение контуров

Обнаружение контуров - это процесс нахождения границ объектов на изображении.

Методы

- `cv2.findContours()`: находит контуры на изображении
- `cv2.drawContours()`: рисует контуры на изображении

Параметры функции `cv2.findContours()`

- `image`: изображение, на котором нужно найти контуры
- `mode`: режим нахождения контуров (например, cv2.RETR_EXTERNAL для нахождения внешних контуров)
- `method`: метод нахождения контуров (например, cv2.CHAIN_APPROX_SIMPLE для упрощения контуров)

Параметры функции `cv2.drawContours()`

-`image`: изображение, на котором нужно нарисовать контуры
-`contours`: контуры, которые нужно нарисовать
-`index`: индекс контура, который нужно нарисовать (например, -1 для рисования всех контуров)
-`color`: цвет, которым нужно рисовать контуры
-`thickness`: толщина контуров

Примечания

Функция `cv2.findContours()` возвращает список контуров и иерархию контуров.
Функция `cv2.drawContours()` рисует контуры на изображении.

In [None]:
import cv2

# Чтение изображения
img = cv2.imread('image.jpg')

# Преобразование изображения в градации серого
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Применение пороговой обработки
_, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)

# Нахождение контуров на изображении
contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Рисование контуров на изображении
cv2.drawContours(img, contours, -1, (0, 255, 0), 2)

# Отображение результатов
cv2.imshow('Оригинал', img)
cv2.imshow('Контуры', thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 2.5. Фильтрация изображений
Фильтрация изображений - это процесс модификации изображения для улучшения или удаления определенных особенностей.

Методы

- `cv2.blur()`: применяет простой фильтр размытия
- `cv2.GaussianBlur()`: применяет фильтр размытия по Гауссу
- `cv2.medianBlur()`: применяет фильтр размытия по медиане

In [None]:
import cv2

# Чтение изображения
img = cv2.imread('image.jpg')

# Применение простого фильтра размытия
blurred_img = cv2.blur(img, (5, 5))

# Применение фильтра размытия по Гауссу
gaussian_blurred_img = cv2.GaussianBlur(img, (5, 5), 0)

# Применение фильтра размытия по медиане
median_blurred_img = cv2.medianBlur(img, 5)

# Отображение результатов
cv2.imshow('Оригинал', img)
cv2.imshow('Простое размытие', blurred_img)
cv2.imshow('Размытие по Гауссу', gaussian_blurred_img)
cv2.imshow('Размытие по медиане', median_blurred_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Работаем самостоятельно

### Задание 2.1

Найти и нарисовать контуры на следующем изображении, выделив при этом разными цветами каждую из фигур.

<p align="center">
  <img width="600" height="480" src="/home/work/catkin_ws/src/ETU_RoboHub/assets/opencv/find_contours.png">
</p>


In [None]:
# TODO

### Задание 2.2

Теперь немного усложним задачу: тебе нужно найти контуры на цветном изображении, выделить их и подписать распознанный цвет объекта

<p align="center">
  <img width="800" height="480" src="/home/work/catkin_ws/src/ETU_RoboHub/assets/opencv/find_cubes.png">
</p>


In [None]:
# TODO