# Сегментация на базе цветов

Один из самых простых способов сегментировать разные объекты - это использовать значения их пикселей. Важно отметить, что значения пикселей будут разными для фона и для самого объекта только если между ними есть какой-то контраст. 

В этом случае мы можем подобрать такое пороговое значение, чтобы отделить объект от фона. Такой подход называется пороговой сегментацией (Threshold segmentation). 

Давайте загрузим нашу тестовую картинку

In [None]:
import os 

import cv2 
import matplotlib.pyplot as plt 
import numpy as np

from skimage.color import rgb2gray

In [None]:
fpath = os.path.join(os.pardir, "assets", "cv_21.jpeg")
original_image = cv2.imread(fpath)
original_image = cv2.cvtColor(original_image, cv2.COLOR_BGR2RGB)

plt.figure(figsize=[6, 6])
plt.imshow(original_image)
plt.show()

Сконвертируем картинку в оттенки серого.

In [None]:
gray_img = rgb2gray(original_image)

plt.figure(figsize=[6, 6])
plt.imshow(gray_img, cmap="gray")
plt.show()

А теперь мы хотим применить определённое пороговое значение к этому изображению. Этот порог дожен разделять картинку на 2 части: передний фон и задний фон. 

Но прежде чем начать подбирать такое значение, давайте посмотрим на размеры картинки. 

In [None]:
print(f"Размеры картинки: {gray_img.shape}")

Мы видим, что высота картинки = 192 пикселя, а ширина - 263 пикселя. 

Давайте возьмём среднее значение пикселей и будем использовать это как порог. 

Если значение пикселя больше, чем пороговое, то мы считает, что этот пиксель принадлежит переднему фону (объекту), если меньше, то принадлежит заднему фону. 

In [None]:
# делаем из матрицы вектор, чтобы удобнее было считать среднее значение 
#   и итерироваться по пикселям
gray_raw = gray_img.reshape(gray_img.shape[0]*gray_img.shape[1])

# Итерируемся по каждому пикселю изображению
for i in range(gray_raw.shape[0]):
    if gray_raw[i] > gray_raw.mean():
        gray_raw[i] = 1
    else:
        gray_raw[i] = 0
# конвертируем из вектора обратно в матрицу (картинку)
gray_thresholded = gray_raw.reshape(gray_img.shape[0],gray_img.shape[1])

plt.figure(figsize=[6, 6])
plt.imshow(gray_thresholded, cmap="gray")
plt.show()

Более тёмные области относятся к заднему фону, белые области относятся к переднему фону. 

Давайте попробуем определить несколько пороговых значений, чтобы сегментировать несколько объектов.

In [None]:
gray_r = gray_img.reshape(gray_img.shape[0]*gray_img.shape[1])
for i in range(gray_r.shape[0]):
    if gray_r[i] > gray_r.mean():
        gray_r[i] = 3
    elif gray_r[i] > 0.5:
        gray_r[i] = 2
    elif gray_r[i] > 0.25:
        gray_r[i] = 1
    else:
        gray_r[i] = 0
gray_multi_thresholded = gray_r.reshape(gray_img.shape[0],gray_img.shape[1])
plt.imshow(gray_multi_thresholded, cmap='gray')

Теперь мы видим разные сегменты на картинке. 

## Заключение

Достоинства данного метода: 

* используются очень простые вычисления 
* все вычисления считаются быстро 
* при высоком констрасте между объектами, этот метод даёт хорошие результаты 

Но как обычно, если ложка дёгтя: 

* когда у нас нет констраста между объектами на картинке
* есть перекрытие значений пикселей 

то получить хорошие результаты очень трудно и не стоит вообще усилий. 

## Полезные ссылки 

* [Introduction to Image Segmentation Techniques](https://www.analyticsvidhya.com/blog/2019/04/introduction-image-segmentation-techniques-python/)