# OpenCV - Procesamiento de imagenes
![](https://pyimagesearch.com/wp-content/uploads/2018/05/opencv_tutorial_header.jpg)

Vamos a revisar algunos de las tareas que se pueden realizar con OpenCV respecto a imágenes y video, en cuanto a procesamiento y manipulación de los pixels.

Luis A. Muñoz

---

## Manipulación de imagenes
Entre las tareas más básicas en el procesamiento de imágenes es la de modificar el tamaño de una imágen. Esto es una manipulación a nivel matricial realizado por OpenCV tanto de imagenes de gris (2D) e imágenes en color (3D).

In [17]:
import cv2

img = cv2.imread("img\\img1.jpg", cv2.IMREAD_COLOR)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

print(img.shape)
print(gray.shape)

cv2.imshow("Imagen BGR", img)
cv2.imshow("Imagen Gray", gray)

cv2.waitKey(0)
cv2.destroyAllWindows()

(450, 600, 3)
(450, 600)


## Bonus App: Marko "tres nombres"

In [27]:
import cv2

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    
    height, width, _ = frame.shape
    
    left = frame[:,:width//2,:]
    right = cv2.flip(left, 1)
    img = cv2.hconcat([left, right])
    
    cv2.imshow('Mirror Cam', img)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

## Region of Interest (ROI)
La Región de Interés (ROI, por sus siglas en inglés) es un concepto en imágenes que hace referencia a la sección de una imágen donde se aplicará algún procesamiento.

In [28]:
import cv2

img = cv2.imread("img\\img1.jpg", cv2.IMREAD_COLOR)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

img_roi = img[100:350,250:400,:] 
gray_roi = gray[100:350,250:400]

cv2.imshow("Imagen BGR", img_roi)
cv2.imshow("Imagen Gray", gray_roi)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Dibujo de figuras con OpenCV
Sobre una imágen o video se pueden superponer formas geometricas con ciertas funciones especiales de OpenCV.

In [29]:
import cv2

img = cv2.imread("img\\img2.jpg", cv2.IMREAD_COLOR)
cv2.line(img, (50, 100), (50, 400), (0, 255, 0), 2)

cv2.imshow("Imagen", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [30]:
import cv2

img = cv2.imread("img\\img2.jpg", cv2.IMREAD_COLOR)
cv2.rectangle(img, (250, 120), (400, 300), (0, 255, 0), 2)

cv2.imshow("Imagen", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [31]:
import cv2

img = cv2.imread("img\\img2.jpg", cv2.IMREAD_COLOR)
cv2.circle(img, (250, 400), 100, (0, 255, 0), 2)

cv2.imshow("Imagen", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Image Blending (addWeighted)
Se puede realizar una suma de imagenes, asignando un peso porcentual a cada imagen. Esto requiere que ambas imagenes tengan las mismas dimensiones y los mismos canales de colores (es decir, la misma forma). Los parametros de la formula (alpha, beta y gama) estan definidos para:

$$dst = \alpha * img1 + \beta * img2 + \gamma $$

In [32]:
import cv2

img1 = cv2.imread("img\\img3.jpg", cv2.IMREAD_COLOR)
print("Size img1:", img1.shape)

img2 = cv2.imread("img\\img4.jpg", cv2.IMREAD_COLOR)
img2 = cv2.resize(img2, (img1.shape[1], img1.shape[0]))    #cvs.resize(img, (ancho, alto))
print("Siza img2:", img2.shape)

# cv.addWeighted(img1, alpha, img2, beta, gamma)
img_photo = cv2.addWeighted(img1, 0.7, img2, 0.3, 0) 
cv2.imshow("Imagen", img_photo)

cv2.waitKey(0)
cv2.destroyAllWindows()

Size img1: (469, 626, 3)
Siza img2: (469, 626, 3)


In [33]:
import cv2

cap = cv2.VideoCapture(0)
img = cv2.imread("img\\img5.jpg")


while True:
    ret, frame = cap.read()
    height, width, _ = frame.shape
    img = cv2.resize(img, (width, height))
    
    img_blended = cv2.addWeighted(img, 0.7, frame, 0.3, 0)
    cv2.imshow('Img', img_blended)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()


## Operaciones lógicas (bitwise)
Se puede realizar operaciones lógicas con los arreglos de imagenes a novel de OpenCV, asi como operaciones aritméticas. Con estas operaciones se pueden hacer tratamientos especiales a las imagenes.

In [38]:
import cv2

img1 = cv2.imread("img\\upc_campus.jpg", cv2.IMREAD_COLOR)
img2 = cv2.imread("img\\upc_logo.jpg", cv2.IMREAD_COLOR)
img2 = cv2.resize(img2, (80, 80))
roi = img1[-80:, -80:]

cv2.imshow("img1", img1)
cv2.imshow("img2", img2)

# Se crea una mascara con la imagen del logo con un control de umbral (threshold)
# y se invierte la imagen con una operacion logica (bitwise_not)
img_gray= cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
ret, mask = cv2.threshold(img_gray, 128, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)

cv2.imshow('mask', mask)
cv2.imshow('mask_inv', mask_inv)

# Hay que oscurecer los pixels que seran reemplazados por el logo (ROI)
img_bg = cv2.bitwise_and(roi, roi, mask=mask)
cv2.imshow("img1_bg", img_bg)

# Hay que tomar solo los puntos que conforman en logo (mascara)
img_fg = cv2.bitwise_and(img2, img2, mask=mask_inv)
cv2.imshow("img2_fg", img_fg)

# Hay que sumar ambas imagenes en el ROI
dst = cv2.add(img_bg, img_fg)
img1[-80:, -80:] = dst
cv2.imshow("Imagen con logo", img1)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [40]:
import cv2

def put_logo(img, logo, roi):
    gray= cv2.cvtColor(logo, cv2.COLOR_BGR2GRAY)
    ret, mask = cv2.threshold(gray, 128, 255, cv2.THRESH_BINARY)
    mask_inv = cv2.bitwise_not(mask)

    fondo = cv2.bitwise_and(roi, roi, mask=mask)
    frente = cv2.bitwise_and(logo, logo, mask=mask_inv)

    dst = cv2.add(fondo, frente)
    img[-100:-20, -100:-20] = dst
    
    return img

cap = cv2.VideoCapture(0)

while True:
    ret, img = cap.read()
    logo = cv2.imread("img\\upc_logo.jpg", cv2.IMREAD_COLOR)
    logo = cv2.resize(logo, (80, 80))
    roi = img[-100:-20, -100:-20]
    
    img_with_logo = put_logo(img, logo, roi)
    
    cv2.imshow("Video Logo", img_with_logo)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()


## Mascaras con inRange (Deteccion de colores)
![](https://i.stack.imgur.com/gyuw4.png)

Se pueden confeccionar máscaras asociadas a un rango de valores de color, utilizado el modelo de color HSV (Hue, Saturation, Value) que permite detectar colores iluminados por luz natural.

In [46]:
import cv2
import numpy as np

img = cv2.imread("img\\people_green_bg.jpg", cv2.IMREAD_COLOR)
img_bg = cv2.imread("img\\office_bg.jpg", cv2.IMREAD_COLOR)
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

print(img_hsv[10, 10, :])    # HUE, SATURATION, VALUE

lower_bound = np.array([40, 200, 255])
upper_bound = np.array([85, 255, 255])
mask = cv2.inRange(img_hsv, lower_bound, upper_bound)
mask_inv = cv2.bitwise_not(mask)

kernel = np.ones((3, 3), np.uint8)
mask = cv2.dilate(mask, kernel, iterations=1)
mask_inv = cv2.erode(mask_inv, kernel, iterations=1)

img_mask = cv2.bitwise_and(img, img, mask=mask_inv)

cv2.imshow('img', img)
cv2.imshow('mask', mask)
cv2.imshow('img_mask', img_mask)

roi = img_bg[-img_mask.shape[0]:,-img_mask.shape[1]:,:]
img_bg2 = cv2.bitwise_and(roi, roi, mask=mask)

dst = cv2.add(img_mask, img_bg2)
cv2.imshow('Final', dst)

cv2.waitKey(0)
cv2.destroyAllWindows()

[ 57 238 255]


## Filtrado de imagenes
Entre los procesos frecuentes de manipulación de imágenes esta el de filtrar una imágen, ya sea para reducír ruido como para hacer énfasis en ciertos elementos geométricos de una imágen con la objetivo de hacer que un proceso posterior sea más sencillo.

In [47]:
import cv2
import numpy as np

img = cv2.imread("img\img1.jpg")
img = cv2.resize(img, (300, 300))
cv2.imshow("Imagen", img)

kernel = np.ones((5, 5), np.float32) / 25

img_fil1 = cv2.filter2D(img, -1, kernel)
img_fil2 = cv2.blur(img, (5, 5))
img_fil3 = cv2.GaussianBlur(img, (7, 7), 0)

cv2.imshow('Filter2D', img_fil1)
cv2.imshow('Blur', img_fil2)
cv2.imshow('Gaussian Blur', img_fil3)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [48]:
import cv2
import numpy as np

img = cv2.imread("img\img6.jpg")
img = cv2.resize(img, (400, 300))
cv2.imshow("Imagen", img)

img_fil1 = cv2.medianBlur(img, 5)
img_fil2 = cv2.bilateralFilter(img, 9, 75, 75)

cv2.imshow("Median Blur", img_fil1)
cv2.imshow("Bilateral Filter", img_fil2)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Detección de bordes
Existen filtros especiales que retornan resultados especiales, por ejemplo, un proceso de filtrado que retorna sobre los bordes de una imagen. OpenCV implementa un número de algoritmos para la detección de bordes. En este ejemplo se prueba el algoritmo de Canny (John F. Canny, 1986)

In [49]:
import cv2

img = cv2.imread("img\img1.jpg", cv2.IMREAD_GRAYSCALE)
img = cv2.resize(img, (400, 300))
cv2.imshow("Imagen", img)

edges = cv2.Canny(img, 100, 200)
cv2.imshow('edges', edges)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [50]:
import cv2

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    edges = cv2.Canny(frame, 100, 200)
    edges_inv = cv2.bitwise_not(edges)
    
    cv2.imshow('edges', edges_inv)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

## Detección de esquinas
Otro algoritmo útil de OpenCV es el algoritmo de detección de esquinas Shi-Tomashi (J. Shi and C. Tomasi, 1994) que busca pixels en donde la gradiente cambia en varias direcciones por encima de un valor de umbral.

In [51]:
import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('img\\img7.jpg')
img = cv2.resize(img, (600, 500))
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)


corners = cv2.goodFeaturesToTrack(gray, 50, 0.01, 10)
corners = np.int0(corners)

for i in corners:
    x,y = i.ravel()   # Convierte un array 2D en 1D
    cv2.circle(img, (x,y), 3, (0, 0, 255), -1)

cv2.imshow('Corners', img)
    
cv2.waitKey(0)
cv2.destroyAllWindows()

## Detección de contornos
El algoritmo de detección de contornos busca pixel adyacentes que tengan las mismas propiedades. El algoritmo requiere un tratamiento inicial de la imágen para hacer más fácil la detección de los bordes.

In [56]:
import cv2
import numpy as np

# Se detectan objetos de color rojo, verde o azul
cap = cv2.VideoCapture(0)

kernel_open = np.ones((30, 30))
kernel_close = np.ones((100, 100))

while True:
    ret, frame = cap.read()
    
    img_hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
    
    mask1 = cv2.inRange(img_hsv, (0,50,20), (5,255,255))   # Rango inferior rojo
    mask2 = cv2.inRange(img_hsv, (175,50,20), (180,255,255))    # Rango superior rojo
    mask = cv2.bitwise_or(mask1, mask2)
    
    # erosion + dilation: elimina puntos blancos
    mask_open = cv2.morphologyEx(mask, cv2.MORPH_OPEN, kernel_open)          
    # dilation + erosion: elimina agujeros negros
    mask_close = cv2.morphologyEx(mask_open, cv2.MORPH_CLOSE, kernel_close)
    
    mask_final = mask_close
    
    # Se hallan los contornos de la imagen (blanco sobre fondo negro)
    conts, h = cv2.findContours(mask_final, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    
    cv2.drawContours(frame, conts, -1, (255, 0, 0), 3)
    
    for i in range(len(conts)):
        x, y, w, h = cv2.boundingRect(conts[i])
        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 0, 255), 2)
           
    cv2.imshow("WebCam", frame)
    cv2.imshow("Mask Final", mask_final)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()
    

## Insertar texto en OpenCV

In [59]:
import cv2

img = cv2.imread("img\\img1.jpg", cv2.IMREAD_COLOR)
cv2.rectangle(img, (260, 120),(380, 300), (0, 0, 255), 2)
cv2.rectangle(img, (260, 100), (320, 120), (0, 0, 255), -1)
cv2.putText(img, "Tulipan", (260, 115), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)

cv2.imshow("Imagen BGR", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [58]:
fonts = [i for i in dir(cv2) if 'FONT' in i]
for font in fonts: print(font)

FONT_HERSHEY_COMPLEX
FONT_HERSHEY_COMPLEX_SMALL
FONT_HERSHEY_DUPLEX
FONT_HERSHEY_PLAIN
FONT_HERSHEY_SCRIPT_COMPLEX
FONT_HERSHEY_SCRIPT_SIMPLEX
FONT_HERSHEY_SIMPLEX
FONT_HERSHEY_TRIPLEX
FONT_ITALIC
QT_FONT_BLACK
QT_FONT_BOLD
QT_FONT_DEMIBOLD
QT_FONT_LIGHT
QT_FONT_NORMAL


## Haar Cascade Detection - Detección de rostros
La detección de objetos utilizando un clasificador de cascada de propiedades (Haar Cascade feature-based detection) es un método de detección efectivo propuesto por Paul Viola y Michael Jones en 2001. Es una aproximación basada en Machine Learning donde una función cascada es entrenada de una muestra de imágenes positivas y negativas. 

Para detectar un rostro, el algoritmo necesita muchas imágenes positivas y negativas para el entrenamiento del modelo clasificador. Lo que hace el algoritmo es extraer las características de un rostro. Para esto se parte un conjunto de caracteristicas: patrones de zonas oscuras e iluminadas que operarán como kernels de convolución.

![](https://docs.opencv.org/3.4/haar_features.jpg)

Con estas características se genera un modelo de rostro que va acumulando las diferentes caracteristicas en estados, de tal forma que en lugar de hacer un proceso complejo de revisar los detalles de una imagen, se hacen varios pasos simples de detección de cada una de las características de un rostro, en una especie de cascada de propiedades, en donde una imágen pasa de estado "puede ser un rostro" a "es un rostro" o "no es un rostro", dependiendo si va acumulando características del modelo generado.

In [65]:
import cv2
import numpy as np

face_cascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
smile_cascade = cv2.CascadeClassifier("haarcascade_smile.xml")

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    faces = face_cascade.detectMultiScale(gray, 1.2, 5)   # imagen(gray), escala, # min vecinos
    
    for x, y, w, h in faces:
        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
        
        roi_gray = gray[y:y+h, x:x+w]
        roi_color = frame[y:y+h, x:x+w]
        
        smiles = smile_cascade.detectMultiScale(roi_gray, 1.12, 18)
        
        for sx, sy, sw, sh in smiles:
            cv2.rectangle(roi_color, (sx, sy), (sx+sw, sy+sh), (0, 0, 255), 2)
       
    
    cv2.imshow('WebCam', frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

## Ejercicio
Automatice el kiosko de fotos en tkinter para que pueda tomar fotografias de forma automática cuando todas las personas frente a la camara se encuentren mirando a la cámara y sonriendo.