# OpenCV

OpenCV es un conjunto de herramientas open source para aplicaciones de visión artificial. Contiene distintas utilidades y algoritmos implementados y optimizados para realizar operaciones comunes en pipelines de visión artificial:

 - Herramientas de lectura y escritura de imágenes y video.
 - Algoritmos optimizados (implementación en C++) accesibles.
 - Utilidades para creación de GUI.
 - Extensibilidad con otras herramientas y librerías.
 - Ampliamente usado en la industria y con una gran comunidad.
 - Documentación y material extensivo disponible en internet.

# Operaciones Básicas
OpenCV usa arrays de Numpy para manipular imágenes en memoria. Los arrays de numpy son estructuras optimizadas para operaciones con arreglos multidimensionales similar a lo que se tiene en el entorno de Matlab.


## Acceder y modificar pixeles

In [1]:
import numpy as np
import cv2

# para cargar una imagen en memoria se usa la funcion imread()
img = cv2.imread("lenna.png")
print(type(img))
print(img.dtype)
print(img.shape)

<class 'numpy.ndarray'>
uint8
(512, 512, 3)


Para acceder al valor de un pixel se usa la posicion en cada dimension `img[fila, col]`

In [None]:
img[100, 100]

OpenCV usa por defecto una representación BGR, para ver el canal azul, podemos acceder al primer elemento del pixel.

In [None]:
img[89, 100, 0]

Para modificar el valor del pixel simplemente se puede asignar un nuevo valor:

In [5]:
img[100, 100] = [255, 255, 255]

In [None]:
img[100,100]

In [None]:
img[97:103, 97:103, 2]


## Visualizar una imagen en un notebook de jupyter
Para visualizar una imagen de OpenCV en un notebook de jupyter debemos usar la librería `matplotlib`

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

plt.imshow(img)

In [None]:
# convertir a rgb
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)

In [None]:
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# print(img[98:102, 98:102, 0])
# print(img_hsv[98:102, 98:102, 0])
plt.imshow(img_hsv, cmap="gray")

In [14]:
# usando una funcion

def display(img):
    plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))

In [None]:
display(img)

## ROI
La Región de Interés o ROI (Region of Interest) puede ser definida usando el indexado de numpy.

In [None]:
#           filas  , columnas
display(img[200:380, 210:350])

## Operaciones sobre imágenes


### Blending
Se suman dos imágenes con distintos niveles de ponderación de manera que se pueda obtener una transparencia, se opera de acuerdo a la siguiente fórmula:

$$g(x) = (1 - \alpha)f_0(x) + \alpha f_1(x)$$

In [None]:
img1 = cv2.imread("lenna.png")
img2 = cv2.imread("opencv.png")
print(img1.shape, img2.shape)

display(cv2.addWeighted(img1, 0.8, img2, 0.2, 0))

### Cambio de espacios de color
Existen más de 150 operaciones para conversiones de espacios de color en OpenCV. Usaremos una vez más la función `cvtColor()` 

Para la conversión de BGR a HSV, es importante tomar en cuenta que los rangos para HSV son los siguientes:

  - hue: [0, 179]
  - saturation: [0, 255]
  - value: [0, 255]

In [None]:
img_hsv = cv2.cvtColor(img1, cv2.COLOR_BGR2HSV)

print(img1[100, 100], img_hsv[100, 100])


In [None]:
img_gray = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
print(img1.shape, img_gray.shape)
display(img_gray)

### Escalado

In [None]:
n_filas = 300
n_cols = 700
# dimensiones de salida de forma explicita
                        #     x    , y
img_long = cv2.resize(img1, (n_cols, n_filas), interpolation=cv2.INTER_CUBIC)
display(img_long)

In [None]:
factor_filas = 1.9
factor_cols = 0.4

display(cv2.resize(img1, None, fy=factor_filas, fx=factor_cols, interpolation=cv2.INTER_CUBIC))

### Rotación
La rotación por un ángulo $\theta$ se puede lograr en base a la siguiente transformación:

$$ M = \begin{bmatrix}cos(\theta) & -sin(\theta)\\ sin(\theta) & cos(\theta)\end{bmatrix}$$

En OpenCV se puede usar la funcion `getRotationMatrix2D` para obtener una matriz de tranformación afín que represente la rotación deseada, y luego aplicar esta transformación a la imagen:

In [None]:
dimensiones = (400, 400, 3)
filas, columnas, _ = dimensiones
# columnas = dimensiones[1]
# canales = dimensiones[2]

print(f"Dim: {dimensiones} -> filas: {filas}, cols: {columnas}, canales: {canales}")

In [None]:
# obtener solamente el canal B
img3 = img1#[:,:,0]

filas, cols, _ = img3.shape
print(img3.shape)
theta = -25

# #                           (centro x      , centro y        , theta, escala)
M = cv2.getRotationMatrix2D((0, 0), theta, 1)
print(M)
# #                     (img, matriz, size) 
display(cv2.warpAffine(img3, M, (cols, filas)))

## Ejercicio

Superponer la imagen de la flecha roja del archivo `flecha.png` con un tamaño de 100x100 pixeles sobre la imagen de `lenna.png` en la **esquina superior derecha** rotado en un ángulo de **135 grados*, como se puede observar en el ejemplo:

![result](output.png)