# Open CV - Imagenes y Video
![](https://4.bp.blogspot.com/-Q0XriPVi_KQ/VG9LQyFIy3I/AAAAAAAADVE/pIGGVP3Ft_g/s1600/opencv-python.png)

OpenCV (Open Source Computer Vision Library: https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_tutorials.html) es una librería de código abierto que incluye varios cientos de algoritmos de computer vision. OpenCV2 4.x API esta basado en código escrito y compilado en C++.

Luis A. Muñoz

---

### *Nota sobre la instalación*
Instalación del paquete OpenCV:

    pip install opencv-python

In [1]:
!pip install opencv-python



In [2]:
import cv2

## Abrir una imagen
OpenCV es una librería que permite importar imagenes de diferentes formatos. Una imagen se importa como un array n-dimensional. Una imagen en tonos de gris será un arreglo de *n x m*, según las dimensiones de la imagen. Una imagen en color será un arreglo de *n x m x c*, donde *c* será el número de canales de color. Esto quiere decír que cada uno de los tres arreglos contiene la información de la intensidad de los colores Rojos, Verde y Azul (la imagen puede tener un cuarto canal llamado *alpha-channel* que controla la transparencia de la imagen). 

![](https://ars.els-cdn.com/content/image/3-s2.0-B9780128230145000077-f03-08-9780128230145.jpg)

OpenCV utiliza un mapa de colores diferentes al RGB: BGR (Blue, Green, Red).

In [31]:
# Open CV utiliza el mapa de colores BGR (no RGB)
img = cv2.imread("img\\sample.jpg", 1)  # 0 : Gray Scale (cv2.IMREAD_GRAYSCALE)
                                    # >0: Return a 3-color image (cv2.IMREAD_COLOR)
                                    # <0: Return the loaded image with alpha channel (cv2.IMREAD_UNCHANGED)
print(type(img))

<class 'numpy.ndarray'>


Como se observa, la imagen importada es un ndarray cuyas dimensiones dependerán de la imagen y de la forma como se ha interpretado la imagen. Aunque no hemos importado la librería *numpy*, tenemos acceso al arreglo y a sus propiedades y métodos.

In [32]:
print("Size:", img.shape)    # Forma del arreglo numpy
print("Dim:", img.ndim)      # Numero de dimensiones
print(img.dtype)

Size: (512, 512, 3)
Dim: 3
uint8


## Ventana de visualización de una imagen
Para mostrar una imagen es necesario no solo adjuntar la imagen a una ventana con `cv2.imshow`, sino que debe declararse la forma de cerrar esta ventana

In [13]:
cv2.imshow("Sample Img", img)
cv2.waitKey(0)        # ms or 0 for close window
cv2.destroyAllWindows()

Para probar un método sobre el arreglo imagen, podemos llamar a `resize` para ajustar las dimensiones del arreglo (y de la imagen), por medio de un proceso de interpolación.

In [14]:
resized_image = cv2.resize(img, (200, 200))

In [15]:
cv2.imshow("Resize Img", resized_image)
cv2.waitKey(0)        # ms or 0 for close window
cv2.destroyAllWindows()

Para ajustar el tamaño de una imagen suele ser común mantener la relación de aspecto (la proporción entre alto y ancho de una imagen). Para esto se puede extraer el tamaño original y operar dirctamente con estos valores. Hay que tener especial cuidado con el hecho de que las dimensiones de un arreglo se especifican como (filas, columnas), mientras que en el caso de una imagen se especifica como (ancho, alto), por lo que hay que invertír la asignación *(fila:alto, columna:ancho)*.

In [16]:
resized_image = cv2.resize(img, (int(img.shape[1]/1.5), int(img.shape[0]/1.5)))
print("Shape:", resized_image.shape)

Shape: (341, 341, 3)


In [17]:
cv2.imshow("Resize Img", resized_image)
cv2.waitKey(0)        # ms or 0 for close window
cv2.destroyAllWindows()

## Guardar una imagen
Podemos guardar una imagen utilizando el método `cv2.imwrite`. Este método retorna un valor booleano para confirmar el proceso

In [18]:
cv2.imwrite("img\\sample_res.jpg", resized_image)

True

## Abrir un video
OpenCV también puede abrir archivos de video mp4 y avi. Para esto se genera un dispositivo de captura que toma el video como atributo de entrada y va extrayendo cada uno de los cuadros que componen en video para mostrarlos en secuencia.

In [24]:
cap = cv2.VideoCapture("img\\earth.mp4")

while True:
    ret, frame = cap.read()
    cv2.imshow("Video", frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

## Captura de una cámara
OpenCV puede tener acceso a una camara web. En este caso, hay que ingresar el recurso de la cámara web como un valor entero en el dispositivo de captura de video.

In [2]:
import cv2

cap = cv2.VideoCapture(0)

# Configuracion de la resolucion (640x480) segun ID de configuracion
# cap.set(3, 320)
# cap.set(4, 240)

while True:
    ret, frame = cap.read()
    
    cv2.imshow('WebCam Color', frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

### TIP: DroidCam
En caso de no tener un cámara web, se puede utilizar la cámara de un teléfono móvil por medio de una aplicación que permita registrar el dispositivo como una cámara web. Se sugiere utiliza la aplicación [DroidCam](https://play.google.com/store/apps/details?id=com.dev47apps.droidcam&hl=es_PE) en equipos Android, e [ivCam](https://apps.apple.com/us/app/ivcam-webcam/id1164464478) en equipos Apple.

Para el caso de DroidCam, se debe de modificar el código para lograr la conexión. Una vez instalada la aplicación, esta mostrará una pantalla donde mostrará la IP del teléfono en la red por la que podremos realizar la conexión. Hay que realizar la captura de la ruta `http://<direccion_ip>/mjpegfeed?640x480`. Esta dirección captura un fotograma que es procesado por OpenCV.

In [68]:
import cv2

# Reemplazar por la IP del telefono
cap = cv2.VideoCapture('http://192.168.1.10:4747/mjpegfeed?640x480')

while True:
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    cv2.imshow('WebCam Color', frame)
    cv2.imshow('WebCam Gray', gray)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

## Guardar un video capturado

In [70]:
import cv2

cap = cv2.VideoCapture(0)
codec = cv2.VideoWriter_fourcc(*'XVID')    # (*."MP4V")
out = cv2.VideoWriter('img\\cam_out.avi', codec, 20.0, (640, 480))

while True:
    ret, frame = cap.read()
    out.write(frame)
    
    cv2.imshow('WebCam Color', frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
out.release()
cv2.destroyAllWindows()

## Procesamiento básico de imagenes y video
Con OpenCV se pueden manipular algunos aspectos de un imagen, como ya vimos anteriormente con la redefinición de su tamaño. Se puede convertir la imágen a gris (partiendo del mapa de colores BGR de OpenCV), rotar una imágen alrededor de un eje o rotarla un ángulo determinado.

In [9]:
img = cv2.imread("img\\sample_res.jpg")
# Rotacion sobre un eje
img_flipped = cv2.flip(img, 1)

# Conversion a Escala de Grises
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Rotacion de una imagen (Matriz de Rotacion sobre el centro)
(h, w) = img.shape[:2]
center = (w/2, h/2)
M = cv2.getRotationMatrix2D(center, 20, scale=1)
img_rotated = cv2.warpAffine(img_gray, M, (w, h))

# Se muestran las imagenes modificadas
cv2.imshow("Original Img", img)
cv2.imshow("Flipped Image", img_flipped)
cv2.imshow("Gray Image", img_gray)
cv2.imshow("Rotated Image", img_rotated)

cv2.waitKey(0)
cv2.destroyAllWindows()

Las imagenes también se pueden utilizando filtros especiales, para desenfocar una imágen (blurring) y así eliminar el ruido, o detectar los bordes de una imágen (con el algoritmo de Canny) o realizar transformacion formológicas para conformar los bordes.

In [15]:
import numpy as np

kernel = np.ones((5, 5), np.uint8)
img = cv2.imread("img\\sample_res.jpg", cv2.IMREAD_GRAYSCALE)

img_blurred = cv2.GaussianBlur(img, (7, 7), 0)
img_border = cv2.Canny(img_blurred, 100, 200)    # Probar con img...
img_dilated = cv2.dilate(img_border, kernel, iterations=1)
img_eroded = cv2.erode(img_dilated, kernel, iterations=1)

cv2.imshow("Blurred Img", img_blurred)
cv2.imshow("Border Img", img_border)
cv2.imshow("Border Dilated", img_dilated)
cv2.imshow("Border Eroded", img_eroded)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Insertar figuras y texto en un imagen

In [30]:
img = cv2.imread("img\\sample.jpg")

cv2.line(img, pt1=(50, 20), pt2=(480, 20), color=(255, 0, 0), thickness=3)
cv2.rectangle(img, pt1=(220, 200), pt2=(370, 400), color=(0, 255, 0), thickness=2)
cv2.circle(img, center=(80, 400), radius=60, color=(0, 0, 255), thickness=-1)

cv2.putText(img, text="OpenCV", org=(200, 80), fontFace=cv2.FONT_HERSHEY_COMPLEX, 
            fontScale=1, color=(255, 255, 255), thickness=1)

cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Detección de umbrales (escala de grises)
Las imágenes en escala de grises son escenciales en el procesamiento de imagenes, ya que contienen la información del contenido visual en dos dimensiones (en lugar de las tres de una imagen a color), y mantiene la forma de los objetos. Para detectar estos será necesario en muchas oportunidades establecer un detector de umbral de valores (entre 0 y 255, es decir entre negro y blanco), de tal forma que se convierta una imágen de escala de grises en una imagen binaria de pixels blancos y negros.

In [44]:
img = cv2.imread("img\\logos.jpg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# image, umbral, valor que reemplaza pixels sobre el umbral (255: blanco)
thresh, bw_img = cv2.threshold(gray_img, 180, 255, cv2.THRESH_BINARY)

cv2.imshow("Image", img)
cv2.imshow("Image Gray", gray_img)
cv2.imshow("Image_BW", bw_img)

cv2.waitKey(0)
cv2.destroyAllWindows()

## ROI y cropping
En procesamiento de imagenes, el ROI es el acrónimo de Region of Interest. Este concepto es importante ya que permite recordar que al momento de procesar una imagen, el proceso se concentra muchas veces sobre una región en particular y no sobre toda la imagen. Esto reduce el costo computacional del proceso.

El cropping (recorte) es la extracción de una sección de la imagen, que puede ser el ROI o una parte que quiere procesarse de forma separada. El recorte de una imagen debe de realizarse en su forma matricial.

In [50]:
img = cv2.imread("img\\logos.jpg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

cropped_gray = img_gray[0:150, 0:160]   # row, cols
cropped_color = img[0:150, 0:160, :]    # row, cols, colors

cv2.imshow("Image", img)
cv2.imshow("Cropped Gray", cropped_gray)
cv2.imshow("Cropped Color", cropped_color)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Aplicación: Detección de lineas de señalización
Un uso fcada más más importante en las tareas de procesamiento en tiempo real de una imagen es en la detección de las lineas de señalización en un camino en los coches autónomos. La tarea del algoritmo es detectar las líneas que marcan un camino para que el automóvil no se salga de la pista.

In [2]:
import cv2

img = cv2.imread("img\\road.jpeg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

cv2.imshow("Image", img)
cv2.imshow("Image Gray", img_gray)

cv2.waitKey(0)
cv2.destroyAllWindows()

Para detectar las líneas de señalización, podemos convertir la imagen gris en binaria, de tal forma que resalten los bordes sobre el fondo negro, y filtrar la imagen con el filtro GaussianBlur para eliminar el ruido de los demas objetos (la vegetación del paisaje) para que no altere el proceso posterior de deteción de bordes (con el filtro Canny).

In [49]:
import cv2
import numpy as np

kernel = np.ones((5, 5), np.uint8)
img = cv2.imread("img\\road.jpeg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

thresh, output = cv2.threshold(img_gray, 200, 255, cv2.THRESH_BINARY)
output = cv2.dilate(output, kernel, iterations=1)
output = cv2.GaussianBlur(output, (5, 5), 2)
output = cv2.Canny(output, 180, 255)

cv2.imshow("Image", img)
cv2.imshow("Output", output)

cv2.waitKey(0)
cv2.destroyAllWindows()

La imágen binaria obtenida la podemos pasar a un filtro especial llamado HoughLinesP, que detecta segmentos de recta en una imagen binaria utilizando [la transformación probabilistica de Hough](https://docs.opencv.org/3.4/d9/db0/tutorial_hough_lines.html). Luego, dibujaremos los segmentos detectados con cv2.line.

In [50]:
import cv2
import numpy as np

kernel = np.ones((5, 5), np.uint8)
img = cv2.imread("img\\road.jpeg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

thresh, output = cv2.threshold(img_gray, 200, 255, cv2.THRESH_BINARY)
output = cv2.dilate(output, kernel, iterations=1)
output = cv2.GaussianBlur(output, (5, 5), 2)
output = cv2.Canny(output, 180, 255)

# image, rho, theta, threshold
lines = cv2.HoughLinesP(output, 1, np.pi/180, 20)
for line in lines:
    x1, y1, x2, y2 = line[0]
    cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)

cv2.imshow("Image", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

La detección, una vez ajustado los parametros, es bastante buena, aunque se observa que detecta bordes en el cielo. Aquí es donde podemos recordar el ROI: la carretera siempre estará en la parte inferior, por lo que nuestro detector solo debe de reconocer patrones en la sección inferior, los 2/3 de la imagen.

In [58]:
import cv2
import numpy as np

kernel = np.ones((5, 5), np.uint8)
img = cv2.imread("img\\road.jpeg")
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Se extre el ROI en color y el gris
h, w = img_gray.shape
ROI_color = img[h // 3:, :, :]
ROI_gray = img_gray[h // 3:, :]

# Se realiza el procesamiento en ROI gris
thresh, output = cv2.threshold(ROI, 200, 255, cv2.THRESH_BINARY)
output = cv2.dilate(output, kernel, iterations=1)
output = cv2.GaussianBlur(output, (5, 5), 2)
output = cv2.Canny(output, 180, 255)

# Se hace el trazado de las lineas en ROI color
lines = cv2.HoughLinesP(output, 1, np.pi/180, 20)
for line in lines:
    x1, y1, x2, y2 = line[0]
    cv2.line(ROI_color, (x1, y1), (x2, y2), (0, 255, 0), 2)

# Se "parcha" la imagen con el ROI color
img[h // 3:, :, :] = ROI_color    
    
cv2.imshow("Image", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

## Aplicación: Insertar figuras en un video
Este script se basa en la gestion de eventos del mouse por parte de OpenCV. Para esto es necesario crear una función que maneje el evento generado por el mouse que estará asociado a un evento gracias a la función cv2.setMouseCallback(window, func), donde func tiene una secuencia de parámetros fija y definida: lo único que cambia es lo que la función hace.

In [59]:
import cv2

COLOR = (0, 0, 255)
pt1 = (0, 0)
pt2 = (0, 0)
topLeft_clicked = False
botRight_clicked = False

def set_figure(event, x, y, flags, param):
    global pt1, pt2, topLeft_clicked, botRight_clicked
    
    if event == cv2.EVENT_LBUTTONDOWN:
        if topLeft_clicked and botRight_clicked:
            pt1 = (0, 0)
            pt2 = (0, 0)
            topLeft_clicked = False
            botRight_clicked = False
            
        if topLeft_clicked == False:
            pt1 = (x, y)
            topLeft_clicked = True
        elif botRight_clicked == False:
            pt2 = (x, y)
            botRight_clicked = True

# Se abre una ventana de video con opciones
cv2.namedWindow('WebCam')
# Se asocia un callback a la ventana (funcion)
cv2.setMouseCallback('WebCam', set_figure)

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    
    # Dibujar una figura en funcion de los parametros
    if topLeft_clicked:
        cv2.circle(frame, center=pt1, radius=1, color=COLOR, thickness=-1)
        
    if topLeft_clicked and botRight_clicked:
        cv2.circle(frame, center=pt2, radius=1, color=COLOR, thickness=-1)
        cv2.rectangle(frame, pt1, pt2, color=COLOR, thickness=3)
    
    cv2.imshow('WebCam', frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

### TIP: Listado de MouseEvents en OpenCV

In [5]:
events = [i for i in dir(cv2) if 'EVENT' in i]
for event in events: print(event)

EVENT_FLAG_ALTKEY
EVENT_FLAG_CTRLKEY
EVENT_FLAG_LBUTTON
EVENT_FLAG_MBUTTON
EVENT_FLAG_RBUTTON
EVENT_FLAG_SHIFTKEY
EVENT_LBUTTONDBLCLK
EVENT_LBUTTONDOWN
EVENT_LBUTTONUP
EVENT_MBUTTONDBLCLK
EVENT_MBUTTONDOWN
EVENT_MBUTTONUP
EVENT_MOUSEHWHEEL
EVENT_MOUSEMOVE
EVENT_MOUSEWHEEL
EVENT_RBUTTONDBLCLK
EVENT_RBUTTONDOWN
EVENT_RBUTTONUP
