## Laboratorio 2: Getting started with OpenCV for image and video processing

Elaborado por: Oscar Omar Martínez Lujano 
Matrícula: 352228  
Carrera: ITR  
Fecha: 2019-02-12  


#### Introducción

OpenCV empezó en 1999 en Intel, por Gary Bradsky. OpenCV es una biblioteca libre de visión artificial. Desde que apareció su primera versión alfa en el mes de enero de 1999, se ha utilizado en infinidad de aplicaciones. Desde sistemas de seguridad con detección de movimiento, hasta aplicaciones de control de procesos donde se requiere reconocimiento de objetos. Esto se debe a que su publicación se da bajo licencia BSD, que permite que sea usada libremente para propósitos comerciales y de investigación con las condiciones en ella expresadas. OpenCV soporta muchos algoritmos relacionados con visión computacional, _machine learning_ y cada día crece mas y mas.

Phyton is un lenguaje de programación que empezó por Guido van Rossum, el cuál se hizo muy popular en poco tiempo debido a su simplicidad y un código muy fácil de entender. Python facilita al programador para expresar sus ideas in menos líneas de código.

A comparación de otros lenguajes como C/C++ , python es mas lento. Pero una ventaja de Python es que puede ser transformado fácilmente con  C/C++. Esta opcion nos ayuda a escribir códigos en C/C++ y crear un contenedor de Python, y así poder usar esos contenedores como módulos de Python. Esto nos da ventajas como es el que nuestro código es tan rápido como el original de C/C++, ya que el que está corriendo en el _background_ es C/C++. También es muy fácil trabajar en Python. Es así como trabaja OpenCV-Python, es un _wrapper_ Python alrededor de la implementación original C++. 

El hecho de que podamos usar Numpy, hace que las tareas sean todavía mucho más fáciles. Numpy está altamente optimizado para librerías de operaciones numéricas. Eso le da un estilo muy a la MATLAB. Todos los arreglos de OpenCV son convertidos a arreglos de Numpy. Asi que cualquier operación que hagas en Numpy puede ser combinada con OpenCV. esto incrementa el número de opciones por usar.

Es por todo esto que OpenCV-Python es una herramienta muy apropiada para el rápido desarrollo de prototipo de problemas de computación visual.

#### Objetivos 
En este laboratorio nos enfocaremos en dos cosas:

- Empezar a trabajar con imágenes: la lectura, visualización y almacenamiento de imágenes procesadas se encuentran entre los aspectos fundamentales del procesamiento de imágenes y la aplicación de visión por computadora. Se aprende a leer una imagen del disco, visualizarla y cómo escribirla de nuevo en el disco.

- Empezar a trabajar con videos: como capturar y visualizar una secuencia de video en vivo adquirida desde una cámara web conectada a una Raspberry Pi, se aprende a leer un archivo de video del disco y procesar un poco de video andes de que se procese y se escriba en una archivo nuevo.

#### Procedimiento
En las siguientes celdas de código y texto, el estudiante mostrará el procedimiento realizado en la práctica, mostrando imágenes de salida, o enlace a videos capturados con la camara. 

La siguiente linea muestra un ejemplo para incluir enlaces externos:

[Ver imagen de udem](https://www.google.com/search?q=udem&num=20&client=ubuntu&hs=lvY&channel=fs&source=lnms&tbm=isch&sa=X&ved=0ahUKEwjK6Nymn6HgAhVFL6wKHfsFAtsQ_AUIDigB&biw=1920&bih=959#imgrc=s2Qnk7dbzmnsxM:)

Para incluir imágenes locales, lo podrá hacer de la siguiente manera:

<img src="figs/vehicular-traffic.jpg" width="800" alt="Combined Image" />



#### Importación de librerías
Las siguientes celdas de código implementan la lectura, visualización y escritura de imagen en disco. Primero, se importan las librerías que serán utilizadas en el desarrollo de la práctica. La primera de ellas es la librería ```numpy``` utilizada para creación y manipulación de listas, análisis numérico, etc. La segunda librería es ```cv2```, ésta hace uso de la librería OpenCV, la cual implementa una gran variedad de algorítmos de procesamiento de imágenes y visión computaciónal. En nuestra práctica, ```cv2``` nos permitirá leer, procesar, visualizar y escribir imágenes en archivo....


In [3]:
# importa librerías estandar
import numpy as np
import cv2 

In [5]:
# read in input image
img_in = cv2.imread('figs/vehicular-traffic.jpg', cv2.IMREAD_COLOR) # alternatively, you can use cv2.IMREAD_GRAYSCALE

# create a new window for image visualisation purposes
cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL

# visualise input image
cv2.imshow("input image", img_in)

# convert input image from colour to greyscale
img_out = cv2.cvtColor(img_in, cv2.COLOR_BGR2GRAY)

# visualise greyscale image
cv2.imshow("greyscale image", img_out)

# wait for the user to press a key
key = cv2.waitKey(0)

# if user presses 's', the grayscale image is write to an image file
if key == ord("s"):
    
    cv2.imwrite('figs/vehicular-traffic-greyscale.png', img_out)
    print('output image has been saved in /figs/vehicular-traffic-greyscale.png')

# destroy windows to free memory  
cv2.destroyAllWindows()
print('windows have been closed properly - bye!')

output image has been saved in /figs/vehicular-traffic-greyscale.png
windows have been closed properly - bye!


In [6]:
#!/usr/bin/env python

# import required libraries
import numpy as np
import cv2
import argparse

def options():
    # parse command line arguments
    parser = argparse.ArgumentParser('Read, visualise and write image into disk')
    parser.add_argument('-i', '--in_image_name', help='input image name', required=True)
    parser.add_argument('-o', '--out_image_name', help='output image name', required=True)
    args = vars(parser.parse_args())
    
    return args

def processing_image(img_in_name, img_out_name):
    
     # read in image from file
    img_in = cv2.imread(img_in_name, cv2.IMREAD_COLOR) # alternatively, you can use cv2.IMREAD_GRAYSCALE

    # verify that image exists
    if img_in is None:
        print('ERROR: image ', img_in_name, 'could not be read')
        exit()

    # convert input image from colour to grayscale
    img_out = cv2.cvtColor(img_in, cv2.COLOR_BGR2GRAY)

    # create a new window for image purposes
    cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL
    cv2.namedWindow("output image", cv2.WINDOW_AUTOSIZE) # that option will allow you for window resizing

    # visualise input and output image
    cv2.imshow("input image", img_in)
    cv2.imshow("output image", img_out)

    # wait for the user to press a key
    key = cv2.waitKey(0)

    # if user pressed 's', the grayscale image is write to disk
    if key == ord("s"):
        cv2.imwrite(img_out_name, img_out)
        print('output image has been saved in ../figs/vehicular-traffic-greyscale.png')

    # destroy windows to free memory  
    cv2.destroyAllWindows()
    print('windows have been closed properly')

    
# main function
def main():    
    
    # uncomment these lines when running on jupyter notebook
    # and comment when running as a script on linux terminal
    args = {
            "in_image_name": "figs/vehicular-traffic.jpg",
            "out_image_name": "figs/vehicular-traffic-greyscale.png"
            }
    
    # comment the following line when running on jupyter notebook
    # and uncomment when running as a script on linux terminarl
    #args = options()
    
    in_image_name = args['in_image_name']
    out_image_name = args['out_image_name']
    
    # call processing image
    processing_image(in_image_name, out_image_name)
    
    
# run first
if __name__=='__main__':
    main()


ERROR: image  ../figs/vehicular-traffic.jpg could not be read


error: OpenCV(4.0.0) /io/opencv/modules/imgproc/src/color.cpp:181: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'


#### Capture video from camera - Basic code

In [None]:
# import required libraries
import numpy as np
import cv2 as cv

# create a VideoCapture object
cap = cv.VideoCapture(0)

# main loop
while(True):

    # capture new frame
    ret, frame = cap.read()

    # convert from colour to grayscale image
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    # visualise image
    cv.imshow('frame', frame)

    # wait for the user to press 'q' to close the window
    if cv.waitKey(1) & 0xFF == ord('q'):
        break

# release VideoCapture object
cap.release()

# destroy windows to free memory
cv.destroyAllWindows()

#### Capture video from camera

In [None]:
# import required libraries
import numpy as np
import cv2


def configure_videoCapture(device_index):

    """
    Configure video capture object to handle video device.

    Parameters
        device_index: int value indicating the index number to access camera

    Returns
        cap: videoCapture-type object

    """

    # create a videoCapture object and returns either a True or False
    cap = cv2.VideoCapture(device_index)

    # if camera could not be opened, it displays an error and exits
    if not cap.isOpened():
        print("ERROR: Camera could not be opened")
        exit()

    # return videoCapture object 'cap'
    return cap


def print_video_frame_specs(cap):

    """
    Print video specifications such as video frame width and height, fps,
    brightness, contrast, saturation, gain, and exposure.

    Parameters
        cap: video capture object

    Returns
        None: this definition only prints information on the command line
              window.
    """    

    # retrieve video properties
    ret, frame = cap.read()
    frame_height, frame_width = frame.shape[:2]

    # verify that frame was properly captured
    if ret == False:
        print("ERROR: current frame could not be read")
        exit()

    else: # if so, video frame stats are displayed

        # print video frames specifications
        print('\nVideo specifications:')
        print('\tframe width: ', cap.get(cv2.CAP_PROP_FRAME_WIDTH))
        print('\tframe height: ', cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
        print('\tframe rate: ', cap.get(cv2.CAP_PROP_FPS))
        print('\tbrightness: ', cap.get(cv2.CAP_PROP_BRIGHTNESS))
        print('\tcontrast: ', cap.get(cv2.CAP_PROP_CONTRAST))
        print('\tsaturation: ', cap.get(cv2.CAP_PROP_SATURATION))
        print('\thue: ', cap.get(cv2.CAP_PROP_GAIN))
        print('\texposure: ', cap.get(cv2.CAP_PROP_EXPOSURE))

    # return None
    return None


def capture_and_process_video(cap):

    """
    Capture live video from a camera connected to your computer. Each frame is
    flipped and visualised together with the original frame on separate windows.

    Parameters
        cap: video capture object

    Returns
        None: none

    """

    # create a new window for image purposes
    cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL
    cv2.namedWindow("output image", cv2.WINDOW_AUTOSIZE) # that option will allow you for window resizing


    # main loop
    print('\ncapturing video ...')
    while(cap.isOpened()):

        # capture frame by frame
        ret, frame = cap.read()

	    # verify that frame was properly captured
        if ret == False:
            print("ERROR: current frame could not be read")
            break

        # if frame was properly captured, it is converted
        # from a colour to a grayscale image
        frame_out = cv2.flip(frame,0)

        # visualise current frame and grayscale frame
        cv2.imshow("input image", frame)
        cv2.imshow("output image", frame_out)


        # wait for the user to press a key
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    # return none
    return None


def free_memory(cap):

    """
    Free memory by releasing videoCapture 'cap' and by destroying/closing all
    open windows.

    Parameters
        cap: video capture object

    Returns
        None: none
    """

    # when finished, release the VideoCapture object and close windows to free memory
    print('closing camera ...')
    cap.release()
    print('camera closed')
    cv2.destroyAllWindows()
    print('program finished - bye!\n')

    # return none
    return None


def run_pipeline(device_index=0):
    """
    Run pipeline to capture, process and visualise both the original frame and
    processed frame.

    Parameters
        device_index: device index - 0 default

    Returns
        arg: None

    """

    # pipeline
    cap = configure_videoCapture(device_index)
    print_video_frame_specs(cap)
    capture_and_process_video(cap)
    free_memory(cap)

    # return none
    return None


# run pipeline    
run_pipeline(device_index = 0)

#### Play video file

In [None]:
# import required libraries
import numpy as np
import cv2

# create a VideoCapture object and specify video file to be read
cap = cv2.VideoCapture('../datasets/videos/highway_right_solid_white_line_short.mp4')

# main loop
while(cap.isOpened()):

    # read current frame
    ret, frame = cap.read()

    # validate that frame was capture correctly
    if ret:
        
        # convert frame from colour to gray scale
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

        # show current frame
        cv2.imshow('frame',gray)

    # wait for the user to press 'q' to exit
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# release VideoCapture object
cap.release()

# destroy windows to free memory
cv2.destroyAllWindows()

#### Conclusiones
En esta sección, el estudiante incluirá sus conclusiones ...