## Laboratorio 2: Getting started with OpenCV for image and video processing

Elaborado por: Oscar Omar Martínez Lujano 
Matrícula: 352228  
Carrera: ITR  
Fecha: 2019-02-12  


#### Introducción

OpenCV empezó en 1999 en Intel, por Gary Bradsky. OpenCV es una biblioteca libre de visión artificial. Desde que apareció su primera versión alfa en el mes de enero de 1999, se ha utilizado en infinidad de aplicaciones. Desde sistemas de seguridad con detección de movimiento, hasta aplicaciones de control de procesos donde se requiere reconocimiento de objetos. Esto se debe a que su publicación se da bajo licencia BSD, que permite que sea usada libremente para propósitos comerciales y de investigación con las condiciones en ella expresadas. OpenCV soporta muchos algoritmos relacionados con visión computacional, _machine learning_ y cada día crece mas y mas.

Phyton is un lenguaje de programación que empezó por Guido van Rossum, el cuál se hizo muy popular en poco tiempo debido a su simplicidad y un código muy fácil de entender. Python facilita al programador para expresar sus ideas in menos líneas de código.

A comparación de otros lenguajes como C/C++ , python es mas lento. Pero una ventaja de Python es que puede ser transformado fácilmente con  C/C++. Esta opcion nos ayuda a escribir códigos en C/C++ y crear un contenedor de Python, y así poder usar esos contenedores como módulos de Python. Esto nos da ventajas como es el que nuestro código es tan rápido como el original de C/C++, ya que el que está corriendo en el _background_ es C/C++. También es muy fácil trabajar en Python. Es así como trabaja OpenCV-Python, es un _wrapper_ Python alrededor de la implementación original C++. 

El hecho de que podamos usar Numpy, hace que las tareas sean todavía mucho más fáciles. Numpy está altamente optimizado para librerías de operaciones numéricas. Eso le da un estilo muy a la MATLAB. Todos los arreglos de OpenCV son convertidos a arreglos de Numpy. Asi que cualquier operación que hagas en Numpy puede ser combinada con OpenCV. esto incrementa el número de opciones por usar.

Es por todo esto que OpenCV-Python es una herramienta muy apropiada para el rápido desarrollo de prototipo de problemas de computación visual.

#### Objetivos 
En este laboratorio nos enfocaremos en dos cosas:

- Empezar a trabajar con imágenes: la lectura, visualización y almacenamiento de imágenes procesadas se encuentran entre los aspectos fundamentales del procesamiento de imágenes y la aplicación de visión por computadora. Se aprende a leer una imagen del disco, visualizarla y cómo escribirla de nuevo en el disco.

- Empezar a trabajar con videos: como capturar y visualizar una secuencia de video en vivo adquirida desde una cámara web conectada a una Raspberry Pi, se aprende a leer un archivo de video del disco y procesar un poco de video andes de que se procese y se escriba en una archivo nuevo.

#### Procedimiento
La siguiente imagen es la que se utiliza para hacer el procesamiento de imágenes:

<img src="figs/vehicular-traffic.jpg" width="400" alt="Combined Image" />



#### a. Importación de librerías

Las siguientes librerías son utilizadas a lo largo de todos los códigos de esta práctica


- ```cv2```: Implementa una gran variedad de algorítmos de procesamiento de imágenes y visión computacional.
- ```numpy:``` Crea y manipula listas, análisis numérico, etc.
- ```argparse:``` Usada para analizar argumentos que pasan por la consola, analiza manualmente los argumentos escritos en un diccionario.


In [3]:
# importa librerías estandar
import numpy as np
import cv2 

#### b. Reading, visualising and saving images

- `cv2.imread(filename[, flags])`
    - Carga una imagen de un archivo
    - filename - nombre del archivo que será cargado.
    - flags - CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_COLOR | CV_LOAD_IMAGE_GRAYSCALE
    - **returns** – Mat object.
- `cv2.namedWindow(winname[, flags])`
    - Crea una ventana
    - name - Nombre de la ventana que será usada para identificarla
    - flags - WINDOW_NORMAL | WINDOW_AUTOSIZE | WINDOW_OPENGL
    - **returns** – None
- `cv2.imshow(winname, mat)`
    - Despliega una imagen en la ventana especificada
    - winname - nombre de la ventana
    - image - imagen que será mostrada
    - **returns** – None
- `cv2.waitKey([delay])`
    - Espera a que presionen una tecla
    - delay - Delay en milisegundos, 0 es el valor especial que significa “forever”.
    - **returns** – el código de la tecla oprimida o -1 si no se presionó nada
- `cv2.imwrite(filename, img[, params])`
    - Guarda una imagen en el archivo especificado
    - filename - nombre del archivo
    - image - imagen que se guardará
    - params - Formato específico de los parametros guardados codificados como pares. Check docs.
    - **returns** – retval
- `cv2.destroyAllWindows()`
    - Destrute todas las ventanas HighGUI
    - **returns** – None

Información obtenida de:
- https://docs.opencv.org/3.0-beta/modules/imgcodecs/doc/reading_and_writing_images.html?highlight=imwrite#cv2.imwrite
- https://docs.opencv.org/3.0-beta/modules/highgui/doc/user_interface.html?highlight=waitkey#waitkey

In [2]:
# read in input image
img_in = cv2.imread('figs/vehicular-traffic.jpg', cv2.IMREAD_COLOR) # alternatively, you can use cv2.IMREAD_GRAYSCALE

# create a new window for image visualisation purposes
cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL

# visualise input image
cv2.imshow("input image", img_in)

# convert input image from colour to greyscale
img_out = cv2.cvtColor(img_in, cv2.COLOR_BGR2GRAY)

# visualise greyscale image
cv2.imshow("greyscale image", img_out)

# wait for the user to press a key
key = cv2.waitKey(0)

# if user presses 's', the grayscale image is write to an image file
if key == ord("s"):
    
    cv2.imwrite('figs/vehicular-traffic-greyscale.png', img_out)
    print('output image has been saved in /figs/vehicular-traffic-greyscale.png')

# destroy windows to free memory  
cv2.destroyAllWindows()
print('windows have been closed properly - bye!')

windows have been closed properly - bye!


#### c. A more elaborated program to read, visualise, and save an image

- `parser.add_argument(name or flags...[, action][, nargs][, const][, default][, type][, choices][, required][, help][, metavar][, dest])`
    - Define como una linea de comando singular debería de ser analizada.
    - name or flags - Either a name or a list of option strings, e.g. foo or -f, --foo.
    - action - acción de tipo básica que será tomada cuando este argumento sea encontrado en la linea de comando.
    - nargs - el numero de argumentos de linea de comando que deberían ser consumidos. 
    - const - valor constante requerido por una acción y selección nargs.
    - default - el valor producido si el argumento está ausente en la linea de comando.
    - type - el tipo al que el argumento de la linea de comando va a ser convertido
    - choices - un contenedor con los valores permitidos para el argumento
    - required - la linea de comando puede ser omitida (opcional)
    - help - pequeña descripción de lo que el argumento hace
    - metavar - nombre para el argumento en mensajes usados.
    - dest - el nombre del atributo que se añade al obejto devuelto por parse_args()
    - **returns** – None

- `cv2.cvtColor(src, code[, dst[, dstCn]])`
    - Convierte una imagen de un espacio de color a otro.
    - src - imagen de entrada
    - dst - imagen de salida del mismo tamaño y profundidad que src
    - code - código de conversión de espacio de color. COLOR_BGR2GRAY, COLOR_BGR2XYZ, COLOR_BGR2YCrCb, COLOR_BGR2HSV, COLOR_BGR2HLS, COLOR_BGR2Lab, COLOR_BGR2Luv, COLOR_BayerBG2BGR
    - dstCn – número de canales en la imagen destino.
    - **returns** – Destination image
    
- `argparse.ArgumentParser(prog=None, usage=None, description=None, epilog=None, parents=[], formatter_class=argparse.HelpFormatter, prefix_chars='-', fromfile_prefix_chars=None, argument_default=None, conflict_handler='error', add_help=True)`
    - Crea un nuevo objeto ArgumentParser.
    - prog - el nombre del programa (default: sys.argv[0])
    - usage - el string describiendo tel uso del programa (default: generated from arguments added to parser)
    - description - texto para desplegar antes del help (default: none)
    - epilog - texto para desplegar despues del help (default: none)
    - parents - una lista de objetos ArgumentParser que deberían ser incluidos
    - formatter_class - una clase para perosnalizar la salida help
    - prefix_chars - lista de caracteres que anteponen argumentos opcionales (default: ‘-‘)
    - fromfile_prefix_chars - lista de caracteres que anteponen archivos de argumentos adicionales que son leídos (default: None)
    - argument_default - el valor default global para argumentos (default: None)
    - conflict_handler - la estrategia de resolver opcionales conflictivos (usualmente innecesario)
    - add_help - agrega un -h+
    help option to the parser (default: True)
    - **returns** – an ArgumentParser Object

- `vars([object])`
    - Regresa el \_\_dict__ attribute del objeto dado si el objeto tiene \_\_dict__ attribute.
    - object - puede ser modulo, clase, instancia, o cualquier objeto que tenga \_\_dict__ attribute.
    - **returns** – dict Object.


Información obtenida de:
- https://docs.opencv.org/3.0-beta/modules/imgproc/doc/miscellaneous_transformations.html#void%20cvtColor(InputArray%20src,%20OutputArray%20dst,%20int%20code,%20int%20dstCn)
- https://docs.python.org/2/library/argparse.html#argparse.ArgumentParser.add_argument
- https://www.programiz.com/python-programming/methods/built-in/vars

In [3]:
#!/usr/bin/env python

# import required libraries
import numpy as np
import cv2
import argparse

def options():
    # parse command line arguments
    parser = argparse.ArgumentParser('Read, visualise and write image into disk')
    parser.add_argument('-i', '--in_image_name', help='input image name', required=True)
    parser.add_argument('-o', '--out_image_name', help='output image name', required=True)
    args = vars(parser.parse_args())
    
    return args

def processing_image(img_in_name, img_out_name):
    
     # read in image from file
    img_in = cv2.imread(img_in_name, cv2.IMREAD_COLOR) # alternatively, you can use cv2.IMREAD_GRAYSCALE

    # verify that image exists
    if img_in is None:
        print('ERROR: image ', img_in_name, 'could not be read')
        exit()

    # convert input image from colour to grayscale
    img_out = cv2.cvtColor(img_in, cv2.COLOR_BGR2GRAY)

    # create a new window for image purposes
    cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL
    cv2.namedWindow("output image", cv2.WINDOW_AUTOSIZE) # that option will allow you for window resizing

    # visualise input and output image
    cv2.imshow("input image", img_in)
    cv2.imshow("output image", img_out)

    # wait for the user to press a key
    key = cv2.waitKey(0)

    # if user pressed 's', the grayscale image is write to disk
    if key == ord("s"):
        cv2.imwrite(img_out_name, img_out)
        print('output image has been saved in ../figs/vehicular-traffic-greyscale.png')

    # destroy windows to free memory  
    cv2.destroyAllWindows()
    print('windows have been closed properly')

    
# main function
def main():    
    
    # uncomment these lines when running on jupyter notebook
    # and comment when running as a script on linux terminal
    args = {
            "in_image_name": "figs/vehicular-traffic.jpg",
            "out_image_name": "figs/vehicular-traffic-greyscale.png"
            }
    
    # comment the following line when running on jupyter notebook
    # and uncomment when running as a script on linux terminarl
    #args = options()
    
    in_image_name = args['in_image_name']
    out_image_name = args['out_image_name']
    
    # call processing image
    processing_image(in_image_name, out_image_name)
    
    
# run first
if __name__=='__main__':
    main()


windows have been closed properly


#### d. Basic program to capture live video from camera
- `cv2.VideoCapture([filename, device])`
    - Construtora VideoCapture
    - filename - nombre del archivo video abierto
    - devide - id del dispositivo de captura del video abierto
    - **returns** – <VideoCapture \object> 
- `cv2.VideoCapture.read()`
    - Graba, decodifica y returna el siguiente frame de video
    - **returns** – retval, image 
- `cv2.VideoCapture.release()`
    - Cierra el archivo de video o el dispositivo de captura.
    - **returns** – None
    
Información obtenida de:
- https://docs.opencv.org/3.0-beta/modules/videoio/doc/reading_and_writing_video.html?highlight=videocapture#videocapture-release

In [4]:
# import required libraries
import numpy as np
import cv2 as cv

# create a VideoCapture object
cap = cv.VideoCapture(0)

# main loop
while(True):

    # capture new frame
    ret, frame = cap.read()

    # convert from colour to grayscale image
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    # visualise image
    cv.imshow('frame', frame)

    # wait for the user to press 'q' to close the window
    if cv.waitKey(1) & 0xFF == ord('q'):
        break

# release VideoCapture object
cap.release()

# destroy windows to free memory
cv.destroyAllWindows()

#### e. Basic program to capture live video from Raspberry Pi camera

    Por el momento no se cuenta con cámara Raspberry Pi 

- `PiCamera(camera_num=0, stereo_mode='none', stereo_decimate=False, resolution=None, framerate=None, sensor_mode=0, led_pin=None, clock_mode='reset', framerate_range=None)`
    - Da una interface de Python pura para la cámara Raspberry Pi
    - **returns** - PiCamera object
- `PiCamera.resolution`
    - Recupera la resolución en la que la imagen, video y previews serán capturados
- `PiCamera.framerate`
    - Recupera el framerate en el que el video portable, imagenes, grabaciones de video correrán `PiRGBArray(camera, size=None)`
    - Produce a 3D RGB arreglo de una captura RGB
    - camera - objeto PiCamera
    - **returns** – arreglo
- `time.sleep(t)`
    - Suspende la ejecución por el número dado de segundos
    - t - este es el número de segundos que la ejecución será suspendida
    - **returns** – None
- `np.float32(c)`
    - Crea un preciso float singular
    - c – numero a convertir
    - **returns** – single precision float.
- `cv2.Canny(image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]])`
    - image - entrada de imagen de 8-bit
    - edges - salida del borde del mapa, single channels 8-bit image, tiene el mismo tamaño que la imagen
    - threshold1 - primer threshold para el procedimiento de histéresis.
    - threshold2 - segundo threshold oara el procedimiento de histéresis.
    - apertureSize - tamaño de apertura para el operador Sobel()
    - L2gradient - un flag, indicando cualquier norm L2 mas preciso
    - **returns** - edges  
- `ord(c)`
    - Regresa un intero representando el punto código Unicode para el caracter Unicode dado
    - c – string de longitud 1 el cual su punto código character string of length 1 whose Unicode code point is to be found.
    - **returns** – int

Información obtenida de:
- https://picamera.readthedocs.io/en/release-1.10/api_array.html#pirgbarray
- https://www.tutorialspoint.com/python/time_sleep.htm
- https://docs.scipy.org/doc/numpy-1.13.0/user/basics.types.html
- https://www.programiz.com/python-programming/methods/built-in/ord
- https://docs.opencv.org/3.0-beta/modules/imgproc/doc/feature_detection.html?highlight=cv2.canny#cv2.Canny

#### f. A more elaborated program to capture, process and visualise video

- `cv2.videoCapture.isOpened()`
    - Retorna verdadero si el video capturado ya ha sido inicializado.
    - **returns** - retval
- `cv2.videoCapture.get(propId)`
    - Retorna la propiedad VideoCapture especificada
    - propId - Identificador propiedad
    - **returns** - retval
- `cv2.flip(src, flipCode[, dst])`
    - Voltea un arreglo 2D verticalmente, horizontalmente o ambos ejes 
    - src - entrada de arreglo.
    - dst - salida de arreglo del mismo tamaño del src
    - flipCode - flag que especifica como voltear un arreglo, 0 significa voltear en el eje x, 1 significa eje y. Valores negativos significa voltear en ambos ejes.
    - **returns** - dst
    
Información obtenida de:

- https://docs.opencv.org/3.0-beta/modules/videoio/doc/reading_and_writing_video.html?highlight=cv2.videocapture.isopened#videocapture
- https://docs.opencv.org/3.0-beta/modules/core/doc/operations_on_arrays.html?highlight=flip#cv2.flip

In [5]:
# import required libraries
import numpy as np
import cv2


def configure_videoCapture(device_index):

    """
    Configure video capture object to handle video device.

    Parameters
        device_index: int value indicating the index number to access camera

    Returns
        cap: videoCapture-type object

    """

    # create a videoCapture object and returns either a True or False
    cap = cv2.VideoCapture(device_index)

    # if camera could not be opened, it displays an error and exits
    if not cap.isOpened():
        print("ERROR: Camera could not be opened")
        exit()

    # return videoCapture object 'cap'
    return cap


def print_video_frame_specs(cap):

    """
    Print video specifications such as video frame width and height, fps,
    brightness, contrast, saturation, gain, and exposure.

    Parameters
        cap: video capture object

    Returns
        None: this definition only prints information on the command line
              window.
    """    

    # retrieve video properties
    ret, frame = cap.read()
    frame_height, frame_width = frame.shape[:2]

    # verify that frame was properly captured
    if ret == False:
        print("ERROR: current frame could not be read")
        exit()

    else: # if so, video frame stats are displayed

        # print video frames specifications
        print('\nVideo specifications:')
        print('\tframe width: ', cap.get(cv2.CAP_PROP_FRAME_WIDTH))
        print('\tframe height: ', cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
        print('\tframe rate: ', cap.get(cv2.CAP_PROP_FPS))
        print('\tbrightness: ', cap.get(cv2.CAP_PROP_BRIGHTNESS))
        print('\tcontrast: ', cap.get(cv2.CAP_PROP_CONTRAST))
        print('\tsaturation: ', cap.get(cv2.CAP_PROP_SATURATION))
        print('\thue: ', cap.get(cv2.CAP_PROP_GAIN))
        print('\texposure: ', cap.get(cv2.CAP_PROP_EXPOSURE))

    # return None
    return None


def capture_and_process_video(cap):

    """
    Capture live video from a camera connected to your computer. Each frame is
    flipped and visualised together with the original frame on separate windows.

    Parameters
        cap: video capture object

    Returns
        None: none

    """

    # create a new window for image purposes
    cv2.namedWindow("input image", cv2.WINDOW_AUTOSIZE)  # alternatively, you can use cv2.WINDOW_NORMAL
    cv2.namedWindow("output image", cv2.WINDOW_AUTOSIZE) # that option will allow you for window resizing


    # main loop
    print('\ncapturing video ...')
    while(cap.isOpened()):

        # capture frame by frame
        ret, frame = cap.read()

	    # verify that frame was properly captured
        if ret == False:
            print("ERROR: current frame could not be read")
            break

        # if frame was properly captured, it is converted
        # from a colour to a grayscale image
        frame_out = cv2.flip(frame,0)

        # visualise current frame and grayscale frame
        cv2.imshow("input image", frame)
        cv2.imshow("output image", frame_out)


        # wait for the user to press a key
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    # return none
    return None


def free_memory(cap):

    """
    Free memory by releasing videoCapture 'cap' and by destroying/closing all
    open windows.

    Parameters
        cap: video capture object

    Returns
        None: none
    """

    # when finished, release the VideoCapture object and close windows to free memory
    print('closing camera ...')
    cap.release()
    print('camera closed')
    cv2.destroyAllWindows()
    print('program finished - bye!\n')

    # return none
    return None


def run_pipeline(device_index=0):
    """
    Run pipeline to capture, process and visualise both the original frame and
    processed frame.

    Parameters
        device_index: device index - 0 default

    Returns
        arg: None

    """

    # pipeline
    cap = configure_videoCapture(device_index)
    print_video_frame_specs(cap)
    capture_and_process_video(cap)
    free_memory(cap)

    # return none
    return None


# run pipeline    
run_pipeline(device_index = 0)


Video specifications:
	frame width:  640.0
	frame height:  480.0
	frame rate:  30.0
	brightness:  0.0
	contrast:  50.0
	saturation:  64.0
	hue:  -1.0
	exposure:  166.0

capturing video ...
closing camera ...
camera closed
program finished - bye!



#### g. Basic program to play a video file

In [6]:
# import required libraries
import numpy as np
import cv2

# create a VideoCapture object and specify video file to be read
cap = cv2.VideoCapture('figs/highway_right_solid_white_line_short.mp4')

# main loop
while(cap.isOpened()):

    # read current frame
    ret, frame = cap.read()

    # validate that frame was capture correctly
    if ret:
        
        # convert frame from colour to gray scale
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

        # show current frame
        cv2.imshow('frame',gray)

    # wait for the user to press 'q' to exit
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# release VideoCapture object
cap.release()

# destroy windows to free memory
cv2.destroyAllWindows()

#### Conclusiones
En este laboratorio, usamos librerias de openCV y numpy. Aprendí lo básico para hacer uso de imágenes y video que se encuentran en el disco, así como el guardar imagenes nuevas. Entendí lo que hace cada función de cada código que se vió en este laboratorio y creo yo que lo mas importante de todos los laboratorios no es hacer que funcione un código o ver el resultado de un código, si no el entender cada función que se utiliza y por supuesto aprendernosla, porque al final de cuentas lo mas importante es lo que tenemos en nuestra cabeza y lo que somos capaces de realizar sin ayuda de nada ni de nadie.

#### Referencias

Introduction to OpenCV-Python Tutorials¶. (n.d.). Retrieved February 11, 2019, from https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_setup/py_intro/py_intro.html#intro



_Yo declaro, que he realizado este Laboratorio 1 con integridad académica_