# PRÁCTICA II: Determinación de la apertura de una ventana motorizada

En esta práctica modificaremos una grabación de una ventana motorizada con la ayuda de las distintas técnicas vistas en los temas 1-4 para conseguir determinar qué porcentaje de dicha ventana está abierta en distintas situaciones visuales (mucha iluminación, oscuridad, partículas, etc.)

Además el usuario que utilice el programa deberá seleccionar 4 puntos en sentido horario que definirán las esquinas de la ventana para generar una imagen transformada de ésta (Aclaración: se debe evitar introducir marcos de la ventana en la imagen segmentada para no influir en el resultado del algoritmo).

Video con el resultado final en: PracticaXanelaCV>DATA>Imagen_resultado.mp4

### ACLARACIÓN IMPORTANTE: Primero se explicarán los distintos segmentos del código de manera no funcional y al final del notebook se añadirá el código ejecutable

Importamos las librerías necesarias para manipular los frames de la imagen:

In [None]:
import cv2
import numpy as np
import matplotlib
matplotlib.use("TkAgg")

### 1. En primer lugar leeremos el video aportado y seleccionaremos el primer frame para que el usuario seleccione los 4 vértices de la ventana.
Para ello utilizamos la función de OpenCV cv2.setMouseCallback() que invocará el callback 'pick_points()' el cual introducirá en una lista global los puntos seleccionados en pantalla en orden horario.

In [None]:
cap = cv2.VideoCapture('./PracticaXanelaCV/DATA/proba.mp4')
if not cap.isOpened():
    print("Error al abrir el video.")
    exit()

In [None]:
# Función para obtener las coordenadas (x,y) donde se hace click con el ratón
pts = []
def pick_points(event,x,y,flags,param):
    if event == cv2.EVENT_LBUTTONDOWN:
        pts.append((x,y))

In [None]:
ret, image = cap.read()
if(ret):
    cv2.imshow('Primer fotograma', image)
    while(len(pts) < 4):
        cv2.setMouseCallback('Primer fotograma', pick_points)
        # Mostramos los puntos seleccionados
        if(len(pts) > 0):
            cv2.circle(image, pts[len(pts)-1], 5, (0,0,255), -1)
            cv2.imshow('Primer fotograma', image)

        if (cv2.waitKey(30) == ord('q')):
            break

    cv2.destroyAllWindows()

## 2. Reordenamos los 4 puntos seleccionados de la lista para crear la imagen transformada de todos los frames del video.

In [None]:
# Corregimos la distorsión de la ventana
pts_src = np.array([pts[0], pts[3], pts[1], pts[2]], np.float32)
pts_dst = np.array([(0,0), (0,image.shape[0]), (image.shape[1],0), (image.shape[1],image.shape[0])], np.float32)
matrix = cv2.getPerspectiveTransform(pts_src, pts_dst)
trans_image = cv2.warpPerspective(image, matrix, (image.shape[1],image.shape[0]))

## 3. Edición de los frames
### 3.1 Recorte de ventana
Para reducir la posibilidad de obtener datos con ruido se optó por dividir la imagen de la ventana en 3 segmentos verticales iguales y aplicar únicamente aplicar filtros a la división central.

In [None]:
# Recortamos la imagen
cropped_image = trans_image[0:trans_image.shape[0], trans_image.shape[1]//3:trans_image.shape[1]//3*2]

### 3.2 Modificación de la imagen
- Escala de grises -> Como el color no nos aporta nada para el algoritmo solicitado trabajaremos con una imagen en escala de grises.

In [None]:
gray_image = cv2.cvtColor(cropped_image, cv2.COLOR_BGR2GRAY)
mean_gray = np.mean(gray_image)

Calcularemos la media de valores de gris para posteriormente diferenciar entre frames con mucha intensidad de luz (día) o poca (noche).

In [None]:
# Obtenemos el valor de la media de grises de la imagen para determinar si es de dia o de noche
if(mean_gray>=150):
    # Filtros diurnos
    blurred_image = cv2.GaussianBlur(gray_image, ksize=(31, 1), sigmaX=0)                       # Emborronamos la imagen con un kernel orientado en el eje X
    threshold = cv2.inRange(blurred_image, lowerb=90, upperb=205)                               # Filtramos los valores de grises
    cannyed_image = cv2.Canny(threshold, threshold1=350, threshold2=220)                        # Obtenemos los bordes
    dilated_image = cv2.dilate(cannyed_image, kernel=np.ones((3,3), np.uint8), iterations=1)    # Dilatamos las lineas de los bordes obtenidos para unificar lineas horizontales

    # Creamos las lineas de la transformada de Hough
    hough_lines = cv2.HoughLinesP(dilated_image, rho = 1, theta=np.pi/180, threshold = 60, minLineLength = 150, maxLineGap = 50)
else:
    # Filtros nocturnos
    blurred_image = cv2.GaussianBlur(gray_image, ksize=(71, 1), sigmaX=0)                       # Emborronamos la imagen con un kernel orientado en el eje X
    threshold = cv2.inRange(blurred_image, lowerb=70, upperb=110)                               # Filtramos los valores de grises
    eroded_image = cv2.erode(threshold, kernel=np.ones((1,30), np.uint8), iterations=3)         # Erosionamos en el eje X
    ret, mask = cv2.threshold(eroded_image, thresh=180, maxval=255, type=cv2.THRESH_BINARY)     # Conversion a binario
    cannyed_image = cv2.Canny(mask, threshold1=350, threshold2=220)                             # Obtenemos los bordes
    dilated_image = cv2.dilate(cannyed_image, kernel=np.ones((3,3), np.uint8), iterations=1)    # Dilatamos las lineas de los bordes obtenidos para unificar lineas horizontales
    blurred_image2 = cv2.GaussianBlur(dilated_image, ksize=(31, 1), sigmaX=0)                   # Emborronamos la imagen una vez más para reducir el ruido

    # Creamos las lineas de la transformada de Hough
    hough_lines = cv2.HoughLinesP(blurred_image2, rho = 1, theta=np.pi/180, threshold = 60, minLineLength = 150, maxLineGap = 50)

## 4. Unificar las lineas de Hough obtenidas y visualizarlas
### 4.1 Separamos las lineas de la transformada de Hough en eje X e eje Y
Para ello se creó la función 'separate_x_y()' que devuelve 2 listas con los respectivos valores de X e Y

In [None]:
# Función para separar en listas distintas los valores de las coordenadas 'x' e 'y' de las lineas dadas
def separate_x_y(lines):
    lines_x = []
    lines_y = []
    if lines is not None:
        for line in lines:
            for x1, y1, x2, y2 in line:
                lines_x.extend([x1, x2])
                lines_y.extend([y1, y2])

    return lines_x, lines_y

lines_x, lines_y = separate_x_y(hough_lines)

### 4.2 Clasificamos los valores del eje Y para diferenciar entre borde superior e inferior de la barra
Recorremos la lista de valores 'lines_y' y diferenciamos entre valores del borde superior del inferior de la barra utilizando el valor mínimo de dicha lista (cuanto más pequeño sea el valor, más arriba en la imagen está situado)

In [None]:
top_y = []
bottom_y = []
for val in lines_y:
    if(min(lines_y) <= val <= min(lines_y)+10):
        # Valores de la horizontal superior
        top_y.append(val)
    else:
        # Valores de la horizontal inferior
        bottom_y.append(val)

### 4.3 Unificamos los valores del eje Y para los dos bordes utilizando la media
Una vez obtenidos todos los valores para el borde superior y el inferior, calculamos la media de los valores para unificar todas los bordes obtenidos en uno solo

In [None]:
if(len(top_y)!=0): line_y_top = round(np.mean(top_y))
else: line_y_top = 0
if(len(bottom_y)!=0): line_y_bottom = round(np.mean(bottom_y))
else: line_y_bottom = 0

### 4.4 Obtenemos el valor mínimo y máximo para los ejes X e Y y creamos los rectángulos que representan las porciones de ventana cerrada y abierta

In [None]:
min_x = 0
max_x = trans_image.shape[1]
min_y = 0
max_y = trans_image.shape[0]

square_top = [[[min_x, 0, max_x, 0], [max_x, 0, max_x, line_y_top], [min_x, line_y_top, max_x, line_y_top], [min_x, 0, min_x, line_y_top]]]
square_bottom = [[[min_x, line_y_bottom, max_x, line_y_bottom], [max_x, line_y_bottom, max_x, max_y], [min_x, max_y, max_x, max_y], [min_x, line_y_bottom, min_x, max_y]]]

### 4.5 Dibujamos los rectángulos en la imagen inicial
Para ello creamos la función 'draw_lines()'

In [None]:
# Función para dibujar lineas en la imagen dada
def draw_lines(img, lines, color = [0, 0, 255], thickness = 4):
    if lines is not None:
        for line in lines:
            for x1,y1,x2,y2 in line:
                cv2.line(img, (x1, y1), (x2, y2), color, thickness)

lines_image = np.zeros((max_y, max_x, 3), dtype = np.uint8)
if(line_y_top!=0):
    draw_lines(lines_image, square_top, color=[255,0,0])
if(line_y_bottom!=0):
    draw_lines(lines_image, square_bottom, color=[0,0,255])
final_image = cv2.addWeighted(trans_image, alpha = 0.7, src2=lines_image, beta = 1.0, gamma = 0.0)

## 5. Calculamos los porcentajes de apertura y cierre de la ventana y los visualizamos

In [None]:
# Calculamos el porcentaje de apertura y cierre de la cortina
if(line_y_top!=0 and line_y_bottom!=0):
    line_center = (line_y_top+line_y_bottom)/2
    percent_top = round(line_center/max_y*100, 2)
    percent_bottom = round(100-percent_top, 2)
elif(line_y_top!=0 and line_y_bottom==0):
    percent_top = 100
    percent_bottom = 0
elif(line_y_top==0 and line_y_bottom!=0):
    percent_top = 0
    percent_bottom = 100
else:
    percent_top = None
    percent_bottom = None

# Agregamos texto a la imagen
cv2.putText(final_image, 'Cerrada: '+str(percent_top)+'%', org=(5, 30), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=[255, 0, 0], thickness=2, lineType=1, bottomLeftOrigin=False)
cv2.putText(final_image, 'Abierta: '+str(percent_bottom)+'%', org=(5, 60), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=[0, 0, 255], thickness=2, lineType=1, bottomLeftOrigin=False)

# Visualizacion
cv2.imshow('Imagen Final', final_image)

## CONCLUSIÓN FINAL
Podemos comprobar que dependiendo de las condiciones medioambientales (poca/mucha intensidad de luz, partículas en el aire (lluvia, polvo), etc.) el ruido de la imagen de entrada varía, por lo tanto debemos de tener esto en cuenta para conseguir una solución global a todas las situaciones posibles y dar un resultado lo más fiable posible. Por ejemplo, el código creado funciona mejor con buena iluminación y sin partículas que cuando la imagen presenta partículas (lluvia o polvo) ya que éstas distorsionan la imagen de la barra produciendo ruido en la imagen de salida y obteniendo así una medición de los porcentajes de apertura/cierre menos exacta.

En esta práctica se optó por diferenciar las grabaciones diurnas de las nocturnas mediante el valor medio de la escala de grises, para así aplicar distintas combinaciones de filtros a cada una. Además, para obtener una buena respuesta del filtro de Canny tuvimos que preprocesar la imagen que le ibamos a pasar para evitar falsos positivos. 
Una de las mayores ventajas de esta práctica es que el objeto a detectar es completamente horizontal, por lo que se aprovechó mucho el uso del emborronamiento Gaussiano con un kernel orientado en el eje X para eliminar la mayor parte de las detecciones que no nos interesaban.

# CÓDIGO EJECUTABLE

In [None]:
import cv2
import numpy as np
import matplotlib
matplotlib.use("TkAgg")


# Función para obtener las coordenadas (x,y) donde se hace click con el ratón
pts = []
def pick_points(event,x,y,flags,param):
    if event == cv2.EVENT_LBUTTONDOWN:
        pts.append((x,y))

# Función para separar en listas distintas los valores de las coordenadas 'x' e 'y' de las lineas dadas
def separate_x_y(lines):
    lines_x = []
    lines_y = []
    if lines is not None:
        for line in lines:
            for x1, y1, x2, y2 in line:
                lines_x.extend([x1, x2])
                lines_y.extend([y1, y2])

    return lines_x, lines_y

# Función para dibujar lineas en la imagen dada
def draw_lines(img, lines, color = [0, 0, 255], thickness = 4):
    if lines is not None:
        for line in lines:
            for x1,y1,x2,y2 in line:
                cv2.line(img, (x1, y1), (x2, y2), color, thickness)


# MAIN():
cap = cv2.VideoCapture('./PracticaXanelaCV/DATA/proba.mp4')
if not cap.isOpened():
    print("Error al abrir el video.")
    exit()

ret, image = cap.read()
if(ret):
    cv2.imshow('Primer fotograma', image)
    while(len(pts) < 4):
        cv2.setMouseCallback('Primer fotograma', pick_points)
        # Mostramos los puntos seleccionados
        if(len(pts) > 0):
            cv2.circle(image, pts[len(pts)-1], 5, (0,0,255), -1)
            cv2.imshow('Primer fotograma', image)

        if (cv2.waitKey(30) == ord('q')):
            break

    cv2.destroyAllWindows()

while(ret):
    ret, image = cap.read()
    if(not ret):
        break

    # Corregimos la distorsión de la ventana
    pts_src = np.array([pts[0], pts[3], pts[1], pts[2]], np.float32)
    pts_dst = np.array([(0,0), (0,image.shape[0]), (image.shape[1],0), (image.shape[1],image.shape[0])], np.float32)
    matrix = cv2.getPerspectiveTransform(pts_src, pts_dst)
    trans_image = cv2.warpPerspective(image, matrix, (image.shape[1],image.shape[0]))

    # Recortamos la imagen
    cropped_image = trans_image[0:trans_image.shape[0], trans_image.shape[1]//3:trans_image.shape[1]//3*2]
    
    # Aplicamos filtros:
    gray_image = cv2.cvtColor(cropped_image, cv2.COLOR_BGR2GRAY)
    mean_gray = np.mean(gray_image)

    # Obtenemos el valor de la media de grises de la imagen para determinar si es de dia o de noche
    if(mean_gray>=150):
        # Filtros diurnos
        blurred_image = cv2.GaussianBlur(gray_image, ksize=(31, 1), sigmaX=0)                       # Emborronamos la imagen con un kernel orientado en el eje X
        threshold = cv2.inRange(blurred_image, lowerb=90, upperb=205)                               # Filtramos los valores de grises
        cannyed_image = cv2.Canny(threshold, threshold1=350, threshold2=220)                        # Obtenemos los bordes
        dilated_image = cv2.dilate(cannyed_image, kernel=np.ones((3,3), np.uint8), iterations=1)    # Dilatamos las lineas de los bordes obtenidos para unificar lineas horizontales

        # Creamos las lineas de la transformada de Hough
        hough_lines = cv2.HoughLinesP(dilated_image, rho = 1, theta=np.pi/180, threshold = 60, minLineLength = 150, maxLineGap = 50)
    else:
        # Filtros nocturnos
        blurred_image = cv2.GaussianBlur(gray_image, ksize=(71, 1), sigmaX=0)                       # Emborronamos la imagen con un kernel orientado en el eje X
        threshold = cv2.inRange(blurred_image, lowerb=70, upperb=110)                               # Filtramos los valores de grises
        eroded_image = cv2.erode(threshold, kernel=np.ones((1,30), np.uint8), iterations=3)         # Erosionamos en el eje X
        ret, mask = cv2.threshold(eroded_image, thresh=180, maxval=255, type=cv2.THRESH_BINARY)     # Conversion a binario
        cannyed_image = cv2.Canny(mask, threshold1=350, threshold2=220)                             # Obtenemos los bordes
        dilated_image = cv2.dilate(cannyed_image, kernel=np.ones((3,3), np.uint8), iterations=1)    # Dilatamos las lineas de los bordes obtenidos para unificar lineas horizontales
        blurred_image2 = cv2.GaussianBlur(dilated_image, ksize=(31, 1), sigmaX=0)                   # Emborronamos la imagen una vez más para reducir el ruido

        # Creamos las lineas de la transformada de Hough
        hough_lines = cv2.HoughLinesP(blurred_image2, rho = 1, theta=np.pi/180, threshold = 60, minLineLength = 150, maxLineGap = 50)

    # Juntamos todas las lineas horizontales en una única para cada borde de la barra (una horizontal para superior, otra horizontal para el inferior)
    lines_x, lines_y = separate_x_y(hough_lines)

    top_y = []
    bottom_y = []
    for val in lines_y:
        if(min(lines_y) <= val <= min(lines_y)+15):
            # Valores de la horizontal superior
            top_y.append(val)
        else:
            # Valores de la horizontal inferior
            bottom_y.append(val)

    if(len(top_y)!=0): line_y_top = round(np.mean(top_y))
    else: line_y_top = 0
    if(len(bottom_y)!=0): line_y_bottom = round(np.mean(bottom_y))
    else: line_y_bottom = 0

    # Definimos las lineas y las agregamos a la imagen inicial
    min_x = 0
    max_x = trans_image.shape[1]
    min_y = 0
    max_y = trans_image.shape[0]

    square_top = [[[min_x, 0, max_x, 0], [max_x, 0, max_x, line_y_top], [min_x, line_y_top, max_x, line_y_top], [min_x, 0, min_x, line_y_top]]]
    square_bottom = [[[min_x, line_y_bottom, max_x, line_y_bottom], [max_x, line_y_bottom, max_x, max_y], [min_x, max_y, max_x, max_y], [min_x, line_y_bottom, min_x, max_y]]]

    lines_image = np.zeros((max_y, max_x, 3), dtype = np.uint8)
    if(line_y_top!=0):
        draw_lines(lines_image, square_top, color=[255,0,0])
    if(line_y_bottom!=0):
        draw_lines(lines_image, square_bottom, color=[0,0,255])
    final_image = cv2.addWeighted(trans_image, alpha = 0.7, src2=lines_image, beta = 1.0, gamma = 0.0)

    # Calculamos el porcentaje de apertura y cierre de la cortina
    if(line_y_top!=0 and line_y_bottom!=0):
        line_center = (line_y_top+line_y_bottom)/2
        percent_top = round(line_center/max_y*100, 2)
        percent_bottom = round(100-percent_top, 2)
    elif(line_y_top!=0 and line_y_bottom==0):
        percent_top = 100
        percent_bottom = 0
    elif(line_y_top==0 and line_y_bottom!=0):
        percent_top = 0
        percent_bottom = 100
    else:
        percent_top = None
        percent_bottom = None

    # Agregamos texto a la imagen
    cv2.putText(final_image, 'Cerrada: '+str(percent_top)+'%', org=(5, 30), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=[255, 0, 0], thickness=2, lineType=1, bottomLeftOrigin=False)
    cv2.putText(final_image, 'Abierta: '+str(percent_bottom)+'%', org=(5, 60), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=[0, 0, 255], thickness=2, lineType=1, bottomLeftOrigin=False)

    # Visualizacion
    cv2.imshow('Imagen Final', final_image)

    if cv2.waitKey(20) == ord('q'):
        cap.release()
        cv2.destroyAllWindows()
        break