# OPENCV

En este tema, aprenderemos a manipular gráficos utilizando la librería OpenCV. El primer paso es instalar la librería

In [None]:
#!pip install opencv-python

## Manipulación básica de imágenes

### Carga y visualización de imágenes
Primero, debemos cargar una imagen en nuestro programa. Esto se puede hacer con la siguiente línea de código:

In [None]:
import cv2
img = cv2.imread("imagen_prueba.jpg")

A continuación, podemos visualizar la imagen usando el siguiente código:

**Para cerrar la ventana pulsamos 0 o se colgará el notebook**

In [None]:
cv2.imshow("Nombre de la ventana", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

### Cambio de tamaño de imagen
Para cambiar el tamaño de una imagen, podemos usar la función cv2.resize(). Aquí hay un ejemplo de código:

In [None]:
resized_img = cv2.resize(img, (300, 300))
cv2.imshow("Imagen redimensionada", resized_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

### Recorte de imágenes
Para recortar una imagen, podemos usar la siguiente línea de código:

In [None]:
y_inicio = 30; y_fin = -30
x_inicio = 50; x_fin = -50
cropped_img = img[y_inicio:y_fin, x_inicio:x_fin]
cv2.imshow("Imagen recortada", cropped_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Transformaciones de color

OpenCV proporciona diferentes transformaciones de color para cambiar el aspecto de una imagen. Algunos ejemplos incluyen:

**Conversión a escala de grises**

In [None]:
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("Imagen en escala de grises", gray_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

**Conversión a HSV (espacio de color de tono, saturación y brillo)**

In [None]:
hsv_img = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
cv2.imshow("Imagen en HSV", hsv_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Filtros de imagen

El desenfoque o "blurring" es un proceso en el que se suaviza una imagen para reducir la cantidad de detalles y ruido. Existen diferentes técnicas de desenfoque que se pueden usar en OpenCV. Aquí hay una explicación de algunas de ellas:

**Desenfoque Gaussiano:** El desenfoque Gaussiano es una técnica de desenfoque que utiliza un filtro Gaussiano para suavizar una imagen. Este filtro toma en cuenta los valores de los pixels circundantes y los pesa en función de su distancia del pixel central. El resultado es una imagen suavizada que reduce el ruido y la textura.

**Desenfoque de mediana:** El desenfoque de mediana es una técnica de desenfoque que utiliza un filtro de mediana para suavizar una imagen. Este filtro reemplaza el valor de un pixel con la mediana de los valores de los pixels circundantes. Este proceso se repite para cada pixel en la imagen, resultando en una imagen suavizada que reduce el ruido y la textura.

**Desenfoque bilateral:** El desenfoque bilateral es una técnica de desenfoque que combina tanto el desenfoque Gaussiano como el desenfoque de mediana. Este filtro toma en cuenta tanto la distancia de los pixels circundantes como su diferencia en intensidad, y pesa estos valores para suavizar la imagen. El resultado es una imagen suavizada que reduce el ruido y la textura sin afectar significativamente los bordes y las formas en la imagen.

**Filtro gausiano**

En este ejemplo, primero se carga una imagen en una variable img. Luego, se aplica un desenfoque Gaussiano a la imagen utilizando la función cv2.GaussianBlur. La función toma como argumentos la imagen a desenfocar, el tamaño del kernel (15x15 en este caso), y la desviación estándar del filtro Gaussiano (0 en este caso).

In [None]:
gaussian_img = cv2.GaussianBlur(img, (15, 15), 0)
cv2.imshow("Imagen con filtro Gaussiano", gaussian_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

**Filtro bilateral**

En este ejemplo, primero se carga una imagen en una variable img. Luego, se aplica un desenfoque bilateral a la imagen utilizando la función cv2.bilateralFilter. La función toma como argumentos la imagen a desenfocar, el tamaño del kernel (9 en este caso), la desviación estándar en el espacio (375 en este caso) y la desviación estándar en la intensidad (375 en este caso).

Después de aplicar el desenfoque bilateral, se muestra la imagen desenfocada en una ventana usando cv2.imshow y se espera a que se presione una tecla para cerrar la ventana con cv2.waitKey. Por último, se cierran todas las ventanas con cv2.destroyAllWindows.

In [None]:
bilateral_img = cv2.bilateralFilter(img, 9, 375, 375)
cv2.imshow("Imagen con filtro bilateral", bilateral_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

**Filtro de mediana**

En este ejemplo, primero se carga una imagen en una variable img. Luego, se aplica un desenfoque de mediana a la imagen utilizando la función cv2.medianBlur. La función toma como argumentos la imagen a desenfocar y el tamaño del kernel (5 en este caso).

Después de aplicar el desenfoque de mediana, se muestra la imagen desenfocada en una ventana usando cv2.imshow y se espera a que se presione una tecla para cerrar la ventana con cv2.waitKey. Por último, se cierran todas las ventanas con cv2.destroyAllWindows.

In [None]:
median = cv2.medianBlur(img, 5)
cv2.imshow("Imagen con filtro de mediana", median)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Detección de Bordes

**Filtro Sobel**

El filtro de Sobel y la detección de bordes Canny son dos operadores diferentes que se utilizan para detectar bordes en imágenes.

El filtro de Sobel es un operador de detección de bordes que se basa en el cálculo de la derivada de la imagen. Se aplica en dos direcciones diferentes: el eje X y el eje Y. El filtro en el eje X detecta bordes horizontales y el filtro en el eje Y detecta bordes verticales. La combinación de estos dos filtros permite detectar bordes en cualquier dirección.

Por otro lado, la detección de bordes Canny es un algoritmo más complejo que incluye varios pasos, incluyendo la aplicación de un filtro Gaussiano para suavizar la imagen, la aplicación de un filtro de Sobel para calcular el gradiente de la imagen y la aplicación de un algoritmo de supresión de no máximos para quitar los bordes falsos y mantener solo los bordes verdaderos.

In [None]:
import numpy as np
import cv2

# Cargar imagen
img = cv2.imread("imagen_prueba.jpg", cv2.IMREAD_GRAYSCALE)

# Definimos los kernels de Sobel en las direcciones X e Y
kernel_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])
kernel_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])

# Aplicamos los kernels a la imagen utilizando una convolución
sobel_x = cv2.filter2D(img, -1, kernel_x)
sobel_y = cv2.filter2D(img, -1, kernel_y)

# Combinamos los resultados en las direcciones X e Y para obtener la magnitud del gradiente
magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
direction = np.arctan2(sobel_y, sobel_x)

# Normalizamos los resultados y los mostramos
magnitude = (magnitude / np.max(magnitude)) * 255
direction = (direction / np.max(direction)) * 255

# Mostrar resultados
cv2.imshow("Input", img)
cv2.imshow("Sobel X", sobel_x)
cv2.imshow("Sobel Y", sobel_y)
cv2.imshow("Magnitude", magnitude.astype("uint8"))
cv2.imshow("Direction", direction.astype("uint8"))
cv2.waitKey(0)
cv2.destroyAllWindows()

Podemos utilizar la función de OpenCV

In [None]:
import cv2
import numpy as np

# Cargar imagen
img = cv2.imread('imagen_prueba.jpg', 0)

# Aplicar filtro de Sobel en el eje X
sobel_x = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=5)

# Aplicar filtro de Sobel en el eje Y
sobel_y = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize=5)

# Obtener magnitud y dirección
magnitude = np.sqrt(np.square(sobel_x) + np.square(sobel_y))
direction = np.arctan2(sobel_y, sobel_x)

# Mostrar resultados
cv2.imshow("Input", img)
cv2.imshow("Sobel X", sobel_x)
cv2.imshow("Sobel Y", sobel_y)
cv2.imshow("Magnitude", magnitude)
cv2.imshow("Direction", direction)
cv2.waitKey(0)
cv2.destroyAllWindows()

**Detección de bordes**

La detección de bordes Canny es un algoritmo utilizado en visión por computadora para encontrar bordes en imágenes. Se basa en la detección de gradientes en la imagen, que indican cambios bruscos de intensidad. La detección de bordes Canny es uno de los métodos más populares y utilizados para la detección de bordes debido a su eficacia y facilidad de implementación.

El algoritmo Canny consiste en varios pasos:
1. Suavizado de la imagen: se aplica un filtro gaussiano a la imagen para suavizar los ruidos y destacar los bordes.
2. Cálculo del gradiente: se calcula el gradiente de la imagen suavizada para encontrar la dirección y magnitud de los bordes.
3. Nivel de umbral: se utiliza un nivel de umbral para determinar qué gradientes son considerados como bordes y cuáles no.
4. Supresión no máxima: se suprimen los gradientes que no son máximos en la dirección del gradiente para evitar la detección de bordes múltiples.
5. Umbrales dobles: se utilizan dos niveles de umbral para determinar la continuidad de los bordes. Los gradientes con una magnitud mayor que el umbral superior se consideran bordes definitivos. Los gradientes con una magnitud entre los umbrales inferior y superior se conservan solo si están conectados a bordes definitivos.

In [None]:
# https://docs.opencv.org/4.x/da/d22/tutorial_py_canny.html
import cv2
import numpy as np

# Cargar una imagen
img = cv2.imread("imagen_prueba.jpg", 0)

# Suavizar la imagen con un filtro Gaussiano
blurred = cv2.GaussianBlur(img, (5, 5), 0)

# Calcular el gradiente de la imagen suavizada
sobel_x = cv2.Sobel(blurred, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(blurred, cv2.CV_64F, 0, 1, ksize=3)

# Calcular la magnitud y dirección del gradiente
magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
direction = np.arctan2(sobel_y, sobel_x) * (180 / np.pi)

# Normalizar la magnitud del gradiente a [0, 255]
magnitude = (magnitude / np.max(magnitude)) * 255

# Aplicar niveles de umbral
upper_threshold = 195
lower_threshold = 100
thresholded = np.zeros(img.shape)
thresholded[magnitude > upper_threshold] = 255

# Suprimir los gradientes no máximos
for i in range(1, img.shape[0] - 1):
    for j in range(1, img.shape[1] - 1):
        angle = direction[i, j]
        if angle < 0:
            angle += 180
        if (angle >= 0 and angle < 22.5) or (angle >= 157.5 and angle <= 180):
            if magnitude[i, j] < magnitude[i, j + 1] or magnitude[i, j] < magnitude[i, j - 1]:
                thresholded[i, j] = 0
        elif angle >= 22.5 and angle < 67.5:
            if magnitude[i, j] < magnitude[i - 1, j + 1] or magnitude[i, j] < magnitude[i + 1, j - 1]:
                thresholded[i, j] = 0
        elif angle >= 67.5 and angle < 112.5:
            if magnitude[i, j] < magnitude[i - 1, j] or magnitude[i, j] < magnitude[i + 1, j]:
                thresholded[i, j] = 0
        elif angle >= 112.5 and angle < 157.5:
            if magnitude[i, j] < magnitude[i - 1, j - 1] or magnitude[i, j] < magnitude[i + 1, j + 1]:
                thresholded[i, j] = 0

                
# Aplicar umbrales dobles
strong_edges = np.zeros(img.shape)
strong_edges[magnitude > upper_threshold] = 255
weak_edges = np.zeros(img.shape)
weak_edges[(magnitude > lower_threshold) & (magnitude <= upper_threshold)] = 255

# Conectar bordes débiles a bordes fuertes
result = np.zeros(img.shape)
for i in range(1, img.shape[0] - 1):
    for j in range(1, img.shape[1] - 1):
        if strong_edges[i, j] == 255:
            result[i, j] = 255
        elif weak_edges[i, j] == 255:
            if (strong_edges[i - 1, j - 1] == 255) or (strong_edges[i - 1, j] == 255) or (strong_edges[i - 1, j + 1] == 255) or (strong_edges[i, j - 1] == 255) or (strong_edges[i, j + 1] == 255) or (strong_edges[i + 1, j - 1] == 255) or (strong_edges[i + 1, j] == 255) or (strong_edges[i + 1, j + 1] == 255):
                result[i, j] = 255

# Mostrar resultados
cv2.imshow("Result", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

Podemos implementar esto con OpenCV

In [None]:
edges_img = cv2.Canny(img, 100, 195)
cv2.imshow("Imagen con bordes destacados", edges_img)
cv2.waitKey(0)
cv2.destroyAllWindows()