# Computer Vision – Metodologias básicas

### Setup

In [8]:
import numpy as np
import argparse
import imutils
import cv2
from matplotlib import pyplot as plt

## Translation

Simplemente se necesita especificar cuántos píxeles deseo cambiar en la imagen # en la dirección X e Y: translación de la imagen 25 píxeles a la derecha y 50 pixeles abajo. [[1, 0, shiftX], [0, 1, shiftY]]

In [4]:
image = cv2.imread("C:/Users/algonzalez/source/repos/Computer_Vision/1_Basics_of_Computer_Vision/images/Imagen1.jpg")
cv2.imshow("Original", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

M = np.float32([[1, 0, 25], [0, 1, 50]])
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))
cv2.imshow("Shifted Down and Right", shifted)
cv2.waitKey(0)
cv2.destroyAllWindows()

M = np.float32([[1, 0, -50], [0, 1, -90]])
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))
cv2.imshow("Shifted Up and Left", shifted)
cv2.waitKey(0)
cv2.destroyAllWindows()

shifted = imutils.translate(image, 0, 100)
cv2.imshow("Shifted Down", shifted)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Resized

La escala o el cambio de tamaño, es el proceso de aumentar o disminuir el tamaño de una imagen en términos de ancho y alto.

Al cambiar el tamaño de una imagen, es importante tener en cuenta la relación de aspecto, que es la relación entre el ancho de la imagen y la altura de una imagen.

Ignorar la relación de aspecto puede llevar a imágenes redimensionadas que se ven comprimidas y distorsionadas. En general, queremos conservar la relación de aspecto de nuestras imágenes cuando cambiamos el tamaño por lo tanto:

Debemos tener en cuenta el método de interpolación de nuestra función de redimensionamiento. 
La definición formal de interpolación es el método para construir nuevos puntos de datos dentro del rango de un conjunto discreto de puntos conocidos.

En este caso, los puntos conocidos son los píxeles de nuestra imagen original. Y el objetivo de una función de interpolación es tomar estos vecindarios de píxeles y usarlos para aumentar o disminuir el tamaño de la imagen. En general, es mucho más beneficioso (y visualmente atractivo) reducir el tamaño de la imagen. Esto se debe a que la función de interpolación simplemente tiene que eliminar píxeles de una imagen. Por otro lado, si tuviéramos que aumentar el tamaño de la imagen, la función de interpolación tendría que "rellenar los huecos" entre los píxeles que antes no existían.


In [9]:
r = 150.0 / image.shape[1]
dim = (150, int(image.shape[0] * r))

# perform the actual resizing of the image
resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)
cv2.imshow("Resized (Width)", resized)
cv2.waitKey(0)
cv2.destroyAllWindows()

# what if we wanted to adjust the height of the image? -- we can apply
# the same concept, again keeping in mind the aspect ratio, but instead
# calculating the ratio based on height -- let's make the height of the
# resized image 50 pixels
r = 50.0 / image.shape[0]
dim = (int(image.shape[1] * r), 50)

# perform the resizing
resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)
cv2.imshow("Resized (Height)", resized)
cv2.waitKey(0)
cv2.destroyAllWindows()

# calculating the ratio each and every time we want to resize
# an image is a real pain -- let's create a  function where we can specify
# our target width or height, and have it take care of the rest for us.
resized = imutils.resize(image, width=100)
cv2.imshow("Resized via Function", resized)
cv2.waitKey(0)
cv2.destroyAllWindows()

# construct the list of interpolation methods
methods = [
    ("cv2.INTER_NEAREST", cv2.INTER_NEAREST),
    ("cv2.INTER_LINEAR", cv2.INTER_LINEAR),
    ("cv2.INTER_AREA", cv2.INTER_AREA),
    ("cv2.INTER_CUBIC", cv2.INTER_CUBIC),
    ("cv2.INTER_LANCZOS4", cv2.INTER_LANCZOS4)]

# loop sobre los métodos de interpolación
for (name, method) in methods:
    resized = imutils.resize(image, width=image.shape[1]*2, inter=method)
    cv2.imshow("Method: {}".format(name), resized)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

## Crop

Cuando recortamos una imagen, queremos eliminar las partes externas de la imagen que no nos interesan. Esto se conoce comúnmente como selección de nuestra Región de interés o, más simplemente, nuestro ROI.

In [4]:
image = cv2.imread("C:/Users/algonzalez/source/repos/Computer_Vision/1_Basics_of_Computer_Vision/images/file.jpeg")
# Hacer crop de manera facil podriamos usar la tecnica de slicing sobre un Numpy array
face = image[50:300, 50:560]
cv2.imshow("Image", face)
cv2.waitKey(0)
cv2.destroyAllWindows()

body = image[90:450, 0:290]
cv2.imshow("Image", body)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Rotate

In [5]:

(h, w) = image.shape[:2]
(cX, cY) = (w / 2, h / 2)

# Rotar la imagen 45 grados
M = cv2.getRotationMatrix2D((cX, cY), 45, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
cv2.imshow("Rotated by 45 Degrees", rotated)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Rotar nuestra imagen -90 grados
M = cv2.getRotationMatrix2D((cX, cY), -90, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
cv2.imshow("Rotated by -90 Degrees", rotated)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Rotar la imagen sobre un punto aleatorio sobre el centro
M = cv2.getRotationMatrix2D((cX - 50, cY - 50), 45, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
cv2.imshow("Rotated by Offset & 45 Degrees", rotated)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 180 grados
rotated = imutils.rotate(image, 180)
cv2.imshow("Rotated by 180 Degrees", rotated)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Flipped

In [6]:
cv2.imshow("Original", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

# flip horizontal
flipped = cv2.flip(image, 1)
cv2.imshow("Flipped Horizontally", flipped)
cv2.waitKey(0)
cv2.destroyAllWindows()

# flip vertical
flipped = cv2.flip(image, 0)
cv2.imshow("Flipped Vertically", flipped)
cv2.waitKey(0)
cv2.destroyAllWindows()

# flip en ambos ejes
flipped = cv2.flip(image, -1)
cv2.imshow("Flipped Horizontally & Vertically", flipped)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Bitwise

La función bitwise_and examina cada píxel en el rectángulo y el círculo. Si ambos pixeles tiene un valor mayor que cero, ese píxel se pone en "ON" (es decir, puesto a 255 en la imagen de salida). Si ambos píxeles no son mayores que cero, entonces el píxel de salida se deja en "OFF" con un valor de 0.

Un 'OR' a nivel de bits examina cada píxel en el rectángulo y el círculo. Si un píxel en el rectángulo o círculo de ejemplo es mayor que cero, entonces el píxel de salida tiene un valor de 255, de lo contrario es 0

El bit 'XOR' es idéntico a la función 'OR', con una excepción: tanto el rectángulo como el círculo no están permitidos a AMBOS tienen valores mayores que 0.

Finalmente, el bit 'NOT' invierte los valores de los píxeles. Pixeles
con un valor de 255 se convierte en 0, y los píxeles con un valor de 0 se convierten
255.

In [10]:
rectangle = np.zeros((300, 300), dtype = "uint8")
cv2.rectangle(rectangle, (25, 25), (275, 275), 255, -1)
cv2.imshow("Rectangle", rectangle)

circle = np.zeros((300, 300), dtype = "uint8")
cv2.circle(circle, (150, 150), 150, 255, -1)
cv2.imshow("Circle", circle)

bitwiseAnd = cv2.bitwise_and(rectangle, circle)
cv2.imshow("AND", bitwiseAnd)
cv2.waitKey(0)

bitwiseOr = cv2.bitwise_or(rectangle, circle)
cv2.imshow("OR", bitwiseOr)
cv2.waitKey(0)

bitwiseXor = cv2.bitwise_xor(rectangle, circle)
cv2.imshow("XOR", bitwiseXor)
cv2.waitKey(0)

bitwiseNot = cv2.bitwise_not(circle)
cv2.imshow("NOT", bitwiseNot)
cv2.waitKey(0)
cv2.destroyAllWindows()

## Arithmetic

Las imágenes son matrices o NumPy, almacenadas como enteros de 8 bits sin signo. Esto,
nos demuestra que los valores de nuestros píxeles estarán en el rango [0, 255]. Cuando
usando funciones como cv2.add y cv2.subtract, los valores serán recortados
a este rango, incluso si los valores agregados o restados caen fuera del
rango de [0, 255]. Por ejemplo:

In [9]:
print("max of 255: {}".format(str(cv2.add(np.uint8([200]), np.uint8([100])))))
print("min of 0: {}".format(str(cv2.subtract(np.uint8([50]), np.uint8([100])))))

# NOTA: utilizar operaciones aritméticas NumPy en estas matrices, el valor
# será modulos (wrap around) en lugar de ser recortado al [0, 255]
# distancia. Es importante tener esto en cuenta al trabajar con imágenes.
print("wrap around: {}".format(str(np.uint8([200]) + np.uint8([100]))))
print("wrap around: {}".format(str(np.uint8([50]) - np.uint8([100]))))

# vamos a aumentar la intensidad de todos los píxeles en nuestra imagen en 100
# lograr esto mediante la construcción de una matriz NumPy que es del mismo tamaño que
# nuestra matriz (llena de unos) y la multiplicación por 100 para crear un
# array lleno de 100, luego simplemente sumamos las imágene. Fijarse como la imagen es "más brillante"
M = np.ones(image.shape, dtype = "uint8") * 100
added = cv2.add(image, M)
cv2.imshow("Added", added)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Podemos restar 50 de todos los píxeles de nuestra imagen y hacer que sea más oscura
M = np.ones(image.shape, dtype = "uint8") * 50
subtracted = cv2.subtract(image, M)
cv2.imshow("Subtracted", subtracted)
cv2.waitKey(0)
cv2.destroyAllWindows()

max of 255: [[255]]
min of 0: [[0]]
wrap around: [44]
wrap around: [206]
