### OPERACIONES BASICAS CON IMAGENES

#### TRASLACION

Para realizar una traslacion de imagen, primero debemos definir una matriz  de transformacion.

![<caption>](images/matrizdetraslacion.png)

Lo que nos importa aqui son los valores de tx y ty:

-   Valores negativos para  tx desplazarán la imagen hacia la izquierda.
-   Valores positivos para  tx desplazarán la imagen a la derecha
-   Valores negativos para  tx desplazarán la imagen hacia arriba
-   Valores positivos para  ty desplazarán la imagen hacia abajo

In [5]:
import numpy as np
import cv2

In [16]:
image= cv2.imread('images/cat.1033.jpg')

Como ejemplo, supongamos que queremos trasladar nuestra imagen 30 píxeles a la izquierda y 12 píxeles hacia abajo :

In [17]:
M = np.float32([[1,0,-30],[0,1,12]])

Una vez que se define la matriz de transformación, podemos simplemente realizar la traslacion de la imagen utilizando la función cv2.warpAffine 

In [21]:
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))
cv2.imshow("Traslacion", shifted)
cv2.imwrite("images/Traslacion.jpg",shifted)
cv2.waitKey(0)

cv2.destroyAllWindows()

![<caption>](images/Traslacion.jpg)

La matriz de transformacion M se define como una matriz de punto flotante; esto es importante porque OpenCV espera que esta matriz sea del tipo de punto flotante. La primera fila de la matriz es [1, 0, tx], donde tx es el número de píxeles que desplazaremos la imagen hacia la izquierda o hacia la derecha . Valores negativos de tx desplazarán la imagen hacia la izquierda y los valores positivos desplazarán la imagen hacia la derecha .

Luego, definimos la segunda fila de la matriz como [0, 1, ty], donde ty es el número de píxeles que desplazaremos la imagen hacia arriba o hacia abajo . Valores negativos de ty desplazará la imagen hacia arriba y los valores positivos desplazarán la imagen hacia abajo .

Usando esta notación, en la línea 18, podemos ver que tx = -30 y ty = 12, indica que estamos desplazando la imagen 30 píxeles hacia la izquierda y 12 píxeles hacia abajo .

el metodo warpAffine espera como primer argumento la imagen , como segundo argumento la matriz de transformacion y como tercer argumento proporcionamos manualmente las dimensiones de la imagen (ancho y alto).

Con la libreria imutils podemos directamente llamar al metodo translate para mover la imagen sin necesidad de definir ninguna matriz de transformacion.

In [31]:
import imutils

In [32]:
shifted = imutils.translate(shifted,-100,-50) #100 a la izquierda y 50 hacia arriba
cv2.imshow("Traslacion2", shifted)
cv2.imwrite("images/Traslacion2.jpg",shifted)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/Traslacion2.jpg)

### ROTACION DE IMAGENES

Similar a la traslación , y quizás como era de esperar, la rotación en un ángulo  se puede definir construyendo una matriz, M , en la forma:

![<caption>](images/rotation.png)

Dado un plano cartesiano (x, y) , esta matriz se puede usar para rotar un vector theta grados (en sentido antihorario) sobre el origen. En este caso, el origen es normalmente el centro de la imagen; sin embargo, en la práctica, podemos definir cualquier coordenada arbitraria (x, y) como nuestro centro de rotación.

A partir de la imagen original, I , la imagen rotada, R, se obtiene mediante una simple multiplicación de matrices: R = I X M

Sin embargo, OpenCV también proporciona la capacidad de  escalar una imagen (es decir, cambiar el tamaño)  y proporcionar un centro de rotación arbitrario alrededor del cual realizar la rotación.


![<caption>](images/rotation2.png)

In [38]:
(h,w) = (image.shape[1],image.shape[0]) #obtengo alto y ancho
(cx,cy) = (w // 2 , h // 2) #calculo el centro

In [40]:
#rotar la imagen 45 grados sentido antihorario alrededor del centro
M = cv2.getRotationMatrix2D((cx,cy), 45,1.0) #obtengo la matriz de rotacion. el 1.0 es la escala. En este caso mantenemos la escala
rotated = cv2.warpAffine(image,M,(w,h)) #aplico la transformacion a la imagen
cv2.imwrite('images/gatorotado.jpg',rotated) #guardo la imagen
cv2.imshow('imagen rotada',rotated) #muestro la imagen en terminal
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/gatorotado.jpg)

Como vemos OpenCV no asigna automáticamente espacio para que toda nuestra imagen llene el cuadro. 

Nuevamente podemos usar la libreria imutils y su metodo rotate que es mas simple.

In [45]:
rotated = imutils.rotate(image,45,(cx,cy),1.0)
cv2.imwrite('images/gatorotado.jpg',rotated) #guardo la imagen
cv2.imshow('imagen rotada',rotated) #muestro la imagen en terminal
cv2.waitKey(0)
cv2.destroyAllWindows()


![<caption>](images/gatorotado.jpg)

Como vemos tenemos el mismo resultado en una sola linea de codigo.

In [51]:
rotated = imutils.rotate_bound(image, 45)
cv2.imwrite('images/gatorotado2.jpg',rotated) #guardo la imagen
cv2.imshow('imagen rotada',rotated) #muestro la imagen en terminal
cv2.waitKey(0)
cv2.destroyAllWindows()


![<caption>](images/gatorotado2.jpg)

Esta función expandirá automáticamente la matriz de imágenes de modo que toda la imagen rotada quepa dentro de ella.

### REDIMENSIONANDO IMAGENES

Escalar, o simplemente cambiar el tamaño , es el proceso de aumentar o disminuir el tamaño de una imagen en términos de ancho y alto.

Al cambiar el tamaño de una imagen, es importante tener en cuenta la relación de aspecto (Aspect Ratio) , que es la relación entre el ancho y la altura de una imagen. Ignorar la relación de aspecto puede dar lugar a imágenes redimensionadas que parezcan comprimidas y distorsionadas

In [54]:
image = cv2.imread('images/dog.1033.jpg')
print(image.shape)

(375, 304, 3)


![<caption>](images/dog.1033.jpg)

In [59]:
#vemos que tiene 375 de alto y 304 pixeles de ancho.
#Redimensionemos para que tenga 150 de ancho , pero sin perder la relacion de aspecto.

r = 150.0/image.shape[1]
dim = (150, int(image.shape[0]*r))
print('aspect ratio: {} \n Dimension final: {}'.format(r,dim))

aspect ratio: 0.4934210526315789 
 Dimension final: (150, 185)


In [60]:
resizeImage = cv2.resize(image,dim,interpolation=cv2.INTER_AREA)
cv2.imwrite('images/resizeImage.jpg',resizeImage)
cv2.imshow('Resize Image',resizeImage)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/resizeImage.jpg)

Al cambiar el tamaño de una imagen, debemos tener en cuenta la relación de aspecto de la imagen. La relación de aspecto es la relación proporcional del ancho y el alto de la imagen:

relación_de_ aspecto = ancho_de_imagen / altura_de_imagen

Si no somos conscientes de la relación de aspecto, nuestro cambio de tamaño arrojará resultados que parecen distorsionados

Hagamos lo mismo utilizando la libreria imutils junto a su metodo resize

En el codigo anterior hemos utilizado método de interpolación  cv2.INTER_AREA. El objetivo de una función de interpolación es examinar vecindarios de píxeles y usar estos vecindarios para aumentar o disminuir ópticamente el tamaño de la imagen sin introducir distorsiones (o al menos la menor cantidad de distorsiones posible).

El primer método es la interpolación del vecino más cercano, especificada por cv2.INTER_NEAREST. Este método es el enfoque más simple para la interpolación. En lugar de calcular promedios ponderados de píxeles vecinos o aplicar reglas complicadas, este método simplemente encuentra el píxel vecino "más cercano" y asume el valor de intensidad. Si bien este método es rápido y simple, la calidad de la imagen redimensionada tiende a ser relativamente pobre y puede generar artefactos en forma de "bloques".

En segundo lugar, tenemos el método cv2.INTER_LINEAR , que realiza una interpolación bilineal: este es el método que OpenCV utiliza de forma predeterminada al cambiar el tamaño de las imágenes.
En tercer lugar, tenemos el método de interpolación cv2.INTER_AREA. Finalmente, tenemos cv2.INTER_CUBIC y cv2.INTER_LANCZOS4.
Estos métodos son más lentos (ya que ya no usan interpolación lineal simple y en su lugar usan splines) y utilizan interpolación bicúbica sobre vecindarios de píxeles cuadrados.

In [68]:
resizeimage2 = imutils.resize(image,width=150) #el metdo se encarga de mantener la relacion de aspecto
cv2.imwrite('images/resizeimage2.jpg',resizeimage2)
cv2.imshow('Resize Image',resizeimage2)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/resizeimage2.jpg)

### FLIP IMAGE

Similar a la rotación de imágenes , OpenCV también proporciona métodos para voltear una imagen a través de su eje x o y . Aunque las operaciones de volteo se usan con menos frecuencia, aún son muy valiosas de aprender, y por razones que quizás no consideres más importantes.

Por ejemplo, imaginemos trabajar para una pequeña empresa de nueva creación que quiere construir un clasificador de aprendizaje automático para detectar rostros dentro de las imágenes. Necesitaríamos un conjunto de datos de caras de ejemplo que nuestro algoritmo podría usar para "aprender" qué es una cara. Pero desafortunadamente, la compañía solo nos ha proporcionado un pequeño conjunto de datos de 20 caras y no tenemos los medios para adquirir más datos.

¿Asi que que hacemos?

¡Aplicamos operaciones de volteo para aumentar nuestro conjunto de datos!

Podemos voltear horizontalmente cada imagen de la cara (ya que una cara sigue siendo una cara, ya sea reflejada o no) y usar estas versiones reflejadas como datos de entrenamiento adicionales.

Podemos voltear una imagen alrededor del eje x , eje y , o incluso ambos

In [76]:
flipped = cv2.flip(image,1) #el valor de uno indica flip horizontal
flipped2= cv2.flip(image,0) #el valor de cero indica flip vertical
cv2.imwrite('images/verticalflipped.jpg',flipped2)
cv2.imshow('Resize Image',flipped2)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/horizontalflipped.jpg)

![<caption>](images/verticalflipped.jpg)

### RECORTAR IMAGEN

Recortas es la accion  de seleccionar y extraer la Región de interés (o simplemente, ROI)  de la imagen que nos interesa.
Por ejemplo, en una aplicación de detección de rostros, es posible que queramos recortar el rostro de una imagen. Imagen fuente PYIMAGESEARCH

![<caption>](images/SLICING.png)

Cuando recortamos una imagen, queremos eliminar las partes externas de la imagen que no nos interesan. Normalmente nos referimos a este proceso como seleccionar nuestra Región de interés , o más simplemente, nuestro ROI.

Podemos lograr el recorte de imágenes usando el corte de matriz NumPy.

Comencemos por inicializar una lista NumPy con valores que van desde [0, 24]

In [84]:
import numpy as np
I = np.arange(0,25)
I

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24])

In [85]:
# Ahora redimensionemos esta lista a una matriz 2D
I=I.reshape((5,5))
I

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24]])

In [86]:
#Supongamos que queremos extraer los pixeles desde x=0 y=0 a x=2 y=3
I[0:3, 0:2]

array([[ 0,  1],
       [ 5,  6],
       [10, 11]])

Como observamos hemos extraidos 3 filas y 2 columnas.

Al aplicar el corte de matriz NumPy a las imágenes, extraemos el ROI usando la siguiente sintaxis:
- roi = imagen [ startY: endY, startX: endX ]

El [startY: endY] proporciona nuestras filas (ya que el eje y es nuestro número de filas) mientras que [startX: endX] proporciona nuestras columnas (ya que el eje x es el número de columnas) en la imagen. 

In [92]:
image = cv2.imread('images/tiomaridopampita.png')
cv2.imshow('Image',image)
cv2.waitKey(0)
cv2.destroyAllWindows()
print(image.shape)


(347, 627, 3)


![<caption>](images/tiomaridopampita.png)

In [97]:
rostro = image[20:200,130:280] ##extraigo el rostro. 
cv2.imwrite('images/andino.jpg',rostro)
cv2.imshow('Andino',rostro)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/andino.jpg)

El rostro lo extraje por prueba y error ya que no aun no vimos los algoritmos de deteccion de rostros.

### OPERACION ARITMETICAS EN IMAGENES

Las imagenes al tratarse como matrices podemos realizar las operacion de suma, resta como cualquier matriz. 
Pero debemos tener el cuenta los intervalos que aceptan las imagenes [0,255]
Sin embargo, asegúrese de tener en cuenta que existe una diferencia entre la adición de OpenCV y NumPy. NumPy realizará aritmética de módulo y "envolver". Por otro lado, OpenCV realizará el recorte y garantizará que los valores de los píxeles nunca caigan fuera del rango [0, 255] .

![<caption>](images/aritmeticaimagenes.png)

Ahora que entendemos los conceptos básicos de la aritmética de imágenes, es posible que se pregunte dónde usaríamos la aritmética de imágenes en el mundo real.

Los ejemplos básicos incluyen:

- Ajustar el brillo y el contraste agregando o restando una cantidad determinada (por ejemplo, agregando 50 a todos los valores de píxeles para aumentar el brillo de una imagen)
- Trabajando con mezcla alfa y transparencia, como lo hacemos en este tutorial.
- Creación de filtros similares a los de Instagram : estos filtros son simplemente funciones matemáticas aplicadas a las intensidades de píxeles

Las imágenes son matrices NumPy almacenadas como enteros de 8 bits sin signo (unit8)
con valores en el rango [0, 255]; al usar las funciones suma / resta en OpenCV, estos valores se  recortarán *a este rango,
incluso si quedan fuera del rango [0, 255] después de aplicar la operación

In [106]:

suma = cv2.add(np.uint8([200]), np.uint8([100])) #por mas que la suma da 300 el metodo add sabe que el maximo es 255
resta = cv2.subtract(np.uint8([50]), np.uint8([100])) #por mas que la resta de -50 el metodo substract sabe que el minimo es 0
print("max de 255: {}".format(suma))
print("min de 0: {}".format(resta))

max de 255: [[255]]
min de 0: [[0]]


Es importante tener en cuenta la salida deseada al realizar aritmética de números enteros:

- ¿Quiere que se recorten todos los valores si quedan fuera del rango [0, 255] ? Luego use los métodos integrados de OpenCV para la aritmética de imágenes.
- ¿Quiere operaciones aritméticas de módulo y tener valores ajustados si caen fuera del rango de [0, 255] ? Luego, simplemente agregue y reste las matrices NumPy como lo haría normalmente.

In [110]:
image = cv2.imread('images/tiomaridopampita.png')
M = np.ones(image.shape,dtype='uint8')*100
suma =cv2.add(image,M)
resta =cv2.subtract(image,M)
cv2.imwrite('images/tioconmenosbrillo.jpg',resta)
cv2.imwrite('images/tioconbrillo.jpg',suma)
cv2.imshow('Tio de marido de pampita con brillo',suma)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/tioconbrillo.jpg)

![<caption>](images/tioconmenosbrillo.jpg)

### OPERACIONES PIXEL A PIXEL (AND, OR ,NOT ,XOR)

Si bien son muy básicas y de bajo nivel, estas cuatro operaciones son fundamentales para el procesamiento de imágenes, especialmente cuando se trabaja con máscaras/filtros como veremos mas adelante.

Las operaciones bit a bit funcionan de manera binaria y se representan como imágenes en escala de grises. Un píxel determinado se "apaga" si tiene un valor de cero, y se "enciende" si el píxel tiene un valor mayor que cero.

In [130]:
#dibujamos un rectangulo en imagen en negro
rectangle = np.zeros((300, 300), dtype="uint8")#imagen en negro de 300 x 300
cv2.rectangle(rectangle, (25, 25), (275, 275), 255, -1) #con -1 el rectangulo se rellena
cv2.imwrite("images/rectangulo.jpg", rectangle)
cv2.imshow("Rectangulo", rectangle)

circle = np.zeros((300, 300), dtype = "uint8")
cv2.circle(circle, (150, 150), 150, 255, -1)
cv2.imwrite("images/circulo.jpg", circle)
cv2.imshow("Circulo", circle)

cv2.waitKey(0)
cv2.destroyAllWindows()



![<caption>](images/rectangulo.jpg)

![<caption>](images/circulo.jpg)

Si consideramos estas imágenes de entrada, veremos que solo tienen dos valores de intensidad de píxeles, o bien el píxel es 0(negro) o el píxel es mayor que cero (blanco). Llamamos imágenes binarias a las imágenes que solo tienen dos valores de intensidad de píxeles.

Un 'AND' bit a bit es solo 'Verdadero' cuando ambas entradas tienen un valor que es 'ON' - en este caso, la función cv2.bitwise_and examina
cada píxel del rectángulo y el círculo; si  AMBOS  píxeles tienen un valor mayor que cero, entonces el píxel se enciende (es decir es 255)
en la imagen de salida; de lo contrario, el valor de salida se establece en 'APAGADO' (es decir, 0)

In [131]:
bitwiseAnd = cv2.bitwise_and(rectangle, circle)
cv2.imshow("AND", bitwiseAnd)
cv2.imwrite("images/operacionAND.jpg", bitwiseAnd)
cv2.waitKey(0)
cv2.destroyAllWindows()


![<caption>](images/operacionAND.jpg)

In [132]:
notop = cv2.bitwise_not(circle)
cv2.imshow("AND", notop)
cv2.imwrite("images/operacionNot.jpg", notop)
cv2.waitKey(0)
cv2.destroyAllWindows()


![<caption>](images/operacionNot.jpg)

In [140]:
orOp = cv2.bitwise_or(rectangle,circle)
cv2.imshow("OR", orOp)
cv2.imwrite("images/operacionOR2.jpg", orOp)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/operacionOR2.jpg)


In [142]:
xorOp = cv2.bitwise_xor(rectangle,circle)
cv2.imshow("XOR", xorOp)
cv2.imwrite("images/operacionXOR1.jpg", xorOp)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/operacionXOR1.jpg)

### IMAGE MASKING

Una máscara nos permite enfocarnos solo en las partes de la imagen que nos interesan.

Por ejemplo, digamos que estamos construyendo un sistema de visión por computadora para reconocer rostros. La única parte de la imagen que nos interesa encontrar y describir son las partes de la imagen que contienen caras; simplemente no nos importa el resto del contenido de la imagen. Siempre que podamos encontrar las caras en la imagen, podemos construir una máscara para mostrar solo las caras en la imagen

Otra aplicación de enmascaramiento de imágenes que encontrará es la combinación alfa y la transparencia. Al aplicar transparencia a imágenes con OpenCV, debemos decirle a OpenCV a qué partes de la transparencia de la imagen se deben aplicar y a qué no; las máscaras nos permiten hacer esa distinción.

import cv2
import numpy as np
image = cv2.imread('images/tiomaridopampita.png')
cv2.imshow("imagen", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/tiomaridopampita.png)

Una máscara tiene el mismo tamaño que nuestra imagen, pero solo tiene dos valores de píxeles
, 0 y 255: los píxeles con un valor de 0 (fondo) son ignorado en la imagen original mientras que enmascara píxeles con un valor de
255 (primer plano) se pueden mantener.


Aplique nuestra máscara - observe cómo solo la persona en la imagen es recortada

In [166]:
mask = np.zeros (image.shape[:2],dtype='uint8')
cv2.rectangle(mask,(140,40),(270,180),255,-1)
cv2.imshow("mask", mask)
cv2.imwrite("images/mask1.jpg", mask)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/mask1.jpg)

In [167]:
masked = cv2.bitwise_and(image,image,mask=mask)
cv2.imwrite("images/masked1.jpg", masked)
cv2.imshow('Mascara aplicada',masked)
cv2.waitKey(0)
cv2.destroyAllWindows()

![<caption>](images/masked1.jpg)

### DIVIDIENDO Y JUNTANDO CANALES CON OPENCV

Como sabemos, una imagen a color está representada por tres componentes: un canal rojo, verde y azul.

Y aunque hemos analizado brevemente las representaciones en escala de grises y binarias de una imagen, es posible que se esté preguntando:

¿Cómo accedo a cada canal rojo, verde y azul individual de una imagen?

Dado que las imágenes en OpenCV se representan internamente como matrices NumPy, el acceso a cada canal se puede lograr de múltiples maneras. Sin embargo, nos centraremos en los dos métodos principales que debe utilizar: cv2.split y cv2.merge.


Por lo general, pensamos en imágenes en el espacio de color RGB: el píxel rojo primero, el píxel verde en segundo lugar y el píxel azul en tercer lugar. Sin embargo, OpenCV almacena imágenes RGB como matrices NumPy en orden de canal inverso. En lugar de almacenar una imagen en orden RGB, almacena la imagen en orden BGR. Así desempaquetamos la tupla en orden inverso.

In [3]:
image = cv2.imread('images/tiomaridopampita.png')
(b,g,r) = cv2.split(image)
cv2.imwrite("images/canalrojo.jpg", r)
cv2.imwrite("images/canalverde.jpg", g)
cv2.imwrite("images/canalazul.jpg", b)
# mostrar cada canal individualmente

cv2.imshow ("Rojo", r) #SUPERIOR DERECHA. VEMOS COMO EL TITULO ES NARANJA Y EN EL CANAL ROJO SE VE BASTANTE BLANCO YA QUE EL ROJO APORTA MUCHO
cv2.imshow ("Verde", g) #INFERIOR IZQUIERDA
cv2.imshow ("Azul", b) #INFERIOR DERECHA. vVEMOS EL SACO DE ANDINO QUE EN EL CANAL AZUL SE VE BLANCO YA QUE APORTA EL AZUL.
cv2.waitKey (0)
cv2.destroyAllWindows()

![<ORIGINAL>](images/tiomaridopampita.png)
![<ROJO>](images/canalrojo.jpg)
![<VERDE>](images/canalverde.jpg)
![<AZUL>](images/canalazul.jpg)

### FUSIONAR LA IMAGEN

In [174]:
merged = cv2.merge([b,g,r])
cv2.imwrite("images/merged.jpg", merged)

cv2.imshow ("Merged", merged) 
cv2.waitKey (0)
cv2.destroyAllWindows()


The system cannot find the file specified.



![<ORIGINAL>](images/merged.jpg)

Por otro lado tambien podemos visualizar cada canal en "color" en lugar de "escala de grises". Esta es estrictamente una técnica de visualización y no algo que usaríamos en una aplicación estándar de procesamiento de imágenes o visión por computadora.

In [9]:
# visualiza cada canal en color
ceros = np.zeros (image.shape [:2], dtype = "uint8")
cv2.imwrite("images/canalrojook1.jpg", cv2.merge ([ceros, ceros, r]))
cv2.imwrite("images/canalverdeok1.jpg", cv2.merge ([ceros, g, ceros]))
cv2.imwrite("images/canalazulok1.jpg",  cv2.merge ([b, ceros, ceros]))
cv2.imshow ("Rojo", cv2.merge ([ceros, ceros, r]))
cv2.imshow ("Verde", cv2.merge ([ceros, g, ceros]))
cv2.imshow ("Azul", cv2.merge ([b, ceros, ceros]))
cv2.waitKey (0)
cv2.destroyAllWindows()

![<ORIGINAL>](images/tiomaridopampita.png)
![<ROJOo>](images/canalrojook1.jpg)
![<VERDE>](images/canalverdeok1.jpg)
![<AZUL>](images/canalazulok1.jpg)