# Taller 1 - Procesamiento y Etiquetado de Datos

**Docente:** Ph.D. John William Branch  
**Asistente de Docencia:** Sergio Robles

Clasificación y Reconocimiento de Patrones  
Universidad Nacional - Sede Medellin

### Notas del Taller  
* Completar los cinco puntos propuestos
* El dataset a utilizar es el archivo comprimido enviado por correo junto con este notebook

#### Entrega
* El Notebook debe ser enviado al correo: srobles@unal.edu.co
* El Asunto del correo debe ser: CRP - Taller 1
* El Correo debe tener adjunto un Notebook resuelto (Archivo con extensión 'ipynb')
* El Correo debe tener adjunto 3 imagenes generadas a partir del último punto

## Librerías

Librerías y paquetes de python a utilizar en el siguiente notebook.  
(Deben estar previamente instalados)

In [None]:
%matplotlib inline
import random
import numpy as np
import pandas as pd
import cv2
import matplotlib.pyplot as plt
import skimage as sk
import glob
from skimage import transform
from skimage import util
from sklearn import preprocessing
from scipy import ndarray

In [None]:
# Utils
def random_rotation(image_array: ndarray):
    # pick a random degree of rotation between 25% on the left and 25% on the right
    random_degree = random.uniform(-25, 25)
    return sk.transform.rotate(image_array, random_degree)

def random_noise(image_array: ndarray):
    # add random noise to the image
    return sk.util.random_noise(image_array)

def horizontal_flip(image_array: ndarray):
    # horizontal flip doesn't need skimage, it's easy as flipping the image array of pixels !
    return image_array[:, ::-1]

## Datos No Estructurados

In [None]:
images = []
data = []

#### Primer punto

In [None]:
# Leer las 11 imagenes almacenadas en la ruta data/images y almacenarlas en el array images
# Tip: Utilizar opencv
# Tip: Las imagenes a través de opencv son leidas en formato BGR, cambiar el formato a RGB

# ESCRIBA SU CÓDIGO AQUÍ
#La imagen 11 se volvió a guardar en un editor externo
dirs = glob.glob('data/*')
dirs.sort()
#print (dirs)
for dir in dirs:
    #print (dir)
    img = cv2.imread(dir)
    
    if img is not None:
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    else:
        img = plt.imread(dir)
    #print (img)
    images.append(img)
    

#### Segundo punto

In [None]:
# Imprimir una imagen leida
# Tip: Utilizar matplotlib

# ESCRIBA SU CÓDIGO AQUÍ
plt.imshow(images[10])

### Normalización y Otros

#### Tercer punto

In [None]:
images_resize = []

In [None]:
# Realizar un resize a las imagenes almacenas y guardarlas en la variable images_resize (150x150)
# Tip: Utilizar opencv

# ESCRIBA SU CÓDIGO AQUÍ
for img in images:
    aux = cv2.resize(img,(150,150))
    images_resize.append(aux)

#### Cuarto punto

In [None]:
images_normalize = []

In [None]:
# Realizar un normalizado en la intensidad de colores en las imagenes almacenadas
# Tip: Utilizar opencv o matemáticas
for img in images_resize:
    aux = cv2.normalize(img,None,alpha = 0,beta=1,norm_type=cv2.NORM_MINMAX, dtype =cv2.CV_32F)
    images_normalize.append(aux)
# ESCRIBA SU CÓDIGO AQUÍ


### Etiquetado

#### Quinto punto

In [None]:
label = []

In [None]:
# Realizar un etiquetado manual de las imagenes almacenadas en la variable images y almacenarlos en la variable label
# Se deben guardar las imagenes en un diccionario de python, donde cada valor del diccionario es una lista de todas las imagenes que se encuentran en esa clase.
# Ejemplo: mis_datos = { 'perros': [imagen_perro1, imagen_perro2], 'gatos': [imagen_gato1, imagen_gato2] }
# ESCRIBA SU CÓDIGO AQUÍ
label = {'PENDRIVE':[images_normalize[0],images_normalize[6]],
         'HANDBAG':[images_normalize[1],images_normalize[4]],
         'PHOTOCOPIER':[images_normalize[2],images_normalize[8],images_normalize[10]],
         'STAPLER':[images_normalize[3],images_normalize[7],images_normalize[9]], 
         'SCISSORS':[images_normalize[5],images_normalize[11]]    
        }
plt.imshow(label['STAPLER'][2])

### Images augmentation

**Sexto punto**  
Utilizar el código para generar 2 nuevas imagenes por cada imagen que se tienen en el dataset. (Solo enviar 3 imagenes generadas)

In [None]:
images = images_normalize

In [None]:
available_transformations = {
    'rotate': random_rotation,
    'noise': random_noise,
    'horizontal_flip': horizontal_flip
}

augmentation_images = []
for img in images:
    num_transformations_to_apply = random.randint(1, len(available_transformations))
    #print (num_transformations_to_apply)
    num_transformations = 0
    transformed_image = None
    while num_transformations <= num_transformations_to_apply:
        # choose a random transformation to apply for a single image
        key = random.choice(list(available_transformations))
        img = random.choice(list(images))
        transformed_image = available_transformations[key](img)
        num_transformations += 1
        augmentation_images.append(transformed_image)

In [None]:
for i  in range(len(augmentation_images)):
    plt.imsave('data/'+ "AM"+str(i).zfill(2)+".jpg",augmentation_images[i])