In [2]:
import cv2
import numpy as np

# Reconocimiento de Flores

## Práctica Final - Visión por computador
---
##### Autores: Marta Gómez Macías, Braulio Vargas López
---

### Definición del problema

El problema elegido consiste en extraer una serie de características del conjunto de imágenes para ser capaces de reconocer la especie de flor que es de las 17 especies posibles, mediante una imagen. Este problema consta de varias partes:

1. __Extracción de las características principales de la imagen__.
2. __Entrenar un algoritmo de aprendizaje a partir de las características extraídas__.

Para esto, vamos a hacer uso de distintos descriptores, como son el descriptor *HOG*, *Shape-Context* o el descriptor de SIFT. Una vez tengamos los descriptores, vamos a crear clústers mediante el método del _vecino más cercano_ y, por último, vamos a hacer uso de un descriptor _bag of words_ para entrenar un algoritmo de aprendizaje.

El descriptor _bag of words_ de OpenCV tiene un problema y es que necesita `keyPoints`, cosa que el descriptor _HOG_ no devuelve, por lo que sólo podremos hacer esta aproximación usando un descriptor SIFT, SURF o cualquiera de la clase `Features2D` de OpenCV.

#### Descriptor de HOG

El descriptor HOG, conocido como ___Histogram of Oriented Gradientes___ muy utilizado para la detección de objetos. Este descriptor computa un histograma de valores donde se indican la frecuencia con la que se dan las direcciones de los gradientes en pequeñas divisiones de la imagen.

#### Descriptor Shape-Context


#### Descriptor de SIFT



### Enfoque de la implementación y eficiencia.

#### 1: Extracción de las características principales de la imagen

En este primer paso, hemos implementado una función que calcula varios tipos de descriptores de una imagen. Esta función devuelve descriptores sin clusterizar de las distintas imágenes.

In [1]:
def create_unclustered_geometric_vocabulary(images, detector_type):
    # Create an empty vocabulary
    vocabulary = []

    if detector_type == 'SURF':
        detector = cv2.xfeature2d.SURF_create()

    elif detector_type == 'SIFT:':
        detector = cv2.xfeature2d.SIFT_create()

    elif detector_type == 'AKAZE':
        detector = cv2.xfeature2d.AKAZE_create()

    elif detector_type == 'MSD':
        detector = cv2.xfeature2d.MSDDetector_create()

    elif detector_type == 'FFD':
        detector = cv2.xfeature2d.FastFeatureDetector_create()

    else:
        raise ValueError('Not a suitable detector')

    for img in images:
        # Detect the keypoints on the image and
        # compute the descriptor for those keypoints
        keypoints, descriptor = detector.detectAndCompute(img, None)
        vocabulary.append(descriptor)

    return np.array(vocabulary, dtype=np.float32)

#### 2. Clusterizar los descriptores obtenidos

En este paso hemos implementado una función que, usando la función `kmeans` de OpenCV clusteriza los descriptores obtenidos anteriormente en $K$ clases distintas.

#### Implementación del modelo de aprendizaje
Para realizar los modelos de aprendizaje, hemos usado la librería `ml` de _OpenCV_, más concretamente hemos entrenado un modelo _Support Vector Machine_ y un modelo _Random Forest_. A la hora de dividir los datos en conjunto de training y test, hemos procurado que haya, al menos, una imagen de cada clase en ambos conjuntos.

In [None]:
def create_train_subset():
    subset = []
    for i in range(0,1360,80):
        subset += np.random.randint(low=i,high=i+80,size=4).tolist()

    return np.array(subset)


test_mask = create_train_subset()
aux = np.arange(1360)
training_mask = np.in1d(aux, test_mask) * 1
training_mask = np.where(training_mask == 0)[0]