In [82]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
import mpld3
%matplotlib inline
mpld3.enable_notebook()
from cperceptron import Perceptron

## Ejercicio 2

Se ha realizado un análisis químico a tres tipos distintos de vinos producidos en una misma región de Italia. Se analizaron 59 muestras del Tipo 1, 71 muestras del Tipo 2 y 48 muestras del Tipo 3.

El archivo `'vinos.npy'` permite observar los resultados de este análisis.

In [83]:
vinos = np.load('vinos.npy')

In [84]:
def escalar(datos, margen_adicional=0, minimos=None, maximos=None):
    """
    Recibe datos cuyos valores se encuentran en el intervalo [minimos, maximos],
    y los escala  de forma que queden en el intervalor [0, 1].
    Adicionalmente, puede especificarse un margen de seguridad, que amplía el
    intervalo entre [minimos, maximos] en un porcentaje dado por margen_adicional.
    El porcentaje debe expresarse como un valor entre 0 y 100 incluidos.
    Si no se especifican los mínimos o los máximos, se los calcula a partir
    del conjunto de datos suministrado.
    Si no se especifica el margen adicional, se asume que es cero.
    """
    if minimos is None:
        minimos = datos.min(axis=0)
    if maximos is None:
        maximos = datos.max(axis=0)
    delta = (maximos - minimos)
    if margen_adicional:
        margen = delta * margen_adicional / 100.0
        minimos -= margen
        maximos += margen
        delta = (maximos - minimos)
    return (datos - minimos) / delta

def generar_patrones(X, T, porcentaje_division=90):
    """
    Sepera las patrones recibidos en dos grupos: uno para entrenamiento y
    otro para prueba.

    El parámetro 'X' es un array con los datos de cada patrón.
    El parámetro 'T' es un array que indica la clase de cada uno de
    los patrones recibidos en 'X'.
    El parámetro 'porcentaje_division' determina cuantos patrones se usarán
    para entrenamiento.

    La función devuelve:
        - Un array que contiene las clases únicas encontradas.
        - Un diccionario donde cada clase tiene asociada los patrones
          para el entrenamiento.
        - Un diccionario donde cada clase tiene asociada los patrones
          para las pruebas.
    """
    clases = np.unique(T)
    patrones_entrenamiento = {}
    patrones_prueba = {}
    for clase in clases:
        # Obtiene los patrones de esta clase
        patrones_de_la_clase = X[T.flat == clase]

        # Mezcla al azar los índices de los patrones
        indices = list(range(len(patrones_de_la_clase)))
        np.random.shuffle(indices)

        # Divide los patrones en 2 grupos: entrenamiento y prueba
        division = len(patrones_de_la_clase) * porcentaje_division // 100
        patrones_entrenamiento[clase] = patrones_de_la_clase[indices[:division]]
        patrones_prueba[clase] = patrones_de_la_clase[indices[division:]]

    return clases, patrones_entrenamiento, patrones_prueba


def armar_patrones_y_salida_esperada(clases, patrones):
    """
    Construye los patrones y la salida esperada a partir de las clases y patrones
    producidos por la función generar_patrones.

    El parámetro 'clases' es un array que contiene las clases únicas encontradas.
    El parámetro 'patrones' es un diccionario donde cada clase tiene asociada
    los patrones correspondiente a esa clase.

    La función devuelve:
        - Un array X con todos los patrones.
        - Un array T con tantas columnas como clases y tantas filas como patrones,
          conteniendo un único 1 en la columna de la clase asociada a cada patrón.
    """
    # Arma los patrones
    X = np.vstack(patrones[c] for c in clases)

    # Arma las respuestas esperadas
    T = np.zeros((len(X), len(clases)))
    i = 0
    for c, f in enumerate(np.cumsum([len(patrones[c]) for c in clases])):
        T[i:f, c] = 1
        i = f

    return X, T

In [85]:
clases, patronesEnt, patronesTest = generar_patrones(escalar(vinos[:,1:]),vinos[:,:1])

In [86]:
X, T = armar_patrones_y_salida_esperada(clases,patronesEnt)
T = T.astype(np.int8)

In [87]:
Xtest, Ttest = armar_patrones_y_salida_esperada(clases,patronesTest)

In [95]:
print("Entrenando P1:")
p1 = Perceptron(X.shape[1])
Vino1 = p1.entrenar_numpy(X, T[:,0], max_pasos=500)
print("Pasos:{0}".format(Vino1))
print("\nEntrenando P2:")
p2 = Perceptron(X.shape[1])
Vino2 = p2.entrenar_numpy(X, T[:,1], max_pasos=500)
print("Pasos:{0}".format(Vino2))
print("\nEntrenando P3:")
p3 = Perceptron(X.shape[1])
Vino3 = p3.entrenar_numpy(X, T[:,2], max_pasos=500)
print("Pasos:{0}".format(Vino3))

Entrenando P1:
Pasos:37

Entrenando P2:
Pasos:50

Entrenando P3:
Pasos:20


Cada fila representa una muestra distinta y está formada, en primer lugar, por el número del tipo al cual pertenece el vino analizado seguido por los 13 atributos que lo caracterizan.

Por ejemplo, la siguiente fila (vinos[80]):

```python
array([   2.  ,   12.  ,    0.92,    2.  ,   19.  ,   86.  ,    2.42,
          2.26,    0.3 ,    1.43,    2.5 ,    1.38,    3.12,  278.  ])
```

es el resultado del análisis de un vino del Tipo 2 (1er. valor de la fila) seguido por 13 valores separados por comas que indican los niveles de las mediciones realizadas a dicho vino. 


Entrene un perceptrón para clasificar los vinos del Tipo 1 utilizando un porcentaje de las muestras existentes. Los patrones que no se utilicen en el entrenamiento serán empleados para probarlo. Realice el mismo procedimiento para los vinos del Tipo 2 y del Tipo 3.

Detalle la cantidad de pasos que fueron necesarios para lograr la mejor clasificación. Pruebe variar el tamaño del conjunto de patrones de entrenado observando para cada caso la proporción de patrones correctamente clasificados por el perceptrón.

In [72]:
(p1.evaluar(Xtest) != Ttest[:,0]).sum()

1

In [71]:
(p2.evaluar(Xtest) != Ttest[:,1]).sum()

0

In [70]:
(p3.evaluar(Xtest) != Ttest[:,2]).sum()

0