# EJERCICIO 6
Con el fin de predecir la puntuación que un catador profesional le otorgará a un determinado vino, se tomaron resultados de análisis físico-químicos de rutina realizados durante la producción de los vinos para tratar de descubrir de que manera estos factores influyen en la puntuación obtenida.
Construir un modelo de este tipo resulta beneficioso no solo para anticipar la puntuación que un enólogo otorgará al vino sino también para poder analizar como la variación de determinadas características afectará, tanto positiva como negativamente, la calidad percibida del vino antes de que éste sea producido.
La bodega portuguesa “Vinho Verde” ha facilitado los resultados de analizar 1599 muestras de varios tipos de vino tinto producidos por esa bodega, junto con las calificaciones que cada uno de ellos obtuvo, las cuales van de 0 a 10, siendo 0 la peor puntuación posible y 10, la mejor. De cada vino se analizaron 11 atributos diferentes (pH, densidad y grado de alcohol, para nombrar sólo algunos), siendo todos estos atributos valores reales continuos.
Entrene una red neuronal artificial mediante backpropagation para que sea capaz de predecir cual será la puntuación que un vino obtendrá a partir de los 11 atributos analizados. Detalle la arquitectura usada y los parámetros empleados en su entrenamiento. Reserve un subconjunto razonable de los patrones disponible para evaluar el desempeño de la red luego de ser entrenada, informando el error obtenido.

In [1]:
import pyximport; pyximport.install()
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
import mpld3
%matplotlib inline
mpld3.enable_notebook()
from utils.cperceptron import Perceptron
from utils.cbackpropagation import ANN #, Identidad, Sigmoide
import utils.patrones as magia

def progreso(ann, X, T, y=None, n=-1, E=None):
    if n % 20 == 0:
        print("Pasos: {0} - Error: {1:.32f}".format(n, E)) 
def progresoPerceptron(perceptron, X, T, n):
    y = perceptron.evaluar(X)
    incorrectas = (T != y).sum()
    print("Pasos: {0}\tIncorrectas: {1}\n".format(n, incorrectas))

In [2]:
winequality = np.load('resources/winequality.npy')
datos = magia.escalar(winequality[:, :-1].round(2))
puntuacion = winequality[:, -1].reshape(-1, 1)

In [3]:
# Armo patrones manualmente
## De entrenamiento
X = datos[:1400,:]
T = puntuacion[:1400,:].astype(np.float64)
## De prueba
Xtest = datos[-199:,:]
Ttest = puntuacion[-199:,:].astype(np.float64)

In [4]:
Xtest.shape

(199, 11)

In [5]:
# Crea la red neuronal
ocultas = 12 #2,5,15
entradas = X.shape[1]
salidas = T.shape[1]
ann = ANN(entradas, ocultas, salidas)
ann.reiniciar()

In [6]:
#Entreno
E, n = ann.entrenar_rprop(X, T, min_error=0, max_pasos=5000, callback=progreso, frecuencia_callback=1000)
print("\nRed entrenada en {0} pasos con un error de {1:.32f}".format(n, E))

Pasos: 1000 - Error: 0.14530131234005239093676209449768
Pasos: 2000 - Error: 0.13475291451265292153038899414241
Pasos: 3000 - Error: 0.13195475081701801833844456268707
Pasos: 4000 - Error: 0.13062818296939079920626625153091
Pasos: 5000 - Error: 0.12924774898121824118213396559440

Red entrenada en 5000 pasos con un error de 0.12924774898121824118213396559440


In [7]:
Y1 = ann.evaluar(Xtest)

In [10]:
np.hstack((Y1.round(),Ttest))

array([[5., 5.],
       [5., 5.],
       [7., 6.],
       [5., 8.],
       [6., 6.],
       [6., 7.],
       [7., 6.],
       [6., 6.],
       [7., 7.],
       [6., 6.],
       [4., 6.],
       [6., 6.],
       [7., 6.],
       [5., 5.],
       [6., 5.],
       [6., 5.],
       [6., 5.],
       [7., 7.],
       [5., 5.],
       [5., 5.],
       [5., 5.],
       [6., 5.],
       [6., 6.],
       [6., 4.],
       [6., 6.],
       [6., 6.],
       [7., 6.],
       [6., 5.],
       [6., 5.],
       [7., 5.],
       [6., 5.],
       [5., 6.],
       [7., 6.],
       [5., 7.],
       [6., 6.],
       [6., 6.],
       [4., 5.],
       [5., 5.],
       [4., 5.],
       [5., 6.],
       [6., 7.],
       [5., 6.],
       [6., 5.],
       [6., 5.],
       [6., 6.],
       [5., 6.],
       [6., 5.],
       [5., 5.],
       [5., 5.],
       [6., 8.],
       [6., 7.],
       [7., 7.],
       [6., 7.],
       [5., 5.],
       [6., 6.],
       [6., 6.],
       [6., 6.],
       [5., 5.],
       [6., 5.

In [11]:
#Evaluo
Y = ((Y1.round() - Ttest ) > 1).sum()
print("Errores de la red: \n{0} \n".format(Y))

Errores de la red: 
7 



In [12]:
Y = ann.evaluar(Xtest)
magia.matriz_de_confusion(Ttest,Y)

(array([[0., 0.]]), [array([1])])