## Ejercicio 5

El archivo **ZOO.csv** contiene información de 101 animales caracterizados por los siguientes atributos:  

<table style="border-collapse: collapse; text-align: left; margin: auto;">
  <tbody>
    <tr>
      <td>1. Nombre del animal</td>
      <td>7. Acuático</td>
      <td>13. Aletas</td>
    </tr>
    <tr>
      <td>2. Tiene Pelo</td>
      <td>8. Depredador</td>
      <td>14. Patas</td>
    </tr>
    <tr>
      <td>3. Plumas</td>
      <td>9. Dentado</td>
      <td>15. Cola</td>
    </tr>
    <tr>
      <td>4. Huevos</td>
      <td>10. Vertebrado</td>
      <td>16. Domestico</td>
    </tr>
    <tr>
      <td>5. Leche</td>
      <td>11. Branquias</td>
      <td>17. Tamaño gato</td>
    </tr>
    <tr>
      <td>6. Vuela</td>
      <td>12. Venenoso</td>
      <td>18. Clase</td>
    </tr>
  </tbody>
</table>



Salvo los atributos 1 y 18 que contienen texto y el 14 que contiene el número de patas del animal, el resto toma el valor 1 si el animal posee la característica y 0 si no. Hay 7 valores de clase posible (atributo 18): mamífero, ave, pez, invertebrado, insecto, reptil y anfibio.  

Entrene un multiperceptrón que sea capaz de clasificar un animal en una de las 7 clases. Utilice el 70% de los ejemplos para entrenar y el 30% para realizar el testeo. Realice al menos 10 ejecuciones independientes de la configuración seleccionada para respaldar sus afirmaciones referidas a la performance del modelo.  

Fuente de Datos: **Zoo Data Set** - https://archive.ics.uci.edu/ml/datasets/zoo  

In [35]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import preprocessing, model_selection
from sklearn.neural_network import MLPClassifier

TEST_SIZE = 0.3

DATOS_DIR   = '../../Datos/'
data = pd.read_csv(DATOS_DIR + 'zoo.csv')
binarizer = preprocessing.LabelBinarizer()

X_raw = np.array(data.iloc[:,1:-1])
Y_raw = np.array(data.iloc[:, -1])

Y_raw = binarizer.fit_transform(Y_raw)
X_train, X_test, Y_train, Y_test = model_selection.train_test_split(X_raw, Y_raw, test_size=TEST_SIZE)

scaler = preprocessing.StandardScaler()
X_train  = scaler.fit_transform(X_train)
X_test   = scaler.transform(X_test)


FunH = 'tanh'   # opciones: identity logistic tanh relu
ocultas = (20, 10)

alfa = 0.01
CotaError = 0.0002
MAX_ITE = 2000

for i in range(10):
	modelo = MLPClassifier(max_iter=MAX_ITE, hidden_layer_sizes=ocultas, alpha=alfa,
						solver='adam', activation=FunH, tol=CotaError,
						verbose=False).fit(X_train, Y_train)

	Y_pred = modelo.predict(X_train)
	score = modelo.score(X_train, Y_train)

	Y_it = binarizer.inverse_transform(Y_train)
	Y_pred_it = binarizer.inverse_transform(Y_pred)

	print('Iteracion %d' % (i+1))

	print('Entrenamiento:')
	print('Efectividad: %6.2f%%' % (100*(Y_pred_it == Y_it).sum()/len(Y_it)) )
	print('      Score: %6.2f' % (score) )

	Y_pred = modelo.predict(X_test)
	score = modelo.score(X_test, Y_test)

	# "invierte" la transformacion binaria para obtener los nombres de las clases
	Y_it = binarizer.inverse_transform(Y_test)
	Y_pred_it = binarizer.inverse_transform(Y_pred)

	print('Prueba:')
	print('Efectividad: %6.2f%%' % (100*(Y_pred_it == Y_it).sum()/len(Y_it)) )
	print('      Score: %6.2f' % (score) )
	print('\n')

Iteracion 1
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad:  93.55%
      Score:   0.90


Iteracion 2
Entrenamiento:
Efectividad: 100.00%
      Score:   0.99
Prueba:
Efectividad:  93.55%
      Score:   0.90


Iteracion 3
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad: 100.00%
      Score:   0.87


Iteracion 4
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad:  96.77%
      Score:   0.90


Iteracion 5
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad:  93.55%
      Score:   0.94


Iteracion 6
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad:  90.32%
      Score:   0.87


Iteracion 7
Entrenamiento:
Efectividad: 100.00%
      Score:   1.00
Prueba:
Efectividad:  96.77%
      Score:   0.90


Iteracion 8
Entrenamiento:
Efectividad: 100.00%
      Score:   0.99
Prueba:
Efectividad:  96.77%
      Score:   0.90


Iteracion 9
Entrenamiento:
Efectividad: 100.00%
