# Red neuronal usando iris
<img src="https://raw.githubusercontent.com/fhernanb/fhernanb.github.io/master/docs/logo_unal_color.png" alt="drawing" width="200"/>


El código mostrado aquí está basado en [este video](https://youtu.be/7wC9YDImpyY)

<img src="iris.jpg" alt="drawing" width="500"/>

In [1]:
import sklearn
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

In [2]:
iris = load_iris()

Para ver las covariables a usar

In [3]:
caract = iris.data
caract[:5]

array([[5.1, 3.5, 1.4, 0.2],
       [4.9, 3. , 1.4, 0.2],
       [4.7, 3.2, 1.3, 0.2],
       [4.6, 3.1, 1.5, 0.2],
       [5. , 3.6, 1.4, 0.2]])

Para ver las tres etiquetas o clases de flores

In [4]:
etiq = iris.target
etiq

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

Para crear los conjuntos de entrenamiento y prueba

In [5]:
X_ent, X_test, y_ent, y_test = train_test_split(caract, etiq)

Para definir la red

In [16]:
red = MLPClassifier(activation='logistic', max_iter=100, hidden_layer_sizes=(10))

Para entrenar la red

In [17]:
red.fit(X_ent, y_ent)

MLPClassifier(activation='logistic', alpha=0.0001, batch_size='auto',
              beta_1=0.9, beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=10, learning_rate='constant',
              learning_rate_init=0.001, max_iter=5000, momentum=0.9,
              n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
              random_state=None, shuffle=True, solver='adam', tol=0.0001,
              validation_fraction=0.1, verbose=False, warm_start=False)

<div class="alert alert-danger">
  El número de iteraciones es insuficiente y por eso se debe aumentar, max_iter=5000 estaría bien.
</div>

Para ver las probabilidades de pertenecer a cada clase con el conjunto de datos de entrenamiento

In [8]:
red.predict_proba(X_ent)[:5] # Las 5 primeras filas

array([[0.36669996, 0.36443818, 0.26886186],
       [0.29078162, 0.34117698, 0.3680414 ],
       [0.27171442, 0.32961686, 0.39866872],
       [0.27666658, 0.33583343, 0.38749999],
       [0.37237674, 0.36334264, 0.26428062]])

Para ver las etiquetas de clasficacion con el conjunto de datos de entrenamiento

In [9]:
y_hat = red.predict(X_ent)
y_hat

array([0, 2, 2, 2, 0, 2, 0, 2, 2, 0, 2, 2, 2, 2, 2, 1, 2, 0, 2, 2, 0, 2,
       2, 2, 0, 2, 2, 2, 0, 2, 2, 2, 0, 2, 2, 0, 2, 0, 2, 2, 0, 2, 2, 2,
       0, 0, 2, 2, 0, 0, 0, 0, 0, 1, 2, 2, 0, 2, 2, 0, 2, 0, 2, 2, 2, 2,
       0, 0, 2, 2, 0, 0, 0, 2, 2, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 0, 2,
       0, 0, 1, 0, 2, 2, 2, 2, 0, 1, 2, 2, 2, 0, 2, 2, 2, 1, 1, 2, 2, 2,
       2, 0])

Para obtener la matriz de confusión

In [10]:
import pandas as pd
pd.crosstab(index=y_hat, columns=y_ent)

col_0,0,1,2
row_0,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
0,35,0,0
1,2,4,0
2,0,34,37


Para obtener la tasa de clasificación correcta con el conjunto de datos de entrenamiento

In [11]:
red.score(X_ent, y_ent) 

0.6785714285714286

Para ver las probabilidades de pertenecer a cada clase con el conjunto de datos de prueba

In [12]:
red.predict_proba(X_test)[:5]

array([[0.37150508, 0.36409995, 0.26439497],
       [0.27457405, 0.32779872, 0.39762723],
       [0.36730504, 0.36253803, 0.27015693],
       [0.37569633, 0.36256778, 0.26173589],
       [0.25278255, 0.32038823, 0.42682922]])

Para ver las etiquetas de clasficacion con el conjunto de datos de prueba

In [13]:
y_hat = red.predict(X_test)
y_hat

array([0, 2, 0, 0, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 1, 2, 0, 2, 2, 2, 0, 0,
       1, 1, 2, 0, 1, 2, 0, 2, 2, 1, 2, 2, 0, 2, 2, 2])

Para obtener la matriz de confusión

In [14]:
pd.crosstab(index=y_hat, columns=y_test)

col_0,0,1,2
row_0,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
0,10,0,0
1,3,2,0
2,0,10,13


Para obtener la tasa de clasificación correcta con el conjunto de datos de prueba

In [15]:
red.score(X_test, y_test)

0.6578947368421053