# Entrenamiento de la red neuronal del proyecto

In [88]:
# importamos librerias necesarias para preprocesar los datos y crear la red neuronal
import pandas as pd
import tensorflow as tf
import numpy as np

# abrimos el archivo donde tenemos guardada la informacion de los filos
df = pd.read_csv('filos.csv')
df.head()

Unnamed: 0,Phylum,tejido,organos,sistemas,simetria_radial,simetria_bilateral,diploblastico,triploblastico,segmentacion,seudocelomados,...,sis_nervioso_ganglionar,sis_nervioso_central,endoesqueleto,exoesqueleto,sis_corporal,rep_sexual,rep_asexual,habitat_terrestre,habitat_acuatico,parasitario
0,chordata,1,1,1,0,1,0,1,1,0,...,0,1,1,0,0,1,0,1,1,0
1,echinodermata,1,1,0,1,0,0,1,0,0,...,0,0,1,0,0,1,0,0,1,0
2,arthropoda,1,1,0,0,1,0,1,1,0,...,1,0,0,1,0,1,0,1,1,0
3,annelida,1,1,0,0,1,0,1,1,0,...,1,0,0,0,1,1,0,1,1,0
4,molusca,1,1,0,0,1,0,1,0,0,...,1,0,0,1,0,1,0,1,1,0


In [89]:
from tensorflow.keras.layers import Dense
from tensorflow.keras import Sequential

# creamos la red neuronal, con una neurona para cada carcteristica en la capa de entrada 
# y una neurona por filo en la capa de salida 
model = Sequential()
model.add(Dense(23, activation='tanh'))
model.add(Dense(13, activation='softmax'))
model.compile(loss=tf.keras.metrics.sparse_categorical_crossentropy,
               optimizer=tf.keras.optimizers.SGD(1.), metrics=['accuracy'])


In [95]:
from sklearn.preprocessing import LabelEncoder
# ultilizamos un codificador de etiquetas para que la red neuronal entienda cual es cual
label_encoder = LabelEncoder()

#separamos varibles de entrada de la varibale objetivo
x_df = df.drop('Phylum', axis=1)
y_df = df.Phylum

# lo convertimos a un formato que la red neuronal entienda
X = x_df.to_numpy()
y = y_df.to_numpy()

label_encoder.classes_ = np.array([i for i in y])

y_encoded = label_encoder.transform(y) 
print("Clases codificadas:", label_encoder.classes_)  # Muestra las clases mapeadas
print("Etiquetas codificadas:", y_encoded)


Clases codificadas: ['chordata' 'echinodermata' 'arthropoda' 'annelida' 'molusca' 'rotifera'
 'nematoda' 'nemertea' 'platyhelmithes' 'ctenophera' 'cnidaria' 'polifera'
 'protozooarios']
Etiquetas codificadas: [ 0  1  2  3  4  5  6  7  8  9 10 11 12]


In [91]:
# entrenamos la red neuronal con los datos y las etiquetas
_= model.fit(X,y_encoded, epochs=50)

Epoch 1/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 505ms/step - accuracy: 0.0000e+00 - loss: 2.7465
Epoch 2/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step - accuracy: 0.3846 - loss: 2.3111
Epoch 3/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - accuracy: 0.4615 - loss: 1.9969
Epoch 4/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 42ms/step - accuracy: 0.7692 - loss: 1.7280
Epoch 5/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - accuracy: 0.8462 - loss: 1.4902
Epoch 6/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - accuracy: 1.0000 - loss: 1.2810
Epoch 7/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 45ms/step - accuracy: 1.0000 - loss: 1.1013
Epoch 8/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - accuracy: 1.0000 - loss: 0.9508
Epoch 9/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[

In [92]:
# medimos su eficiencia 
test_loss, test_acc = model.evaluate(X,  y_encoded, verbose=2)
print('\nTest accuracy:', test_acc)

1/1 - 0s - 191ms/step - accuracy: 1.0000 - loss: 0.0600

Test accuracy: 1.0


In [94]:
# lo probamos y guardamos asegurando que sea accesible
import os

chordata = np.array([1,1,1,0,1,0,1,1,0,1,0,1,0,0,1,1,0,0,1,0,1,1,0])
chordata = chordata.reshape(1,-1)
pred = model.predict(chordata)
print(np.argmax(pred))

model.save("modelo.keras")
os.chmod("modelo.keras", 0o666)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step
0
