# Red neuronal para el data-set de animales

In [1]:
import pandas as pd
import numpy as np

## 1. Importar los conjuntos de datos de entrenamiento y prueba

Los conjuntos X contienen los atributos que se utilizan de entrada para una red neuronal. Los conjuntos Y tienen al atributo $\textit{type}$, que es el atributo cuyo valor la red neuronal debe inferir.

In [2]:
def cargar_train_test():
    X_train = pd.read_csv('X_train.csv',index_col=0)
    X_test = pd.read_csv('X_test.csv',index_col=0)

    y_train = pd.read_csv('y_train.csv',index_col=0)
    y_train = pd.DataFrame({'type':np.array(y_train.index)
                      })

    y_test = pd.read_csv('y_test.csv',index_col=0)
    y_test = pd.DataFrame({'type':np.array(y_test.index)
                       })
    return (X_train,X_test,y_train,y_test)

X_train,X_test,y_train,y_test = cargar_train_test()

Puedes descomentar las siguientes celdas para visualizar estos conjuntos.

In [5]:
#X_train

In [7]:
#X_test

In [9]:
#y_train

In [13]:
#y_test

## 2. Preparación de los datos

Los conjuntos X e Y se normalizan para facilitarle el trabajo al algoritmo de optimización y las funciones de activación. La técnica de normalización utilizada se llama $\textit{min-max}$. Para cada atributo $a$ de los datos, se mapea cada valor $v \mapsto v / max(a)$, donde $ max(a)$ es el maximo valor que existe en ese atributo. De esta forma, cuando $v=max(a)$, el valor normalizado sera 1. Es decir, todos los valores estaran en el rango $[0,1]$.

In [3]:
def preparar_datos(X_train,X_test,y_train,y_test):
    X_train = X_train.values
    X_test = X_test.values
    y_train = y_train.values
    y_test = y_test.values


    X_train = X_train / np.amax(np.concatenate((X_train, X_test), axis=0), axis=0)
    X_test = X_test / np.amax(np.concatenate((X_train, X_test), axis=0), axis=0)
    y_train = y_train / 7  
    y_test = y_test / 7 

    return (X_train,X_test,y_train,y_test)

X_train,X_test,y_train,y_test = preparar_datos(X_train,X_test,y_train,y_test)

In [19]:
#X_train

In [None]:
#X_test

In [None]:
#y_train

In [None]:
#y_test

## 3. Importar la inicialización de pesos y bias

Luego de un muestreo de muchos entrenamientos de la red neuronal, con una inicialización aleatoria de pesos y bias, se encontraron estos parametros como los que lograban el mejor valor de accuracy.

In [4]:
def importar_pesos_bias():
    weights_input_hidden = np.loadtxt('initialized_weights_input_hidden.csv', delimiter=',')
    weights_hidden_output= np.loadtxt('initialized_weights_hidden_output.csv', delimiter=',')
    bias_hidden= np.array([np.loadtxt('initialized_bias_hidden.csv', delimiter=',')])
    bias_output= np.array([np.loadtxt('initialized_bias_output.csv', delimiter=',')])
    return (weights_input_hidden,weights_hidden_output,bias_hidden,bias_output)
weights_input_hidden,weights_hidden_output,bias_hidden,bias_output = importar_pesos_bias()

Puedes descomentar las siguientes celdas para visualizar estos datos.

In [6]:
#weights_input_hidden

In [8]:
#weights_hidden_output

In [10]:
#bias_hidden

In [12]:
#bias_output

## 4. Implementación de la red neuronal

In [5]:
# Funcion de activacion sigmoide
def sigmoide(x):
    x = np.clip(x, -500, 500)
    return 1 / (1 + np.exp(-x))

# Derivada de la funcion de activacion sigmoide
def sigmoide_derivada(x):
    return x * (1 - x)

class PerceptronMulticapa:
    def __init__(self, input_size, hidden_size, output_size,weights_input_hidden=None,
                weights_hidden_output=None,bias_hidden=None,bias_output=None):
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size
        
        # Inicializacion de pesos y bias
        # Estos parametros iran cambiando a medida que se optimizen
        if weights_input_hidden is None:
            self.weights_input_hidden = np.random.rand(input_size, hidden_size)
        else:
            self.weights_input_hidden = weights_input_hidden
            
        if weights_hidden_output is None:
            self.weights_hidden_output = np.random.rand(hidden_size, output_size)
        else:
            self.weights_hidden_output = weights_hidden_output
            
        if bias_hidden is None:
            self.bias_hidden = np.random.rand(1, hidden_size)
        else:
            self.bias_hidden = bias_hidden

        if bias_output is None:
                self.bias_output = np.random.rand(1, output_size)
        else:
            self.bias_output = bias_output


        # Se guardan las inicializaciones de pesos y bias en atributos diferentes
        self.initialized_weights_input_hidden = self.weights_input_hidden.copy()
        self.initialized_weights_hidden_output = self.weights_hidden_output.copy()
        self.initialized_bias_hidden = self.bias_hidden.copy()
        self.initialized_bias_output = self.bias_output.copy()
        
        
    def pensar(self, X):
        self.hidden_input = np.dot(X, self.weights_input_hidden) + self.bias_hidden
        self.hidden_output = sigmoide(self.hidden_input)
        self.output = np.dot(self.hidden_output, self.weights_hidden_output) + self.bias_output
        return self.output
        
    def retropropagacion(self, X, y, output, ratio_aprendizaje):
        # Retropropagacion
        error = y - output
        d_output = error
        d_hidden = np.dot(d_output, self.weights_hidden_output.T) * sigmoide_derivada(self.hidden_output)
        
        # Actualizacion de pesos y bias
        self.weights_hidden_output += np.dot(self.hidden_output.T, d_output) * ratio_aprendizaje
        self.weights_input_hidden += np.dot(X.T, d_hidden) * ratio_aprendizaje
        self.bias_output += np.sum(d_output, axis=0, keepdims=True) * ratio_aprendizaje
        self.bias_hidden += np.sum(d_hidden, axis=0, keepdims=True) * ratio_aprendizaje

    def predecir(self, X):
        return self.pensar(X)
    
    def entrenar(self, X, y, epocas, ratio_aprendizaje,debug=False,intervalo_de_epoca = 100):
        for epoca in range(epocas):
            output = self.pensar(X)
            
            self.retropropagacion(X, y, output, ratio_aprendizaje)
            
            perdida = np.mean(np.square(y - output))
            if debug and epoca % intervalo_de_epoca == 0:
                print(f'Epoca {epoca}, Perdida: {perdida:.4f}')

## 5. Entrenamiento

In [6]:
X_train,X_test,y_train,y_test = cargar_train_test()
X_train,X_test,y_train,y_test = preparar_datos(X_train,X_test,y_train,y_test)
weights_input_hidden,weights_hidden_output,bias_hidden,bias_output = importar_pesos_bias()

input_size = 16#X_train.shape[1]
hidden_size = 64
output_size = 7

perceptron = PerceptronMulticapa(input_size, hidden_size, output_size,weights_input_hidden,weights_hidden_output,bias_hidden,bias_output)
# esta inicializacion de abajo fue usada previamente. Aca, no se pasan por parametros los pesos y bias. Por lo tanto, se inicializan aleatoriamente
# perceptron = PerceptronMulticapa(input_size, hidden_size, output_size)

perceptron.entrenar(X_train, y_train, epocas=1000, ratio_aprendizaje=0.01,debug=True)

predicciones = perceptron.predecir(X_test)

Epoca 0, Perdida: 997.9707
Epoca 100, Perdida: 0.0899
Epoca 200, Perdida: 0.0898
Epoca 300, Perdida: 0.0897
Epoca 400, Perdida: 0.0897
Epoca 500, Perdida: 0.0896
Epoca 600, Perdida: 0.0896
Epoca 700, Perdida: 0.0895
Epoca 800, Perdida: 0.0895
Epoca 900, Perdida: 0.0895


## 6. Analisis del accuracy

In [8]:
total = 0
for itr,pred in enumerate(predicciones):
    if(np.argmax(pred)+1 == y_test[itr]*7):
        total += 1
    print('valor predecido: ',np.argmax(pred)+1,' - valor real: ',y_test[itr]*7)
print('accuracy: ',total/len(y_test))

valor predecido:  1  - valor real:  [5.]
valor predecido:  1  - valor real:  [2.]
valor predecido:  1  - valor real:  [4.]
valor predecido:  1  - valor real:  [2.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [4.]
valor predecido:  6  - valor real:  [6.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [4.]
valor predecido:  3  - valor real:  [7.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  6  - valor real:  [7.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [2.]
valor predecido:  1  - valor real:  [3.]
valor predecido:  6  - valor real:  [6.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [1.]
valor predecido:  1  - valor real:  [2.]
accuracy:  0.47619047619047616
