In [None]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score


In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

In [None]:
class Multicapa:
    """
    Red neuronal con tres capas:
    
    Entrada
    Oculta
    Salida
    
    Los parámetros (pesos) que conectan las capas se encuentran en matrices
    con los nombres siguientes:
    
    Entrada -> self.Theta_0 -> Oculta
    Oculta  -> self.Theta_1 -> Salida
    """
    def __init__(self, n_entrada, n_ocultas, n_salidas):
        """
        Inicializa la red neuronal, con pesos Theta_0 y Theta_1 aleatorios,
        esta implementación debe incluir el uso de sesgos, por lo que éstos
        no se cuentan en los parámetros siguientes, puedes incluirlos como
        neuronas extra o en sus propias matrices, sólo sé consistente pues
        esto afectará tu implementación.
        
        :param n_entrada: número de datos de entrada (sin contar el sesgo)
        :param n_ocultas: número de neuronas ocultas
        :param n_salidas: número de nueronas de salida
        """
        self.Theta_0 = np.random.rand(n_entrada + 1, n_ocultas)
        self.Theta_1 = np.random.rand(n_ocultas + 1, n_salidas)
    
    def feed_forward(self, X, vector = None):
        """ Calcula las salidas, dados los datos de entrada en forma de matriz.
        Guarda los parámetros siguientes:
        A0: activaciones de la capa de entrada, ya con sesgos
        Z1: potenciales de la capa oculta, aún sin sesgo
        A1: activaciones de la capa oculta, ya con sesgos
        Z2: potenciales de la capa de salida
        A2: activaciones de la capa de salida
        
        :param vector: [opcional] se utilizarán los pesos indicados en este
                       vector en lugar de los pesos actuales de la red.
        """
        if vector is None:
            theta0 = self.Theta_0
            theta1 = self.Theta_1
        else:
            theta0, theta1 = self.reconstruct_matrices(vector)
        
        self.A0 = np.insert(X, 0, 1, axis=1)
        self.Z1 = np.dot(self.A0, theta0)
        self.A1 = 1 / (1 + np.exp(-self.Z1))
        self.A1 = np.insert(self.A1, 0, 1, axis=1)  # Añadir sesgo a la capa oculta
        self.Z2 = np.dot(self.A1, theta1)
        self.A2 = 1 / (1 + np.exp(-self.Z2))
        return
        
    def back_propagate(self, X, Y, lambda_r = 0.0):
        """ Calcula el error y su gradiente dados los pesos actuales de la red
        y los resultados esperados.
        
        Guarda el error en el atributo self.error y el gradiente en matrices
        self.Grad_1 y self.Grad_0, que tienen la misma forma de Theta_0 y Theta_1.
        
        :param X: matriz de entradas
        :param Y: matriz de salidas deseadas
        :param lambda_r: coeficiente de regularización
        """
        self.feed_forward(X)
        n = X.shape[0]
        error = (1/n) * np.sum(cross_entropy(Y, self.A2)) + (lambda_r / (2*n)) * (np.sum(np.square(self.Theta_0))
                                                                                  + np.sum(np.square(self.Theta_1))) 
        self.error = error
        delta_2 = Y - self.A2
        delta_1 = np.dot(delta_2, self.Theta_1[1:].T) * np.array(derivada_logistica_atajo(self.A1[:,1:]))

        grad_1 = - np.dot(self.A1[:,1:].T, delta_2) / n
        sesgo_1 = - np.sum(delta_2, axis = 0, keepdims = True) / n
        grad_0 = - np.dot(self.A0[:,1:].T, delta_1) / n
        sesgo_0 = - np.sum(delta_1, axis = 0, keepdims = True) / n
        
        grad_0 += (lambda_r / n) * self.Theta_1[1:]
        grad_0 += (lambda_r / n) * self.Theta_0[1:]
    
        self.Grad_1 = np.concatenate((sesgo_1, grad_1))
        self.Grad_0 = np.concatenate((sesgo_0, grad_0))
        
        return self.error
        
    def calc_error(self, X, Y, vector, lambda_r = 0.0):
        """
        Calcula el error que se cometería utilizando los pesos en 'vector' en lugar
        de los pesos actuales de la red.
        
        :returns: el error
        """
        theta_0, theta_1 = self.reconstruct_matrices(vector)
        self.feed_forward(X, vector)
        n = X.shape[0] 
        return 1/n * np.sum(cross_entropy(Y,self.A2)) + (lambda_r / (2*n)) * (np.sum(np.square(theta_0))
                                                                              + np.sum(np.square(theta_1)))
    
    def vector_weights(self):
        """
        Acomoda a todos los parámetros en las matrices de sesgos y pesos, en un solo vector.
        
        :returns: vector de parámetros
        """
        return np.concatenate((self.Theta_0.flatten(), self.Theta_1.flatten()))
    
    def reconstruct_matrices(self, vector):
        """
        Dado un vector, rearma matrices del tamaño de las matrices de sesgos y pesos.
        
        :returns: matrices de parámetros
        """
        n_oculta, n_entrada = self.Theta_0.shape
        n_salida, n_oculta_2 = self.Theta_1.shape
        
        fin_Theta_0 = n_oculta * n_entrada
        fin_Theta_1 = fin_Theta_0 + n_salida * n_oculta_2
        
        Theta_0 = np.reshape(vector[:fin_Theta_0], (n_oculta, n_entrada))
        Theta_1 = np.reshape(vector[fin_Theta_0:fin_Theta_1], (n_salida, n_oculta_2))
    
        return Theta_0, Theta_1
        
    def approx_gradient(self, X, Y, lambda_r = 0.0):
        """
        Aproxima el valor del gradiente alrededor de los pesos actuales,
        perturbando cada peso, uno por uno hasta estimar la variación alrededor
        de cada peso.
        
        En este método se itera sobre cada peso w:
        * Sea w - epsilon -> val1, se calcula el error e1 cometido por la red si w es
                                   reemplazado por val1.
        * Sea w + epsilon -> val2, se calcula el error e2 cometido por la red si w es
                                   reemplazado por val2.
        * La parcial correspondiente se estima como (val1 - val2)/(2 * epsilon)
        
        Este método sólo se utiliza para verificar que backpropagation esté bien
        implementado, ya que en la práctica es muy lento y menos preciso.
        
        :returns: matrices que tienen la misma forma de Theta_0 y Theta_1, donde
                  cada entrada es la estimación de la parcial del error con
                  respecto al peso correspondiente
        """
        aproximacion_gradiente_0 = np.zeros_like(self.Theta_0)
        aproximacion_gradiente_1 = np.zeros_like(self.Theta_1)
        epsilon = 0.0001
    
        for i in range(self.Theta_0.shape[0]):
            for j in range(self.Theta_0.shape[1]):
                aux = self.Theta_0[i, j]
                self.Theta_0[i, j] -= epsilon
                self.feed_forward(X)
                error1 = self.calc_error(X, Y, self.vector_weights(), lambda_r)   

                self.Theta_0[i, j] = aux
                self.Theta_0[i, j] += epsilon
                self.feed_forward(X)
                error2 = self.calc_error(X, Y, self.vector_weights(), lambda_r)

                self.Theta_0[i, j] = aux
                
                aproximacion_gradiente_0[i, j] = (error2 - error1) / (2 * epsilon)
    
        for i in range(self.Theta_1.shape[0]):
            for j in range(self.Theta_1.shape[1]):

                aux = self.Theta_1[i, j]
                self.Theta_1[i, j] -= epsilon
                self.feed_forward(X)
                error1 = self.calc_error(X, Y, self.vector_weights(), lambda_r)             

                self.Theta_1[i, j] = aux
                self.Theta_1[i, j] += epsilon 
                self.feed_forward(X)
                error2 = self.calc_error(X, Y, self.vector_weights(), lambda_r)
                
                self.Theta_1[i, j] = aux
                
                aproximacion_gradiente_1[i, j] = (error2 - error1) / (2 * epsilon)
    
        return aproximacion_gradiente_0, aproximacion_gradiente_1
        
    def gradient_descent(self, X, Y, alpha, ciclos=10, check_gradient = False, lambda_r = 0.0):
        """ Evalúa y ajusta los pesos de la red, de acuerdo a los datos en X y los resultados
        deseados en Y.  Al final grafica el error vs ciclo.  Si el entrenamiento es correcto
        el error debe descender por cada iteración (ciclo).
        
        :param X: datos de entrada
        :param Y: salidas deseadas
        :param alpha: taza de aprendizaje
        :param ciclos: número de veces que se realizarán ajustes para todo el conjunto de datos X
        :param check_gradient: se calculará el gradiente con backpropagation y con aproximación por
                               perturbaciones, imprimiendo los valores lado a lado para que puedan
                               ser comparados.
        :param lambda_r: coeficiente de regularización
        """
        errores_back = []
        errores_aprox = []
        for ciclo in range(ciclos):
            #self.feed_forward(X)
            self.back_propagate(X, Y, lambda_r)
            error_b = self.error
            errores_back.append(error_b)
            grad0, grad1 = self.Grad_0, self.Grad_1
            
            if check_gradient:    
                aproximacion_gradiente_0, aproximacion_gradiente_1 = self.approx_gradient(X, Y, lambda_r)
                error_p = self.calc_error(X,Y,self.vector_weights(), lambda_r)
                errores_aprox.append(error_p)
                print(f'Gradiente 0: {self.Grad_0}\n')
                print(f'Aproximacion 0: {aproximacion_gradiente_0}\n')
                print(f'Gradiente 1: {self.Grad_1}\n')
                print(f'Aproximación 1: {aproximacion_gradiente_1}\n')
            self.Theta_0 -= alpha * grad0
            self.Theta_1 -= alpha * grad1
            
        plt.plot(np.arange(ciclos), errores_back, label='Error Backpropagation')
        if check_gradient:
            plt.plot(np.arange(ciclos), errores_aprox, label='Error Aproximación')
            plt.legend()
        plt.xlabel('Ciclos')
        plt.ylabel('Error')
        plt.title('Errores vs Ciclo de Entrenamiento')
        plt.grid(True)
        plt.show()
            
    def print_output(self):
        """
        Muestra en pantalla los valores de salida obtenidos en la última ejecución de feed_forward.
        """
        if hasattr(self, 'A2'):
            print("Valores de salida:")
            print(self.A2)
        else:
            print("Aún no se ha ejecutado feed_forward.")


In [None]:
# Inicializar y entrenar la red
n_entrada = X_train.shape[1]
n_ocultas = 10 
n_salidas = 1

modelo = Multicapa(n_entrada, n_ocultas, n_salidas)
modelo.gradient_descent(X_train, y_train.values.reshape(-1, 1), alpha=0.01, ciclos=1000)


In [None]:
y_pred = modelo.predict(X_test).flatten()  

# Evaluar el modelo
print('Accuracy:', accuracy_score(y_test, y_pred))
print('Precision:', precision_score(y_test, y_pred))
print('Recall:', recall_score(y_test, y_pred))
print('F1 Score:', f1_score(y_test, y_pred))
