# Red hecha a mano

In [29]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

df = pd.read_csv('clima_munich_limpio.csv')

X = df.iloc[:, 0:11].values
Y = df.iloc[:, -1].values
scaler = StandardScaler()
X = scaler.fit_transform(X)


# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/3)

# Número de registros de entrenamiento
n = X_train.shape[0]
print('Cantidad de filas de entrenamiento: ', n)
# Construir red neuronal con pesos y sesgos inicializados aleatoriamente
leaky_relu = lambda x: np.where(x > 0, x, x * 0.01)
logistic = lambda x: 1 / (1 + np.exp(-x))

np.random.seed(453599)
w_hidden = (np.random.rand(4, 11)*2)-1      
w_hidden2 = (np.random.rand(4, 4)*2)-1   
w_output = (np.random.rand(1, 4)*2)-1         

b_hidden = (np.random.rand(4, 1)*2)-1         
b_hidden2 = (np.random.rand(4, 1)*2)-1        
b_output = (np.random.rand(1, 1)*2)-1         

# Ejecutar entradas a través de la red neuronal para obtener salidas predichas
def forward_prop(X):
    Z1 = w_hidden @ X + b_hidden        
    A1 = leaky_relu(Z1)
    Z2 = w_hidden2 @ A1 + b_hidden2     
    A2 = leaky_relu(Z2)
    Z3 = w_output @ A2 + b_output       
    A3 = logistic(Z3)
    return Z1, A1, Z2, A2, Z3, A3

# Calculo de precisión
def precision(X, Y):
    test_predictions = forward_prop(X.transpose())[5]
    test_comparisons = np.equal((test_predictions >= .5).flatten().astype(int), Y)
    accuracy = sum(test_comparisons.astype(int) / X.shape[0])
    print("Porcentaje de aciertos: ", (accuracy*100).round(2))

print('Pre entrenamiento: \n')
print('Test')
precision(X_test, Y_test)
print('Train')
precision(X_train, Y_train)

# Se realiza el descenso de gradiente y calculo la red entrenada

# Tasa de aprendizaje
L = 0.01

# Derivadas de las funciones de activación
d_leaky_relu = lambda x: np.where(x > 0, x, 0.01) 
d_logistic = lambda x: np.exp(-x) / (1 + np.exp(-x)) ** 2

# Función de backward propagation
def backward_prop(Z1, A1, Z2, A2, Z3, A3, X, Y):
    dC_dA3 = 2 * (A3 - Y)           
    dA3_dZ3 = d_logistic(Z3)
    dZ3_dW3 = A2
    dZ3_dA2 = w_output
    dC_dZ3 = dC_dA3 * dA3_dZ3

    dC_dA2 = dZ3_dA2.T @ dC_dZ3
    dA2_dZ2 = d_leaky_relu(Z2)
    dZ2_dW2 = A1
    dZ2_dA1 = w_hidden2
    dC_dZ2 = dC_dA2 * dA2_dZ2

    dC_dA1 = dZ2_dA1.T @ dC_dZ2
    dA1_dZ1 = d_leaky_relu(Z1)
    dZ1_dW1 = X
    dC_dZ1 = dC_dA1 * dA1_dZ1

    dC_dW3 = dC_dZ3 @ dZ3_dW3.T
    dC_dB3 = np.sum(dC_dZ3, axis=1, keepdims=True)

    dC_dW2 = dC_dZ2 @ dZ2_dW2.T
    dC_dB2 = np.sum(dC_dZ2, axis=1, keepdims=True)

    dC_dW1 = dC_dZ1 @ dZ1_dW1.T
    dC_dB1 = np.sum(dC_dZ1, axis=1, keepdims=True)
    
    return dC_dW1, dC_dB1, dC_dW2, dC_dB2, dC_dW3, dC_dB3

for i in range(150_000):
    # seleccionar aleatoriamente uno de los datos de entrenamiento
    idx = np.random.choice(n, 1, replace=False)
    X_sample = X_train[idx].transpose()
    Y_sample = Y_train[idx]

    # pasar datos seleccionados aleatoriamente a través de la red neuronal
    Z1, A1, Z2, A2, Z3, A3 = forward_prop(X_sample)

    # distribuir error a través de la retropropagación
    # y devolver pendientes para pesos y sesgos
    dW1, dB1, dW2, dB2, dW3, dB3 = backward_prop(Z1, A1, Z2, A2, Z3, A3, X_sample, Y_sample)

    # actualizar pesos y sesgos
    w_hidden -= L * dW1
    b_hidden -= L * dB1
    w_hidden2 -= L * dW2
    b_hidden2 -= L * dB2
    w_output -= L * dW3
    b_output -= L * dB3

# Cálculo de precisión
print('Post entrenamiento: \n')
print('Test')
precision(X_test, Y_test)
print('Train')
precision(X_train, Y_train)


Cantidad de filas de entrenamiento:  1820
Pre entrenamiento: 

Test
Porcentaje de aciertos:  61.69
Train
Porcentaje de aciertos:  60.49
Post entrenamiento: 

Test
Porcentaje de aciertos:  96.71
Train
Porcentaje de aciertos:  97.75


# Red de libreria

In [31]:
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

df = pd.read_csv('clima_munich_limpio.csv')

# Extraer variables de entrada (todas las filas, todas las columnas menos la última)
X = (df.values[:, :-1])

# Extraer columna de salida (todas las filas, última columna)
Y = df.values[:, -1]

scaler = StandardScaler()
X = scaler.fit_transform(X)

# Separar los datos de entrenamiento y prueba
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/3)

#red
nn = MLPClassifier(solver='adam',
                   hidden_layer_sizes=(100, 100, ),
                   activation='relu',
                   max_iter=150_000,
                   learning_rate_init=.01)

#entrenamiento
nn.fit(X_train, Y_train)

print("Porcentaje de aciertos con train: ", (nn.score(X_train, Y_train)*100))
print("Porcentaje de aciertos con test: ", (nn.score(X_test, Y_test)*100))


Porcentaje de aciertos con train:  98.57142857142858
Porcentaje de aciertos con test:  96.26783754116356
