## Dataset

En las siguientes celdas se importa el dataset y se prepara para la implementación de los modelos de aprendizaje.

In [1]:
import pandas as pd
import kagglehub

path = kagglehub.dataset_download("dragonheir/logistic-regression")

print("Path to dataset files:", path)
dataset = pd.read_csv(r'C:\Users\FLopezP\.cache\kagglehub\datasets\dragonheir\logistic-regression\versions\1\Social_Network_Ads.csv')

Path to dataset files: C:\Users\FLopezP\.cache\kagglehub\datasets\dragonheir\logistic-regression\versions\1


In [2]:
# Female = 1
# Male = 0
aux = []
for i in range(len(dataset["Gender"])):
    if dataset["Gender"][i] == "Female":
        aux.append(1)
    else:
        aux.append(0)

dataset["GenderNum"] = aux
dataset = dataset.loc[:,["User ID", "Gender", "GenderNum", "Age", "EstimatedSalary", "Purchased"]]
dataset

Unnamed: 0,User ID,Gender,GenderNum,Age,EstimatedSalary,Purchased
0,15624510,Male,0,19,19000,0
1,15810944,Male,0,35,20000,0
2,15668575,Female,1,26,43000,0
3,15603246,Female,1,27,57000,0
4,15804002,Male,0,19,76000,0
...,...,...,...,...,...,...
395,15691863,Female,1,46,41000,1
396,15706071,Male,0,51,23000,1
397,15654296,Female,1,50,20000,1
398,15755018,Male,0,36,33000,0


In [3]:
# train test split
ds_train = dataset[0:280]
ds_test = dataset[280:400].reset_index()
ds_test = ds_test.drop(columns = ["index"])
labels_train = ds_train["Purchased"]
labels_test = ds_test["Purchased"].reset_index()

## Regresión Logística

Buscamos predecir si dadas 3 características (Género, Edad, Salario Estimado) se compra un elemento.

In [4]:
# Dimensiones:
# Vector de entrada: (M/F, Edad, Salario)
# Vector de pesos: (a, b, c)^T
# Sesgo: d
# z = Entrada.Pesos + Sesgo
# Proba = 1/(1+e^-z)

import numpy as np
def mix_char(ds):
    """
    ds = DataFrame, en este caso asumimos que tiene las características adecuadas del problema

    return: lista de características normalizadas
    """
    df = ds.drop(columns = ["User ID", "Gender"])
    for column in df.columns:
        if column != "GenderNum":
            df[column] = df[column] / df[column].max()
    
    char = []
    for i in range(len(ds)):
        aux = [df["GenderNum"][i], df["Age"][i], df["EstimatedSalary"][i]]
        arr_aux = np.array(aux)
        arr_aux = np.reshape(arr_aux, (1,3))
        char.append(arr_aux)
    return char

In [5]:
#Tenemos los conjuntos de entrenamiento ya agrupados. Ahora tenemos que realizar la multiplicación por los pesos.
train_char = mix_char(ds_train)
test_char = mix_char(ds_test)

print(train_char[0], test_char[0])

[[0.         0.31666667 0.12666667]] [[1.         0.98333333 0.61111111]]


In [6]:
def logit(train_instance, weight, bias):
    """
    train_instance = Vector único de 1x3.
    weight = Vector de pesos (1x3)
    bias = Vector del sesgo

    returns logit del vector
    """
    weight = weight.reshape(3,1)
    z = np.dot(train_instance, weight) + bias
    log = 1 / (1 + np.exp(-z))
    return log[0][0]

def cross_entropy_pog(y, logit):
    """
    y = valor del label
    muestra = logit de un valor del dataset

    returns CrossEntropy(Label, Muestra)
    """
    cross_entropy = -((y*np.log(logit)) + ((1-y)*np.log(1-logit)))
    return cross_entropy

In [7]:
def logistic_regression_w_b(lr, labels, train, epochs):
    """
    lr = learning rate
    labels = labels de entrenamiento
    train = conjunto de datos de entrenamiento
    epochs = épocas de entrenamiento

    returns w, bias los vectores de peso y sesgo
    """
    w = np.zeros((1,3))
    bias = np.random.rand(1)
    labels = labels
    train = train
    for i in range(epochs):
        for i in range(len(train)):
            a = logit(train[i], w, bias) # Predicción del modelo
            ce_loss = cross_entropy_pog(labels[i], a)
            grad = (a - labels[i])*train[i]
            grad_bias = (a - labels[i])
            w -= lr*grad
            bias -= lr*grad_bias
    return w, bias

In [8]:
w_, b_ = logistic_regression_w_b(0.05, labels_train, train_char, 25)
print(w_, b_)

[[-0.11691264  4.95959305  4.3863788 ]] [-5.89279336]


In [9]:
eval = [logit(i, w_, b_) for i in test_char]
eval_bin = []
for i in eval:
    if i >= 0.5:
        eval_bin.append(1)
    else:
        eval_bin.append(0)

In [10]:
test_labels_perrones = [i for i in labels_test["Purchased"]]
print(len(test_labels_perrones), len(eval_bin))

120 120


In [11]:
def acc_f1(labels, eval):
    """
    labels = conjunto de labels
    eval = conjunto de predicciones del modelo
    """
    tp, tn, fp, fn = 0, 0, 0, 0
    for i in range(len(labels)):
        if labels[i] == 1 and eval[i] == 1:
            tp += 1
        elif labels[i] == 0 and eval[i] == 1:
            fp += 1
        elif labels[i] == 1 and eval[i] == 0:
            fn += 1
        elif labels[i] == 0 and eval[i] == 0:
            tn +=1
    acc = (tp+tn)/(tp+tn+fp+fn)
    f1 = (2*tp)/(2*tp + fp +fn)
    print(f"Verdaderos Positivos: {tp}, Verdaderos Negativos: {tn}")
    print(f"Falsos Positivos: {fp}, Falsos Negativos: {fn}")
    print(f"Accuracy: {acc}")
    print(f"F1: {f1}")

In [12]:
acc_f1(test_labels_perrones, eval_bin)

Verdaderos Positivos: 42, Verdaderos Negativos: 42
Falsos Positivos: 4, Falsos Negativos: 32
Accuracy: 0.7
F1: 0.7


In [13]:
# Esta celda solo se hace para comparar
import sklearn
from sklearn import metrics
print(metrics.classification_report(test_labels_perrones, eval_bin))
print(metrics.confusion_matrix(test_labels_perrones, eval_bin)) #Algo no me encanta de los resultados cawn

              precision    recall  f1-score   support

           0       0.57      0.91      0.70        46
           1       0.91      0.57      0.70        74

    accuracy                           0.70       120
   macro avg       0.74      0.74      0.70       120
weighted avg       0.78      0.70      0.70       120

[[42  4]
 [32 42]]


## Red Neuronal

La arquitectura de esta red neuronal tendrá 3 valores de entrada, uno por cada valor del dataset. Tendremos **una** capa oculta de **n** unidades, y finalmente una salida binaria.

In [14]:
class BNU:
    """
    Esta clase busca implementar una neurona. Las características de cada neurona serán los valores de entrada, 
    el peso asociado, y el sesgo asociado. Si bien se tendría que tener una matriz, al considerar cada neurona
    con su vector de pesos y sesgos, se puede tener un procesamiento aislado que permite el reajuste de pesos.
    (No sé si sea una implementación correcta, xd)
    """
    def __init__(self, *inputs):
        self.inputs = inputs
        self.weight = np.random.rand(1,3) # Bendiciones a Daniela por la ayuda.
        self.bias = np.random.rand(1)
        
    def logit(self):
        """
        Calcula el valor de salida de cada neurona con función de activación sigmoide.
        (En otra implementación se tendría con funciones más interesantes como RELU, GELU.)
        """
        input_vector = np.array(self.inputs)
        peso = self.weight.reshape(3,1)
        z = np.dot(input_vector, peso) + self.bias
        log = 1 / (1 + np.exp(-z))
        return log[0]  

In [15]:
# Definimos los valores de entrada de la red y de cada capa.
# Debe de haber una forma más sencilla de resolver esto, pero mira XD.

aux_label = 0
lr = 0.3
a, b, c = 0, 0, 0
epochs = 15

#Inicialización de la red neuronal
c1 = BNU(a, b, c)
c2 = BNU(a, b, c)
c3 = BNU(a, b, c)
c4 = BNU(c1.logit(), c2.logit(), c3.logit())
c5 = BNU(c1.logit(), c2.logit(), c3.logit())
c6 = BNU(c1.logit(), c2.logit(), c3.logit())
c7 = BNU(c4.logit(), c5.logit(), c6.logit())

red_neuronal = [c1, c2, c3, c4, c5, c6, c7]

# Esto inicia el periodo de entrenamiento de la red.
for epoch in range(epochs):
    for i in train_char:
        label = labels_train[aux_label]
        
        inp1, inp2, inp3 = i[0]
        
        c1.inputs = inp1, inp2, inp3
        c2.inputs = inp1, inp2, inp3
        c3.inputs = inp1, inp2, inp3
        
        c4.inputs = c1.logit(), c2.logit(), c3.logit()
        c5.inputs = c1.logit(), c2.logit(), c3.logit()
        c6.inputs = c1.logit(), c2.logit(), c3.logit()
        
        c7.inputs = c4.logit(), c5.logit(), c6.logit()
    
        #Parte del entrenamiento
        pred = c7.logit()  #Output de la última celda
        ce_loss = cross_entropy_pog(label, pred)
        grad = (a - label)*i
        grad_bias = (a - label)
    
        for j in red_neuronal:
            j.weight -= lr*grad
            j.bias -= lr*grad_bias

    print(f"Epoch: {epoch}, Loss: {ce_loss}")
    aux_label += 1

Epoch: 0, Loss: 1.8463149308453826
Epoch: 1, Loss: 1.8463149308453826
Epoch: 2, Loss: 1.8463149308453826
Epoch: 3, Loss: 1.8463149308453826
Epoch: 4, Loss: 1.8463149308453826
Epoch: 5, Loss: 1.8463149308453826
Epoch: 6, Loss: 1.8463149308453826
Epoch: 7, Loss: nan
Epoch: 8, Loss: inf
Epoch: 9, Loss: inf
Epoch: 10, Loss: inf
Epoch: 11, Loss: inf
Epoch: 12, Loss: inf
Epoch: 13, Loss: inf
Epoch: 14, Loss: inf


  cross_entropy = -((y*np.log(logit)) + ((1-y)*np.log(1-logit)))
  cross_entropy = -((y*np.log(logit)) + ((1-y)*np.log(1-logit)))


In [16]:
# Evaluación de la red

aux_label = 0
eval_rn = []

for i in test_char:
    i1, i2, i3 = i[0]
    label = test_labels_perrones[aux_label]
    
    c1.inputs = i1, i2, i3
    c2.inputs = i1, i2, i3
    c3.inputs = i1, i2, i3
    
    c4.inputs = c1.logit(), c2.logit(), c3.logit()
    c5.inputs = c1.logit(), c2.logit(), c3.logit()
    c6.inputs = c1.logit(), c2.logit(), c3.logit()
    
    c7.inputs = c4.logit(), c5.logit(), c6.logit()
    pred = c7.logit()

    if pred >= 0.5:
        eval_rn.append(1)
    else:
        eval_rn.append(0)

In [17]:
# Predice maaaaaaaaaaaaaaaaaaaaaaaaaaaaaaal, todo es positivo según mi querida red neuronal.
# No sé qué pingas hice mal. 
# Bueno sí sé, retropropagación, ¿pero cómo rayos implemento eso?
acc_f1(test_labels_perrones, eval_rn)

Verdaderos Positivos: 74, Verdaderos Negativos: 0
Falsos Positivos: 46, Falsos Negativos: 0
Accuracy: 0.6166666666666667
F1: 0.7628865979381443


**Dudas**

1. No hay un algoritmo de retropropagación debido a que no encuentro una forma de relacionar las neuronas dentro de mi red más allá del input. ¿Qué mejoras se le podrían hacer a la clase de BNU para lidiar con esto?
2. ¿Cómo se calculan las derivadas parciales en cada caso?