In [10]:
import numpy as np

def kernel_sigmoid(z):
    '''
    Función signomide o función logística, la cual tiene dominio en los 
    números reales e imágenes entre cero y uno.

    Parameters
    ----------
    z (int): Cualqueir número real.
    
    Returns
    ------    
    (int): Número entre cero y uno.
    '''    
    return 1 / (1 + np.exp(-z))



In [12]:
def forward_propagation(W, b, X, y):
    """
    Propagación hacia adelante, es dericr, calcula las predicciones del modelo y el costo asociado para un 
    conjunto dado de datos de entrada, utilizando los parámetros indicados W como peso y b como el sesgo.

    Parameters:
    -----------
    W (numpy.ndarray) : Vector de pesos de la regresión logística.
        
    b (float) : Sesgo de la regresión logística.
        
    X (numpy.ndarray): 
        Parámetro con la matriz de la variables caracteristicas. Cada fila representa una observacion, 
        y cada columna representa una variable (característica), es utilizado para trianing.
        
    y (numpy.ndarray) : Array de numpy (columna) con las estiquestas reales de los datos.

    Returns:
    --------
    A (numpy.ndarray): Array de numpy con las predicciones del modelo. Cada elemento del array representa la probabilidad
    de que el ejemplo correspondiente pertenezca a la clase positiva (una de las dos etiquetas reales).

        
    cost (float) : Valor de la función de costo calculado.
    """  
    
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
    # Calcula para cada entrada de X un combinación linea con los parámetros de la regresión W y b
    Z = np.dot(W, X.T) + b
    # Aplicar la función sigmoide a cada valor de z para obtener las predicciones
    A = kernel_sigmoid(Z)
    # Calculo de la funcion de costos de la regresion. Sirve para medir que tan equivocado estás
    cost = (- 1 / data_number) * np.sum(y * np.log(A) + (1 - y) * (np.log(1 - A)))
    #Retorna las predicciones del modelo y el costo asociado con esas predicciones. 
    return A, cost



In [None]:
def backward_propagation(X, A, y):
    
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
    # los gradites indica la dirección y la magnitud en la que debemos ajustar los parámetros
    #Calcula el gradiente del array W (pesos) para minimizar el costo
    dW = (1 / data_number) * np.dot((A - y), X)
    #Calcula el gradiente del array b (sesgo) para minimizar el costo
    db = (1 / data_number) * np.sum(A - y)
    #Devuelve los gradites respectivos
    return dW, db




In [None]:
def optimize(W, b, X, y, num_iterations, learning_rate):
    """
    la función optimize ajusta iterativamente los parámetros del modelo utilizando el gradiente 
    descendente para minimizar el costo. Guardar los costos cada 100 iteraciones permite monitorear
    el proceso de entrenamiento y asegurarse de que el modelo está aprendiendo correctamente.
    """
    
    #crea lista para guardar los costos.
    costs = []

    # For para ejecutar las actualizaciones segun el número de iteraciones especificado
    for i in range(num_iterations):
        #se ejecuta el metodo de propagacion hacia adelante con los parámetros ingresados
        A, cost = forward_propagation(W, b, X, y)
        #se ejecuta el metodo de propagacion hacia atras con los parámetros ingresados
        dW, db = backward_propagation(X, A, y)
        #Se modifica W con la tasa de aprendizaje indicada y el gradiente de W
        W = W - learning_rate * dW
        #Se modifica b con la tasa de aprendizaje indicada y el gradiente de b
        b = b - learning_rate * db
        #si la iteración es módulo 100 se guarda en la lista costs definida fura del for
        #Esto para ver con se va comportando los costos y si van disminuyendo o si se estancó.
        if i % 100 == 0:
            costs.append(cost)

    #Diccionario para guardar los valores finales de los parámetros
    params = {
        "W": W, 
        "b": b
    }
    #Diccionario para guardar los valores finales de los gradientes
    gradients = {
        "dW": dW,
        "db": db
    }
    #Devolver los diccionarios de los parámetros, gradientes y la lista de la evolución de los costos.
    return params, gradients, costs



In [13]:
def predict(W, b, X):
    
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
     #Inicializa un array a cero donde van a estar la predicciónes.
    y_prediction = np.zeros((1, data_number))
    # Calcula para cada entrada de X un combinación linea con los parámetros de la regresión W y b
    Z = np.dot(W, X.T) + b
    #aplica la función sigmoide en Z calculado anteriormente, obteniendo así las "activaciones" para cada entrada.
    A = kernel_sigmoid(Z)
    #for que recorre las activaciones de Z para generar las respectivas predicciones
    for i in range(A.shape[1]):
        #Es 1 cuando la activación es mayor que 0.5, sino se le asígna 0.
        y_prediction[0, i] = 1 if A[0, i] > 0.5 else 0
        
    #Retorna todas las predicciones
    return y_prediction

In [None]:
def model_regresion_logistico(X_train, y_train, X_val, y_val, num_iterations=2000, learning_rate=0.5):
    dimensions = X_train.shape[1]
    W = np.zeros(shape=(1, dimensions))
    b = 0
    params, gradients, costs = optimize(W, b, X_train, y_train, num_iterations, learning_rate)
    W = params["W"]
    b = params["b"]
    y_prediction_validation = predict(W, b, X_val)
    y_prediction_train = predict(W, b, X_train)
    lista = {
        "Ajuste entrenamiento": 100 - np.mean(np.abs(y_prediction_train - y_train)) * 100,
        "Ajuste testeo": 100 - np.mean(np.abs(y_prediction_validation - y_val)) * 100,
        "Costo en proceso": costs
    }
    return lista
