In [408]:
import numpy as np

def kernel_sigmoid(z):
    '''
    Función signomide o función logística, la cual tiene dominio en los 
    números reales e imágenes entre cero y uno.

    Parameters
    ----------
    z (int): Cualqueir número real.
    
    Returns
    ------    
    (int): Número entre cero y uno.
    '''    
    return 1 / (1 + np.exp(-z))



In [409]:
def forward_propagation(W, b, X, y):
    """
    Propagación hacia adelante, es dericr, calcula las predicciones del modelo y el costo asociado para un 
    conjunto dado de datos de entrada, utilizando los parámetros indicados W como peso y b como el sesgo.

    Parameters:
    -----------
    W (numpy.ndarray) : Vector de pesos de la regresión logística.
        
    b (float) : Sesgo de la regresión logística.
        
    X (numpy.ndarray): 
        Parámetro con la matriz de la variables caracteristicas. Cada fila representa una observacion, 
        y cada columna representa una variable (característica), es utilizado para trianing.
        
    y (numpy.ndarray) : Array de numpy (columna) con las estiquestas reales de los datos.

    Returns:
    --------
    A (numpy.ndarray): Array de numpy con las predicciones del modelo. Cada elemento del array representa la probabilidad
    de que el ejemplo correspondiente pertenezca a la clase positiva (una de las dos etiquetas reales).

        
    cost (float) : Valor de la función de costo calculado.
    """  
    
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
    # Calcula para cada entrada de X un combinación linea con los parámetros de la regresión W y b
    Z = np.dot(W, X.T) + b
    # Aplicar la función sigmoide a cada valor de z para obtener las predicciones
    A = kernel_sigmoid(Z)
    # Calculo de la funcion de costos de la regresion. Sirve para medir que tan equivocado estás
    cost = (- 1 / data_number) * np.sum(y * np.log(A) + (1 - y) * (np.log(1 - A)))
    #Retorna las predicciones del modelo y el costo asociado con esas predicciones. 
    return A, cost



In [410]:
def backward_propagation(X, A, y):
    """
    Se encargar de culcular los gredientes de parámetro W (peso) y b (sesgo), pasa así optimizar el costo del modelo.

    Parameters:
    -----------
    X (numpy.ndarray): Parámetro con la matriz de la variables caracteristicas. Cada fila representa una observacion, 
        y cada columna representa una variable (característica).
    A (numpy.ndarray): Valores predichos de la propagación hacia adelante.
    y (numpy.ndarray): Array de numpy (columna) con las estiquestas reales de los datos.

    Returns:
    --------
    dW (numpy.ndarray): Gradiente de la matriz de pesos.
    db (float): Gradiente del sesgo.
    """
    
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
    # los gradites indica la dirección y la magnitud en la que debemos ajustar los parámetros
    #Calcula el gradiente del array W (pesos) para minimizar el costo
    dW = (1 / data_number) * np.dot((A - y), X)
    #Calcula el gradiente del array b (sesgo) para minimizar el costo
    db = (1 / data_number) * np.sum(A - y)
    #Devuelve los gradites respectivos
    return dW, db




In [411]:
def optimize(W, b, X, y, num_iterations, learning_rate):
    """
    El método optimize ajusta iterativamente los parámetros del modelo utilizando el gradiente 
    descendente para minimizar el costo. Guarda los costos cada 100 iteraciones permite monitorear
    el proceso de entrenamiento y asegurarse de que el modelo está aprendiendo correctamente.
    
    Parameters:
    -----------
    W (numpy.ndarray): Vector de pesos de la regresión logística.
    b (float): Valor de sesgo.
    X (numpy.ndarray): Parámetro con la matriz de la variables caracteristicas. Cada fila representa una observacion, 
                       y cada columna representa una variable (característica).
    y (numpy.ndarray): Array de numpy (columna) con las estiquestas reales de los datos.
    num_iterations (int): Número de iteraciones para el bucle de optimización.
    learning_rate (float): Tasa de aprendizaje para el descenso de gradiente.

    Returns:
    --------
    params (dict): Diccionario que contiene los W (pesos) y el b (sesgo) optimizados.
    gradients (dict): Diccionario que contiene los gradientes finales de los pesos y el sesgo.
    costs (list): Lista de costos registrados durante el proceso de optimización.
    """
    #crea lista para guardar los costos.
    costs = []

    # For para ejecutar las actualizaciones segun el número de iteraciones especificado
    for i in range(num_iterations):
        #se ejecuta el metodo de propagacion hacia adelante con los parámetros ingresados
        A, cost = forward_propagation(W, b, X, y)
        #se ejecuta el metodo de propagacion hacia atras con los parámetros ingresados
        dW, db = backward_propagation(X, A, y)
        #Se modifica W con la tasa de aprendizaje indicada y el gradiente de W
        W = W - learning_rate * dW
        #Se modifica b con la tasa de aprendizaje indicada y el gradiente de b
        b = b - learning_rate * db
        #si la iteración es módulo 100 se guarda en la lista costs definida fura del for
        #Esto para ver con se va comportando los costos y si van disminuyendo o si se estancó.
        if i % 100 == 0:
            costs.append(cost)

    #Diccionario para guardar los valores finales de los parámetros
    params = {
        "W": W, 
        "b": b
    }
    #Diccionario para guardar los valores finales de los gradientes
    gradients = {
        "dW": dW,
        "db": db
    }
    #Devolver los diccionarios de los parámetros, gradientes y la lista de la evolución de los costos.
    return params, gradients, costs



In [412]:
def predict(W, b, X):
    """
    Este método realiza predicciones utilizando los pesos y el sesgo que aprendió.

    Parameters:
    -----------
    W (numpy.ndarray): Vector de pesos de la regresión logística.
    b (float): Valor de sesgo.
    X (numpy.ndarray): Parámetro con la matriz de la variables caracteristicas. Cada fila representa una observacion, 
                       y cada columna representa una variable (característica)

    Returns:
    --------
    y_prediction (numpy.ndarray): Etiquetas predichas (valores 0 o 1).
    """   
    #obtener el número de filas de los datos de training
    data_number = X.shape[0]
     #Inicializa un array a cero donde van a estar la predicciónes.
    y_prediction = np.zeros((1, data_number))
    # Calcula para cada entrada de X un combinación linea con los parámetros de la regresión W y b
    Z = np.dot(W, X.T) + b
    #aplica la función sigmoide en Z calculado anteriormente, obteniendo así las "activaciones" para cada entrada.
    A = kernel_sigmoid(Z)
    #for que recorre las activaciones de Z para generar las respectivas predicciones
    for i in range(A.shape[1]):
        #Es 1 cuando la activación es mayor que 0.5, sino se le asígna 0.
        y_prediction[0, i] = 1 if A[0, i] > 0.5 else 0
        
    #Retorna todas las predicciones
    return y_prediction

In [413]:
def model_regresion_logistico(X_train, y_train, X_val, y_val, num_iterations=2000, learning_rate=0.5):
    """
    Método que entrena un modelo de regresión logística y lo evalúa en los datos de entrenamiento y validación.

    Parameters:
    -----------
    X_train (numpy.ndarray): Partición de características seleccionadas para entrenamiento.
    y_train (numpy.ndarray): Partición para entrenamiento.
    X_val (numpy.ndarray): Partición de características para validación (testing).
    y_val (numpy.ndarray): Particioón para validación (testing).
    num_iterations (int): Número de iteraciones para el entrenamiento.
    learning_rate (float): Tasa de aprendizaje para el descenso de gradiente.

    Returns:
    --------
    resultados (dict): Diccionario que contiene la precisión en entrenamiento, la precisión en validación y el historial de los costos.
    """
    
    # Determinar el número de características
    dimensions = X_train.shape[1]
    # Inicializar los pesos y el sesgo a cero
    W = np.zeros(shape=(1, dimensions))
    b = 0
    
    # Optimizar los parámetros W y b utilizando los datos de entrenamiento
    params, gradients, costs = optimize(W, b, X_train, y_train, num_iterations, learning_rate)
    
    # Obtener los valores optimizados de W y b
    W = params["W"]
    b = params["b"]
    
    # Realizar predicciones en los datos de entrenamiento y validación
    y_prediction_train = predict(W, b, X_train)
    y_prediction_validation = predict(W, b, X_val)
    
    # Calcular el ajuste (precisión) del modelo en los datos de entrenamiento y validación
    ajuste_entrenamiento = 100 - np.mean(np.abs(y_prediction_train - y_train)) * 100
    ajuste_val = 100 - np.mean(np.abs(y_prediction_validation - y_val)) * 100
    
    # Crear un diccionario con los resultados
    resultados = {
        "Ajuste entrenamiento": ajuste_entrenamiento,
        "Ajuste testeo": ajuste_val,
        "Costo en proceso": costs
    }
    
    # Retornar el diccionario con los resultados
    return resultados



# Ejecución de las 10 corridas del código

## Código Original

In [414]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import time

def kernel_sigmoid(z):
    return 1 / (1 + np.exp(-z))

def forward_propagation(W, b, X, y):
    data_number = X.shape[0]
    Z = np.dot(W, X.T) + b
    A = kernel_sigmoid(Z)
    cost = (-1 / data_number) * np.sum(y * np.log(A) + (1 - y) * (np.log(1 - A)))
    return A, cost

def backward_propagation(X, A, y):
    data_number = X.shape[0]
    dW = (1 / data_number) * np.dot((A - y), X)
    db = (1 / data_number) * np.sum(A - y)
    return dW, db

def optimize(W, b, X, y, num_iterations, learning_rate):
    costs = []
    for i in range(num_iterations):
        A, cost = forward_propagation(W, b, X, y)
        dW, db = backward_propagation(X, A, y)
        W = W - learning_rate * dW
        b = b - learning_rate * db
        if i % 100 == 0:
            costs.append(cost)
    params = {"W": W, "b": b}
    gradients = {"dW": dW, "db": db}
    return params, gradients, costs

def predict(W, b, X):
    Z = np.dot(W, X.T) + b
    A = kernel_sigmoid(Z)
    y_prediction = (A > 0.5).astype(int)
    return y_prediction

def model_regresion_logistico1(X_train, y_train, X_val, y_val, num_iterations=2000, learning_rate=0.5):
    dimensions = X_train.shape[1]
    W = np.zeros((1, dimensions))
    b = 0
    params, gradients, costs = optimize(W, b, X_train, y_train, num_iterations, learning_rate)
    W = params["W"]
    b = params["b"]
    
    y_prediction_train = predict(W, b, X_train)
    y_prediction_validation = predict(W, b, X_val)
    
    lista = {
        "Ajuste entrenamiento": 100 - np.mean(np.abs(y_prediction_train - y_train)) * 100,
        "Ajuste testeo": 100 - np.mean(np.abs(y_prediction_validation - y_val)) * 100,
        "Costo en proceso": costs
    }
    return lista

# Datos y las transformaciones
datos = pd.read_csv("Diabetes.txt")
X = np.array(datos.drop(["Outcome"], axis=1))
y = np.array(datos["Outcome"])
X = (X - np.min(X)) / (np.max(X) - np.min(X))

# Separa la muestra
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.20, random_state=None)

# Medir el tiempo de las 10 ejecuciones
tiempos_ori = []
for i in range(10):
    inicio = time.time()
    model_regresion_logistico1(X_train, y_train, X_val, y_val, num_iterations=1000, learning_rate=0.003)
    fin = time.time()
    tiempos_ori.append((i + 1, fin - inicio))

tiempos_original = pd.DataFrame({
    "Run": [tiempo[0] for tiempo in tiempos_ori],
    "Original": [tiempo[1] for tiempo in tiempos_ori]
})

tiempos_original



Unnamed: 0,Run,Original
0,1,0.048993
1,2,0.049001
2,3,0.051001
3,4,0.050002
4,5,0.05
5,6,0.046
6,7,0.055002
7,8,0.046
8,9,0.045001
9,10,0.053063


## Optimizado

In [420]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import time

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def model_regresion_logistico2(X_train, y_train, X_val, y_val, num_iterations=1000, learning_rate=0.01, batch_size=64):
    dimensions = X_train.shape[1]
    W = np.zeros(dimensions)
    b = 0
    data_number = X_train.shape[0]
    
    costs = []
    for i in range(num_iterations):
        Z = np.dot(X_train, W) + b
        A = sigmoid(Z)
        
        cost = (-1 / data_number) * np.sum(y_train * np.log(A) + (1 - y_train) * np.log(1 - A))
        
        dW = (1 / data_number) * np.dot(X_train.T, (A - y_train))
        db = (1 / data_number) * np.sum(A - y_train)
        
        W -= learning_rate * dW
        b -= learning_rate * db
        
        if i % 100 == 0:
            costs.append(cost)

    #precalcalcular parámetros de la funcion
    Z_train = np.dot(X_train, W) + b
    Z_val = np.dot(X_val, W) + b
    #Y luego vectorizar la función predicción evitando un ciclo for
    y_prediction_train = sigmoid(Z_train) >= 0.5
    y_prediction_validation = sigmoid(Z_val) >= 0.5
    
    #No usar diccionario y ejecutar las operaciones y resultados en el return
    return 100 - np.mean(np.abs(y_prediction_train - y_train)) * 100, 100 - np.mean(np.abs(y_prediction_validation - y_val)) * 100, costs

# Datos y las transformaciones
datos = pd.read_csv("Diabetes.txt")
X = np.array(datos.drop(["Outcome"], axis=1))
y = np.array(datos["Outcome"])
X = (X - np.min(X, axis=0)) / (np.max(X, axis=0) - np.min(X, axis=0))

# Separa la muestra
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.20, random_state=None)

# Medir el tiempo de las 10 ejecuciones
tiempos_opti = []
for i in range(10):
    inicio = time.time()
    ajuste_entrenamiento, ajuste_testeo, costs = model_regresion_logistico2(X_train, y_train, X_val, y_val, num_iterations=1000, learning_rate=0.01)
    fin = time.time()
    tiempos_opti.append((i + 1, fin - inicio))

tiempos_optimizado = pd.DataFrame({
    "Run": [tiempo[0] for tiempo in tiempos_opti],
    "Optimizado": [tiempo[1] for tiempo in tiempos_opti]
})

tiempos_optimizado


Unnamed: 0,Run,Optimizado
0,1,0.046
1,2,0.048049
2,3,0.041368
3,4,0.041913
4,5,0.043002
5,6,0.040827
6,7,0.049999
7,8,0.039003
8,9,0.038052
9,10,0.039947


## Sklearn

In [416]:

from sklearn.linear_model import LogisticRegression


# Datos y transformaciones
datos = pd.read_csv("Diabetes.txt")
X = np.array(datos.drop(["Outcome"], axis=1))
y = np.array(datos["Outcome"])
X = (X - np.min(X)) / (np.max(X) - np.min(X))

# Separa la muestra
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.20, random_state=42)

# Medir tiempo del modelo LogisticRegression en 10 ejecuciones
tiempos_sklearn = []
for i in range(10):
    inicio = time.time()
    modelo = LogisticRegression(max_iter=1000)
    modelo.fit(X_train, y_train)
    fin = time.time()
    tiempos_sklearn.append((i + 1, fin - inicio))

# Resultados
tiempos_sklearn = pd.DataFrame({
    "Run": [tiempo[0] for tiempo in tiempos_sklearn],
    "Sklearn": [tiempo[1] for tiempo in tiempos_sklearn]
})

tiempos_sklearn


Unnamed: 0,Run,Sklearn
0,1,0.002962
1,2,0.002078
2,3,0.00392
3,4,0.002048
4,5,0.002953
5,6,0.002047
6,7,0.003007
7,8,0.002945
8,9,0.001999
9,10,0.003


## Tabla Resumen

In [421]:
# Extraer columnas de cada df de los tiempos de ejecución
df1 = tiempos_original[['Run', 'Original']]
df2 = tiempos_optimizado[['Optimizado']]
df3 = tiempos_sklearn[['Sklearn']]

# Concatenar las columnas extraídas una al lado de la otra
df_colums = pd.concat([df1, df2, df3], axis=1)

# Crear observación promedio
fila_prom = pd.DataFrame({
    'Run': ['Media'],
    'Original': [df1['Original'].mean()],
    'Optimizado': [df2['Optimizado'].mean()],
    'Sklearn': [df3['Sklearn'].mean()]
})

# Concatenar la fila de promedios al DataFrame
df_resumen = pd.concat([df_colums, fila_prom], axis=0, ignore_index=True)

df_resumen

Unnamed: 0,Run,Original,Optimizado,Sklearn
0,1,0.048993,0.046,0.002962
1,2,0.049001,0.048049,0.002078
2,3,0.051001,0.041368,0.00392
3,4,0.050002,0.041913,0.002048
4,5,0.05,0.043002,0.002953
5,6,0.046,0.040827,0.002047
6,7,0.055002,0.049999,0.003007
7,8,0.046,0.039003,0.002945
8,9,0.045001,0.038052,0.001999
9,10,0.053063,0.039947,0.003



### Conclusiones:
    1. El tener mayor cantidad de funciónes puede ser mas "ordenado" pero es menos óptimo
    2. Entre mas operaciones entre objetes de una misma librería haga es mejor, pues estos están optimizacos entre sí.
    3. Vectorizar funciónes de ciclos disminuye de manera evidente el tiempo de ejecución
    4. Las librería de modelos de python está muy optimizados las cuales es difícil crear un código con el tiempo de ejución que estos presentan.
    5. Entre más iteraciones se pierde la ambiguedad del tiempo y muestra más claro de cual es más optimo que otro.


### Modificaciones que redujerfon el tiempo:
    1. Primero lo que hice fue reducir el número de métodos externos en el modelo final, no obstante si dejé algunas ya que quitarlas implicaba hacerlo más lento.
    2. La función predict la sustituí completamente por una versión vectorizada y sin for, y también inicializaba variables que estaban dentro de for de estas desde afuera e ingresarla como parámetro para evitar su multiple declaración.
    3. Se quitó el diccionario de return y se devolvió en vector los resultados y los cuales no se definieron anteriormente, sino que en el return.