In [1]:
import numpy as np

def sigmoide(beta, X):     
    return 1.0/(1 + np.exp(-np.dot(X, beta.T))) 


def costo(beta, X, y): 
    
    log_func_v = sigmoide(beta, X) 
    y = np.squeeze(y)     
    final = -(y * np.log(log_func_v) ) - ((1 - y) * np.log(1 - log_func_v)) 
    return np.mean(final) 
  
  
def gradiente(beta, X, y):     
    grad_inic = sigmoide(beta, X) - y.reshape(X.shape[0], -1) 
    grad = np.dot(grad_inic.T, X) 
    return grad 
  
  
def gradienteDescendente(X, y, beta, alpha ): 
    
    Costo = costo(beta, X, y) 
    CostoActual = 1
    
    cambioConvergencia = 0.001
      
    while(CostoActual > cambioConvergencia): 
        CostoAnt = Costo 
        beta = beta - (alpha * gradiente(beta, X, y)) 
        Costo = costo(beta, X, y) 
        CostoActual = CostoAnt - Costo        
      
    return beta  
  
  
def predecir(beta, X):     
    probabilidad = sigmoide(beta, X) 
    resultado = np.where(probabilidad >= .5, 1, 0) 
    return np.squeeze(resultado)


def normalizar(X):     
    minimo = np.min(X, axis = 0) 
    maximo = np.max(X, axis = 0) 
    aleat = maximo - minimo 
    Xnorm = 1 - ((maximo - X)/aleat) 
    return Xnorm  


def comparar(prediccion,Y):
    TP = 0
    FP = 0
    TN = 0
    FN = 0

    for i in range(len(Y)):
        if(int(prediccion[i]) == 1 & int(Y[i]) == 1):
            TP += 1
        elif(int(prediccion[i]) == 1 & int(Y[i]) == 0):
            FP += 1
        elif(int(prediccion[i]) == 0 & int(Y[i]) == 0):
            TN += 1
        else:
            FN += 0
    precision = TP / (TP + FP)
    recall = TP / (TP + FN)
    F1 = (2 * precision * recall) / (precision + recall)

    resultados_final = [precision,recall,F1]
    return resultados_final

if __name__=="__main__":

    data = np.genfromtxt('grades_data.txt',delimiter=',')
    X = normalizar(data[:,:-1])
    X = np.hstack((np.matrix(np.ones(X.shape[0])).T,X))
    y = data[:,-1]

    ## Separar datos de entrenamiento y de prueba
    X100 = np.vsplit(X,[70,])
    X70 = X100[0] #70% para entrenamiento
    X30 = X100[1] #30% para prueba    

    Y100 = np.hsplit(y,[70,])
    Y70 = Y100[0] #70% para entrenamiento
    Y30 = Y100[1] #30% para prueba

    alpha = 0.01

    theta = np.matrix(np.zeros(X70.shape[1])) #theta inicial
    theta = gradienteDescendente(X70,Y70,theta,alpha) #entrenamiento con 70% de los datos

    print("Coeficientes theta:", theta) 
  
   
    prediccion = predecir(theta, X30) #se predice con el otro 30% de los datos

    resultados = []
    resultados = comparar(prediccion,Y30)
     
    print("Valores de prueba (30%): ", Y30)
    print("Valores predecidos: ", prediccion)
    print("Precisión: ", resultados[0])
    print("Recall: ", resultados[1])
    print("F1: ", resultados[2])

Coeficientes theta: [[-8.79687057 10.03153842  8.6281264 ]]
Valores de prueba (30%):  [0. 1. 1. 1. 1. 1. 1. 1. 0. 0. 1. 1. 1. 1. 1. 1. 0. 1. 1. 0. 1. 1. 0. 1.
 1. 1. 1. 1. 1. 1.]
Valores predecidos:  [0 1 1 1 1 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1]
Precisión:  0.8076923076923077
Recall:  1.0
F1:  0.8936170212765957
