In [None]:
import math

# -----------------------------
# Función sigmoide
# -----------------------------
def sigmoid(z):
    return 1 / (1 + math.exp(-z))

# -----------------------------
# Calcular probabilidades predichas
# p[i] = P(Y[i]=1 | X[i]) = sigmoid(sum_j beta[j] * X[i][j])
# -----------------------------
def calcular_probabilidades(X, beta):
    m = len(X)
    n = len(beta)

    # Inicializar lista p con bucle explícito
    p = []
    for _ in range(m):
        p.append(0.0)

    for i in range(m):
        z = 0.0
        for j in range(n):
            z += beta[j] * X[i][j]
        p[i] = sigmoid(z)
    return p

# -----------------------------
# Calcular gradiente
# grad[j] = sum_i (Y[i] - p[i]) * X[i][j]
# -----------------------------
def calcular_gradiente(X, Y, p):
    n = len(X[0])
    m = len(X)

    # Inicializar gradiente con bucle explícito
    grad = []
    for _ in range(n):
        grad.append(0.0)

    for j in range(n):
        suma = 0.0
        for i in range(m):
            suma += (Y[i] - p[i]) * X[i][j]
        grad[j] = suma
    return grad

# -----------------------------
# Calcular norma Euclidiana de un vector
# ||v||_2 = sqrt(sum_j v[j]^2)
# -----------------------------
def norma_vector(v):
    suma = 0.0
    for i in range(len(v)):
        suma += v[i] * v[i]
    return math.sqrt(suma)

# -----------------------------
# Actualización de beta
# beta_j^{nuevo} = beta_j^{viejo} + eta * grad[j]
# -----------------------------
def actualizar_beta(beta, grad, eta):
    n = len(beta)
    for j in range(n):
        beta[j] += eta * grad[j]
    return beta

# -----------------------------
# Algoritmo completo de gradiente ascendente
# -----------------------------
def gradiente_ascendente(X, Y, eta=0.01, max_iter=1000, tol=0.0001):
    n = len(X[0])

    # Inicializar beta usando bucle explícito
    beta = []
    for _ in range(n):
        beta.append(0.0)

    print(len(beta))

    for iteration in range(max_iter):
        # calcular probabilidades
        p = calcular_probabilidades(X, beta)

        # calcular gradiente
        grad = calcular_gradiente(X, Y, p)

        # norma del gradiente para condición de paro
        grad_norm = norma_vector(grad)
        if grad_norm < tol:
            print(f"Convergió en {iteration} iteraciones")
            break

        # actualizar beta
        beta = actualizar_beta(beta, grad, eta)

    return beta

# -----------------------------
# EJEMPLO DE USO
# -----------------------------

# Note que se debe agregar al principio una columna de unos:
X = [
      [1, 0, 0, 1, 0],
      [1, 1, 1, 1, 1],
      [1, 0, 0, 0, 1]
]
Y = [1,0,1]

beta_final = gradiente_ascendente(X, Y, eta=0.1, max_iter=10000)
print("Beta final:", beta_final)

5
Beta final: [6.902148466225883, -6.902148466225872, -6.902148466225872, -3.911844806414595e-15, -3.911844806414595e-15]
