In [8]:
import numpy as np

# Gerar um dataset sintético manualmente
m = 100
n = 2

# Gerar X com bias
np.random.seed(42)
X = np.random.uniform(0, 1, (m, n)) * 2
X = np.hstack([np.ones((m, 1)), X])  # Adicionar coluna de bias

# Gerar Theta verdadeiro
Theta_verd = np.random.rand(n + 1) * 10

# Calcular Y com erro
z = X @ Theta_verd
error = 0.15 * np.random.randn(m)
Y = (z + error) >= 0
Y = Y.astype(float)

# Verificar dimensões
print('Theta a estimar:', Theta_verd)
print('\nPrimeiras 5 linhas de X:\n', X[:5])
print('\nPrimeiras 5 linhas de Y:\n', Y[:5])
print('\nDimensões de X:', X.shape, 'e Y:', Y.shape)

Theta a estimar: [6.42031646 0.84139965 1.61628714]

Primeiras 5 linhas de X:
 [[1.         0.74908024 1.90142861]
 [1.         1.46398788 1.19731697]
 [1.         0.31203728 0.31198904]
 [1.         0.11616722 1.73235229]
 [1.         1.20223002 1.41614516]]

Primeiras 5 linhas de Y:
 [1. 1. 1. 1. 1.]

Dimensões de X: (100, 3) e Y: (100,)


In [9]:
def sigmoid(theta, x):
    z = np.dot(theta, x)
    return 1 / (1 + np.exp(-z))

In [16]:
def regularized_logistic_cost_function(x, y, theta, lambda_=0.):
    m = x.shape[0]
    z = x @ theta
    h = 1 / (1 + np.exp(-z))  # Saída da sigmoide
    
    # Clipping para evitar log(0) ou log(1)
    eps = 1e-15  # Valor epsilon para evitar zeros
    h = np.clip(h, eps, 1 - eps)  # Força h entre [eps, 1-eps]
    
    # Cálculo do custo com valores seguros
    cost = (-1/m) * np.sum(y * np.log(h) + (1 - y) * np.log(1 - h))
    
    # Termo de regularização (exceto theta[0])
    reg = (lambda_ / (2 * m)) * np.sum(theta[1:]**2)
    
    return cost + reg

In [29]:
# TODO: Comprovar a sua implementação no dataset

# Modificar e comprovar vários valores de theta 
theta = Theta_verd
theta = np.array([10.4, 5.8,  8.6])

j = regularized_logistic_cost_function(X, Y, theta, lambda_=0.) 

print('Custo do modelo:')
print(j)
print('Theta comprovado e Theta real:') 
print(theta)
print(Theta_verd)

Custo do modelo:
6.61068328954856e-08
Theta comprovado e Theta real:
[10.4  5.8  8.6]
[6.42031646 0.84139965 1.61628714]


In [11]:
def regularized_logistic_gradient_descent(x, y, theta, alpha=0.1, lambda_=0., e=1e-3, iter_=1000):
    j_hist = []
    m, n = x.shape
    iter_ = int(iter_)
    
    for k in range(iter_):
        h = 1 / (1 + np.exp(-x @ theta))
        errors = h - y
        gradients = (1/m) * (x.T @ errors)
        
        # Regularização (exceto bias)
        gradients[1:] += (lambda_/m) * theta[1:]
        
        theta_new = theta - alpha * gradients
        cost = regularized_logistic_cost_function(x, y, theta_new, lambda_)
        
        j_hist.append(cost)
        
        # Verificar convergência
        if k > 0 and abs(j_hist[-1] - j_hist[-2]) < e:
            print(f'Convergência na iteração {k}')
            break
            
        theta = theta_new
    
    return j_hist, theta

In [20]:
# TODO: Implementar a função que forma o modelo por gradient descent regularizado

def regularized_logistic_gradient_descent(x, y, theta, alpha=1e-1, lambda_=0., e=0.001, iter_=0.001): 
    """ 
    Formar o modelo otimizando a sua função de custo por gradient descent
    
    Argumentos posicionais:
    x -- array 2D de Numpy com os valores das variáveis independentes dos exemplos, de tamanho m x n 
    y -- array 1D Numpy com a variável dependente/objetivo, de tamanho m x 1
    theta -- array 1D Numpy com os pesos dos coeficientes do modelo, de tamanho 1 x n (vetor fila)
    
    Argumentos numerados (keyword):
    alpha -- float, ratio de formação
    lambda -- float com o parâmetro de regularização
    e -- float, diferença mínima entre iterações para declarar que a formação finalmente convergiu 
    iter_ -- int/float, número de iterações
    
    Devolver:
    j_hist -- list/array com a evolução da função de custo durante a formação 
    theta -- array Numpy com o valor do theta na última iteração
    """
    iter = int(iter_)  # Converter iter_ para inteiro se necessário
    j_hist = []  # Inicializar histórico de custos
    
    m, n = x.shape  # Obter m e n a partir das dimensões de X
    
    for k in range(iter):  # Iterar sobre o número máximo de iterações
        h = sigmoid(theta, x.T)  # Calcular a hipótese h_theta(x)
        error = h - y  # Calcular o erro
        
        # Atualizar theta
        theta_iter = np.copy(theta)  # Copiar theta para atualização
        for j in range(n):  # Iterar sobre o número de características
            if j == 0:
                # Não regularizar o termo de bias
                theta_iter[j] = theta[j] - (alpha / m) * np.dot(error, x[:, j])
            else:
                # Regularizar todos os outros coeficientes
                theta_iter[j] = theta[j] - (alpha / m) * (np.dot(error, x[:, j]) + (lambda_ * theta[j]))
        
        theta = theta_iter  # Atualizar theta para a próxima iteração
        
        # Calcular o custo para a iteração atual
        cost = regularized_logistic_cost_function(x, y, theta, lambda_)
        j_hist.append(cost)  # Adicionar o custo ao histórico
        
        # Verificar a convergência
        if k > 0 and abs(j_hist[-1] - j_hist[-2]) < e:
            print('Convergir na iteração n.º: ', k)
            break
    else:
        print('N.º máx. de iterações alcançado')
    
    return j_hist, theta

In [28]:
import time

# TODO: Comprovar a sua implementação através da formação de um modelo no dataset sintético anteriormente criado.

# Criar um theta inicial com um determinado valor.
theta_ini = np.array([16.0, 20.0, 9.0])

print('Theta inicial:') 
print(theta_ini)

alpha = 1e-1 
lambda_ = 0. 
e = 1e-3 
iter_ = 1000

print('Hiper-parâmetros usados:')
print('Alpha:', alpha, 'Error máx.:', e, 'Nº iter', iter_)

t = time.time()
j_hist, theta_final = regularized_logistic_gradient_descent(X, Y, theta_ini, alpha, lambda_, e, iter_) 

print('Tempo de formação (s):', time.time() - t)

# TODO: completar
print("\nTamanho de j_hist:", len(j_hist))
print('\nÚltimos 10 valores da função de custo') 
print(j_hist[-10:])
print('\n Custo final:') 
print(j_hist[-1]) 
print('\nTheta final:') 
print(theta_final)

print('Valores verdadeiros de Theta e diferença com valores formados:') 
print(Theta_verd)
print(theta_final - Theta_verd)

Theta inicial:
[16. 20.  9.]
Hiper-parâmetros usados:
Alpha: 0.1 Error máx.: 0.001 Nº iter 1000
Convergir na iteração n.º:  1
Tempo de formação (s): 0.0011789798736572266

Tamanho de j_hist: 2

Últimos 10 valores da função de custo
[6.114328393992325e-11, 6.114328393992325e-11]

 Custo final:
6.114328393992325e-11

Theta final:
[16. 20.  9.]
Valores verdadeiros de Theta e diferença com valores formados:
[6.42031646 0.84139965 1.61628714]
[ 9.57968354 19.15860035  7.38371286]
