In [29]:
import numpy as np
import pandas as pd

dados = {'idade': [25, 35, 45],  # idade
         'peso': [80, 90, 100],  # peso
         'diabetes': [0, 1, 1]}  # tem diabetes (0 ou 1)

df = pd.DataFrame(dados)

# Adicionando a coluna de bias (intercepto)
df['intercepto'] = 1

# Função para calcular Z (produto entre X e beta)
def z(X, beta):
    return np.dot(X, beta)

# Função sigmoide
def prob_sigmoide(z):
    return 1 / (1 + np.exp(-z))

# Função de verossimilhança
def verossimilhanca(y, sigmoide):
    return np.sum(y * np.log(sigmoide) + (1 - y) * np.log(1 - sigmoide))

# Gradiente da verossimilhança
def gradiente_vero(sigmoide, X, y):
    erro = y - sigmoide
    gradiente = np.dot(X.T, erro)
    return gradiente

# Função de atualização de beta (gradiente descendente)
def atualizacao_beta(X, y, beta_inicial, taxa_aprendizado, num_passos):
    beta = beta_inicial
    for passo in range(num_passos):
        z_valor = z(X, beta)  # Calcula Z
        previsao = prob_sigmoide(z_valor)  # Calcula a probabilidade com a função sigmoide
        grad = gradiente_vero(previsao, X, y)  # Calcula o gradiente da verossimilhança
        
        beta += taxa_aprendizado * grad  # Atualiza os parâmetros beta
        
        if passo % 100 == 0:
            ll = verossimilhanca(y, previsao)  # Calcula a verossimilhança
            print(f"Passo {passo}: Log-Verossimilhança = {ll}")
    
    return beta

# Preparando os dados
X = df[['intercepto', 'idade', 'peso']].values  # Inclui o intercepto (coluna de 1's)
y = df['diabetes'].values

# Valores iniciais de beta
beta_inicial = np.zeros(X.shape[1])

# Definindo os parâmetros do gradiente descendente
taxa_aprendizado = 0.01
num_passos = 1000

# Executando o gradiente descendente
beta_final = atualizacao_beta(X, y, beta_inicial, taxa_aprendizado, num_passos)

print("Coeficientes finais (beta):", beta_final)


Passo 0: Log-Verossimilhança = -2.0794415416798357
Passo 100: Log-Verossimilhança = -0.0020015705789453234
Passo 200: Log-Verossimilhança = -0.0019649764056144264
Passo 300: Log-Verossimilhança = -0.0019296957250620928
Passo 400: Log-Verossimilhança = -0.00189565908468944
Passo 500: Log-Verossimilhança = -0.0018628018426403191
Passo 600: Log-Verossimilhança = -0.0018310637584210787
Passo 700: Log-Verossimilhança = -0.001800388624627037
Passo 800: Log-Verossimilhança = -0.001770723935031016
Passo 900: Log-Verossimilhança = -0.0017420205849151187
Coeficientes finais (beta): [-0.05362755  2.18115971 -0.76835557]
