# Modelagens de regressão

Este lab explorar modelagens diferentes para o problema de regressão.

Para resolver diversos problemas, é interessante sempre utilizar um solver poderoso, de preferência que aceite restrições para que você não tenha que fazer o Lagrangiano manualmente. Além do trabalho, solvers que aceitam restrições realizam uma centenas ou milhares de heurísticas para simplificar as restrições e o problema, antes de iniciar a solução de fato.

Por questões didáticas, a seguir usamos um solver simples disponível pela biblioteca `scipy`.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import os
from scipy.optimize import minimize

Abaixo segue a função a ser aprendida adicionada de um ruído com distribuição normal.

In [None]:
f = lambda x: 2*x + 1

# b = f(x) + ruído
x = np.linspace(-2, 2, 20).flatten()
b = f(x) + np.random.normal(0, 1, x.shape)

Como o ruído é normal e pequeno, uma regressão através da norma euclidiana funciona bem.

## Regressão L2

In [None]:
# matriz com as observações
A = np.vstack([np.ones_like(x), x]).T
A.shape

Construa sua função de custo para minimizar o erro via normal L2, i.e., a raíz da soma dos quadrados dos erros.

In [None]:
# Retorna um vetor com os erros dado os parâmetros 'coefs'
def error_vector(coefs):
    return ...

# Retorna a norma L2 de v
def L2_norm(v):
    return ...

# F.O.: Raíz quadrada da soma dos quadrados dos erros
def L2_cost(v):
    return L2_norm(error_vector(v))

In [None]:
# Realiza a minimização da função de custo. L2_cost
res = minimize(L2_cost, np.array([0, 0]))
L2_cost_ret = res.x

In [None]:
plt.plot(x, b, 'o', label='Dados')
plt.plot(x, L2_cost_ret[0] + L2_cost_ret[1]*x, '--', label='L2 - sem outlier')

plt.legend()
plt.show()

Agora vamos adicionar um outlier e ver se a regressão ainda continua a funcionar

In [None]:
# adicionando outlier
b[-1] = -100

# Regressão L2 após outlier
res = minimize(L2_cost, np.array([0, 0]))
L2_cost_outlier_ret = res.x

In [None]:
plt.plot(x, b, 'o', label='Dados')
plt.plot(x[-1], b[-1], 'o', label='Outlier')

plt.plot(x, L2_cost_ret[0] + L2_cost_ret[1]*x, '--', label='L2 - sem outlier')
plt.plot(x, L2_cost_outlier_ret[0] + L2_cost_outlier_ret[1]*x, '--', label='L2')

plt.legend()
plt.show()

Vimos que o método de regularização L1 tem como objetivo promover esparsidade.

**Atenção**: Um detalhe não apresentado em aula é que tipicamente deixamos de fora da regularização L1 o escalar responsável pela translação (intercept), i.e., penalizamos apenas as escolhas das variáveis e não a translação necessária.

Em nosso caso, o escalar é a primeira variável da matriz $A$, assim, a retiramos da regularização.

In [None]:
# Retorna a norma L1 do vetor v
def L1_norm(v):
    return ...

# F.O.: L2 no erro e regularização L1 nos coeficientes, excluindo o intercept
def L2_regL1_cost(v, λ=5):
    return L2_norm(error_vector(v)) + λ*L1_norm(v[1:])

# L2 no erro e regularização L1
res = minimize(L2_regL1_cost, np.array([0, 0]))
L2_regL1_ret = res.x

In [None]:
plt.plot(x, b, 'o', label='Dados')
plt.plot(x[-1], b[-1], 'o', label='Outlier')

plt.plot(x, L2_cost_ret[0] + L2_cost_ret[1]*x, '--', label='L2 - sem outlier')
plt.plot(x, L2_cost_outlier_ret[0] + L2_cost_outlier_ret[1]*x, '--', label='L2')
plt.plot(x, L2_regL1_ret[0] + L2_regL1_ret[1]*x, '--', label='L2 Reg L1 com λ=5')

plt.legend()
plt.show()

In [None]:
# F.O.: L1 no erro
def L1_cost(v):
    return L1_norm(error_vector(v))

# L1 no erro
res = minimize(L1_cost, np.array([0, 0]))
L1_ret = res.x

In [None]:
# Para ver melhor os resultados, não mostrado o outlier presente nos dados
plt.plot(x[:-1], b[:-1], 'o', label='Dados')
#plt.plot(x[-1], b[-1], 'o', label='Outlier')

plt.plot(x, L2_cost_ret[0] + L2_cost_ret[1]*x, '--', label='L2 - sem outlier')
plt.plot(x, L2_cost_outlier_ret[0] + L2_cost_outlier_ret[1]*x, '--', label='L2')
plt.plot(x, L2_regL1_ret[0] + L2_regL1_ret[1]*x, '--', label='L2 Reg L1 com λ=5')
plt.plot(x, L1_ret[0] + L1_ret[1]*x, '--', label='L1')

plt.legend()
plt.show()