Enzo Gabriel é um estagiário na empresa _XYZ corporate SA_. Certo dia, foi solicitado a Enzo um modelo linear para prever o valor de um novo produto da marca com base em certas características de outros produtos.

Enzo, então, aplicou os conhecimentos obtidos na aula do professor Ayres e resolveu a equação normal para encontrar os coeficientes da regressão linear com base nos dados fornecidos.

In [1]:
import numpy as np

# Matrix de features (X)
X = np.array([
    [1,  2],
    [2, 3.5],
    [3,  5],
    [4,  7]
], dtype=float)

# Vetor target (y)
y = np.array([9, 14, 19, 25], dtype=float)

# Adiciona a coluna de 1s (intercepto)
ones = np.ones((X.shape[0], 1))
X_ones = np.concatenate((ones, X), axis=1)

print("Matriz X (com coluna de 1s):\n", X_ones)
print("\nVetor y:", y)

Matriz X (com coluna de 1s):
 [[1.  1.  2. ]
 [1.  2.  3.5]
 [1.  3.  5. ]
 [1.  4.  7. ]]

Vetor y: [ 9. 14. 19. 25.]


In [2]:
# Encontrar os coeficientes da regressão linear usando a equação normal
X_T = X_ones.transpose()
XTX = np.matmul(X_T, X_ones)
XTy = np.matmul(X_T, y)

inv_XTX = np.linalg.inv(XTX)
theta = np.matmul(inv_XTX, XTy)
print("\nCoeficientes (w0, w1, w2):", theta)


Coeficientes (w0, w1, w2): [3. 2. 2.]


Ele, então, aferiu seus resultados usando o modelo LinearRegression do sklearn.

In [3]:
# Usando sklearn
from sklearn.linear_model import LinearRegression
model = LinearRegression(fit_intercept=False)
model.fit(X_ones, y) 
print("\nCoeficientes (w0, w1, w2):", ( model.coef_))


Coeficientes (w0, w1, w2): [3. 2. 2.]


No outro dia, Félix, o gato de Enzo Gabriel, subiu no teclado de seu computador e acidentalmente clonou uma das colunas da matriz de features.

In [4]:
# Matrix de features (X)
X = np.array([
    [1,  2,  1],
    [2, 3.5, 2],
    [3,  5,  3],
    [4,  7,  4]
], dtype=float)

# Vetor target (y)
y = np.array([9, 14, 19, 25], dtype=float)

# Adiciona a coluna de 1s (intercepto)
ones = np.ones((X.shape[0], 1))
X_ones = np.concatenate((ones, X), axis=1)

print("Matriz X (com coluna de 1s):\n", X_ones)
print("\nVetor y:", y)

Matriz X (com coluna de 1s):
 [[1.  1.  2.  1. ]
 [1.  2.  3.5 2. ]
 [1.  3.  5.  3. ]
 [1.  4.  7.  4. ]]

Vetor y: [ 9. 14. 19. 25.]


Desapercebido da situação, Enzo pensou que a nova coluna tratava-se apenas de uma nova feature adicionada por algum colega da empresa.

Assim, decidiu encontrar os coeficientes da mesma maneira que antes.

In [5]:
# Encontrar os coeficientes da regressão linear usando a equação normal
X_T = X_ones.transpose()
XTX = np.matmul(X_T, X_ones)
XTy = np.matmul(X_T, y)

inv_XTX = np.linalg.inv(XTX)
theta = np.matmul(inv_XTX, XTy)
print("\nCoeficientes (w0, w1, w2, w3):", theta)

LinAlgError: Singular matrix

O erro fez com que Enzo notasse que, pelo fato de a nova coluna de features ser idêntica a uma já existente, a matriz X^T*X tornou-se singular.

Ou seja, por causa da dependência linear entre as colunas de X, o determinante da matriz se tornou nulo.

In [6]:
np.linalg.det(XTX)

np.float64(0.0)

Enzo, no entanto, era um aplicado aluno de Machine Learning no Insper e se lembrou do método de regularização _ridge_.

Ao somar um termo de penalidade proporcional à norma euclidiana dos coeficientes, a regularização _ridge_ garante uma equação normal não singular.

In [8]:
# Usando ridge regression
alpha = 1.0 # Hiperparâmetro de regularização

# Equação normal regularizada
X_T = X_ones.transpose()
XTX = np.matmul(X_T, X_ones)
XTy = np.matmul(X_T, y)

I = np.eye(XTX.shape[0])
XTX_reg = XTX + alpha * I # Modificação aqui
inv_XTX_reg = np.linalg.inv(XTX_reg)
theta_ridge = np.matmul(inv_XTX_reg, XTy)

print("Coeficientes (w0, w1, w2, w3):", theta_ridge)

Coeficientes (w0, w1, w2, w3): [1.40480769 1.10576923 2.16346154 1.10576923]


Conferindo pelo modelo Ridge do sklearn.

In [9]:
# Usando sklearn
from sklearn.linear_model import Ridge
model_ridge = Ridge(alpha=1.0, fit_intercept=False)
model_ridge.fit(X_ones, y)

print("Coeficientes (w0, w1, w2, w3):", model_ridge.coef_)

Coeficientes (w0, w1, w2, w3): [1.40480769 1.10576923 2.16346154 1.10576923]
