# Regressão Linear Múltipla
Podemos implementar a regressão linear múltipla seguindo as mesmas etapas da regressão simples. A principal diferença é que o array `x` agora terá duas ou mais colunas.

## Passos 1 e 2: Importando pacotes e classes e fornecendo dados
Primeiramente, importamos `numpy` e `sklearn.linear_model.LinearRegression` e fornecemos entradas e saídas conhecidas:

In [None]:
import numpy as np
from sklearn.linear_model import LinearRegression

X = [[0, 1], [5, 1], [15, 2], [25, 5], [35, 11], [45, 15], [55, 34], [60, 35]]
y = [4, 5, 20, 14, 32, 22, 38, 43]
X, y = np.array(X), np.array(y)

In [None]:
X

In [None]:
y

Na regressão linear múltipla, `x` é uma matriz bidimensional com pelo menos duas colunas, enquanto `y` geralmente é uma matriz unidimensional. No nosso exemplo de regressão linear múltipla, `x` tem exatamente duas colunas.

## Passo 3: Criando e ajustando o modelo
A próxima etapa é criar o modelo de regressão como uma instância de `LinearRegression` e ajustá-lo com `.fit()`. O resultado destes comandos é o modelo variável referente ao objeto do tipo `LinearRegression`. Isso representa o modelo de regressão ajustado aos dados existentes:

In [None]:
model = LinearRegression().fit(X, y)

## Passo 4: Obtendo os resultados
Podemos obter as propriedades do modelo da mesma forma que no caso da regressão linear simples, ou seja:

In [None]:
r_sq = model.score(X, y)

print(f"coeficiente de determinacao: {r_sq}")
print(f"interceptacao: {model.intercept_}")
print(f"coeficientes: {model.coef_}")

Aqui, obtemos o valor de $R^2$ usando `.score()` e os valores dos estimadores dos coeficientes de regressão com `.intercept_` e `.coef_`. Novamente, `.intercept_` contém o valor de $b_0$, enquanto agora `.coef_` é uma matriz contendo $b_1$ e $b_2$.

Neste exemplo, a interceptação é de aproximadamente $5.52$ e este é o valor da resposta prevista quando $x_1=x_2=0$. Um aumento de $x_1$ em $1$ produz um aumento da resposta prevista em $0.45$. Da mesma forma, quando $x_2$ aumenta $1$, a resposta aumenta $0.26$.

## Passo 5: Fazendo previsões
As previsões também funcionam da mesma maneira que no caso da regressão linear simples:

In [None]:
y_pred = model.predict(X)

print(f"resposta prevista:\n{y_pred}")

A resposta prevista é obtida com `.predict()`, que é equivalente ao seguinte:

In [None]:
y_pred = model.intercept_ + np.sum(model.coef_ * X, axis=1)
print(f"resposta prevista:\n{y_pred}")

Podemos, portanto, prever os valores de saída multiplicando cada coluna da entrada pelo peso apropriado, somando os resultados e adicionando a interceptação à soma.

Finalmente, também é possível aplicar este modelo a novos dados:

In [None]:
X_new = np.arange(10).reshape((-1, 2))
X_new

In [None]:
y_new = model.predict(X_new)
y_new

Essa é a previsão usando um modelo de regressão linear.

Note que que a regressão produziu um coeficiente de determinação relativamente alto. A princípio, poderíamos pensar que isso é um ótimo resultado! No entanto, em situações do mundo real, ter um $R^2$ próximo de um também pode ser um sinal de *overfitting*.

Na prática, isso significa que o modelo aprendeu muito bem os dados existentes, mas não é capaz de fazer boas generalizações. Assim, para verificar o desempenho de um modelo, quando lidamos com dados reais, devemos testá-lo com novos dados. Para isso, algumas observações não serão usadas usadas para ajustar ou treinar o modelo. Veremos isos nas próximas lições. 😉