# Regress√£o Linear M√∫ltipla
Podemos implementar a regress√£o linear m√∫ltipla seguindo as mesmas etapas da regress√£o simples. A principal diferen√ßa √© que o array `x` agora ter√° duas ou mais colunas.

## Passos 1 e 2: Importando pacotes e classes e fornecendo dados
Primeiramente, importamos `numpy` e `sklearn.linear_model.LinearRegression` e fornecemos entradas e sa√≠das conhecidas:

In [None]:
import numpy as np
from sklearn.linear_model import LinearRegression

X = [[0, 1], [5, 1], [15, 2], [25, 5], [35, 11], [45, 15], [55, 34], [60, 35]]
y = [4, 5, 20, 14, 32, 22, 38, 43]
X, y = np.array(X), np.array(y)

In [None]:
X

In [None]:
y

Na regress√£o linear m√∫ltipla, `x` √© uma matriz bidimensional com pelo menos duas colunas, enquanto `y` geralmente √© uma matriz unidimensional. No nosso exemplo de regress√£o linear m√∫ltipla, `x` tem exatamente duas colunas.

## Passo 3: Criando e ajustando o modelo
A pr√≥xima etapa √© criar o modelo de regress√£o como uma inst√¢ncia de `LinearRegression` e ajust√°-lo com `.fit()`. O resultado destes comandos √© o modelo vari√°vel referente ao objeto do tipo `LinearRegression`. Isso representa o modelo de regress√£o ajustado aos dados existentes:

In [None]:
model = LinearRegression().fit(X, y)

## Passo 4: Obtendo os resultados
Podemos obter as propriedades do modelo da mesma forma que no caso da regress√£o linear simples, ou seja:

In [None]:
r_sq = model.score(X, y)

print(f"coeficiente de determinacao: {r_sq}")
print(f"interceptacao: {model.intercept_}")
print(f"coeficientes: {model.coef_}")

Aqui, obtemos o valor de $R^2$ usando `.score()` e os valores dos estimadores dos coeficientes de regress√£o com `.intercept_` e `.coef_`. Novamente, `.intercept_` cont√©m o valor de $b_0$, enquanto agora `.coef_` √© uma matriz contendo $b_1$ e $b_2$.

Neste exemplo, a intercepta√ß√£o √© de aproximadamente $5.52$ e este √© o valor da resposta prevista quando $x_1=x_2=0$. Um aumento de $x_1$ em $1$ produz um aumento da resposta prevista em $0.45$. Da mesma forma, quando $x_2$ aumenta $1$, a resposta aumenta $0.26$.

## Passo 5: Fazendo previs√µes
As previs√µes tamb√©m funcionam da mesma maneira que no caso da regress√£o linear simples:

In [None]:
y_pred = model.predict(X)

print(f"resposta prevista:\n{y_pred}")

A resposta prevista √© obtida com `.predict()`, que √© equivalente ao seguinte:

In [None]:
y_pred = model.intercept_ + np.sum(model.coef_ * X, axis=1)
print(f"resposta prevista:\n{y_pred}")

Podemos, portanto, prever os valores de sa√≠da multiplicando cada coluna da entrada pelo peso apropriado, somando os resultados e adicionando a intercepta√ß√£o √† soma.

Finalmente, tamb√©m √© poss√≠vel aplicar este modelo a novos dados:

In [None]:
X_new = np.arange(10).reshape((-1, 2))
X_new

In [None]:
y_new = model.predict(X_new)
y_new

Essa √© a previs√£o usando um modelo de regress√£o linear.

Note que que a regress√£o produziu um coeficiente de determina√ß√£o relativamente alto. A princ√≠pio, poder√≠amos pensar que isso √© um √≥timo resultado! No entanto, em situa√ß√µes do mundo real, ter um $R^2$ pr√≥ximo de um tamb√©m pode ser um sinal de *overfitting*.

Na pr√°tica, isso significa que o modelo aprendeu muito bem os dados existentes, mas n√£o √© capaz de fazer boas generaliza√ß√µes. Assim, para verificar o desempenho de um modelo, quando lidamos com dados reais, devemos test√°-lo com novos dados. Para isso, algumas observa√ß√µes n√£o ser√£o usadas usadas para ajustar ou treinar o modelo. Veremos isos nas pr√≥ximas li√ß√µes. üòâ