# Linear Regression



A [Regressão Linear](https://scikit-learn.org/stable/modules/svm.html#regression) é um tipo de algoritmo de aprendizado de máquina usado para __prever um valor numérico__ com base em um conjunto de dados com exemplos rotulados. Ao contrário da classificação, onde o objetivo é prever a classe de um novo dado, a regressão linear busca prever um valor numérico contínuo.



# Como funciona?

- __Treinamento:__ A regressão linear é treinada usando um conjunto de dados rotulado, onde cada dado possui um valor numérico conhecido.
- __Aprendizado:__ O algoritmo aprende a identificar a relação entre as variáveis ​​do conjunto de dados e o valor numérico a ser previsto.
- __Previsão:__ Quando um novo dado é apresentado ao algoritmo, ele usa o que aprendeu durante o treinamento para prever o valor numérico para o novo dado.

A regressão linear é representada por uma equação linear da forma:

```
y = mx + b
```
- __y__ é o valor numérico a ser previsto.
- __x__ é a variável independente.
- __m__ é a inclinação da reta.
- __b__ é o intercepto da reta.

In [None]:
from sklearn import datasets
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from matplotlib import pyplot as plt 
import pandas as pd

In [None]:
from sklearn import datasets

In [None]:
# boston = datasets.load_boston()
data = pd.read_csv('../data/datasetBostonHouse/bostonHouse.csv')
data.head()

In [None]:
x = data[['crim',
          'zn',
          'indus',
          'chas',
          'nox',
          'rm',
          'age',
          'dis',
          'rad',
          'tax',
          'ptratio',
          'b',
          'lstat']]
y = data[['medv']]

In [None]:
x.shape
y.shape

Criação do modelo

In [None]:
l_reg = linear_model.LinearRegression()

Imprimir todas as instâncias os features "Crim "


In [None]:
x[['crim']]

Criar uma Transposta do Dataset

In [None]:
x.T[0]

Criar um gráfico dos datapoints

In [None]:
plt.scatter(x[['crim']], y)
plt.show()

In [None]:
plt.scatter(x[['nox']], y)
plt.show()

In [None]:
plt.scatter(x[['rm']], y)
plt.show()

Split it in Train set and Test set

In [None]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)

Create model and train the model

In [None]:
model = l_reg.fit(x_train, y_train)

In [None]:
predictions = model.predict(x_test)


In [None]:
predictions

In [None]:
l_reg.score(x, y)

In [None]:
print(f'coefience: (scale factor multiplcatitor of x_variable) {l_reg.coef_}')

In [None]:
print(f'intercept: {l_reg.intercept_}')