# Breve descrição sobre o Boston Housing Dataset

O dataset possui 506 linhas com 14 colunas de dados. Seu principal objetivo é descrever sobre a vizinhança da cidade de Boston, nos Estados Unidos. Seus atributos são:

- CRIM: Taxa de criminalidade da cidade;
- ZN: Proporção de terrenos residenciais zoneados para lotes com mais de 25 mil pés quadrados;
- INDUS: Proporção de negócios não-varejistas ao redor da cidade;
- CHAS: Modelo variável de Charlies River;
- NOX: Concentração de óxidos nítricos (por 10 milhões);
- RM: Número médio de quartos por habitação;
- AGE: Proporção ocupação de casas construídas antes de 1940;
- DIS: Distâncias ponderadas de cinco centros empregatícios de Boston;
- RAD: Índice de acessibilidade a rodovias radiais;
- TAX: Taxa de imposto de propriedade por \$10.000;
- PTRATIO: Proporção aluno-professor por cidade;
- B: 1000 (Bk - 0,63) ^ 2 onde Bk é a proporção de negros por cidade;
- LSTAT: % população de classe baixa;
- MEDV:  Valor médio das casas ocupadas em $ 1.000.

# Importando pacotes importantes

In [1]:
import torch
import matplotlib.pyplot as plt

from nn.regression import Regression
from sklearn.datasets import load_boston
from sklearn.metrics import mean_squared_error

# Coletando base de dados

In [2]:
x, y = load_boston(return_X_y=True)

## Calculando os theta's com 80% da base

In [3]:
regression = Regression(x, y, size=0.8, ones=True)

# torch.inverse(x.T @ x) @ x.T @ y
thetas = regression.fit()
print(f"Valores do vetor theta = {thetas}")

Valores do vetor theta = tensor([ 3.0077e+01, -2.0214e-01,  4.4128e-02,  5.2674e-02,  1.8847e+00,
        -1.4928e+01,  4.7604e+00,  2.8873e-03, -1.3003e+00,  4.6166e-01,
        -1.5543e-02, -8.1163e-01, -1.9717e-03, -5.3227e-01],
       dtype=torch.float64)


## Calculando o RMSE o resto da base (20%)

In [8]:
y_pred = regression.predict(thetas, regression.x_train)
rmse = regression.rmse(y_pred, regression.y_train)
print(f"Train RMSE {rmse}")

print("----------------------------------")

y_pred = regression.predict(thetas)
rmse = regression.rmse(y_pred)
print(f"Test RMSE {rmse}")

Train RMSE 4.77267006211416
----------------------------------
Test RMSE 5.727116436760301


# Autores

    Christiano Machado @ https://github.com/chrismachado
    Vitor Veras @ https://github.com/vitorverasm

