O banco de dados contém informações de 40 apartamentos vendidos no mês passado. Cada linha do banco de dados é um apartamento. Ajuste o seguinte modelo de regressão múltipla para os dados:

$Y = b0+b1x1+b2x2+b3x3+erro$, em que:

$Y$ = preço do apartamento;

$x1$ = tamanho do apartamento, em metros quadrados; 

$x2$ = idade do prédio, em anos;

$x3$ = andar em que o apartamento está.

Obs.: Note que não usaremos todas as variáveis independentes.

**Qual é o preço previsto de um imóvel com 80m2, 10 anos e que está no 9o andar?**

In [34]:
#Base de Dados:
database = {
    "apt" : [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
             17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30,
             31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
    
    "price" : [814364, 837887, 1094109, 727129, 784800, 1158339, 1080046,
               839743, 920737, 713176, 859764, 982291, 733894, 915152, 980419,
               1061956, 981657, 711479, 830290, 965093, 849199, 640924, 688660,
               821829, 982912, 1020831, 710888, 801885, 1307216, 671028, 918318,
               843974, 923510, 836419, 967390, 601516, 1297396, 918891, 1279741, 860217],

    "size" : [87, 86, 105, 100, 88, 100, 136, 86, 84, 94, 100, 86, 78,
              84, 78, 93, 104, 71, 86, 101, 83, 77, 78, 98, 98, 84, 89,
              107, 138, 83, 96, 94, 104, 100, 100, 94, 111, 104, 103, 103],

    "age" : [9, 10, 8, 11, 8, 9, 9, 10, 11, 6, 14, 13, 10, 8, 6, 4, 11,
             15, 5, 9, 10, 10, 13, 11, 11, 8, 12, 7, 9, 11, 8, 10, 12, 14,
             7, 14, 7, 6, 9, 9],

    "floor" : [9, 1, 12, 7, 13, 8, 6, 8, 9, 6, 4, 14, 3, 6, 11, 3, 4, 8, 8,
               9, 6, 9, 6, 11, 3, 15, 4, 2, 12, 5, 14, 17, 11, 8, 6, 2, 7, 8, 10, 4],

    "rooms" : [2, 2, 4, 3, 2, 3, 4, 2, 2, 3, 3, 2, 3, 2, 2, 3, 3, 2, 3, 3, 2,
               2, 2, 3, 3, 2, 2, 3, 4, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3],

    "garage" : [2, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 1, 1, 2, 1, 2, 2, 2, 1, 2, 2,
                2, 2, 1, 2, 2, 1, 2, 2, 0, 2, 1, 2, 1, 2, 1, 2, 2, 2, 2],
}

In [35]:
# Imports
import numpy as np


Para obtenção do nosso modelo

$\hat{y} = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_3$ 

Onde:

- $\hat{y}$ é a variável aleatória
- $x_i$ variáveis independetes
- $\beta_0$ interceptação
- $\beta_i$ coeficientes de inclinação

Vamos fazer uso da fórmula:

\begin{equation*}
\hat{\beta} = (X^{T}X)^{-1}X^{T}Y
\end{equation*}


In [44]:
x1 = database['size']
x2 = database['age']
x3 = database['floor']
x0 = [1] * len(x1)

Y = database['price']


Y = np.matrix(Y).T

X = np.matrix([x0, x1, x2, x3])
X = X.T

Beta_hat = ((X.T*X).I)*X.T*Y

b0 = Beta_hat.item(0, 0)
b1 = Beta_hat.item(1, 0)
b2 = Beta_hat.item(2, 0)
b3 = Beta_hat.item(3, 0)

print "B0 = " + str(b0)
print "B1 = " + str(b1)
print "B2 = " + str(b2)
print "B3 = " + str(b3)




B0 = 324728.189621
B1 = 6920.21351868
B2 = -17590.1682604
B3 = 11216.9468539


### O valor estimado:

In [46]:
tamanho = 80
idade = 10
andar = 9

preco = b0 + b1*tamanho + b2*idade + b3*andar
print "R$ {:,.2f}".format(preco)

R$ 803,396.11
