# Regressão Linear Múltipla

Ao contrário dos problemas do capítulo 1, neste caso existem múltiplas variáveis de entrada. Um problema deste tipo, por exemplo, consiste em determinar um modelo que mapeia o preço dos imóveis não somente em função do seu tamanho, mas também da quantidade de quartos, banheiros, etc. Ou seja, o modelo deve ser composto da combinação linear de todas as variáveis de entrada do problema, conforme segue.

$$
\begin{align} 
\theta = \begin{bmatrix} \theta_{1} \\ \theta_{2} \\ . \\ . \\ \theta_{n+1} \end{bmatrix} && 
x = \begin{bmatrix} 1 \\ x_{1} \\ . \\ . \\ x_{n} \end{bmatrix} && 
h_{\theta}(x) = \theta^{T} x
\end{align}$$

$$h_{\theta}(x) = \theta_{1} + \theta_{2} x_{1} + ... + \theta_{n+1} x_{n}$$

Uma forma de interpretar este modelo no contexto do estimador de preço dos imóveis é: considerando $x_{1}$ o tamanho em metros quadrados da casa e $x_{2}$ a quantidade de quartos, $\theta_{1}$ seria o preço base da casa, $\theta_{2}$ o preço por metro quadrado, $\theta_{3}$ o preço por cada quarto adicional, e assim por diante. 


O Gradiente para a função custo na regressão linear múltipla pode ser obtido conforme segue:

$$J(\theta) = \frac{1}{2 m} \sum\limits_{i=1}^{m}(h_{\theta}(x^{i}) - y^{i})^{2} = \frac{1}{2 m} \sum\limits_{i=1}^{m}(\theta^T x^{i} - y^{i})^{2}$$

$$\nabla J(\theta) = \begin{bmatrix} \frac{\partial J}{\partial \theta_1} & \frac{\partial J}{\partial \theta_2} & ... &  \frac{\partial J}{\partial \theta_{n+1}}\end{bmatrix}^T = \begin{bmatrix} \frac{1}{m} \sum\limits_{i=1}^{m}(\theta^T x^{i} - y^{i}) & \frac{1}{m} \sum\limits_{i=1}^{m}(\theta^T x^{i} - y^{i}) x_{1}^{i} & ... & \frac{1}{m} \sum\limits_{i=1}^{m}(\theta^T x^{i} - y^{i}) x_{n}^{i} \end{bmatrix}^T$$

## Normalização das Entradas

Conforme já discutido, o Algoritmo Gradiente Descendente, utilizado para minimizar a função custo, irá realizar deslocamentos proporcionais a inclinação da curva em cada uma das suas direções. 

In [37]:
import numpy as np

# multiple linear regression hypothesis: o1*x1 + o2*x2
def h(x, o):
    return np.dot(x, o)

# J = MSE/2
def J(x, o, y):
    m = np.shape(x)[0]
    h_x = h(x, o)
    return np.sum(np.power(h_x - y, 2), axis=0)*1/(2*m)

In [36]:
def plot_cost_function():
    %matplotlib inline
    import matplotlib.pyplot as plt
    
    # arbitrary data to visualize cost function
    o1 = np.arange(-10, 10, 0.25)
    o2 = np.arange(-10, 10, 0.25)

    # prepare data in meshgrid format
    X, Y = np.meshgrid(o1, o2)
    
    # serialize meshgrid to use J
    c_o = np.power(len(o1), 2)
    o = np.zeros((2, c_o))
    o[0, :] = np.reshape(X, [1, c_o])
    o[1, :] = np.reshape(Y, [1, c_o])
    j = J(x, o, y)

    # transform j to meshgrid
    Z = np.reshape(j, np.shape(X))
        
    # plot
    fig = plt.figure(figsize=(20,10))
    # surface
    ax = fig.add_subplot(121, projection='3d')
    ax.set_xlabel(r'$\theta_{1}$')
    ax.set_ylabel(r'$\theta_{2}$')
    
    ax.plot_surface(X, Y, Z, alpha=0.2)
    
    # plot contours    
    ax = fig.add_subplot(122)
    levels = [10, 50, 100, 250, 500, 750, 1000] # to improve view 
    contours = ax.contour(X, Y, Z, levels, colors='black')
    
    plt.clabel(contours, inline = True, fontsize = 10)
    plt.xlabel(r'$\theta_{1}$')
    plt.ylabel(r'$\theta_{2}$')

In [35]:
x1 = np.arange(-10, 10, 0.25)
x2 = np.arange(-10, 10, 0.25)
x = np.zeros([len(x1), 2])
x[:,0] = x1
x[:,1] = x2

o = np.array([[1],[2]])
y = h(x,o)

# new arbitrary data to visualize cost function
o1 = np.arange(-10, 10, 0.25)
o2 = np.arange(-10, 10, 0.25)

print(J(x,o,y))

(80, 2)
[0.]
