# Funções Lineares nos Parâmetros (Regressão Linear)

Na aula anterior, falamos sobre o problema de ajustar uma função (curva) a um conjunto de pontos $(x_1,y_1), \ldots, (x_n,y_n)$. Diferente do problema de interpolação, as funções que iremos considerar podem não interpolar os pontos, isto é, passar exatamente por eles. Por essa razão, foi necessário definir medidas da qualidade do ajuste.

## Qualidade do Ajuste

Falamos sobre três medidas:

1. Erro máximo
$$E_\infty(f) = \max_{i=1\,\ldots,n} |f(x_i) - y_i|$$

2. Erro médio (ou erro $L_1$)
$$E_1(f) = \frac{1}{n} \sum_{i=1}^n |f(x_i) - y_i|$$

3. Raiz do erro médio quadrático (ou erro $L_2$)
$$E_2(f) = \sqrt{\frac{1}{n} \sum_{i=1}^n (f(x_i) - y_i)^2}$$

Ranqueando as métricas de qualidade em ordem crescente segundo à sensiblidade à *outliers*, vimos que
$$
E_1 \prec E_2 \prec E_\infty. 
$$
Vimos também que $E_2(f)$ é mais fácil de ser minimizada que $E_1(f)$. A minimização de $E_2(f)$, ou mais especificamente de $\sum_{i=1}^n (f(x_i) - y_i)^2$ dá origem ao método dos quadrados mínimos.

## Método dos quadrados mínimos

Foi desenvolvido no quadro.

Hoje vamos estudar um caso específico de ajuste de curva que acontece quando a função é linear nos parâmetros. O problema de ajuste, neste caso, é chamado de **Regressão Linear**.

## Exemplos de Regressão Linear

* Regressão Linear...
$$
f(x) = \beta_0 + \beta_1 x
$$

*  Regressão Linear...
$$
f(x) = ax + b \textrm{sen}(x)
$$

*  Regressão Linear...
$$
f(x) = \beta_0 + \beta_1 x + \beta_2 x^2 + \ldots \beta_p x^p
$$

## Regressão Linear Simples

Deduzimos na aula anterior:

$$
\begin{bmatrix}
n & \sum x_i \\
\sum x_i & \sum x_i ^2
\end{bmatrix}
\beta
= 
\begin{bmatrix}
\sum y_i \\
\sum y_i x_i
\end{bmatrix}
$$

Resolvendo-se o sistema acima, temos:

$$
\beta_1 = \frac{\sum x_i \sum y_i -n \sum x_i y_i}{\left(\sum x_i\right)^2 -n \sum x_i^2}
 \quad \textrm{e} \quad
\beta_0 = \frac{\sum y_i - b_1 \sum x_i}{n}.
$$

Considere o exemplo a seguir.

In [3]:
import numpy as np

x = np.array([0.3,2.7,4.5,5.9,7.8])
y = np.array([1.8,1.9,3.1,3.9,3.3])

M = np.vstack([x,y,x**2,x*y,y**2]).T
M

array([[  0.3 ,   1.8 ,   0.09,   0.54,   3.24],
       [  2.7 ,   1.9 ,   7.29,   5.13,   3.61],
       [  4.5 ,   3.1 ,  20.25,  13.95,   9.61],
       [  5.9 ,   3.9 ,  34.81,  23.01,  15.21],
       [  7.8 ,   3.3 ,  60.84,  25.74,  10.89]])