# Aula 11 - Mínimos Quadrados

O objetivo de mínimos quadrados é obter os melhores parâmetros de uma específica função de forma que a curva mais se aproxime dos dados.

Supomos um conjunto de dados ($x_i$, $y_i$) que queremos ajustar por uma função linear qualquer $f(x)$

Definimos como erro do experimento $i$, $e_i$, a diferença entre o valor determinado pelo experimento $y_i$ e pelo valor aplicado na função $f(x_i)$

\begin{equation}
e_i = f(x_i) - y_i \tag{1}
\end{equation}

Ao escolher o melhor conjunto de parâmetros, queremos que o erro total seja o menor possível. Para isso precisamos minimizar o erro total. Infelizmente, a simples soma dos erros não fornece a melhor função para ser minimizada, pois ela gera um conjunto grande de possíveis soluções. O módulo do erro também não é uma função boa para ser ajustada porque não é uma função contínua. Portanto, a função a ser minimizada será a soma dos quadrados dos erros:

\begin{equation}
E = \sum_i e_i^2 \tag{2}
\end{equation}

## Exemplo de ajuste por uma linha

Vamos supor que a função a ser ajustada seja uma função de primeiro grau. Logo, os parâmetros a serem determinados são os parãmetros $a_1$ e $a_2$.

$$f(x) = a + bx$$

Para obter os valores mínimos derivamos a equação (2) em relação aos parâmetros de ajuste $a_1$ e $a_2$.

$$\frac{\partial E}{\partial a} = 0 \tag{3}$$
$$\frac{\partial E}{\partial b} = 0 \tag{4}$$

Vamos primeiramente realizar a derivada da equação (3)

$$\frac{\partial E}{\partial a} = \sum_{i}\frac{\partial (e_i^2)}{\partial a} = \sum_{i}2e_i\frac{\partial e_i}{\partial a} = \sum_{i}2e_i\frac{\partial f(x_i)}{\partial a} = \sum_{i}2e_i = \sum_{i}2[f(x_i) - y_i] = \sum_{i}2(a + bx_i - y_i) \tag{5}$$

Em seguida derivamos a equação (4)

$$\frac{\partial E}{\partial b} = \sum_{i}\frac{\partial (e_i^2)}{\partial b} = \sum_{i}2e_i\frac{\partial e_i}{\partial b} = \sum_{i}2e_i\frac{\partial f(x_i)}{\partial b} = \sum_{i}2e_ix_i = \sum_{i}2[f(x_i) - y_i]x_i = \sum_{i}2(ax_i + bx_i^2 - y_ix_i) \tag{6}$$

Agora igualamos as derivadas obtidas nas equações (5) e (6) por zero, como mostrado nas equações (3) e (4)

\begin{equation}
\begin{matrix}
\sum_{i}2(a + bx_i - y_i) = 0\\
\sum_{i}2(ax_i + bx_i^2 - y_ix_i) = 0
\end{matrix}
\end{equation}

que simplificamos para:

\begin{equation}
\begin{matrix}
a\sum_{i}1 + b\sum_{i}x_i = \sum_{i}y_i\\
a\sum_{i}x_i + b\sum_{i}x_i^2 = \sum_{i}y_ix_i
\end{matrix} \tag{7}
\end{equation}

Para simplificar a notação, vamos substituir os somatórios por:

$$S = \sum_i1$$
$$S_x = \sum_ix_i$$
$$S_y = \sum_iy_i$$
$$S_{xx} = \sum_ix_i^2$$
$$S_{xy} = \sum_ix_iy_i \tag{8}$$

Assim a equação 7 fica:

\begin{equation}
\begin{matrix}
aS + bS_x = S_y\\
aS_x + bS_{xx} = S_{xy}
\end{matrix} \tag{9}
\end{equation}

## Parâmetros do melhor ajuste

Finalmente, para obter os melhores parâmetros basta obter os valores de $a$ e $b$ no sistema de equações lineares dado na equação (9).

Para obter $a$ vamos eliminar $b$ multiplicando a primeira equação de (9) por $S_{xx}$ e a segunda equação por $-S_x$.

\begin{equation}
\begin{matrix}
aSS_{xx} + bS_xS_{xx} = S_yS_{xx}\\
-aS_x^2 - bS_{xx}S_x = -S_{xy}S_x
\end{matrix} \tag{10}
\end{equation}

Agora somamos as duas equações de (10) e separamos $a$

$$aSS_{xx} - aS_x^2 = S_yS_{xx} - S_{xy}S_x$$
$$a = \frac{S_yS_{xx} - S_{xy}S_x}{SS_{xx} - S_x^2} \tag{11}$$

Fazendo procedimento semelhante obtemos o valor de $b$:

$$b = \frac{SS_{xy} - S_xS_y}{SS_{xx} - S_x^2} \tag{12}$$

## Considerando a incerteza dos parâmetros

As medidas de um experimento possuem incertezas. Quando fazemos um ajuste, queremos que a curva passe mais próxima dos pontos com menor incerteza. Para considerar esta incerteza defnimos o chamado chi-quadrado $\chi^2$, que nada mais é do que a equação (2) onde cada erro ao quadrado é dividido pela incerteza ao quadrado.

$$\chi^2 = \sum_i\frac{e_i^2}{\sigma_i^2} \tag{13}$$

Ao derivarmos a equação (13) pelos parâmetros como feito acima, obtemos o mesmo resultado, porém a equação (8) vira:

$$S = \sum_i\frac{1}{\sigma^2}$$
$$S_x = \sum_i\frac{x_i}{\sigma_i^2}$$
$$S_y = \sum_i\frac{y_i}{\sigma_i^2}$$
$$S_{xx} = \sum_i\frac{x_i^2}{\sigma_i^2}$$
$$S_{xy} = \sum_i\frac{x_iy_i}{\sigma_i^2} \tag{14}$$

E o resultado final é a mesma equação:

$$a = \frac{S_yS_{xx} - S_{xy}S_x}{SS_{xx} - S_x^2}$$

$$b = \frac{SS_{xy} - S_xS_y}{SS_{xx} - S_x^2}$$

## Obtendo as incertezas dos parâmetros ajustados

Para terminar, sabemos que as medidas possuem incertezas associadas aos experimentos e queremos saber como essas incertezas podem ser propagadas para os parâmetros ajustados. Infelizmente, é extremamente complicado considerar as barras de erro nas duas variáveis, não existindo uma solução pré-determinada. Porém, se considerarmos a incerteza apenas na variável dependente, o procedimento se torna mais simples.

Devemos lembrar que a equação de propagação de erro é:

$$\sigma_f^2 = \left(\frac{\partial f}{\partial a_1} \right)^2\sigma_{a_1}^2 + \left(\frac{\partial f}{\partial a_2} \right)^2\sigma_{a_2}^2 + \cdot\cdot\cdot + \left(\frac{\partial f}{\partial a_n} \right)^2\sigma_{a_n}^2 = \sum_i\left(\frac{\partial f}{\partial a_i} \right)^2\sigma_{a_i}^2$$

Aplicando essa equação para $a$ e para $b$ supondo que os erros ocorrem apenas em $y$, temos que:

$$\sigma_a^2 = \sum_i\left(\frac{\partial a}{\partial y_i} \right)^2\sigma_i^2 \tag{15}$$
$$\sigma_b^2 = \sum_i\left(\frac{\partial b}{\partial y_i} \right)^2\sigma_i^2 \tag{16}$$

Primeiramente, vamos obter a derivada de $a$ em relação a $y_i$:

$$\frac{\partial a}{\partial y_i} = \frac{\partial}{\partial y_i}\left(\frac{S_yS_{xx} - S_{xy}S_x}{SS_{xx} - S_x^2} \right)$$
$$\frac{\partial a}{\partial y_i} = \frac{1}{SS_{xx} - S_x^2}\frac{\partial}{\partial y_i}\left(S_yS_{xx} - S_{xy}S_x\right)$$
$$\frac{\partial a}{\partial y_i} = \frac{1}{SS_{xx} - S_x^2}\left(S_{xx}\frac{\partial S_y}{\partial y_i} - S_x\frac{\partial S_{xy}}{\partial y_i}\right) \tag{17}$$

Substituindo na equação (17) os valores de $S_y$ e $S_xy$ dados na equação (14) obtemos o resultado da derivada

$$\frac{\partial a}{\partial y_i} = \frac{1}{SS_{xx} - S_x^2}\left(\frac{S_{xx}}{\sigma_i^2} - \frac{S_xx_i}{\sigma_i^2}\right)$$
$$\frac{\partial a}{\partial y_i} = \frac{1}{\sigma_i^2}\left(\frac{S_{xx} - S_xx_i}{SS_{xx} - S_x^2}\right) \tag{18}$$

Substituindo a equação (18) na equação (15) obtemos:

$$\sigma_a^2 = \sum_i\left[\frac{1}{\sigma_i^2}\left(\frac{S_{xx} - S_xx_i}{SS_{xx} - S_x^2}\right) \right]^2\sigma_i^2$$
$$\sigma_a^2 = \sum_i\frac{1}{\sigma_i^2}\frac{(S_{xx} - S_xx_i)^2}{(SS_{xx} - S_x^2)^2}$$
$$\sigma_a^2 = \frac{1}{(SS_{xx} - S_x^2)^2}\sum_i\frac{1}{\sigma_i^2}(S_{xx}^2 - 2S_{xx}S_xx_i + S_x^2x_i^2)$$
$$\sigma_a^2 = \frac{1}{(SS_{xx} - S_x^2)^2}\left(S_{xx}^2 \sum_i\frac{1}{\sigma_i^2}- 2S_{xx}S_x\sum_i\frac{x_i}{\sigma_i^2} + S_x^2\sum_i\frac{x_i^2}{\sigma_i^2}\right)$$
$$\sigma_a^2 = \frac{1}{(SS_{xx} - S_x^2)^2}\left(S_{xx}^2 S - 2S_{xx}S_xS_x + S_x^2S_{xx}\right)$$
$$\sigma_a^2 = \frac{1}{(SS_{xx} - S_x^2)^2}\left(S_{xx}^2 S - S_{xx}S_x^2\right)$$
$$\sigma_a^2 = \frac{1}{(SS_{xx} - S_x^2)^2}S_{xx}\left(S_{xx} S - S_x^2\right)$$
$$\sigma_a^2 = \frac{S_{xx}}{(SS_{xx} - S_x^2)} \tag{19}$$

Fazendo o mesmo procedimento para (b) temos:

$$\sigma_b^2 = \frac{S}{(SS_{xx} - S_x^2)} \tag{20}$$