# Erros

A an√°lise de erros √© essencial para compreender as limita√ß√µes dos algoritmos
num√©ricos e tentar garantir a precis√£o e estabilidade dos resultados fornecidos
por eles.

## $ \S 1 $ Tipos de erros

* __Erros de aproxima√ß√£o (ou arredondamento)__: O erro de aproxima√ß√£o ocorre
  quando um determinado n√∫mero n√£o pode ser representado exatamente no sistema
  de ponto flutuante, sendo portanto necess√°rio arredond√°-lo ou trunc√°-lo para
  que se ajuste ao formato especificado. Este tipo de erro √© inerente ao sistema
  de ponto flutuante, pois decorre do n√∫mero finito de d√≠gitos significativos
  que s√£o armazenados em mem√≥ria. Os erros de aproxima√ß√£o podem se propagar e
  se acumular, levando potencialmente a imprecis√µes significativas no resultado
  final.

* __Erros de truncamento__: Os erros de truncamento s√£o introduzidos quando um
  processo infinito, como uma seq√º√™ncia ou m√©todo iterativo, √© encerrado
  ap√≥s um n√∫mero finito de etapas. Por exemplo, ao calcular a representa√ß√£o
  de uma fun√ß√£o por sua s√©rie de Taylor, os erros de truncamento surgem da
  omiss√£o de termos de ordem superior. Estes erros dependem do algoritmo e do
  n√∫mero de itera√ß√µes ou termos utilizados. A redu√ß√£o dos erros de truncamento
  geralmente envolve o aumento do n√∫mero de itera√ß√µes ou termos, o que por
  outro lado pode levar tamb√©m a um aumento do custo computacional e dos erros
  de arredondamento envolvidos.
  
* __Perda de signific√¢ncia__: A perda de signific√¢ncia ocorre quando dois n√∫meros
  quase iguais s√£o subtra√≠dos, levando a uma perda de d√≠gitos significativos no
  resultado. Este fen√¥meno tamb√©m √© conhecido como _cancelamento catastr√≥fico_ e
  pode levar a imprecis√µes substanciais no c√°lculo. A perda de signific√¢ncia
  pode ser mitigada usando-se algoritmos ou t√©cnicas que evitam ao m√°ximo a
  subtra√ß√£o de n√∫meros, ou aumentando-se a precis√£o da representa√ß√£o de ponto
  flutuante.

üìù Note que a palavra "truncamento" no segundo tipo n√£o se refere ao modo de se
aproximar um dado n√∫mero por um outro no formato de ponto flutuante (considerado
no caderno anterior), mas sim √† omiss√£o de um n√∫mero passos ou termos de
uma express√£o ou processo que nunca termina.


## $ \S 2 $ Exemplos de erros

__Exemplo 2.1 (erro de aproxima√ß√£o):__ 
Suponha que queiramos somar os n√∫meros $ 0.1 $ e $ 0.2 $ em um sistema de ponto
flutuante como o padr√£o IEEE 754 de precis√£o simples. Ambos os n√∫meros s√£o
racionais, mas nenhum deles pode ser escrito como uma fra√ß√£o de inteiros cujo
denominador √© pot√™ncia de $ 2 $, logo suas representa√ß√µes na base bin√°ria s√£o
infinitas. Por este motivo, necessariamente ocorrem erros de aproxima√ß√£o ao
tentarmos represent√°-los como n√∫meros de ponto flutuante na m√°quina:

$$
0.1_{10} \approx 0.00011001100110011001101_{2} \quad \text{e} \quad 
0.2_{10} \approx 0.00110011001100110011001_{2}
$$

Ao somar esses dois n√∫meros aproximados e converter o resultado de volta para
decimal obtemos:
$$
0.1_{10} + 0.2_{10} \approx 0.30000000000000004_{10} \quad \text{em vez de} \quad 0.3_{10} \,.
$$
O erro de arredondamento √© portanto $ 4 \times 10^{-17} $.

In [1]:
x = 0.1
y = 0.2
x + y

0.30000000000000004

__Exemplo 2.2 (erro de truncamento):__ Suponha que desejemos calcular o valor da
constante $ e $. Uma id√©ia seria utilizar a s√©rie de Taylor da fun√ß√£o
exponencial ao redor de $ 0 $, que converge para qualquer $ x $:
$$
e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!} = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots
$$
Contudo, pela natureza finita da m√°quina, √© necess√°rio truncar a s√©rie ap√≥s um
n√∫mero finito de termos. Se o truncamento for efetuado ap√≥s os primeiros quatro
termos, obteremos o valor aproximado
$$
e = e^{1} \approx 1 + \frac{1}{1!} + \frac{1^2}{2!} + \frac{1^3}{3!} = \frac{8}{3} = 2.6\overline{6}\,.
$$

J√° o valor real de $ e $ √© aproximadamente $ 2.71828 $. O erro de truncamento √© portanto
bastante significativo neste caso: $ 0.0516 $, aproximadamente.

__Exemplo 2.3 (perda de signific√¢ncia ou cancelamento catastr√≥fico):__ 

Considere as somas seguintes no nosso sistema de ponto flutuante:
$$
3.40 + 9.87 \approx 13.0 \quad \text{e} \quad 3.40 + 100 \approx 103\,.
$$
Em ambos os casos, apesar do arredondamento, o resultado aproximado das opera√ß√µes est√° relativamente pr√≥ximo do valor
exato. Agora considere a seguinte opera√ß√£o, que envolve uma subtra√ß√£o:
$$
(100 + 3.40) - 102 \approx 103 - 102 = 1\,.
$$
Aqui o valor exato √© $ 1.4 $. Portanto o erro _relativo_
$$
\frac{1.4 - 1.0}{1.4}
$$
√© de quase $ 30\% $. A explica√ß√£o √© que a subtra√ß√£o de dois n√∫meros que est√£o
muito pr√≥ximos um do outro pode gerar a perda de v√°rios d√≠gitos significativos.
O erro absoluto √© pequeno, mas o relativo, que √© o que importa na maioria dos
casos, n√£o √©.  Para tornar este ponto mais dram√°tico, se continuando a conta do
nosso exemplo, tiv√©ssemos que multiplicar o √∫ltimo resultado por $ 10\,000 $, o
resultado exato seria $ 14\,000 $, enquanto o valor aproximado seria apenas $
10\,000 $.


__Exemplo 6.4 (perda de signific√¢ncia ou cancelamento catastr√≥fico):__
Consideremos outro exemplo da perda de signific√¢ncia.  O m√©todo mais simples
para se calcular a derivada $ f'(a) $ de uma fun√ß√£o $ f $ num ponto $ a $
consiste em aproxim√°-la por
$$
\frac{f(a + h) - f(a)}{h}\,.
$$
Como $ f'(a) $ √© por defini√ß√£o o limite desta quantidade conforme $ h \to 0 $,
√© natural supor que quanto menor o valor de $ h $, melhor ser√° a aproxima√ß√£o. Contudo,
h√° algumas dificuldades com esta id√©ia. Primeiramente, se $ h $ for muito
pequeno, ele pode ser substitu√≠do por zero no sistema de ponto flutuante, gerando
um erro na tentativa de efetuar a divis√£o. Independentemente disto, pode ocorrer
o cancelamento catastr√≥fico no c√°lculo do numerador, que ent√£o √© amplificado
pelo denominador muito pequeno.

Como ilustra√ß√£o vamos tentar calcular o valor da derivada do seno em $ a = 2 $,
usando este m√©todo para valores cada vez menores de $ h $.

In [2]:
from numpy import sin, cos


def derivative(f, x, h):
    return (f(x + h) - f(x)) / h


exact = cos(2)
for n in range(1, -20, -1):
    h = 10**(n)
    approx = derivative(sin, 2, h)
    print(f"expoente: {n:3}", f"\terro: {exact - approx: 3.6e}")

expoente:   1 	erro: -2.715598e-01
expoente:   0 	erro:  3.520306e-01
expoente:  -1 	erro:  4.473377e-02
expoente:  -2 	erro:  4.539514e-03
expoente:  -3 	erro:  4.545793e-04
expoente:  -4 	erro:  4.546418e-05
expoente:  -5 	erro:  4.546484e-06
expoente:  -6 	erro:  4.547462e-07
expoente:  -7 	erro:  4.485187e-08
expoente:  -8 	erro:  2.663398e-09
expoente:  -9 	erro:  5.817455e-08
expoente: -10 	erro:  2.802192e-07
expoente: -11 	erro: -1.940227e-06
expoente: -12 	erro:  7.577538e-05
expoente: -13 	erro:  1.867977e-04
expoente: -14 	erro:  5.737913e-03
expoente: -15 	erro: -8.307993e-02
expoente: -16 	erro: -4.161468e-01
expoente: -17 	erro: -4.161468e-01
expoente: -18 	erro: -4.161468e-01
expoente: -19 	erro: -4.161468e-01


## $ \S 3 $ Medidas do erro: erro absoluto e erro relativo

Seja $ x $ um n√∫mero qualquer e denotemos por $ \bar x $ uma aproxima√ß√£o para $ x $.
Por exemplo, $ x $ pode ser um n√∫mero irracional e $ \bar x $ aquele que o representa
no sistema de ponto flutuante da m√°quina. Ou $ x $ pode ser uma raiz de um polin√¥mio
e $ \bar x $ uma aproxima√ß√£o para ela, obtida atrav√©s de algum m√©todo num√©rico.
√â importante ter uma medida da discrep√¢ncia entre estes dois valores. Com isto em mente
definimos:
* O __erro absoluto__ associado a esta aproxima√ß√£o por 
  $$ \boxed{\varepsilon_x = x - \bar x} $$
* O __erro relativo__ associado a esta aproxima√ß√£o por 
  $$ \phantom{(x \ne 0)} \qquad \boxed{\rho_x = \frac{x - \bar x}{x} \qquad (x \ne 0) } $$

Em geral o valor exato $ x $ √© desconhecido. Nestas situa√ß√µes o melhor que se pode
esperar √© conseguir uma _cota_ para o erro relativo ou absoluto.

üìù Alguns autores preferem definir o erro absoluto por $ | x - \bar x |$ e o relativo
por $ \frac{| x - \bar x|}{| x |} $. De fato, na maior parte dos casos o que importa
√© o tamanho do erro, n√£o seu sinal.


__Teorema 3.1 (erro na adi√ß√£o e subtra√ß√£o):__
_Sejam $x$ e $y$ dois n√∫meros reais, aproximados com erros
absolutos $\varepsilon_x$ e $\varepsilon_y$ e erros relativos $\rho_x$ e
$\rho_y$, respectivamente. Ent√£o, para a adi√ß√£o e subtra√ß√£o de $x$ e $y$, as
seguintes rela√ß√µes s√£o v√°lidas:_

(a) $ \varepsilon_{x\pm y} = \varepsilon_x + \varepsilon_y $\,.

(b) _Assumindo que_ $ x $, $ y $ _e_ $ x \pm y \ne 0 $,
$$
\rho_{x\pm y} = \frac{x}{x \pm y} \rho_x + \frac{y}{x \pm y}\rho_y
$$

__Prova:__ Vamos demonstrar o resultado para a soma de $ x $ e $ y $; o caso da diferen√ßa
√© inteiramente an√°logo. Sejam $ \bar x $ e $ \bar y $ as respectivas aproxima√ß√µes.

(a) Pela defini√ß√£o de erro absoluto,
\begin{align*} \varepsilon_{x+ y} &= (x + y) - (\bar x + \bar y) \\
&= (x - \bar x) + (y - \bar y) \\
&= \varepsilon_x + \varepsilon_y \,.
\end{align*}

(b) Pela parte (a),
\begin{align*} \rho_{x+ y} &= \frac{\varepsilon_{x+ y}}{x + y} \\
&= \frac{\varepsilon_x + \varepsilon_y}{x + y} \\
&= \frac{x}{x + y}\, \frac{\varepsilon_x}{x} +
\frac{y}{x + y}\, \frac{\varepsilon_y}{y}\\
&= \frac{x}{x + y}\,\rho_x + \frac{y}{x + y}\,\rho_y\,.
\end{align*}


__Teorema 3.2 (erro no produto):__
_Sejam $x$ e $y$ n√∫meros reais, aproximados por $ \bar x $ e
$ \bar y $, de modo que os respectivos erros absolutos e relativos sejam
$\varepsilon_x$, $\varepsilon_y$, $\rho_x$ e $\rho_y$. Suponha que os erros
relativos $ \rho_x $ e $ \rho_y $ sejam pequenos.  Ent√£o para o produto de $x$ e
$y$ valem as seguintes rela√ß√µes:_

_(a) O erro absoluto_ $ \varepsilon_{xy} = xy - \bar{x}\bar{y} $ _satisfaz_
$$ \varepsilon_{xy} \approx \bar{x}\,\varepsilon_y + \bar{y}\,\varepsilon_x + \varepsilon_x\,\varepsilon_y \,.$$

_(b) O erro relativo_ $ \rho_{xy} = \frac{xy - \bar{x}\bar{y}}{xy} $ _satisfaz_
$ \rho_{xy} \approx \rho_x + \rho_y \,$ _(assumindo que $ x,\, y \ne 0 $)_.

__Prova:__

(a) Pela defini√ß√£o do erro absoluto,
\begin{alignat*}{9}
\varepsilon_{xy} &= xy - \bar x \bar y \\
&= xy - x \bar y + x \bar y - \bar x \bar y  \\
&=  x(y - \bar y) + \bar y(x - \bar x)  \\
&= x\,\varepsilon_y + \bar y\,\varepsilon_x \\
&= x\,\varepsilon_y + \frac{\bar y}{y}\,y\,\varepsilon_x \\
&\approx  x\,\varepsilon_y + y\,\varepsilon_x \,.
\end{alignat*}
A √∫ltima aproxima√ß√£o √© tanto melhor quanto menor for o erro relativo $ \rho_y $. De fato,
$$
\left\lvert \frac{\bar y}{y} - 1 \right\rvert = 
\frac{|y - \bar y|}{| y |} = \rho_y\,. 
$$

(b) Como visto na demonstra√ß√£o da parte (a),
\begin{align*}
\rho_{xy} &= \frac{\varepsilon_{xy}}{xy} \\
&= \frac{x \, \varepsilon_y + \bar y \, \varepsilon_x}{xy} \\
&= \frac{\varepsilon_y}{y} + \frac{\bar y}{y}\, \frac{\varepsilon_x}{x} \\
&\approx \rho_x + \rho_y \,.
\end{align*}

__Teorema 3.3 (erro na divis√£o):__
_Sejam $x$ e $y$ dois n√∫meros reais com erros absolutos
$\varepsilon_x = x - \bar{x}$ e $\varepsilon_y = y - \bar{y}$, e erros relativos
$\rho_x = \frac{x - \bar{x}}{x}$ e $\rho_y = \frac{y - \bar{y}}{y}$,
respectivamente, onde $ x,\,y \ne 0$. Ent√£o, para a divis√£o de $x$ por $y$, as
seguintes rela√ß√µes s√£o v√°lidas:_

(a) $ \varepsilon_{x / y} = \frac{x}{\bar y} \big( \rho_x - \rho_y \big)\,. $


(b) $ \rho_{x / y} \approx \rho_x - \rho_y\,. $

__Prova:__

(a) Temos
\begin{align*}
\varepsilon_{x / y} &= \frac{x}{y} - \frac{\bar{x}}{\bar{y}} \\
&= \frac{x\bar{y} - \bar x y}{y\bar y} \\
&= \frac{x\bar{y} - xy + xy - \bar x y}{y\bar y} \\
&= \frac{x\,(\bar{y} - y) + (x - \bar x)\,y}{y\bar y} \\
&= - \frac{\varepsilon_y}{y}\,\frac{x}{\bar y} + \frac{\varepsilon_x}{x}\,\frac{x}{\bar y} \\
&=\frac{x}{\bar y} \big( \rho_x - \rho_y \big)\,.
\end{align*}

(b) Da parte (a) segue que se $ \rho_y $ √© pequeno, ent√£o:
\begin{align*} \rho_{x / y} &= \frac{\varepsilon_{x / y}}{x / y} \\
&=\frac{y}{\bar y}  \big( \rho_x - \rho_y \big) \\
&\approx \rho_x- \rho_y\,.
\end{align*}

üìù Note que em todos estes tr√™s teoremas, foram ignorados os erros de
aproxima√ß√£o envolvidos nos resultados $ \bar x \pm \bar y $, $ \bar x\bar y $ e 
$ \bar x / \bar y $, decorrentes do fato que estes n√∫meros em geral n√£o podem
ser representados fielmente no sistema de ponto flutuante. 