# Aritm√©tica de ponto flutuante em computadores

## $ \S 1 $ Introdu√ß√£o

O principal objetivo dos m√©todos num√©ricos √© desenvolver algoritmos e t√©cnicas
eficazes para resolver problemas matem√°ticos e, no processo, ajudar-nos a obter
um maior entendimento sobre eles. Os m√©todos num√©ricos s√£o especialmente √∫teis
quando solu√ß√µes anal√≠ticas ou em forma fechada n√£o est√£o dispon√≠veis ou s√£o
muito dif√≠ceis de se calcular.  N√∫meros s√£o a base de toda computa√ß√£o. Portanto
√© necess√°rio que primeiro compreendamos como eles s√£o representados em uma
m√°quina, como a capacidade de mem√≥ria e poder de processamento finitos
inevitavelmente levam a erros, e como estes erros podem ser controlados.

## $ \S 2 $ O sistema de representa√ß√£o de n√∫meros de ponto fixo

No sistema dos __n√∫meros de ponto fixo__, especifica-se uma base $ b \ge 2 $,
digamos a decimal, e uma quantidade fixa de d√≠gitos para se representar a parte
inteira e a parte fracion√°ria de um n√∫mero qualquer, digamos $ 3 $ e $ 4 $
respectivamente. Poder√≠amos portanto representar os n√∫meros
\begin{align*}
\pi& \quad \text{como}& 3&.1416 \\
-\frac{\pi}{1000}& \quad \text{como}& -0&.0031 \\
123 & \quad \text{como}& 123&.0 \\
-123.456789& \quad \text{como}& -123&.4568
\end{align*}
Observe que neste sistema a diferen√ßa entre dois n√∫meros sucessivos √© sempre a
mesma ($ 0.0001 $ para as escolhas que fizemos).

Como veremos, o sistema de ponto fixo √© muito inflex√≠vel e ineficiente para ser
utilizado na pr√°tica. Usando base $ b = 2 $ e $ 32 $ bits para armazenar cada
n√∫mero positivo, com $ 16 $ bits reservados para a parte inteira e $ 16 $ para a
parte fracion√°ria, s√≥ seria poss√≠vel representar n√∫meros entre $ 2^{-16} \approx
0,00002 $ e $ 2^{16} = 65536 $.

üìù Se usarmos $ 32 $ bits para armazenar diretamente os d√≠gitos de n√∫meros
inteiros, o menor e maior valor que podem ser representados na m√°quina s√£o
$$
-2^{31} = -2,147,483,648 \quad \text{e} \quad  2^{31} - 1 = 2,147,483,647\,.
$$
(ou seja, entre $ \pm 2 $ bilh√µes, aproximadamente). Note que estes n√∫meros
s√£o relativamente pequenos.

## $ \S 3 $ O sistema de representa√ß√£o de n√∫meros de ponto flutuante

### $ 3.1 $ Defini√ß√£o dos n√∫meros de ponto flutuante

A aritm√©tica de ponto flutuante √© um pilar dos m√©todos num√©ricos, fornecendo um
meio eficiente de representar e manipular n√∫meros reais em hardware e software.
Os n√∫meros de ponto flutuante s√£o n√∫meros expressos num formato espec√≠fico, que
nos permite representar tanto magnitudes grandes quanto pequenas mantendo
precis√£o razo√°vel. O padr√£o [IEEE 754](https://en.wikipedia.org/wiki/IEEE_754)
(estabelecido em 1985), que define os formatos de n√∫meros de ponto flutuante
utilizados comumente, tornou-se parte integrante da engenharia dos sistemas
modernos de computa√ß√£o e dos algoritmos num√©ricos. Em particular, ele tamb√©m √©
seguido em Python.

Um n√∫mero de ponto flutuante consiste do produto de duas componentes: uma
__mantissa__ (ou _significando_) e uma __base__ elevada a um __expoente__, por
exemplo:
$$
-1234.56 = -1.23456
\times 10^3 \,.
$$
Mais geralmente, um __n√∫mero de ponto flutante__ tem a forma
$$
x = \text{(sinal)}\, \, \text{mantissa}\, \times \,\text{base}^{\text{expoente}}\,.
$$
_Devem ser respeitadas as seguintes restri√ß√µes sobre estes elementos:_
* O __sinal__ $ \pm $ √© representado por um √∫nico bit.
* A __base__ $ b $ pode ser qualquer inteiro $ \ge 2 $ (ou seja), mas esta escolha √© fixa.
  Na maioria esmagadora dos casos, √© utilizado o sistema bin√°rio ($ b = 2 $).
* O __expoente__ √© representado utilizando-se um n√∫mero fixo de bits, por exemplo
  $ 8 $ para precis√£o simples. Dentre as $ 2^8 = 256 $
  possibilidades, duas sempre s√£o reservadas para denotar valores especiais,
  como infinito (`inf` em Python) ou _NaN_ (_Not a Number_, `NaN`). Sendo assim,
  no caso da precis√£o simples, os poss√≠veis expoentes s√£o aqueles entre $ -126 $
  e $ +127 $. Esta restri√ß√£o limita as _magnitudes_ dos n√∫meros que podem ser
  representados precisamente pela m√°quina. Se o expoente de um n√∫mero n√£o est√°
  dentro desta faixa, o resultado pode ser um erro de __overflow__ (muito grande
  para ser representado) ou de __underflow__ (muito pequeno para ser
  representado).
* A __mantissa__ ou __significando__ deve estar no intervalo $ [1, b) $,
  onde $ b $ √© a base. Sendo assim, neste formato a mantissa de um n√∫mero
  envolve exatamente um d√≠gito antes do ponto (e este d√≠gito n√£o pode ser nulo).
  Por exemplo, quando $ b = 10 $ √© a base, $ 4.321 $ √© um mantissa v√°lida, mas $
  0.4321 $ e $ 43.21 $ n√£o s√£o. A mantissa √© representada no sistema de precis√£o
  simples atrav√©s de $ 23 $ bits. Na verdade quando a base √© $ 2 $, libera-se um
  bit adicional para armazenagem, j√° que como a mantissa deve estar em $ [1, 2)
  $, o d√≠gito antes do ponto s√≥ pode ser $ 1 $; este bit √© chamado de _bit
  impl√≠cito_ ou _escondido_.  Seja como for, a limita√ß√£o do n√∫mero de bits
  reservados para a mantissa imp√µe uma restri√ß√£o √† _precis√£o_ com que um n√∫mero
  pode ser representado.
  
No caso do formato de __precis√£o simples__ s√£o utilizados portanto
$$
32 \text{ bits} = 1 \text{ bit para o sinal} +
8 \text{ bits para o expoente} + 23\text{ bits para a mantissa}
$$
para se representar um n√∫mero de ponto flutuante. Observe que mesmo
utilizando apenas $ 32 $ bits, atrav√©s deste formato √© poss√≠vel representar
n√∫meros numa faixa muito mais ampla que aquela represent√°vel usando o formato de
ponto fixo. 

üìù O padr√£o IEEE 754 tamb√©m cont√©m especifica√ß√µes para representa√ß√£o de n√∫meros
com dupla ($ 64 $ bits), qu√°drupla ($ 128 $ bits) e meia ($ 16 $ bits) precis√£o,
dentre outros.

üìù O termo "ponto flutuante" se refere ao fato que a posi√ß√£o do ponto de base
n√£o √© fixa. √Ä medida que o expoente muda, o ponto pode "flutuar" entre
diferentes posi√ß√µes, permitindo que a representa√ß√£o cubra eficientemente uma
ampla gama de n√∫meros. Python representa os n√∫meros de ponto flutuante com o
tipo `float`; a sua representa√ß√£o mais fiel √© aquela da chamada
_nota√ß√£o cient√≠fica_: `<mantissa>e<expoente>` (em que a base $ b = 10 $). Por
exemplo $ 123.45 $ corresponde nesta nota√ß√£o a `1.2345e2`.


### $ 3.2 $ Caracter√≠sticas do sistema de n√∫meros de ponto flutuante

<div class="alert alert-info">  Para tornar a discuss√£o mais simples e concreta,
de agora em diante assumiremos que no nosso sistema de n√∫meros de ponto
flutuante:
    <ul>
        <li>A base $ b $ √© $ 10 $.
        <li> As mantissas s√£o constitu√≠das de $ 3 $ d√≠gitos.
        <li> Os expoentes variam entre $ -9 $ e $ 9 $.
        </li></ul></div>
</div>

Neste caso:
* O zero √© representado por $$ 0 = 0.00 \times 10^{-9}\,. $$ Este √© o √∫nico
  n√∫mero cuja mantissa n√£o respeita as restri√ß√µes descritas na $ \S 3.1 $.
  Como veremos, _n√£o se pode representar o zero por_ $ 0.00 \times 10^{e} $
  _para qualquer expoente_ $ e \ne -9 $, sob pena de termos $ x + 0 = 0 $
  para alguns n√∫meros $ x \ne 0 $.
* O maior n√∫mero represent√°vel neste sistema √© $ 9.99 \times 10^9 $
  (aproximadamente $ 10 $ bilh√µes), e o menor n√∫mero positivo √©
  $ 1.00 \times 10^{-9} $.
* Chamamos de __d√©cada__ o conjunto de n√∫meros que t√™m um mesmo expoente $ e $.
  Em cada d√©cada do nosso sistema, podem ser representados $ 900 $ n√∫meros:
  aqueles com mantissa entre $ 1.00 $ e $ 9.99 $.
* Dentro da d√©cada de expoente $ e $, n√∫meros sucessivos est√£o igualmente
  espa√ßados (por $ 10^{e - 2} $, no nosso formato). Em particular, esta
  dist√¢ncia aumenta exponencialmente conforme $ e $ aumenta.
* O padr√£o IEEE 754 detalha v√°rios modos de se aproximar um n√∫mero que
  n√£o pode ser representado exatamente neste formato, de acordo com 
  a necessidade da aplica√ß√£o sob considera√ß√£o. Por exemplo, para
  representar $ 2.345 $ neste sistema, podem-se utilizar:
    * __Truncamento__, significando que os d√≠gitos excedentes s√£o simplesmente
      descartados; neste caso o truncamento seria portanto
      $ 2.34 \times 10^0 $.
    * __Arredondamento, desempate por cima__, significando que o n√∫mero √©
    substitu√≠do por aquele mais pr√≥ximo dentro do formato e, em caso de empate
    entre duas op√ß√µes, pela maior delas; no exemplo, $ 2.35 \times 10^0 $.
    * __Arredondamento, desempate por d√≠gito par (modo default)__, significando
    que o n√∫mero √© substitu√≠do pelo mais pr√≥ximo dentro do formato e que,
    no caso de haver duas op√ß√µes, √© escolhido aquele cujo d√≠gito menos 
    significativo √© par; no caso, $ 2.34 \times 10^0 $. A vantagem deste modo √©
    que em casos amb√≠guos o arredondamento √© feito sem qualquer vi√©s, j√°
    que metade dos d√≠gitos em base $ 10 $ (ou base $ 2 $) √© par e a outra metade √©
    √≠mpar. Se em casos de empate o arredondamento sempre √© feito por cima, por
    exemplo, em algumas situa√ß√µes isto pode gerar um ac√∫mulo de erros de
    aproxima√ß√£o, por todos terem a mesma dire√ß√£o.
* Os resultados _intermedi√°rios_ de opera√ß√µes com n√∫meros de ponto-flutuante
  s√£o armazenados com precis√£o extra, em geral precis√£o dupla. Nos nossos
  exemplos, permitiremos que a mantissa destes n√∫meros auxiliares seja
  representada com $ 6 $ d√≠gitos (em vez de $ 3 $). Al√©m disto, relaxamos
  a exig√™ncia que a mantissa contenha exatamente um d√≠gito n√£o-nulo antes do ponto.
  Contudo, ao final da opera√ß√£o sempre √© necess√°rio trazer o resultado de volta
  ao formato especificado, por algum dos tr√™s tipos de aproxima√ß√£o considerados
  no ponto acima.

__Exerc√≠cio:__ Mostre que o nosso sistema consiste de exatamente $ 34\,201 $
n√∫meros diferentes.

A precis√£o finita inerente √† representa√ß√£o de n√∫meros reais utilizando um
n√∫mero limitado de d√≠gitos n√£o apenas restringe a classe de n√∫meros que
podem ser representados de maneira exata, mas tamb√©m traz inevitavelmente a
possibilidade de erros mesmo nas opera√ß√µes aritm√©ticas mais simples.
Estas limita√ß√µes exigem uma cuidadosa considera√ß√£o
da propaga√ß√£o de erros e da estabilidade dos m√©todos num√©ricos, bem como a
ado√ß√£o de t√©cnicas para minimizar o impacto dos erros na precis√£o e
confiabilidade dos resultados computacionais.

## $ \S 3 $ Adi√ß√£o no sistema de ponto flutuante

Nas pr√≥ximas se√ß√µes vamos explicar atrav√©s de exemplos como s√£o calculadas
a soma, diferen√ßa e produto de dois n√∫meros no sistema de ponto flutuante.

__Exemplo 3.1:__ Calcule a soma dos n√∫meros $ 3.15 \times 10^2 $ e $ 1.26 \times 10^1
$, utilizando arredondamento com desempate para cima.

_Solu√ß√£o:_ Antes de realizar a adi√ß√£o, precisamos garantir que os expoentes sejam
iguais. Para isto, vamos "deslocar o ponto" do n√∫mero com o _menor_ expoente
para que passe a ter o mesmo expoente que o outro n√∫mero:
\begin{equation*}
    1.26 \times 10^1 = 0.126 \times 10^2 \quad \text{(igualando os expoentes)}
\end{equation*}
Agora podemos realizar a adi√ß√£o:
\begin{equation*}
    \begin{aligned}
        &\phantom{+}& 3&.15 & \times & 10^2 & \\
        &+& 0&.126 & \times & 10^2 & \text{(adicionando)} \\
        &{=}& 3&.276 & \times & 10^2 & \text{(arredondando)} \\
        &{\approx} & 3&.28 & \times & 10^2 & \text{(resultado)}
    \end{aligned}
\end{equation*}
Note que a mantissa do resultado intermedi√°rio $ 3.276 \times 10^2 $ foi
representada com precis√£o adicional, antes que ele fosse convertido por
arredondamento a um resultado final que segue nossas conven√ß√µes.

__Exemplo 3.2:__ Calcule a soma dos n√∫meros $ 6.21 \times 10^{2} $ e
$ 5.73 \times 10^{0} $, utilizando truncamento se necess√°rio.

_Solu√ß√£o:_ Mais uma vez, precisamos igualar os expoentes antes de
realizar a adi√ß√£o. Para isto ajustamos o n√∫mero com o _menor_ expoente:
\begin{equation*}
    5.73 \times 10^0 = 0.0573 \times 10^2 \quad \text{(igualando os expoentes)}
\end{equation*}
Calculando a soma:
\begin{equation*}
    \begin{aligned}
        &\phantom{+}& 6&.21 & \times & 10^2 \\
        &+& 0&.0573 & \times & 10^2 & \text{(adicionando)}\\
        &{=}& 6&.2673 & \times & 10^2 & \text{(truncamento)} \\
        &{\approx} & 6&.26 & \times & 10^2 & \text{(resultado)}
    \end{aligned}
\end{equation*}
Observe o uso do truncamento no √∫ltimo passo para trazer a mantissa do resultado
intermedi√°rio de volta ao nosso formato.

__Exemplo 3.3__: Adicione $ 9.53 \times 10^{-1} $ a $ 7.20 \times 10^{-2} $ usando
arredondamento, com desempate por d√≠gito menos significativo par se necess√°rio.

_Solu√ß√£o:_ Igualando o expoente do segundo n√∫mero ao do primeiro:
\begin{equation*}
    7.20 \times 10^{-2} = 0.720 \times 10^{-1} \quad \text{(igualando os expoentes)}
\end{equation*}
Realizando a adi√ß√£o:
\begin{equation*}
    \begin{aligned}
        &\phantom{+}& 9&.53 &\times& 10^{-1} \\
        &+& 0&.720 &\times& 10^{-1} & \text{(adicionando)}\\
        &{=}& 10&.25 &\times& 10^{-1} & \text{(renormalizando)} \\
        &{=}& 1&.025 &\times& 10^{0} &  \text{(arredondando)}\\
        &{\approx}& 1&.02 &\times& 10^{0} & \text{(resultado)} \\
    \end{aligned}
\end{equation*}
No √∫ltimo passo o resultado do arredondamento foi $ 1.02 \times 10^0 $ e n√£o
$ 1.03 \times 10^0 $ j√° que, conforme especificado no enunciado, √© o primeiro
destes cujo d√≠gito menos significativo √© par.

__Exerc√≠cio:__ Calcule as somas dos n√∫meros de ponto flutuante abaixo. Suas
respostas devem seguir a conven√ß√£o acima, ou seja, os expoentes devem estar entre
$ 9 $ e $ -9 $ e as mantissas devem possuir exatamente tr√™s d√≠gitos
significativos.

(a) $ 2.34 \times 10^2 + 3.87 \times 10^2 $; utilize arredondamento com desempate para cima.

(b) $ 4.23 \times 10^{-4} + 1.38 \times 10^{-3} $; utilize truncamento.

(c) $ 3.24 \times 10^5 + 9.78 \times 10^3 $; utilize arredondamento com desempate por d√≠gito par.

(d) $ 7.36 \times 10^{-7} + 4.29 \times 10^{-9} $; utilize arredondamento com desempate para cima.

(e) $ 5.99 \times 10^9 + 8.43 \times 10^{-1} $; utilize truncamento.

(f) $ 1.03 \times 10^9 + 8.97 \times 10^{9} $; utilize arredondamento com desempate por d√≠gito par.

__Exerc√≠cio__:

(a) Mostre que seguindo as nossas conven√ß√µes vale $ 1.00 \times 10^0  + 0.00 \times 10^3  = 0.00 \times 10^3 $.

(b) Mais geralmente, discuta a representa√ß√£o do n√∫mero zero por
    $ 0.00 \times 10^e $ para expoentes distintos do menor poss√≠vel.

__Exerc√≠cio:__ Explique o resultado na c√©lula de c√≥digo abaixo.

In [18]:
x = 0.1
y = 0.2
print(x + y)

0.30000000000000004


## $ \S 4 $ Subtra√ß√£o no sistema de ponto flutuante

__Exemplo 4.1__: Calcule a diferen√ßa $ 1.52 \times 10^3 - 7.38 \times 10^2 $.

_Solu√ß√£o:_ Como para a adi√ß√£o, inicialmente √© necess√°rio deslocar o ponto do
n√∫mero de menor expoente para que este se iguale ao do outro n√∫mero:
\begin{equation*}
    7.38 \times 10^{2} = 0.738 \times 10^{3} \quad \text{(igualando os expoentes)}
\end{equation*}
Calculando a diferen√ßa:
\begin{equation*}
    \begin{aligned}
        &\phantom{-}& 1&.52 &\times& 10^{3} \\
        &-& 0&.738 &\times& 10^{3} & \text{(subtraindo)}\\
        &{=}& 0&.782 &\times& 10^{3} & \text{(renormalizando)}\\
        &{=}& 7&.82 &\times& 10^{2} & \text{(resultado)} \\
    \end{aligned}
\end{equation*}


__Exemplo 4.2__: Calcule a diferen√ßa entre $ 6.42 \times 10^{6} $ e
$ 4.21 \times 10^{4} $ utilizando truncamento.

_Solu√ß√£o:_ Igualando o expoente do segundo n√∫mero ao primeiro:
\begin{equation*}
    4.21 \times 10^4 = 0.0421 \times 10^6 \quad \text{(igualando os expoentes)}
\end{equation*}
Realizando a subtra√ß√£o:
\begin{equation*}
    \begin{aligned}
        &\phantom{+}& 6&.42 &\times& 10^{6} \\
        &-& 0&.0421 &\times& 10^{6} & \text{(subtraindo)}\\
        &{=}& 6&.3779 &\times& 10^{6} &  \text{(truncando)}\\
        &{\approx}& 6&.37 &\times& 10^{6} &  \text{(resultado)}\\
    \end{aligned}
\end{equation*}

__Exemplo 4.3__: Subtraia $ 9.76 \times 10^{-3} $ de $ 1.95 \times 10^{-4} $
utilizando arrendamento, com desempate por d√≠gito menos significativo par.
_Solu√ß√£o:_
Como o n√∫mero $ a = 1.95 \times 10^{-4} $ do qual est√° sendo feita a subtra√ß√£o
(_minuendo_) √© menor que o n√∫mero $ b = 9.76 \times 10^{-3} $ que ser√° subtra√≠do
(_subtraendo_), √© mais f√°cil calcular $ b - a $ e depois observar que
$ a - b = -(b - a) $.
Como antes, precisamos primeiro igualar os expoentes:
\begin{equation*}
    1.95 \times 10^{-4} = 0.195 \times 10^{-3} \quad \text{(igualando os expoentes)}
\end{equation*}
Ent√£o
\begin{equation*}
    \begin{aligned}
        &\phantom{-}& 9&.76 &\times& 10^{-3} \\
        &{-}& 0&.195 &\times& 10^{-3} & \text{(subtraindo)} \\
        &{=}& 9&.565 &\times& 10^{-3} & \text{(arredondando)}  \\
        &{\approx}& 9&.56 &\times& 10^{-3} & \text{(resultado)} 
    \end{aligned}
\end{equation*}
Assim, no nosso sitema a diferen√ßa de $ 1.95 \times 10^{-4} $ e
$ 9.76 \times 10^{-3} $ √© $ -9.56 \times 10^{-3} $.

__Exerc√≠cio:__ Calcule as diferen√ßas abaixo. Suas respostas devem seguir a
conven√ß√£o acima, ou seja, os expoentes devem estar entre $ 9 $ e $ -9 $ e as
mantissas devem possuir exatamente tr√™s d√≠gitos significativos.

(a) $ 6.71 \times 10^1 - 3.42 \times 10^0 $ utilizando truncamento.

(b) $ 9.12 \times 10^{-3} - 2.46 \times 10^{-2} $ utilizando arredondamento com desempate para cima.

(c) $ 1.98 \times 10^6 - 3.24 \times 10^4 $ utilizando arredondamento com desempate por d√≠gito menos significativo par.

(d) $ 7.25 \times 10^{-7} - 5.93 \times 10^{-5} $ utilizando truncamento.

(e) $ 4.73 \times 10^8 - 3.92 \times 10^8 $ utilizando arredondamento com desempate por d√≠gito menos significativo par.

(f) $ 1.01 \times 10^{-9} - 1.32 \times 10^{-9} $ utilizando arredondamento com desempate para cima.

__Exerc√≠cio:__ Utilizando arredondamento com desempate para cima, mostre que no nosso sistema:

(a) Se $ \vert \delta \vert < \frac{1}{2} \times 10^{-3} $, ent√£o
$ 1 \pm \delta = 1 $.

(b) Se $ \varepsilon^2 < \frac{1}{2} \times 10^{-3} $,
ent√£o
$$
1 - (1 - \varepsilon)(1 + \varepsilon) = 0\,.
$$

## $ \S 5 $ Multiplica√ß√£o no sistema de ponto flutuante

__Exemplo 5.1:__ Calcule o produto entre $ 5.23 \times 10^2 $ e $ 1.06 \times 10^{-1} $
utilizando arredondamento, com desempate por par.

_Solu√ß√£o:_ Primeiramente multiplicamos as mantissas e somamos os expoentes, depois
renormalizamos e aproximamos o resultado conforme a necessidade:
\begin{equation*}
\begin{aligned}
&\phantom{{=}}& 5&.23 &\times& 10^2 & \\
&\times& 1&.06 &\times& 10^{-1} \quad & \text{(mutiplicando mantissas)} \\
\hline
&{=} &  (&.03138 & & \quad & \\
&+ & &.0000 & & & \\
&+ & 5&.23) & \times & 10^{2 - 1} \quad & \text{(adicionando expoentes)} \\
&{=}& 5&.26138 & \times & 10^{1} \quad & \text{(arredondando)} \\
&{\approx} & 5&.26 & \times & 10^{1} \quad & \text{(resultado)} \\
\end{aligned}
\end{equation*}

__Exemplo 5.2:__ Multiplique $ 3.71 \times 10^3 $ por $ 4.29 \times 10^{-2} $
utilizando arredondamento para cima.

__Solu√ß√£o:__ 
\begin{equation*}
\begin{aligned}
&\phantom{=}& 3&.71 &\times& 10^3 & \\
&\times& 4&.29 &\times& 10^{-2} \quad & \text{(mutiplicando mantissas)} \\
\hline
&{=} & (&.3339 & & \quad & \\
&+ & &.742 & & & \\
&+ & 14&.84) & \times & 10^{3 - 2} \quad & \text{(adicionando expoentes)} \\
&{=}& 15&.9159 & \times & 10^{1} \quad & \text{(renormalizando)} \\
&{=}& 1&.59159 & \times & 10^{2} \quad & \text{(arredondando)} \\
&{\approx} & 1&.59 & \times & 10^{2} \quad & \text{(resultado)} \\
\end{aligned}
\end{equation*}


__Exemplo 5.3:__ Calcule o produto de $ 2.13 \times 10^{-5} $ e 
$ \times 4.81 \times 10^{-5} $ utilizando truncamento se necess√°rio.

__Solu√ß√£o:__ 
\begin{equation*}
\begin{aligned}
&\phantom{=}& 2&.13 &\times& 10^{-5} & \\
&\times& 4&.81 &\times& 10^{-5} \quad & \text{(mutiplicando mantissas)} \\
\hline
&{=} & (&0.0213 & & \quad & \\
&{+} & 1&.704 & & & \\
&{+} & 8&.52) & \times & 10^{-5-5} \quad & \text{(adicionando expoentes)} \\
&{=}& 10&.2453 & \times & 10^{-10} \quad & \text{(renormalizando)} \\
&{=}& 1&.2453 & \times & 10^{-9} \quad & \text{(truncando)} \\
&{\approx} & 1&.24 & \times & 10^{-9} \quad & \text{(resultado)} \\
\end{aligned}
\end{equation*}

__Exerc√≠cio:__ Calcule os produtos dos n√∫meros abaixo no nosso sistema de ponto flutuante.

(a) $ 6.71 \times 10^1 $ e $ 3.42 \times 10^0 $, utilizando truncamento.

(b) $ 9.12 \times 10^{3} $ e $ -2.40 \times 10^{-2} $, utilizando arredondamento com desempate para cima.

(c) $ -1.98 \times 10^6 $ e $ 3.24 \times 10^4 $, utilizando arredondamento com desempate por d√≠gito par.

(d) $ 7.25 \times 10^{-2} $ e $ 5.93 \times 10^{4} $, utilizando truncamento.

(e) $ 4.73 \times 10^3 $ e $ -3.92 \times 10^5 $, utilizando arredondamento com desempate por d√≠gito par.

(f) $ 5.01 \times 10^{-3} $ e $ 1.32 \times 10^{-7} $, utilizando arredondamento com desempate para cima.

__Exerc√≠cio__: 

(a) Seja $ a = 2.50 \times 10^4 $. Qual √© o maior n√∫mero $ x $ no nosso sistema
    de ponto flutuante tal que o produto $ ax $ _n√£o_ resulta num erro de
    overflow?

(b) Seja $ b = 2.50 \times 10^{-3} $. Qual √© o menor n√∫mero $ y $ no nosso sistema
    de ponto flutuante tal que o produto $ by $ _n√£o_ resulta num erro de
    underflow?

üìù A divis√£o na aritm√©tica de ponto flutuante √© uma opera√ß√£o mais complexa
que a adi√ß√£o, subtra√ß√£o ou multiplica√ß√£o, por isto n√£o ser√° considerada
detalhadamente aqui. Em resumo, ela consiste dos tr√™s passos:

* Extrair as mantissas e os expoentes.
* Calcular a diferen√ßa entre os expoentes do divisor e do dividendo.
* Calcular o quociente das mantissas, por exemplo usando divis√£o longa, m√©todo
  de Newton ou m√©todo de Goldschmidt. Como antes, este quociente pode precisar
  ser ajustado (aproximado ou renormalizado) para que siga o formato de ponto
  flutuante especificado.