### **Aulas 12 e 13**

- Representação de números em vírgula flutuante
- A norma IEEE 754
  - Operações aritméticas em vírgula flutuante
  - Precisão simples e precisão dupla
  - Casos particulares
  - Representação desnormalizada
  - Arredondamentos
- Unidade de vírgula flutuante do MIPS
  - Instruções da FPU do MIPS
  - Análise de um exemplo de tradução de C para assembly

Bernardo Cunha, José Luís Azevedo, Arnaldo Oliveira

## Representação de quantidades fracionárias

- A codificação de quantidades numéricas com que trabalhámos até agora esteve sempre associada à representação de números inteiros
- A representação posicional de inteiros pode também ser usada para representar números racionais considerando-se potências negativas da base
- Por exemplo a representação da quantidade 5.75 em base 2 com 4 bits para a parte inteira e 4 bits para a parte fracionária poderia ser:
   23 22 21 20 2-1 2-2 2-3 2-4



 Esta representação designa-se por "representação em vírgula fixa"

# Representação de quantidades fracionárias

- A representação de quantidades fracionárias em vírgula fixa coloca de imediato a questão da divisão do espaço de armazenamento para as partes inteira e fracionária
- Quantos bits devem ser reservados para a parte inteira e quantos para a parte fracionária, sabendo nós que o espaço de armazenamento é limitado?
- O número de bits da parte inteira determina a gama de valores representáveis (2<sup>4</sup>, no exemplo anterior)
- O número de bits da parte fracionária, determina a **precisão** da representação (passos de 2<sup>-4</sup> = 0.0625, no exemplo anterior)

# Representação de números em Vírgula Flutuante

• **Exemplo**: -23.45129 (vírgula fixa). A mesma quantidade pode também ser representada recorrendo à notação científica:

$$-2.345129 \times 10^{1} \qquad -(2\times10^{0}+3\times10^{-1}+4\times10^{-2}+5\times10^{-3}+...+9\times10^{-6})\times10^{1}$$

$$-0.2345129\times10^{2} \qquad -(0\times10^{0}+2\times10^{-1}+3\times10^{-2}+4\times10^{-3}+...+9\times10^{-7})\times10^{2}$$

- São representações do mesmo valor em que a posição da vírgula tem de ser ponderada, na interpretação numérica da quantidade, pelo valor do expoente de base 10
- Esta técnica, em que a vírgula pode ser deslocada sem alterar o valor representado, designa-se também por representação em vírgula flutuante (VF)
- A representação em VF tem a vantagem de não desperdiçar espaço de armazenamento com os zeros à esquerda da quantidade representada
- No primeiro exemplo, o número de dígitos diferentes de zero à esquerda da vírgula é igual a um: diz-se que a representação está normalizada

## Representação de números em Vírgula Flutuante

 A representação de quantidades em vírgula flutuante, em sistemas computacionais digitais, faz-se recorrendo à estratégia descrita no slide anterior, mas usando agora a base dois:

$$N = (+/-) 1.f \times 2^{Exp}$$

(representação em binário de uma quantidade real, no formato de vírgula flutuante normalizada)

• Em que:

f – parte fracionária representada por n bits

**1.f** — mantissa (também designada por significando)

**Exp** – **expoente** da potência de base 2 representado por *m* bits

## Representação de números em Vírgula Flutuante

- O problema da divisão do espaço de armazenamento coloca-se também neste caso, mas agora na determinação do número de bits ocupados pela parte fracionária e pelo expoente
- Essa divisão é um compromisso entre gama de representação e precisão:
  - Aumento do número de bits da parte fracionária ⇒ maior precisão na representação
  - Aumento do número de bits do expoente ⇒ maior gama de representação
- Um bom design implica compromissos adequados!



- A representação é normalizada: o bit à esquerda do ponto binário é sempre 1. Como é sempre 1, esse bit não é explicitamente representado (hidden bit)
- A parte fracionária (23 bits) pode então tomar valores compreendidos entre:

#### 

- E os limites de representação da mantissa (1.f) são:



 O expoente é codificado em excesso de 127 (2<sup>n-1</sup>-1, n=8 bits). Ou seja, é somado ao expoente verdadeiro (Exp) o valor 127 para obter o código de representação

(i.e. E = Exp + 127, em que E é o expoente codificado)

$$N = (-1)^S 1.f \times 2^{Exp} = (-1)^S 1.f \times 2^{E-127}$$

- O código 127 representa, assim, o expoente zero; códigos maiores do que 127 representam expoentes positivos e códigos menores que 127 representam expoentes negativos
- Os códigos 0 e 255 são reservados. O expoente pode, desta forma, tomar valores entre -126 e +127 [códigos 1 a 254].

**Exemplo**: Qual o valor, em decimal, representado em **0x41580000**?

#### 0 10000010 101100000000000000000000

**Expoente** = 
$$130 - offset = 130 - 127 = 3 \Leftrightarrow (Exp = E - offset)$$

Mantissa = 
$$(1 + parte fracionária) = 1 + .1011 = 1.1011$$

A quantidade representada (R) será então: +1.1011 × 23

$$R = +1.1011 \times 2^{3} = (1 + 1 \times 2^{-1} + 0 \times 2^{-2} + 1 \times 2^{-3} + 1 \times 2^{-4}) \times 2^{3}$$
$$= +1.6875 \times 8 = +13.5$$

• Exemplo: codificar no formato vírgula flutuante IEEE 754 precisão simples, o valor -12593.75<sub>10</sub> x 10<sup>-3</sup>

$$-12593.75 \times 10^{-3} = -12.59375$$

Parte inteira:  $12_{10} = 1100_{2}$ 

Parte fracionária:  $0.59375_{10} = 0.10011_2$ 

$$12.59375_{10} = 1100.10011_2 \times 2^0$$

Normalização:  $1100.10011_2 \times 2^0 = 1.10010011_2 \times 2^3$ 

Expoente codificado:  $+3 + 127 = 130_{10} = 10000010_2$ 

# **1 10000010** 10010011000000000000000

0xC1498000

#### 0.59375 × 2 1.18750 MSb 0.18750 $\times$ 2 0.37500 0.37500 $\times$ 2 0.75000 0.75000 × 2 1,50000 0.50000 × 2 LSb 1,00000

• A gama de representação suportada por este formato será portanto:

$$\pm [1.175494 \times 10^{-38}, 3.402824 \times 10^{+38}]$$

- Qual o número de dígitos à direita da vírgula na representação em decimal (casas decimais)?
- Partindo de uma representação com "n" dígitos fracionários na base "r", o número máximo de dígitos na base "s" que garante que a mudança de base não acrescenta precisão à representação original é:

 Assim, de modo a não exceder a precisão da representação original, a representação em decimal deve ter, no máximo, 6 casas decimais:

$$m = \left| n \frac{\log r}{\log s} \right| = \left| 23 \frac{\log 2}{\log 10} \right| = 6$$

• Ou, sabendo que o nº de bits por casa decimal =  $\log_2(10) \cong 3.3$ ), o número de casas decimais é  $\lfloor 23 / 3.3 \rfloor = 6$  casas decimais



- Nas operações com quantidades representadas neste formato podem ocorrer situações de *overflow* e de *underflow*:
  - Overflow: quando o expoente do resultado n\(\tilde{a}\) o cabe no espa\(\tilde{c}\) o que lhe est\(\tilde{a}\) destinado \(\tilde{E} > \frac{254}{}\)

 Underflow: caso em que o expoente é tão pequeno que também não é representável → E < 1)</li>

# Norma IEEE 754 – Adição / Subtração

Exemplo:  $N = 1.1101 \times 2^0 + 1.0010 \times 2^{-2}$ 

1º Passo: Igualar os expoentes ao maior dos expoentes

 $a = 1.1101 \times 2^0$   $b = 0.010010 \times 2^0$ 

2º Passo: Somar / subtrair as mantissas mantendo os expoentes

 $N = 1.1101 \times 2^0 + 0.010010 \times 2^0 = 10.000110 \times 2^0$ 

3º Passo: Normalizar o resultado

 $N = 10.000110 \times 2^0 = 1.0000110 \times 2^1$ 

4º Passo: Arredondar o resultado e renormalizar (se necessário)

$$N = 1.0000 110 \times 2^1 = 1.0001 \times 2^{-1}$$

$$\begin{array}{c|ccccc}
1.0000 & 11 \\
+ & 0.0000 & 10 \\
\hline
1.0001 & 01
\end{array}$$

**Exemplo com 4 bits fracionários** 

# Norma IEEE 754 – Multiplicação

Exemplo:  $N = (1.1100 \times 2^{0}) \times (1.1001 \times 2^{-2})$ 

1º Passo: Somar os expoentes

Exp. Resultado = 0 + (-2) = -2

2º Passo: Multiplicar as mantissas

 $Mr = 1.1100 \times 1.1001 = 10.101111$ 

3º Passo: Normalizar o resultado

 $N = 10.101111 \times 2^{-2} = 1.0101111 \times 2^{-1}$ 

4º Passo: Arredondar o resultado e renormalizar (se necessário)

$$N = 1.0101 111 \times 2^{-1} = 1.0110 \times 2^{-1}$$

**Exemplo com 4 bits fracionários** 

### Norma IEEE 754 – Divisão

Exemplo:  $N = (1.0010 \times 2^{0}) / (1.1000 \times 2^{-2})$ 

1º Passo: Subtrair os expoentes

Exp. Resultado = 0 - (-2) = 2

2º Passo: Dividir as mantissas

Mr = 1.0010 / 1.1000 = 0.11

3º Passo: Normalizar o resultado

$$N = 0.11 \times 2^2 = 1.1 \times 2^1$$

4º Passo: Arredondar o resultado

$$N = 1.1 \times 2^1 = 1.1000 \times 2^1$$

**Exemplo com 4 bits fracionários** 

# Norma IEEE 754 (precisão dupla)

 A norma IEEE 754 suporta a representação de quantidades em precisão simples (32 bits)

$$N = (-1)^S 1.f \times 2^{(E-127)}$$
 (Precisão simples - tipo float)

• e em precisão dupla (64 bits)

$$N = (-1)^S 1.f \times 2^{(E-1023)}$$
 (Precisão dupla - tipo double)

# Norma IEEE 754 (precisão dupla)



$$N = (-1)^S 1.f \times 2^{Exp} = (-1)^S 1.f \times 2^{E-1023}$$

- Na codificação do expoente, os códigos 0 e 2047 são reservados.
   O expoente pode então tomar valores entre -1022 e +1023
   [códigos 1 a 2046]
- A gama de representação suportada pelo formato de precisão dupla será:

## Norma IEEE 754 – casos particulares

- A norma IEEE 754 suporta ainda a representação de alguns casos particulares:
  - A quantidade zero; essa quantidade não seria representável de acordo com o formato descrito até aqui
  - +/-infinito (inf). Gama de representação excedida; divisão por 0. Exemplos: 1.0 / 0.0, -1.0 / 0.0
  - Resultados não numéricos (NaN Not a Number). Exemplo:
     0.0 / 0.0, inf / inf, nan \* 2
  - Afim de aumentar a resolução (menor quantidade representável) é ainda possível usar um formato de mantissa desnormalizada no qual o bit à esquerda do ponto binário é zero

# Norma IEEE 754 – casos particulares

| Precisão Simples |             | Precisão Dupla |             | Representa                             |
|------------------|-------------|----------------|-------------|----------------------------------------|
| Expoente         | Parte Frac. | Expoente       | Parte Frac. |                                        |
| 0                | 0           | 0              | 0           | 0                                      |
| 0                | ≠0          | 0              | ≠0          | Quantidade<br>desnormalizada           |
| 1 a 254          | qualquer    | 1 a 2046       | qualquer    | Nº em vírgula flutuante<br>normalizado |
| 255              | 0           | 2047           | 0           | Infinito                               |
| 255              | <b>≠</b> 0  | 2047           | <b>≠</b> 0  | NaN (Not a Number)                     |

## Norma IEEE 754 – representação desnormalizada

- Representação com mantissa desnormalizada: assume-se que o bit à esquerda do ponto binário é 0
- O expoente codificado é 0; o expoente verdadeiro é -126 (precisão simples) ou -1022 (precisão dupla)
- Permite a representação de quantidades cada vez mais pequenas (underflow gradual)
- Gama de representação com mantissa desnormalizada, em precisão simples:

$$\pm [1 \times 2^{-23} \times 2^{-126}, 1.0 \times 2^{-126}]$$



- As operações aritméticas são efetuadas com um número de bits da parte fracionária superior ao disponível no espaço de armazenamento
- Desta forma, na conclusão de qualquer operação aritmética é necessário proceder ao arredondamento do resultado por forma a assegurar a sua adequação ao espaço que lhe está destinado
- As técnicas mais comuns no processo de arredondamento do resultado (o qual introduz um erro) são:
  - Truncatura
  - Arredondamento simples
  - Arredondamento para o par (ímpar) mais próximo

• Truncatura (exemplo com 2 bits na parte fracionária: d=2)

| val  | Trunc(val) | Erro |
|------|------------|------|
| x.00 | X          | 0    |
| x.01 | Х          | -1/4 |
| x.10 | Х          | -1/2 |
| x.11 | Х          | -3/4 |

Erro médio = 
$$(0 - 1/4 - 1/2 - 3/4) / 4$$
  
=  $-3/8$ 

• Mantém-se a parte inteira, desprezando qualquer informação que exista à direita do ponto binário

 Arredondamento simples (exemplo com 2 bits na parte fracionária: d=2)

| val  | Arred(val) | Erro                |
|------|------------|---------------------|
| x.00 | X          | 0                   |
| x.01 | X          | x - x.25 = -1/4     |
| x.10 | x + 1      | (x+1) - x.5 = +1/2  |
| x.11 | x + 1      | (x+1) - x.75 = +1/4 |

#### Erro médio

$$= (0 - 1/4 + 1/2 + 1/4) / 4$$
$$= +1/8$$

• Soma-se 1 ao 1º bit à direita do ponto binário e trunca-se o resultado (arred(val) = trunc(val + 0.5))

 O erro médio é mais próximo de zero do que no caso da truncatura, mas ligeiramente polarizado do lado positivo

 Arredondamento para o par mais próximo (exemplo com 2 bits na parte fracionária: d=2)

| val   | Arred(val) | Erro | val   | Arred(val) | Erro |
|-------|------------|------|-------|------------|------|
| x0.00 | x0         | 0    | x1.00 | x1         | 0    |
| x0.01 | х0         | -1/4 | x1.01 | x1         | -1/4 |
| x0.10 | х0         | -1/2 | x1.10 | x1 + 1     | +1/2 |
| x0.11 | x1         | +1/4 | x1.11 | x1 + 1     | +1/4 |

 Semelhante à técnica de arredondamento simples, mas decidindo, para o caso "xx.10", em função do primeiro bit à esquerda do ponto binário

• Erro médio = (0 - 1/4 - 1/2 + 1/4) / 4 + (0 - 1/4 + 1/2 + 1/4) / 4= -1/8 + 1/8 = 0

| O que fica à direita de $b_{23}$ | Exemplo                                                             | Resultado                                                                |
|----------------------------------|---------------------------------------------------------------------|--------------------------------------------------------------------------|
| < 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> b <sub>22</sub> b <sub>23</sub> 011 | <b>Round down</b> : bits à direita de $b_{23}$ são descartados           |
| > 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> b <sub>22</sub> b <sub>23</sub> 101 | <b>Round up</b> : soma-se 1 a $b_{23}$ (propagando o <i>carry</i> )      |
| = 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> b <sub>22</sub> 1 100               | <b>Round up</b> : soma-se 1 a $b_{23}$ (propagando o <i>carry</i> ) (*)  |
| = 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> B <sub>22</sub> 0 100               | <b>Round down</b> : bits à direita de $b_{23}$ são descartados (*)       |
| = 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> B <sub>22</sub> 1 100               | <b>Round down</b> : bits à direita de $b_{23}$ são descartados (**)      |
| = 0.5                            | 1.b <sub>1</sub> b <sub>2</sub> b <sub>22</sub> 0 100               | <b>Round up</b> : soma-se 1 a $b_{23}$ (propagando o <i>carry</i> ) (**) |

<sup>(\*)</sup> Arredondamento para o par mais próximo.

<sup>(\*\*)</sup> Arredondamento para o **impar mais próximo**.

#### Norma IEEE 754 – arredondamentos

• Os valores resultantes de cada fase intermédia do cálculo de uma operação aritmética são armazenados com três bits adicionais, à direita do bit menos significativo da mantissa (i.e., para o caso de precisão simples, com pesos 2<sup>-24</sup>, 2<sup>-25</sup> e 2<sup>-26</sup>)



- Objetivos: 1) ter bits suplementares para a pós-normalização e 2) minimizar o erro introduzido pelo processo de arredondamento
  - G Guard Bit;
  - R Round bit
  - S Sticky bit Resultado da soma lógica de todos os bits à direita do bit R (i.e., se houver à direita de R pelo menos 1 bit a '1', então S='1')

#### Norma IEEE 754 – arredondamentos



#### Norma IEEE 754 – arredondamentos



# Cálculo em Vírgula Flutuante no MIPS



# Vírgula Flutuante no MIPS – registos

- Os registos do coprocessador 1 são designados por **\$fn**, em que o indíce **n** toma valores entre 0 e 31 (\$f0, \$f1, \$f2, ...)
- Cada par de registos consecutivos [\$fn,\$fn+1] (com n par) pode funcionar como um registo de 64 bits para armazenar valores em precisão dupla.
- A referência ao conjunto de 2 registos faz-se sempre indicando como operando o registo par (\$f0, \$f2, \$f4,...)

 Apenas os registos de índice par podem ser usados no contexto das instruções

## Vírgula Flutuante no MIPS – instruções aritméticas

```
abs.p FPdst,FPsrc #Absolute Value
neg.p FPdst,FPsrc #Negate
div.p FPdst,FPsrc1,FPsrc2 #Divide
mul.p FPdst,FPsrc1,FPsrc2 #Multiply
add.p FPdst,FPsrc1,FPsrc2 #Addition
sub.p FPdst,FPsrc1,FPsrc2 #Subtract
```

- O sufixo .p representa a precisão com que é efetuada a operação (simples ou dupla); na instrução é substituído pelas letras .s ou .d respetivamente
- Exemplos:

```
add.s $f0,$f4,$f6 #$f0=$f4 + $f6
```

### Vírgula Flutuante no MIPS – conversão entre tipos

```
cvt.d.s FPdst,FPsrc #Convert Float to Double
cvt.d.w FPdst,FPsrc #Convert Integer to Double
cvt.s.d FPdst,FPsrc #Convert Double to Float
cvt.s.w FPdst,FPsrc #Convert Integer to Float
cvt.w.d FPdst,FPsrc #Convert Double to Integer
cvt.w.s FPdst,FPsrc #Convert Float to Integer
```

- A letra mais à direita especifica o formato original; a letra do meio, especifica o formato do resultado - s: float (single), d: double, w: inteiro
- As conversões entre tipos de representação são efetuadas pela FPU: os registos operando e destino das instruções são obrigatoriamente registos da FPU

### Conversão entre tipos – exemplos

```
= -1.625 \times 2^2 = -6.5
cvt.d.s $f6,$f0 #Convert Float to Double
   E = (129-127) + 1023 = 1025 = 10000000001_2
   $f6=0x00000000 $f7=1 1000000001 1010000...0
   $f6=0x00000000 $f7=0xC01A0000
cvt.w.s $f8,$f0 #Convert Float to Integer
   Exp = (129-127) = 2
   Val = -1.625 \times 2^2 = -6.5
   Resultado: (int)(-6.5) = trunc(-6.5) = -6
   $f8=0xFFFFFFA (-6 em complemento para 2)
```

## Vírgula Flutuante no MIPS – instruções de transferência

 Transferência de informação entre registos do CPU e da FPU, e entre registos da FPU

```
Registo do CPU
             Registo da FPU
      CPUSrc, FPdst
                     #Move to Coprocessor 1
mtc1
                     #Ex: mtc1 $t0,$f4
mfc1
                     #Move from Coprocessor 1
     CPUdst,FPsrc
                     #Ex: mfc1 $a0,$f6
mov.s FPdst, FPsrc
                     #Move from FPsrc to FPdst (single)
                     #Ex: mov.s $f4,$f8
                     #Move from FPsrc to FPdst (double)
mov.d FPdst, FPsrc
                     #Ex: mov.d $f2,$f0
```

- Estas instruções copiam o conteúdo integral do registo fonte para o registo destino
- Não fazem qualquer tipo de conversão entre tipos de informação

### Vírgula Flutuante no MIPS – instruções de transferência

 Transferência de informação entre registos da FPU e a memória

```
Registo da FPU
              Endereço de memória
       FPdst, offset (CPUreg) | #Load Float from memory
1.s
                             #Ex: 1.s $f0,4($a0)
       FPsrc, offset (CPUreq) #Store Float into memory
S.S
                             #Ex: s.s $f0,0($a0)
1.d
      FPdst, offset (CPUreq) #Load Double from memory
                             #Ex: 1.d $f4,8($a1)
s.d
       FPsrc, offset (CPUreq) #Store Double into memory
                             #Ex: s.d $f4,16($t0)
Instruções nativas (só muda a mnemónica):
lwc1
      FPdst, offset (CPUreq) #Load Float from memory
swc1 FPsrc, offset (CPUreq) #Store Float into memory
ldc1 FPdst, offset (CPUreq) #Load Double from memory
sdc1
      FPsrc, offset (CPUreg) #Store Double into memory
```

### Vírgula Flutuante no MIPS – Manipulação de constantes

 Nas instruções da FPU do MIPS os operandos têm que residir em registos internos, o que significa que não há suporte para a manipulação direta de constantes. Como lidar então com operandos que são constantes?

#### Método 1

- Determinar, manualmente, o valor que codifica a constante (32 bits para precisão simples ou 64 bits para precisão dupla)
- Carregar essa constante em 1 ou 2 registos do CPU e copiar o(s) seu(s) valor(es) para o(s) registo(s) da FPU

#### Método 2:

- Usar as directivas ".float" ou ".double" para definir em memória o valor da constante: 32 bits (.float) ou 64 bits (.double)
- Ler o valor da constante da memória para um registo da FPU usando as instruções de acesso à memória (1.s ou 1.d)

#### Vírgula Flutuante no MIPS – Manipulação de constantes

• O MARS disponibiliza duas instruções virtuais que permitem usar o método 2 (definição da constante em memória) de forma simplificada. Essas instruções têm o seguinte formato:

```
1.s FPdst,label #Ex: l.s $f0,K1
1.d FPdst,label #Ex: l.d $f4,K1
```

em que "label" representa o endereço onde a constante está armazenada em memória.

 A decomposição em instruções nativas destas instruções é (admitindo, por exemplo, que K1 corresponde ao endereço 0x10010008):

```
1.s $f0,k1
    lui $1,0x1001
    l.s $f0,0x0008($1)
```

```
1.d $f4,k1
    lui $1,0x1001
    l.d $f4,0x0008($1)
```

## Vírgula Flutuante no MIPS – instruções de decisão

- A tomada de decisões envolvendo quantidades em vírgula flutuante realiza-se de forma distinta da utilizada para o mesmo tipo de operação envolvendo quantidades inteiras
- Para quantidades em vírgula flutuante são necessárias duas instruções em sequência: uma comparação das duas quantidades, seguida da decisão (que usa a informação produzida pela comparação):
  - A instrução de comparação coloca a True ou False uma flag (1 bit), dependendo de a condição em comparação ser verdadeira ou falsa, respetivamente
  - Em função do estado dessa flag a instrução de decisão (instrução de salto) pode alterar a sequência de execução

#### Cálculo em Vírgula Flutuante no MIPS

Instruções de comparação:

```
c.xx.s FPUreg1, FPUreg2 # compare float
c.xx.d FPUreg1, FPUreg2 # compare double
```

Em que xx pode ser uma das seguintes condições:

```
EQ - equal
LT - less than
```

LE - less or equal

Exemplos:

```
c.eq.s $f0,$f2 / c.le.d $f4,$f8
```

Instruções de salto:

```
bc1t label # branch if true
bc1f label # branch if false
```

### Vírgula Flutuante no MIPS – instruções de decisão

```
float a, b;
if(a > b)
  a = a + b;
else
  a = a - b;
```

```
# a: $f0
# b: $f2
if: c.le.s $f0, $f2 # if(a > b)
    bc1t else
     add.s $f0, $f0, $f2 # a = a + b;
                         # }
     j endif
                        # else
else: sub.s $f0, $f0, $f2 # a = a - b;
endif:...
```

#### Convenções de utilização dos registos

- Registos para passar parâmetros para sub-rotinas (do tipo float ou double):
  - **\$f12** (\$f13), **\$f14** (\$f15), por esta ordem
- Registos para devolução de resultados das sub-rotinas:
  - **\$f0** (\$f1)
- Registos que <u>podem</u> ser livremente usados e alterados pelas sub-rotinas ("caller-saved"):
  - **\$f0** (\$f1) a **\$f18** (\$f19)
- Registos que <u>não podem</u> ser alterados pelas sub-rotinas ("callee-saved"):
  - **\$f20** (\$f21) a **\$f30** (\$f31)

#### Tradução C / Assembly - Exemplo 1

```
#define SIZE 25
double average(double *, int);

void main(void)
{
    double array[SIZE];
    double avg;
    ...
    avg = average( array, SIZE );
    print_double( avg );  // syscall 3
}
```

# Tradução C / Assembly - Exemplo 1

```
void main(void)
{
    static double array[SIZE];
    double avg;
    ...
    avg = average( array, SIZE );
    print_double( avg );  // syscall 3
}
```

```
.data
                        # 8*SIZE (alinhado múltiplo 8)
array: .space 200
      .eqv SIZE, 25
      .text
      .globl main # avg: $f12
main:
                        # Salvaguarda $ra
      la $a0, array
      li $a1, SIZE
      jal average
      mov.d $f12, $f0
                        # avg = average(array, SIZE)
      li
            $v0, 3
      syscall
                        # print_double(avg)
                        # Repõe $ra
            $ra
      jr
```

## Tradução C / Assembly - Exemplo 1

```
double average(double *v, int N)
{
  double sum = 0.0;
  int i;
  for(i = 0; i < N; i++)
     sum += v[i];
  return sum / (double)N;
}</pre>
```

```
# sum: $f0 / tmp1: $f4 / i: $t0 / tmp2: $t1
average: mtcl $0, $f0
       cvt.d.w $f0, $f0 # sum = 0.0
      1i $t0, 0 # i = 0
for: bge $t0, $a1, endf # while(i < N) {
       sll $t1, $t0, 3
                           # tmp = i * 8
       addu $t1, $t1, $a0 # $t1 = &v[i]
      1.d $f4, 0($t1) # $f4 = v[i] add d $f0, $f0, $f4 # $um += v[i]
                                 f4 = v[i]
       addi $t0, $t0, 1
                           #
                                 i++
                           # }
       j for
    endf:
       cvt.d.w $f4, $f4  # $f4 = (double)N
       div.d $f0, $f0, $f4 # return sum / (double) N
              $ra
       jr
```

# Tradução C / Assembly – Exemplo 2

```
float fun(float, int);

void main(void)
{
   float res;

   res = fun( 12.5E-2, 2 );
   print_float( res ); // syscall 2
}
```

```
float fun(float a, int m)
{
    float val;
    if( a >= -5.6 )
       val = (float)m * (a - 32.0);
    else
      val = 0.0;
    return val;
}
```

# Tradução C / Assembly – Exemplo 2

```
void main(void)
                            float fun(float a, int k)
  float res;
  res = fun(12.5E-2, 2);
  print_float( res );  // syscall 2
}
      .data
k1: .float 12.5E-2 # 12.5 \times 10^{-2}
k2: .float -5.6
k3: .float 32.0
k4: .float 0.0
      .text
      .glob1 main # res: $f12
main:
                       # salvaguarda $ra
      . . .
      1.s $f12, k1 # $f12 = 12.5E-2
      li $a0, 2 # $a0 = 2
      jal fun
      mov.s $f12, $f0  # res = fun(12.5E-2, 2)
      li $v0, 2
      syscall
                        # print_float(res)
                        # repõe $ra
            $ra
      jr
```

# Tradução C / Assembly – Exemplo 2

```
float fun(float a, int m)
{
  float val;
  if(a >= -5.6)
     val = (float)m * (a - 32.0);
  else
                                    .data
     val = 0.0;
                                k1: .float 12.5E-2
  return val;
                                k2: .float -5.6
                                k3: .float 32.0
                                k4: .float 0.0
# val: $f2 / a: $f12 / m: $a0
fun: 1.s $f0, k2 # $f0 = -5.6
     c.lt.s $f12, $f0 # if( a >= -5.6)
     bc1t else
     1.s $f2, k3
                        # val = 32.0
     sub.s $f2, $f12, $f2 # val = a - 32.0
     mtc1 $a0, $f0 # $f0 = m
    cvt.s.w $f0, $f0 # $f0 = (float)m
     mul.s $f2, $f0, $f2 # val = (float)m * val
     i endif # } else
else: 1.s $f2, k4 # val = 0.0
endif: mov.s $f0, $f2  # return val;
     ir $ra
```

#### Exercícios

- Na conversão de uma quantidade codificada em formato IEEE754 precisão simples para decimal, qual o número máximo de casas decimais com que o resultado deve ser apresentado? E se o valor original estiver representado em formato IEEE754 precisão dupla?
- Determine a representação em formato IEEE754 precisão simples da quantidade real **19,1875**. Determine a representação da mesma quantidade em precisão dupla
- Determine o valor em decimal da quantidade representada em formato IEEE754, precisão simples, como 0xC19AB000
- Determine o valor em decimal da quantidade representada em formato IEEE754, precisão simples, como 0x80580000

#### Exercícios

- Considere que o conteúdo dos dois seguintes registos da FPU representam a codificação de duas quantidades reais no formato IEEE754 precisão simples:
  - \$\$f0 = 0x416A0000
  - \$f2 = 0xC0C00000

Calcule o resultado das instruções seguintes, apresentando o resultado em hexadecimal:

```
abs.s $f4,$f2  # $f4 = abs($f2)
neg.s $f6,$f0  # $f6 = neg($f0)
sub.s $f8, $f0,$f2  # $f8 = $f0 - $f2
sub.s $f10,$f2,$f0  # $f10 = $f2 - $f0
add.s $f12,$f0,$f2  # $f12 = $f0 + $f2
mul.s $f14,$f0,$f2  # $f14 = $f0 * $f2
div.s $f16,$f0,$f2  # $f16 = $f0 / $f2
div.s $f18,$f2,$f0  # $f18 = $f2 / $f0
cvt.d.s $f20,$f2  # Convert single to double
cvt.w.s $f22,$f0  # Convert single to integer
```