



#### INF01113 Organização De Computadores B

## Segundo Trabalho

Benchmarks de Organizações de Computadores

Bruno Alexandre Hofstetter Bourscheid (00550177)
Fernando Longhi de Andrade (00580366)
Luiz Augusto Ponzoni Schmidt (00580108)
Miguel Dutra Fontes Guerra (00342573)
Pedro Lubaszewski Lima (00341810)

Turma B



## Algoritmos Selecionados

#### **Bubble Sort**

- Complexidade: O(n²);
- Algoritmo de ordenação simples;
- Muitas comparações e trocas;
- Baixo uso de memória;
- Pouco paralelismo (dependência entre as instruções).

### Fast Fourrier Transform (FFT)

- Complexidade: O(n log(n));
- Operações matemáticas complexas;
- Várias instruções de ponto flutuante;
- Acesso regular à memória;
- Alto paralelismo.

### Binary Search

- Complexidade: O(log(n)) (vetor ordenado);
- Poucas instruções;
- Bastante acesso à memória (depende da cache);
- Depende da latência de acesso à memória.

## Parâmetros de Organização



## Tamanho da Cache L1

Representa a quantidade de dados mais próximos da *CPU*. Isso pode afetar o desempenho de programas que dependam de dados com localidade temporal e espacial, afetando o número de *cache misses*.



# Associatividade da *Cache* L1

É o número de blocos de cada conjunto de memória cache. Também deve afetar a questão de programas com dados que apresentam localidade espacial, através de mais ou menos cache misses.



# Tamanho do Fetch Buffer

Um maior tamanho de fetch buffer implica em mais instruções sendo processadas simultâneamente. Ou seja, deve afetar algoritmos que apresentem maior paralelismo de instruções.

## Configuração Fixa

Como configuração fixa inicial, utilizou-se os seguintes parâmetros:

- Tamanho da Cache L1: 16kB;
- Associatividade da Cache L1: 8-way;
- Tamanho do Fetch Buffer: 64 bytes;

Os demais parâmetros de configuração do processador foram mantidos.

4 / 11

### Resultados mudando o tamanho de cache L1



### Análise dos Resultados

Para testar a solução, foram criadas as seguintes entradas:

- $\bullet \ A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix};$
- $\bullet \ B = \begin{bmatrix} 4 & 3 \\ 2 & 1 \end{bmatrix};$
- $\bullet \ B_{NULL} = \begin{bmatrix} 0 & 0 \\ 0 & 0 \end{bmatrix};$
- $C = \begin{bmatrix} 121 & 10 \\ 50 & 3 \end{bmatrix}.$

Esperando as seguintes saídas:

- $R_1 = \begin{vmatrix} 128 & 15 \\ 70 & 16 \end{vmatrix}$ , com A, B e C como entradas;
- $R_2 = \begin{bmatrix} 121 & 10 \\ 50 & 3 \end{bmatrix}$ , com A,  $B_{NULL}$  e C como entradas.



### Resultados mudando a associatividade da cache L1

Como a saída 
$$doutr = [128, 15, 70, 16]$$
, no modo da memória  $read$   $first$ , então foi validado que  $R_1 = \begin{bmatrix} 128 & 15 \\ 70 & 16 \end{bmatrix}$ .

Grupo 13 Segundo Trabalho 13 de junho de 2025 7/11

### Análise dos Resultados

Como a saída  $doutr = \begin{bmatrix} 121, 10, 50, 3 \end{bmatrix}$ , no modo da memória read first, então foi validado que  $R_2 = \begin{bmatrix} 121 & 10 \\ 50 & 3 \end{bmatrix}$ .

 Grupo 13
 Segundo Trabalho
 13 de junho de 2025
 8 / 11

## Resultados mudando o tamanho do fetch buffer

Grupo 13 Segundo Trabalho 13 de junho de 2025 9/11

### Análise dos Resultados

Grupo 13 Segundo Trabalho 13 de junho de 2025 10/11

## Algoritmo em C

11 / 11