

# Auxiliar 9

Arquitecturas y caché

Profesores: Alexandra Ibarra, Luis Mateu y Rodrigo Urrea.

Auxiliares: Luciano Márquez, Tomás Vergara.

Semestre: Otoño 2025.

### Resumen

## 1 Memorias

#### 1.1 Memoria DRAM

La memoria DRAM es de rápido acceso, pero no lo suficiente para alimentar a la CPU (lectura puede tomar 100 ciclos del reloj). Esta se descompone en líneas de un cierto tamaño (usualmente 16 bytes). Se suele anotar a la L-ésima línea de la DRAM como M[L]. Para una memoria con lineas de tamaño T, se dice que L es la etiqueta de la dirección D si  $L=D\/T$ .

#### 1.2 Memoria SRAM

La memoria SRAM es de más rápido acceso que la memoria DRAM. Usada en cachés. Su tamaño debe ser una potencia de 2, por ejemplo 4096=212. Al igual que la DRAM se decompone en líneas de un cierto tamaño (usualmente 16 bytes). Se suele anotar a la LC-ésima línea de la SRAM como C[LC]. Si la línea L esta en el caché (de tamaño C), solo puede estar en C[LC], con LC = L % C. Si C es de tamaño 4096 entonces LC es los 12 bytes menos significativos de L. Además del caché se tiene también una SRAM del mismo tamaño que el caché donde se almacenan las etiquetas de las líneas almacenadas en el caché, se dice que en E[LC] se encuentra la etiqueta de línea almacenada en C[LC]. También se tiene un bit adicional donde se almacena si la línea en el caché ha sido modificada, se dice que A[LC] indica si la linea almacenada en C[LC] fue o no modificada.

### 1.3 Accesos a memoria

Para acceder a un dato en la la línea L de la DRAM no se consulta directamente esta, eso seria muy costoso, si no que se consulta primero en el caché. Acceder a un dato en la línea L será un acierto si E[LC] = L, con LC = L % C. Si es un desacierto, C[LC] contendra una línea L' distinta, por lo cuál habrá que ir a buscar a la memoria por la línea consultada. En caso de que A[L'] se encuentre en 1, antes de recuperar M[L] se debera escribir C[LC] en M[L']. Luego se recupera M[L] de la memoria DRAM, se guarda en C[LC], se escribe L en E[LC] y se deja A[LC] en 1.

#### 1.4 Grados de asociatividad

Se dice que un caché tiene n grados de asociatividad si se compone de n caches de acceso directo (los descritos anteriormente). Una etiqueta solo puede estar guardada en 1 de los n cachés, y la



busqueda se realiza de forma paralela en ellos. Frente a un desacierto se elije aleatoriamente uno de los n cachés para almacenar la etiqueta.

## 2 Arquitecturas

## 2.1 Arquitectura microprogramada

- Las instrucciones se procesan de a 1 a la vez.
- Se espera a que se termine de ejecutar una para ejecutar la siguiente.
- Cada instrucción requiere de varios ciclos del reloj.

## 2.2 Arquitectura en pipeline

- Las instrucciones pasan por etapas, por ejemplo fetch, decode y execute.
- Se tiene una instrucción en cada etapa por ciclo del reloj, por lo que cada ciclo del reloj se completa una instrucción (en el mejor caso).
- En caso de haber un salto, se pierde el trabajo hecho en fetch y decode de las líneas inmediatamente siguientes al salto.
- Operaciones costosas (división o lectura de memoria) toman varios ciclos y bloquean el pipeline.

## 2.3 Arquitectura superescalar

- Se ejecutan varios pipelines que avanzan de manera síncrona.
- Con n pipelines se pueden ejecutar n instrucciones por cada ciclo del reloj (como máximo).
- Todavia se tiene el problema de las operaciones costosas, que bloquean el pipeline.
- Las instrucciones con dependencias (por ejemplo lectura de un registro escrito por la instrucción anterior) deben esperar a que la bloqueante termine, ralentizando el pipeline.

## 2.4 Arquitectura con ejecución especulativa y fuera de orden

- Se tienen multiuples unidades de ejecución.
- Las instrucciones se ejecutan cuando sus operandos se encuentran listos.
- En caso de que estos no esten listos (por la ejecución de una operación costosa) se prosigue con las operaciones siguientes.
- Los saltos se especulan (predicen).
- Complejos de implementar y costosos en tamaño y energía.



## **Preguntas**

**P1.** La figura muestra un extracto del contenido de un caché de **128KB** de 2 grados de asociatividad y líneas de 16 bytes. El computador posee un bus de direcciones de 20 bits.

El caché se organiza en 2 bancos, cada uno con 4096 líneas.

Por ejemplo en la línea  $\mathbf{4f2}$  (en hexadecimal) del banco izquierdo se almacena la línea de memoria que tiene como etiqueta  $\mathbf{04f2}$  (es decir, la línea que va de la dirección  $\mathbf{04f20}$  en hexadecimal a la dirección  $\mathbf{04f2f}$ ).

|       | Banco 1  |           | Banco2   |           |
|-------|----------|-----------|----------|-----------|
| línea | etiqueta | contenido | etiqueta | contenido |
| 301   | 4301     |           | 2301     |           |
| 4f2   | 04f2     |           | a4f2     |           |
| c36   | dc36     |           | 1c36     |           |

Un programa accede a las siguientes direcciones de memoria:

- a4f28
- dc360
- 53014
- 2301c
- 1c360
- ec368
- 84f20
- dc36c

#### Conteste:

- (i) ¿Cuál es la porción de la dirección que se usa como etiqueta?
- (ii) ¿Cuál es la porción de la dirección que se usa para indexar el caché?
- (iii) ¿Qué accesos a la memoria son aciertos y cuáles son desaciertos? En caso de un desacierto muestre también el estado del caché luego del acceso.



### **P2.** Considere el siguiente programa en assembly:

Haga una tabla de la ejecución de las instrucciones del programa anterior prediciendo que el salto se realiza en:

- Una arquitectura microprogramada.
- Una arquitectura en pipeline con etapas fetch, decode y execute.
- Una arquitectura superescalar, con 2 pipelines con las etapas de la arquitectura anterior.