## 66.70 Estructura del Computador

## Memoria

- Memoria volátil y no volátil
- RAM
- ROM
- Disco rígido
- Pendrive
- CD-ROM, DVD-ROM
- Cinta

## Clasificación por el modo de acceso

• RAM: M. de Acceso Aleatorio

El tiempo y procedimiento para el acceso es independiente de la dirección accedida

- RWM: M. de Lectura/Escritura, en gral. referida como <u>RAM</u>
- ROM: M. de Sólo Lectura
- **CAM**: M. Direccionable por Contenido (o Asociativa)
- SAM: M. de Acceso Secuencial Cinta, Reg. de desplazamiento, Stack
- **DAM**: M. de Acceso Directo o Semi-Aleatorio Disco rígido: acceso aleatorio a la pista y secuencial dentro de esta

# Memoria de lectura/escritura Celda de 1 bit



## RAM dinámica

- DRAM fue patentada en 1968.
- 1 o 0 lógico ⇔ capacitor cargado o descargado
- Significativamente más lenta que RAM estática
- Significativamente más barata que RAM estática:
  - (1 transistor + 1 capacitor) VS. (6 transistores)
  - Permite lograr alta densidad de elementos de memoria
  - apropiada para grandes volúmenes de memoria

### Organización "2-D"



¿Qué limitaciones aparecen con este tipo de organización? p.e. con  $512M \times 8$  bits

### Organización en "2-D" con varios chips de memoria



### Organización en "2-D" con varios chips de memoria



Organización "2-1/2 D"

Módulo de 64 posiciones de 1 bit



• n bits de address => n/2 bits en filas y n/2 bits en columnas

### Organización "2-1/2 D"

Módulo de 64 posiciones de 1 bit



- ✓ Menor número de pines
- Menor tiempo de acceso de palabras sucesivas (decodifica sólo columna)

✓ Los 8 bits correspondientes una posición de memoria están en una "3ra dimensión" y son seleccionados simultáneamente

n bits de address => n/2 bits en filas y n/2 bits en columnas
 t multiplexado en el tiempo
 Direccionar 1 bit => (a) Seleccionar fila (b) Seleccionar columna

n° de fila en guardado en registro y posterior decodificación de columna



### Arquitectura multibanco

- Un sólo módulo de memoria está conformado por varios chips
- -Todos los bits que definen una dirección de memoria dentro del módulo se dividen según:



- Cada chip es especificado por los bits "banco"
- Dentro de cada chip cada bit es especificado por su fila y su columna



### Arquitectura multibanco

Ejemplo tutorial de un módulo de memoria compuesto por 4 módulos de 8 bits cada uno



- Total de memoria del módulo 32 bits => la dirección es definida por 5 bits
- La dirección de memoria se interpreta como dividida en los campos Banco, Fila y Columna
- Una dirección de memoria específica identifica uno de los 32 bits (0..31) y este puede estar en cualquiera de los cuatro módulos



### Arquitectura multibanco

Acceso secuencial a los bancos





Bancos entrelazados



### Arquitectura multibanco

Acceso secuencial a los bancos





## Módulos de memoria comerciales

consumo)



Señales RAS y CAS

¿Cuál es su capacidad de memoria? ¿Cómo direcciona cada posición de memoria?

✓ Vcc 3.3 - 2.5 - 1.8 V (menor Vcc, mayor velocidad-menor



# Módulos de memoria comerciales



- **✓** DRAM
- ✓ DIMM 168 pines (84 x 2)
- ✓ Organizada en palabras de 64 bits
- ✓DQ<sub>0</sub>...DQ<sub>63</sub>: 8 bytes leídos en paralelo
- ✓ A<sub>0</sub>... A<sub>12</sub>: direccionamiento
- **√**WE: habilita escritura
- ✓ 16 pines con V<sub>SS</sub> y 16 pines con V<sub>DD</sub>

| PIN |                 | PIN |                 | PIN |                 | PIN |                 |
|-----|-----------------|-----|-----------------|-----|-----------------|-----|-----------------|
| NO. | NAME            | NO. | NAME            | NO. | NAME            | NO. | NAME            |
| 1   | V <sub>SS</sub> | 43  | V <sub>SS</sub> | 85  | V <sub>SS</sub> | 127 | V <sub>ss</sub> |
| 2   | DQ0             | 44  | OE2             | 86  | DQ32            | 128 | NC              |
| 3   | DQ1             | 45  | RAS2            | 87  | DQ33            | 129 | RAS3            |
| 4   | DQ2             | 46  | CAS2            | 88  | DQ34            | 130 | CAS6            |
| 5   | DQ3             | 47  | CAS3            | 89  | DQ35            | 131 | CAS7            |
| 6   | V <sub>DD</sub> | 48  | WE2             | 90  | V <sub>DD</sub> | 132 | "NC             |
| 7   | DQ4             | 49  | V <sub>DD</sub> | 91  | DQ36            | 133 | V <sub>DD</sub> |
| 8   | DQ5             | 50  | NC              | 92  | DQ37            | 134 | NC              |
| 9   | DQ6             | 51  | NC              | 93  | DQ38            | 135 | NC              |
| 10  | DQ7             | 52  | NC              | 94  | DQ39            | 136 | NC              |
| 11  | DQ8             | 53  | NC              | 95  | DQ40            | 137 | NC              |
| 12  | V <sub>SS</sub> | 54  | V <sub>ss</sub> | 96  | V <sub>SS</sub> | 138 | V <sub>ss</sub> |
| 13  | DQ9             | 55  | DQ16            | 97  | DQ41            | 139 | DQ48            |
| 14  | DQ10            | 56  | DQ17            | 98  | DQ42            | 140 | DQ49            |
| 15  | DQ11            | 57  | DQ18            | 99  | DQ43            | 141 | DQ50            |
| 16  | DQ12            | 58  | DQ19            | 100 | DQ44            | 142 | DQ51            |
| 17  | DQ13            | 59  | V <sub>DD</sub> | 101 | DQ45            | 143 | V <sub>DD</sub> |
| 18  | V <sub>DD</sub> | 60  | DQ20            | 102 | V <sub>DD</sub> | 144 | DQ52            |
| 19  | DQ14            | 61  | NC              | 103 | DQ46            | 145 | NC              |
| 20  | DQ15            | 62  | NC              | 104 | DQ47            | 146 | NC              |
| 21  | NC              | 63  | NC              | 105 | NC              | 147 | NC              |
| 22  | NC              | 64  | V <sub>ss</sub> | 106 | NC              | 148 | V <sub>SS</sub> |
| 23  | V <sub>SS</sub> | 65  | DQ21            | 107 | V <sub>ss</sub> | 149 | DQ53            |
| 24  | NC              | 66  | DQ22            | 108 | NC.             | 150 | DQ54            |
| 25  | NC              | 67  | DQ23            | 109 | NC              | 151 | DQ55            |
| 26  | V <sub>oo</sub> | 68  | V <sub>SS</sub> | 110 | V <sub>DD</sub> | 152 | V <sub>ss</sub> |
| 27  | WE0             | 69  | DQ24            | 111 | NC              | 153 | DQ56            |
| 28  | CASO            | 70  | DQ25            | 112 | CAS4            | 154 | DQ57            |
| 29  | CAS1            | 71  | DQ26            | 113 | CAS5            | 155 | DQ58            |
| 30  | RAS0            | 72  | DQ27            | 114 | RAS1            | 156 | DQ59            |
| 31  | OE0             | 73  | V <sub>DD</sub> | 115 | NC              | 157 | V <sub>DD</sub> |
| 32  | V <sub>SS</sub> | 74  | DQ28            | 116 | V <sub>SS</sub> | 158 | DQ60            |
| 33  | A0              | 75  | DQ29            | 117 | _A1_            | 159 | DQ61            |
| 34  | A2              | 76  | DQ30            | 118 | A3              | 160 | DQ62            |
| 35  | A4              | 77  | DQ31            | 119 | A5              | 161 | DQ63            |
| 36  | A6              | 78  | V <sub>SS</sub> | 120 | A7              | 162 | V <sub>ss</sub> |
| 37  | A8              | 79  | NC              | 121 | A9              | 163 | NC              |
| 38  | A10             | 80  | NC              | 122 | A11             | 164 | NC              |
| 39  | A12             | 81  | NC              | 123 | NC              | 165 | SA0             |
| 40  | V <sub>DD</sub> | 82  | SDA             | 124 | V <sub>pp</sub> | 166 | SA1             |
| 41  | NC              | 83  | SCL             | 125 | NC              | 167 | SA2             |
| 42  | NC              | 84  | V <sub>DD</sub> | 126 | NC              | 168 | V <sub>nn</sub> |

## Criterios para reducir el tiempo de acceso

- ✓ Bancos entrelazados
  - Accede a un banco mientras en el otro se refresca la información
  - Enmascara el tiempo de refresco
  - · Mejora rendimiento si pos. sucesivas están en bancos diferentes
- ✓ Mayor cantidad de bits leídos en paralelo (ancho del bus)
- ✓ Mayor velocidad del clock (memoria sincrónica SDRAM)
  - Mayor consumo de potencia
  - Proclive a errores de almacenamiento de bits
- ✓ Con igual velocidad de clock leer en flanco ascendente y también en el descendente (DDR)

# Revisitando la conexión memoria-procesador





# Revisitando la conexión memoria-procesador

¿Qué debería modificarse?

Organización de la memoria

## Tiempos de acceso de los distintos tipos





## Capacidad vs. Velocidad

- Menor tiempo de acceso => mayor costo por bit
- Mayor capacidad => menor costo por bit
- Mayor capacidad => mayor tiempo de acceso

una computadora ...

...requiere de mucha memoria y de memoria muy rápida

#### Organización de la memoria

## Tiempos de acceso





Organizar el funcionamiento de los distintos tipos de memoria (SRAM, DRAM, HD)



Rendimiento del sistema: como si tuviera mucha memoria y sólo memoria rápida

## Organización en jerarquías



## Organización en jerarquías



| Memory type | Access time | Cost/MB | Typical amount used | Typical cost |
|-------------|-------------|---------|---------------------|--------------|
| Registers   | 0.5 ns      | High    | 2 KB                | -            |
| Cache       | 5-20 ns     | \$80    | 2 MB                | \$160        |
| Main memory | 40-80ns     | \$0.40  | 512 MB              | \$205        |
| Disk memory | 5 ms        | \$0.005 | 40 GB               | \$200        |

### El porqué de la Memoria Cache

90% del tiempo de ejecución corresponde al 10% del código

### "Principio de localidad"

- Localidad temporal
   Si accedo a una dirección, en poco tiempo volveré a accederla
- Localidad espacial
   Si accedo a una dirección, las direcciones cercanas tienen mayor probabilidad de ser accedidas

### El porqué de la Memoria Cache

90% del tiempo de ejecución corresponde al 10% del código

### "Principio de localidad"

- Localidad temporal
   Si accedo a una dirección, en poco tiempo volveré a accederla
- Localidad espacial

  Si accedo a una dirección, las direcciones cercanas tienen mayor probabilidad de ser accedidas

Datos almacenados en posiciones contiguas

Iteraciones, procedimientos recursivos

## Memoria Cache

Evita el cuello de botella producido por la marcada diferencia entre la velocidad del CPU y la velocidad de memoria principal

#### Físicamente el cache es:

- Memoria muy rápida
- de poca capacidad
- "Cercana" al CPU

### Cómo funciona:

- Memoria dividida en bloques
- Al acceder un dato de mem. principal: bajo bloque completo al cache
- En el próximo acceso verifico si la posición buscada esta en cache, si no cargo otro bloque

### Agrega pasos al proceso de lectura/escritura pero:

Cache + Principio de localidad => Aumenta el rendimiento

## Memoria Cache

- √ Visibilidad desde el punto de vista del programador
- ✓ Porqué la mem. cache es más rápida que la mem. princ.?
  - Construida con electrónica más rápida (SRAM)
    - es más cara, ocupa más espacio y disipa más potencia
    - pero es escasa

Sin Cache

- Por ser escasa su árbol de decodificación es pequeño
- Su cercanía al CPU es física y lógica, no se comunica por un bus compartido

Con Cache



### Estructuras del Cache

### √ Cache especializado

- Cache de datos
- Cache de instrucciones

### √ Cache multinivel

- Cache más grandes son más lentos
- Cache grandes, mayor ind. de aciertos

=> varios niveles



## Historia del cache en procesadores Intel

- **80386** sin caché on-chip.
- **80486** 8kB de caché unificada. Bloques de 16 bytes
- **Pentium** 2 cachés on-chip. 8kB para datos y 8kB para instrucciones.
- **Pentium II** caché L2
- Pentium 4

Caché L1: 8kBytes (4k+4k) Caché L2 256kB Caché L3

Core 2 duo

Cache L1 (32k + 32 k) L2 6 Mb

Core i7

Cache L1 (32k + 32 k) L2 256k L3 8Mb