

# Sistemas Digitales

Arquitectura 1/2

Primer Cuatrimestre 2025

Sistemas Digitales DC - UBA



#### Hoy vamos a ver:

• Definición de arquitecturas.



#### Hoy vamos a ver:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.



#### Hoy vamos a ver:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.
- Lenguaje máquina y programa almacenado en memoria.



#### Hoy vamos a ver:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.
- Lenguaje máquina y programa almacenado en memoria.
- Codificación de instrucciones, compilación y ensamblado.



¿Qué es la arquitectura, o mejor dicho, la arquitectura de un procesador? La arquitectura de un procesador se refiere a aquello con lo que podemos trabajar cuando escribimos un programa. Son las instrucciones, los registros y la forma de acceder a memoria, definiendo así la estructura lógica y comportamental del procesador.



¿Cómo interactuamos con la arquitectura de un procesador? Escribiendo un programa en un lenguaje ensamblador, o sea, el lenguaje que el procesador entiende.



¿Qué cosa no es la arquitectura de un procesador? La implementación física específica del procesador que le permite ejecutar estos programas. Puede haber varias implementaciones distinas de una misma arquitectura pertenecientes a una o varias empresas, para el programa, siempre y cuando respeten lo que la arquitectura define, van a ser intercambiables.



¿Qué elementos expuestos a quién programa constituyen una arquitectura?



¿Qué elementos expuestos a quién programa constituyen una arquitectura?

• El conjunto de instrucciones.



¿Qué elementos expuestos a quién programa constituyen una arquitectura?

- El conjunto de instrucciones.
- El conjunto de registros.



¿Qué elementos expuestos a quién programa constituyen una arquitectura?

- El conjunto de instrucciones.
- El conjunto de registros.
- La forma de acceder a la memoria.



¿Qué elementos expuestos a quién programa constituyen una arquitectura?

- El conjunto de instrucciones.
- El conjunto de registros.
- La forma de acceder a la memoria.

¿Qué es una instrucción, un registro o una memoria?



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```



```
int sumar_arreglo(int a[], int largo) {
  int acumulador = 0;
  int i;
  for (i = 0; i < largo; i++) {
      acumulador = acumulador + a[i];
  }
  return acumulador;
}</pre>
```

#### Preguntémonos:

• ¿Qué comportamiento tiene este programa?



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```

- ¿Qué comportamiento tiene este programa?
- ¿Cómo interpreta el procesador la línea 5? ¿Esto se realiza en una o varias instrucciones de lenguaje máquina?



```
int sumar_arreglo(int a[], int largo) {
  int acumulador = 0;
  int i;
  for (i = 0; i < largo; i++) {
     acumulador = acumulador + a[i];
  }
  return acumulador;
}</pre>
```

- ¿Qué comportamiento tiene este programa?
- ¿Cómo interpreta el procesador la línea 5? ¿Esto se realiza en una o varias instrucciones de lenguaje máquina?
- ¿Cómo se representan y almacenan las variables i y acumulador?



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```

- ¿Qué comportamiento tiene este programa?
- ¿Cómo interpreta el procesador la línea 5? ¿Esto se realiza en una o varias instrucciones de lenguaje máquina?
- ¿Cómo se representan y almacenan las variables i y acumulador?
- ¿Cómo se representan y almacenan las variables a y largo?



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```

- ¿Qué comportamiento tiene este programa?
- ¿Cómo interpreta el procesador la línea 5? ¿Esto se realiza en una o varias instrucciones de lenguaje máquina?
- ¿Cómo se representan y almacenan las variables i y acumulador?
- ¿Cómo se representan y almacenan las variables a y largo?
- ¿Cómo se decide cuál es la próxima instrucción a ejecutar?



Al final de la clase vamos a poder responder todas estas preguntas, en el contexto de una arquitectura en particular. A continuación, un pequeño adelanto.

# Programa de ejemplo en ASM (RISC V)



```
1 | section .text
2 | .global sumar_arreglo
   sumar_arreglo:
  |\# a0 = int a[], a1 = int largo, t0 = acumulador, t1
   = i
5 | Ii t0, 0 # acumulador = 0
  | 1i \quad t1, 0 \quad \# i = 0
   ciclo: # Comienzo de ciclo
   bge t1, a1, fin # Si i >= largo, sale del ciclo
   slli t2, t1, 2 # Multiplica i por 4 (1 \ll 2 = 4)
   add t2, a0, t2 # Actualiza la dir. de memoria
10
11
   lw t2, 0(t2) # De-referencia la dir,
   add t0, t0, t2 # Agrega el valor al acumulador
12
13
   addi t1, t1, 1 # Incrementa el iterador
  i ciclo
14
                       # Vuelve a comenzar el ciclo
15
   fin:
   mv a0, t0 # Mueve t0 (acumulador) a a0
16
17
                     # Devuelve valor por a0
   ret
```

# Lenguaje ensamblador



Al programar solemos utilizar lenguajes de alto nivel. Estos lenguajes se expresan en un dominio independiente de la arquitectura del procesador donde se vaya a correr el programa.



Proveen un nivel de abstracción basado en:



Proveen un nivel de abstracción basado en:

• Variables que preservan valores (int a, b = 3;).



#### Proveen un nivel de abstracción basado en:

- Variables que preservan valores (int a, b = 3;).
- Estructuras de control que permiten modificar la ejecución secuencial del programa (if, switch, for).



#### Proveen un nivel de abstracción basado en:

- Variables que preservan valores (int a, b = 3;).
- Estructuras de control que permiten modificar la ejecución secuencial del programa (if, switch, for).
- Un mecanismo que nos permite realizar una invocación o llamada a una función desde cualquier punto del programa, pasando y recibiendo parámetros (int foo(int bar)).



Los procesadores pueden ejecutar instrucciones escritas en un lenguaje en particular, que conoce su arquitectura y se expresa estrictamente en términos de sus componentes (instrucciones, registros y memoria). Este es el lenguaje ensamblador de esta arquitectura ()RISC V en nuestro caso).



Cada arquitectura cuenta con un lenguaje ensamblador particular, en nuestro caso cuando decimos lenguaje ensamblador, nos estamos refiriendo al lenguaje ensamblador de RISC V.

Los lenguajes ensambladores son, en realidad, una familia de lenguajes de bajo nivel.



Los procesadores implementan una arquitectura y necesitan ser acompañados por programas de compilado, ensamblado y enlazado que permiten escribir código en alto nivel y conseguir que éste se traduzca, en una serie de pasos, en código binario ejecutable. En caso contrario solamente podríamos programar en lenguaje ensamblador.







```
suma_arreglo.c
    (Así lo escribimos en el editor)
                       suma_arreglo.S
 (Primera traducción a ensamblador))
                        suma_arreglo.o
                                                  mem.o
(Segunda traducción a código objeto)
                       suma_arreglo.bin
(Tercera traducción, listo para ejecutar)
```



La arquitectura RISC V es una arquitectura abierta, modular, de uso industrial y que está ganando rápidamente adopción en varios dominios estratégicos.



Una suma en el lenguaje ensamblador de RISC V se escribe de la siguiente manera:

| С          | RISC V |    |    |   |
|------------|--------|----|----|---|
| a = b + c; | add    | а, | b, | С |



Una suma en el lenguaje ensamblador de RISC V se escribe de la siguiente manera:

| С          | RISC V |    |    |   |
|------------|--------|----|----|---|
| a = b + c; | add    | а, | b, | С |

La primera parte, add, recibe el nombre de mnemónico, e indica el tipo de operación que queremos realizar, en este caso una suma. Los operandos b y c son los operandos de fuente y a el operando destino ya que será el que almacene el valor del resultado de la operación.

# Instrucciones compuestas



| С                                          | RISC V |
|--------------------------------------------|--------|
| // operaciones compuestas $a = b + c - d;$ |        |



| С                                          | RISC V |
|--------------------------------------------|--------|
| // operaciones compuestas $a = b + c - d;$ |        |

El lenguaje ensamblador no permite la composición de operaciones del modo en que lo hace, por ejemplo, C, por lo que debemos descomponer la operaciones en instrucciones atómicas (una suma y una resta).



La operaciones lógico aritméticas modifican el estado del procesador según su semántica, dichas modificaciones deben realizarse rápidamente debido a que constituyen el grueso del cómputo que ocurre en nuestros procesadores. Es por esto que los operandos de fuente y destino son registros y no direcciones de memoria.

Si queremos realizar operaciones aritméticas o lógicas con datos que se encuentran en memoria, debemos primero mover esos datos de la memoria principal a los registros.



RISC V cuenta con 32 registros que suelen implementarse como un arreglo de memoria estática de 32 bits con varios puertos. A este arreglo se lo suele referir como banco de registros o archivo de registros (register file).



#### Nombres de los registros



Los registros pueden nombrarse por su índice, desde x0 a x31 o según su uso habitual, que indica el propósito que suele cumplir el registro en el funcionamiento de un programa.

#### Nombres de los registros



Los registros pueden nombrarse por su índice, desde x0 a x31 o según su uso habitual, que indica el propósito que suele cumplir el registro en el funcionamiento de un programa.

• El registro zero (x0) almacena siempre el valor 0, y no puede ser escrito. Cualquier operación que lo tenga como operando de destino, descarta la escritura del mismo.

#### Nombres de los registros



Los registros pueden nombrarse por su índice, desde x0 a x31 o según su uso habitual, que indica el propósito que suele cumplir el registro en el funcionamiento de un programa.

- El registro zero (x0) almacena siempre el valor 0, y no puede ser escrito. Cualquier operación que lo tenga como operando de destino, descarta la escritura del mismo.
- Los registros s0 a s11 y los t0 a t6 se utilizan para almacenar variables.



Los registros pueden nombrarse por su índice, desde x0 a x31 o según su uso habitual, que indica el propósito que suele cumplir el registro en el funcionamiento de un programa.

- El registro zero (x0) almacena siempre el valor 0, y no puede ser escrito. Cualquier operación que lo tenga como operando de destino, descarta la escritura del mismo.
- Los registros s0 a s11 y los t0 a t6 se utilizan para almacenar variables.
- ra y de a0 a a7 tienen usos relacionados con las llamadas a función.

# Nombres de los registros según su uso



| x0 / zero               | Alambrado a cero                       |
|-------------------------|----------------------------------------|
| x1 / ra                 | Dirección de retorno                   |
| x2 / sp                 | Stack pointer                          |
| x3 / gp                 | Global pointer                         |
| x4 / tp                 | Thread pointer                         |
| x4 / tp<br>x5 / t0      | Temporal                               |
| x6 / t1                 | Temporal                               |
| x6 / t1<br>x7 / t2      | Temporal                               |
|                         |                                        |
| x8 / s0 / fp<br>x9 / s1 | Saved register, frame pointer          |
| x9 / s1<br>x10 / a0     | Saved register                         |
| ,                       | Argumento de función, valor de retorno |
| x11 / a1                | Argumento de función, valor de retorno |
| x12 / a2                | Argumento de función                   |
| x13 / a3                | Argumento de función                   |
| x14 / a4                | Argumento de función                   |
| x15 / a5                | Argumento de función                   |
| x16 / a6                | Argumento de función                   |
| x17 / a7                | Argumento de función                   |
| x18 / s2                | Saved register                         |
| x19 / s3                | Saved register                         |
| x20 / s4                | Saved register                         |
| x21 / s5                | Saved register                         |
| x22 / s6                | Saved register                         |
| x23 / s7                | Saved register                         |
| x24 / s8                | Saved register                         |
| x25 / s9                | Saved register                         |
| x26 / s10               | Saved register                         |
| x27 / s11               | Saved register                         |
| x28 / t3                | Temporal                               |
| x29 / t4                | Temporal                               |
| x30 / t5                | Temporal                               |
| x31 / t6                | Temporal                               |
| 32                      | -                                      |
|                         |                                        |

## Registros y variables



En el lenguaje ensamblador no nos referimos a un conjunto de variables no acotadas y cuyo nombre podemos definir según convenga para la interpretación del programa, sino que contamos con un conjunto fijo de 32 elementos con los que operar.

## Registros y variables



Por eso, cuando traducimos un programa de un lenguaje de alto nivel a ensamblador debemos decidir en qué registros almacenar los valores de nuestras variables.

### Instrucciones compuestas sobre registros



## C RISC V



```
 \begin{array}{|c|c|c|c|c|c|} \hline C & & & & & & & & \\ \hline \\ // \text{ operaciones compuestas} & \# & s0 = a, & s1 = b \\ \\ a = b + c - d; & \# & s2 = c, & s3 = d, & t0 = t \\ \\ add & t0, & s1, & s2 & \# & t = b + c \\ \\ sub & s0, & t0, & s3 & \# & a = t - d \\ \hline \end{array}
```

Volvemos al ejemplo anterior utilizando los nombres reales de los registros sobre los que podemos operar.

#### Valores inmediatos



Las instrucciones de lenguaje ensamblador pueden tener valores constantes como operandos, suelen llamarse valores inmediatos ya que se encuentran disponibles en la misma instrucción (no hace falta recuperar su valor a partir de un registro o desde la memoria).

#### Valores inmediatos



El valor puede escribirse en decimal, hexadecimal (prefijo 0x) o binario (prefijo 0b). Los valores inmediatos son de 12 bits y se extiende su signo a 32 bits antes de operar.

# Operando con constantes



| С                        | RISC V                                                                 |
|--------------------------|------------------------------------------------------------------------|
| a = a + 4;<br>b = a -12; | #s0=a, $s1=baddi s0, s0, 4 \# a = a + 4addi s1, s0, -12 \# b = a - 12$ |

### Operando con constantes



| С                        | RISC V |
|--------------------------|--------|
| a = a + 4;<br>b = a -12; |        |

Podemos definir constantes positivas y negativas como operandos utilizando la operación addi (add inmediate).

# Asignando constantes a registros



| С                               | RISC V |
|---------------------------------|--------|
| i = 0;<br>x = 2032;<br>y = -78; |        |



| С                               | RISC V                                               |
|---------------------------------|------------------------------------------------------|
| i = 0;<br>x = 2032;<br>y = -78; | $\begin{array}{llllllllllllllllllllllllllllllllllll$ |

Podemos definir constantes positivas y negativas como operandos.

## Valores inmediatos de 32 bits



| С                   | RISC V                                                              |
|---------------------|---------------------------------------------------------------------|
| int a = 0×ABCDE123; | lui s2, 0xABCDE #s2=0xABCDE000<br>addi s2, s2, 0x123 #s2=0xABCDE123 |



| С                   | RISC V                                                              |
|---------------------|---------------------------------------------------------------------|
| int a = 0×ABCDE123; | lui s2, 0xABCDE #s2=0xABCDE000<br>addi s2, s2, 0x123 #s2=0xABCDE123 |

Como los valores inmediatos son de 12 bits y se los extiende respetando el signo a 32 bits cuando realizamos una operación, cargar una constante de 32 bits requiere que hagamos dos operaciones.



| С                   | RISC V                                                              |
|---------------------|---------------------------------------------------------------------|
| int a = 0×ABCDE123; | lui s2, 0xABCDE #s2=0xABCDE000<br>addi s2, s2, 0x123 #s2=0xABCDE123 |

Primero cargamos los veinte bits más altos con la instrucción lui(load upper inmediate) y luego los 12 bits más bajos con un addi como veníamos haciendo.

## Valores inmediatos de 32 bits



| С                              | RISC V                                                              |
|--------------------------------|---------------------------------------------------------------------|
| <pre>int a = 0xFEEDA987;</pre> | lui s2, 0xFEEDB #s2=0xFEEDB000<br>addi s2, s2, -1657 #s2=0xFEEDA987 |



| С                              | RISC V                                                              |
|--------------------------------|---------------------------------------------------------------------|
| <pre>int a = 0xFEEDA987;</pre> | lui s2, 0xFEEDB #s2=0xFEEDB000<br>addi s2, s2, -1657 #s2=0xFEEDA987 |

Si la parte baja se expresa como un número negativo (bit más alto en 1), al extender el signo va a cargar con unos la parte alta. Por eso tenemos que tener esto en cuenta.



| С                              | RISC V                                                              |
|--------------------------------|---------------------------------------------------------------------|
| <pre>int a = 0xFEEDA987;</pre> | lui s2, 0xFEEDB #s2=0xFEEDB000<br>addi s2, s2, -1657 #s2=0xFEEDA987 |

La parte alta con todos unos equivale a un menos uno en complemento a dos, por lo cual, para compensar el efecto de la extensión del signo en la suma, se incrementa en uno la parte alta que vamos a cargar. En el ejemplo hacemos lui s2, 0xFEEDB en lugar de lui s2, 0xFEEDA.



El tipo de operando que resta presentar es el de memoria. La memoria se estructura y accede como si fuera un arreglo de elementos de 32 bits (4 bytes).

El acceso a memoria es significativamente más lento que el acceso a registros pero nos permite acceder a mucha más información que si tuviésemos que operar solamente con registros.

#### Direcciones de memoria



RISC V permite acceder a la memoria con índices (direcciones) de 32 bits, o sea 4.294.967.296 índices posibles.

Pero cabe notar que el índice apunta a un byte en particular, o sea, a uno de los cuatro bytes de la palabra, de modo que entre una palabra de 32 bits y otra, los índices avanzan en cuatro unidades. Podemos indicar que la lectura o escritura se hará a partir de un byte en particular.

## Accesos a memoria (direcciones)



| 1   | Byte Address |    |    | Word Address | Data W              |   |   |   | w | ord Number |   |   |   |        |
|-----|--------------|----|----|--------------|---------------------|---|---|---|---|------------|---|---|---|--------|
|     | :            |    |    | :            | :                   |   |   |   |   |            | : |   |   |        |
| Ī   | 13           | 12 | 11 | 10           | 00000010            | С | D | 1 | 9 | Α          | 6 | 5 | В | Word 4 |
|     | F            | E  | D  | С            | 000000c             | 4 | 0 | F | 3 | 0          | 7 | 8 | 8 | Word 3 |
|     | В            | A  | 9  | 8            | 0000008             | 0 | 1 | Ε | Ε | 2          | 8 | 4 | 2 | Word 2 |
|     | 7            | 6  | 5  | 4            | 00000004            | F | 2 | F | 1 | Α          | С | 0 | 7 | Word 1 |
|     | 3            | 2  | 1  | 0            | 00000000            | Α | В | С | D | Ε          | F | 7 | 8 | Word 0 |
| (a) | MSB          |    |    | LSB          | (b) width = 4 bytes |   |   |   |   |            |   |   |   |        |

A la izquierda (a), vemos los índices de memoria (byte address) representados de derecha a izquierda, donde a la derecha vemos el byte menos significativo (LSB) y a la derecha el byte más significativo de la palabra (MSB). La dirección de palabra (word address) corresponde al índice del byte menos significativo de ésta.

## Accesos a memoria (datos)



|     | Byte Address |    |    | Word Address | ,                   | Data W |   |   | w | ord Number |   |   |   |        |
|-----|--------------|----|----|--------------|---------------------|--------|---|---|---|------------|---|---|---|--------|
|     | :            |    |    | •            | •                   |        |   |   |   |            | • |   |   |        |
|     | 13           | 12 | 11 | 10           | 00000010            | С      | D | 1 | 9 | Α          | 6 | 5 | В | Word 4 |
|     | F            | E  | D  | С            | 000000c             | 4      | 0 | F | 3 | 0          | 7 | 8 | 8 | Word 3 |
|     | В            | A  | 9  | 8            | 00000008            | 0      | 1 | Ε | Ε | 2          | 8 | 4 | 2 | Word 2 |
|     | 7            | 6  | 5  | 4            | 00000004            | F      | 2 | F | 1 | Α          | С | 0 | 7 | Word 1 |
|     | 3            | 2  | 1  | 0            | 00000000            | Α      | В | С | D | Ε          | F | 7 | 8 | Word 0 |
| (a) | MSB          |    |    | LSB          | (b) width = 4 bytes |        |   |   |   |            |   |   |   |        |

A la derecha (b) vemos los datos ordenados según palabras de 32 bits (4 bytes) y el número de palabra (word number). La relación entre número de palabra y dirección de palabra es:

word address \*4 = word number

#### Leyendo y escribiendo datos



Para operar con la memoria utilizamos las instrucciones 1w (load word) para leer una palabra de memoria en un registro y sw (store word) para escribir una palabra desde un registro a la memoria. Las direcciones se definen como:

dirección = base + desplazamiento

Donde la base será el valor de un registro y el desplazamiento una constante con signo de 12 bits.

# Leyendo un arreglo



| С               | RISC V                            |
|-----------------|-----------------------------------|
| int a = mem[2]; | #s7 = a, s3 = mem   lw, s7, 8(s3) |

### Leyendo un arreglo



| С               | RISC V                            |
|-----------------|-----------------------------------|
| int a = mem[2]; | #s7 = a, s3 = mem   lw, s7, 8(s3) |

Si suponemos que los datos del arreglo mem son palabras de 4 bytes, y que la posición de memoria en la que comienza el arreglo está almacenada en s3, la forma de leer el tercer dato del arreglo (recordemos que el primer dato se encuentra en mem[0]) es indicando s3 como la base y 8 como el desplazamiento, ya que la memoria se accede con índices que apuntan de a byte y cada dato tiene 4 bytes (4 \* 2 = 8).

# Escribiendo en un arreglo



| С            | RISC V                                           |
|--------------|--------------------------------------------------|
| mem[5] = 33; | #s3 = mem<br>addi t3, zero, 33<br>sw, t3, 20(s3) |

## Escribiendo en un arreglo



| С            | RISC V                                           |
|--------------|--------------------------------------------------|
| mem[5] = 33; | #s3 = mem<br>addi t3, zero, 33<br>sw, t3, 20(s3) |

Si suponemos que los datos del arreglo mem son palabras de 4 bytes, y que la posición de memoria en la que comienza el arreglo está almacenada en s3, la forma de escribir el quinto dato del arreglo (recordemos que el primer dato se encuentra en mem[0]) es indicando s3 como la base y 20 como el desplazamiento ya que la memoria se accede con índices que apuntan de a byte y cada dato tiene 4 bytes (4 \* 5 = 20).

## Repaso de lenguaje ensamblador



Hasta este punto se presentó lo siguiente:

### Repaso de lenguaje ensamblador



Hasta este punto se presentó lo siguiente:

• Definición de arquitectura.

## Repaso de lenguaje ensamblador



Hasta este punto se presentó lo siguiente:

- Definición de arquitectura.
- Definición de lenguajes de alto y bajo nivel.

## Repaso de lenguaje ensamblador



#### Hasta este punto se presentó lo siguiente:

- Definición de arquitectura.
- Definición de lenguajes de alto y bajo nivel.
- Lenguaje ensamblador de RISCV.

## Repaso de lenguaje ensamblador



#### Hasta este punto se presentó lo siguiente:

- Definición de arquitectura.
- Definición de lenguajes de alto y bajo nivel.
- Lenguaje ensamblador de RISCV.
- Operaciones, operandos, uso de registros, constantes y memoria.

## Programa de ejemplo en C



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```



```
int sumar_arreglo(int a[], int largo) {
   int acumulador = 0;
   int i;
   for (i = 0; i < largo; i++) {
       acumulador = acumulador + a[i];
   }
   return acumulador;
}</pre>
```

¿Qué podemos entender de la traducción que presentamos antes?

# Programa de ejemplo en ASM (RISC V)



```
1 | section .text
2 | .global sumar_arreglo
   sumar_arreglo:
  |\# a0 = int a[], a1 = int largo, t0 = acumulador, t1
   = i
5 | Ii t0, 0 # acumulador = 0
  | 1i \quad t1, 0 \quad \# i = 0
   ciclo: # Comienzo de ciclo
   bge t1, a1, fin # Si i >= largo, sale del ciclo
   slli t2, t1, 2 # Multiplica i por 4 (1 \ll 2 = 4)
   add t2, a0, t2 # Actualiza la dir. de memoria
10
11
   lw t2, 0(t2) # De-referencia la dir,
   add t0, t0, t2 # Agrega el valor al acumulador
12
13
   addi t1, t1, 1 # Incrementa el iterador
  i ciclo
14
                       # Vuelve a comenzar el ciclo
15
   fin:
   mv a0, t0 # Mueve t0 (acumulador) a a0
16
17
                     # Devuelve valor por a0
   ret
```

Intervalo

# Programando con RISCV

## Programas almacenados en memoria



Uno de los principios fundamentales de los procesadores es el de programa almacenado en memoria, eso significa que las instrucciones que describen el comportamiento de un programa se almacenan (siguiendo un formato particular) en la memoria del procesador, la misma que se accede en las operaciones de lectura y escritura (sw,lw).

#### Tamaño de la instrucción



Cada instrucción ocupa 32 bits (una palabra), por lo cual sus direcciones se incrementan en múltiplos de 4, recordemos que la arquitectura RISC V permite acceder a la memoria con direcciones que refieren al byte menos significativo a partir del cual leer o escribir la palabra.

## Fetch-decode-execute



| Dirección | Instrucción almacenada |
|-----------|------------------------|
| 0×538     | addi s1, s2, 3         |
| 0×53C     | lw t2, 8(s1)           |
| 0×540     | sw s3, 3(t6)           |



| Dirección | Instrucción almacenada |
|-----------|------------------------|
| 0×538     | addi s1, s2, 3         |
|           | lw t2, 8(s1)           |
| 0×540     | sw s3, 3(t6)           |

El procesador ejecuta el programa almacenando la posición de memoria de la instrucción que se está ejecutando en un registro de 32 bits conocido como el program counter (PC). Va a cargar el contenido de la instrucción de memoria (fetch), ejecutarla (execute) y luego incrementar el PC en 4 posiciones para repetir el ciclo. Al comenzar este programa se carga la instrucción de la posición 0x538, se la ejecuta, se incrementa el PC a 0x53C y se vuelve a repetir el ciclo.

#### Fetch-decode-execute





A esto lo llamamos ciclo de fetch decode execute o ciclo de instrucción. Ya que al ejecutar un programa se carga una instrucción de memoria (fetch), se la decodifica para configurar el procesador según su tipo (decode) y luego se actualiza el estado del procesador (registros y memoria), de acuerdo al a semántica de la instrucción (execute).

#### Program counter



En la sección de control de ejecución condicional veremos la importancia que tiene el valor del program counter.

# Instrucciones



El set de instrucciones de RISC V cuenta con instrucciones lógicas como la conjunción (and), disyunción (or) y la disyunción excluyente (xor).



En el diagrama vemos los valores de los registros s1 y s2, representados en formato binario, y luego los resultados de aplicar las operaciones lógicas con distintos operandos de destino utilizando los anteriores como fuente.

|               |      |       |        | Source registers |           |           |           |           |  |
|---------------|------|-------|--------|------------------|-----------|-----------|-----------|-----------|--|
|               |      |       |        | s1               | 0100 0110 | 1010 0001 | 1111 0001 | 1011 0111 |  |
|               |      |       |        | s2               | 1111 1111 | 1111 1111 | 0000 0000 | 0000 0000 |  |
| Assembly code |      |       | Result |                  |           |           |           |           |  |
| As            | semb | ly co | de     |                  |           | Res       | sult      |           |  |
|               | semb |       |        | s3               | 0100 0110 |           | o000 0000 | 0000 0000 |  |
|               |      | s1,   | s2     | s3               | 0100 0110 |           |           | 0000 0000 |  |



Algunos usos típicos de las instrucciones lógicas son:



Algunos usos típicos de las instrucciones lógicas son:

 or: Combinar dos registros que sólo tienen asignada la parte alta y baja respectivamente, un or entre 0xFEED0000 y 0x0000F0CA resulta en 0xFEEDF0CA.



Algunos usos típicos de las instrucciones lógicas son:

- or: Combinar dos registros que sólo tienen asignada la parte alta y baja respectivamente, un or entre 0xFEED0000 y 0x0000F0CA resulta en 0xFEEDF0CA.
- and: Nos permite limpiar partes de un registro, si quisiéramos preservar solamente la parte baja de 0xBABACOCO podemos hacer un and con 0x0000FFFF consiguiendo 0x0000COCO.



Algunos usos típicos de las instrucciones lógicas son:

- or: Combinar dos registros que sólo tienen asignada la parte alta y baja respectivamente, un or entre 0xFEED0000 y 0x0000F0CA resulta en 0xFEEDF0CA.
- and: Nos permite limpiar partes de un registro, si quisiéramos preservar solamente la parte baja de 0xBABACOCO podemos hacer un and con 0x0000FFFF consiguiendo 0x0000COCO.
- xor: Conseguir la negación lógica al aplicar la operación a -1, recordemos que -1 se codifica con todos 1, por lo que xori s1, s2, -1 va a aplicar un xor entre s2 y -1 que se codifica como 0xFFF en 12 bits y se extiende a 0xFFFFFFFF al ejecutar, consiguiendo un xor contra todos unos, que efectivamente niega el valor.



Las instrucciones de desplazamiento permiten desplazar un valor a izquierda o derecha en una cantidad definida por el segundo operando fuente, si este segundo operando se trata de un inmediato, lo codifica en 5 bits (complemento a dos extendiendo el signo a 32 bits).



Hay tres operaciones posibles:



Hay tres operaciones posibles:

 s11 (shift left logical): desplaza a izquierda el valor tantas veces como especifique el segundo operando fuente, completando con ceros a derecha.



#### Hay tres operaciones posibles:

- s11 (shift left logical): desplaza a izquierda el valor tantas veces como especifique el segundo operando fuente, completando con ceros a derecha.
- srl (shift right logical): desplaza a derecha el valor tantas veces como especifique el segundo operando fuente, completando con ceros a izquierda.



#### Hay tres operaciones posibles:

- s11 (shift left logical): desplaza a izquierda el valor tantas veces como especifique el segundo operando fuente, completando con ceros a derecha.
- srl (shift right logical): desplaza a derecha el valor tantas veces como especifique el segundo operando fuente, completando con ceros a izquierda.
- sra (shift right arithmetic): desplaza a derecha el valor tantas veces como especifique el segundo operando fuente, completando con el valor del bit más significativo a izquierda (preserva signo).



#### Hay tres operaciones posibles:

- s11 (shift left logical): desplaza a izquierda el valor tantas veces como especifique el segundo operando fuente, completando con ceros a derecha.
- srl (shift right logical): desplaza a derecha el valor tantas veces como especifique el segundo operando fuente, completando con ceros a izquierda.
- sra (shift right arithmetic): desplaza a derecha el valor tantas veces como especifique el segundo operando fuente, completando con el valor del bit más significativo a izquierda (preserva signo).

Existen versiones donde el segundo operando fuente es un inmediato (slli, srli, srai).



En el diagrama vemos los valores del registro \$5, representado en formato binario, y luego los resultados de aplicar las operaciones de desplazamiento.

|                 |    | Source register |           |           |           |  |
|-----------------|----|-----------------|-----------|-----------|-----------|--|
|                 | s5 | 1111 1111       | 0001 1100 | 0001 0000 | 1110 0111 |  |
| Assembly code   |    | Result          |           |           |           |  |
| slli t0, s5, 7  | t0 | 1000 1110       | 0000 1000 | 0111 0011 | 1000 0000 |  |
| srli s1, s5, 17 | s1 | 0000 0000       | 0000 0000 | 0111 1111 | 1000 1110 |  |
| srai t2, s5, 3  | t2 | 1111 1111       | 1110 0011 | 1000 0010 | 0001 1100 |  |

#### Consiguiendo un byte en particular



Utilizando desplazamientos y máscaras podemos acceder a un byte en particular dentro de una palabra, si tenemos el valor 0xABCDEF00 en el registro s1 y queremos conseguir el segundo byte (desde el menos significativo) y almacenarlo en s2 podemos hacer lo siguiente:

```
1 | srli t0, s1, 8
2 | andi s2, t0, 0xFF
```

La primera instrucción desplaza el valor un byte a la derecha y la segunda preserva solamente el byte menos significativo, que luego almacena en s2.

## Control del flujo de ejecución



Para poder ejecutar programas que no tengan un flujo secuencial (donde todas las instrucciones se suceden en orden), necesitamos poder saltear instrucciones en nuestro programa o volver a una instrucción anterior, como suele suceder en los lenguajes de alto nivel con las estructuras de if, while, for, case.

## Control del flujo de ejecución



El mecanismo para conseguir esto en el lenguaje ensamblador de RISC V es modificar el valor del registro PC (program counter) de modo que la próxima instrucción no sea la siguiente en la memoria sino la que se defina en una instrucción específica.





Las instrucciones de control de flujo van a comparar el valor de los dos primeros operandos, y en función del resultado van reemplazar el valor del PC con el del tercer operando. Las instrucciones son:

• beq(branch if equal): que reemplaza el valor del PC si los dos primeros operandos son iguales.



- beq(branch if equal): que reemplaza el valor del PC si los dos primeros operandos son iguales.
- bne(branch if not equal): que reemplaza el valor del PC si los dos primeros operandos son distintos.



- beq(branch if equal): que reemplaza el valor del PC si los dos primeros operandos son iguales.
- bne(branch if not equal): que reemplaza el valor del PC si los dos primeros operandos son distintos.
- blt(branch if less than): que reemplaza el valor del PC si el primer operando es menor que el segundo.



- beq(branch if equal): que reemplaza el valor del PC si los dos primeros operandos son iguales.
- bne(branch if not equal): que reemplaza el valor del PC si los dos primeros operandos son distintos.
- blt(branch if less than): que reemplaza el valor del PC si el primer operando es menor que el segundo.
- bge(branch if greater than or equal): que reemplaza el valor del PC si el primer operando es mayor o igual que el segundo.

# Instrucciones de control sobre operandos sin signo



Existen variantes que interpretan a los operandos como enteros sin signo a la hora de realizar las comparaciones. Sus mnemónicos son bltu, bgeu.

# Ejemplo y etiquetas



```
1  addi s0, zero, 4
2  addi s1, zero, 1
3  slli s1, s1, 2
4  beq s0, s1, target
5  addi s1, s1, 1
6  sub s1, s1, s0
7  target:
8  add s1, s1, s0
```



```
1  addi s0, zero, 4
2  addi s1, zero, 1
3  slli s1, s1, 2
4  beq s0, s1, target
5  addi s1, s1, 1
6  sub s1, s1, s0
7  target:
8  add s1, s1, s0
```

Este ejemplo carga un 4 en s0 y un 1 en s1 (addi), luego desplaza a s1 dos posiciones a la izquierda (s1li), lo cual equivale a multiplicar por 4 y compara sin ambos registros son iguales (beq). El último operando es de tipo etiqueta.



```
1 addi s0, zero, 4
2 addi s1, zero, 1
3 slli s1, s1, 2
4 beq s0, s1, target
5 addi s1, s1, 1
6 sub s1, s1, s0
7 target:
8 add s1, s1, s0
```

Las etiquetas se definen como nombre: donde nombre es la referencia que podemos usar en otras instrucciones y será interpretada como la dirección de memoria donde se almacena la instrucción inmediatamente siguiente a su definición.

# Ejemplo y etiquetas



```
1  addi s0, zero, 4
2  addi s1, zero, 1
3  slli s1, s1, 2
4  beq s0, s1, target
5  addi s1, s1, 1
6  sub s1, s1, s0
7  target:
8  add s1, s1, s0 #dir: 0xB400
```



```
1  addi s0, zero, 4
2  addi s1, zero, 1
3  slli s1, s1, 2
4  beq s0, s1, target
5  addi s1, s1, 1
6  sub s1, s1, s0
7  target:
8  add s1, s1, s0 #dir: 0xB400
```

Si la instrucción add s1, s1, s0 se encuentra almacenada en la dirección 0xB400, al evaluar la condición en beq s0, s1, target y determinar que los valores de los operandos son iguales, el PC será actualizado con el valor 0xB400 y la próxima instrucción a ejecutar será add s1, s1, s0 en lugar de addi s1, s1, 1.



En los casos anteriores el valor del PC se actualizaba solamente cuando se cumplía una condición luego de comparar el valor de dos operandos. Para realizar una actualización (salto) incondicional del valor del PC se utilizan las instrucciones:



En los casos anteriores el valor del PC se actualizaba solamente cuando se cumplía una condición luego de comparar el valor de dos operandos. Para realizar una actualización (salto) incondicional del valor del PC se utilizan las instrucciones:

 j (jump): que simplemente actualiza el valor del PC con el del operando provisto (inmediato de 20 bits extendidos en signo a 32).



En los casos anteriores el valor del PC se actualizaba solamente cuando se cumplía una condición luego de comparar el valor de dos operandos. Para realizar una actualización (salto) incondicional del valor del PC se utilizan las instrucciones:

- j (jump): que simplemente actualiza el valor del PC con el del operando provisto (inmediato de 20 bits extendidos en signo a 32).
- jal (jump and link): que almacena el valor actual del PC en el registro indicado en el primer operando y actualiza el valor del PC con el del segundo operando (inmediato de 20 bits extendidos en signo a 32).



```
1    j target
2    srai s1, s1, 2
3    addi s1, s1, 1
4    sub s1, s1, s0
5    target:
6    add s1, s1, s0
```



```
1  j target
2  srai s1, s1, 2
3  addi s1, s1, 1
4  sub s1, s1, s0
5  target:
6  add s1, s1, s0
```

En este ejemplo la segunda, tercera y cuarta instrucción no se ejecutan, ya que el salto incondicional de la primera instrucción contínua la ejecución en add s1, s1, s0.



C RISC V

```
\#s0=pow, s1=x
// calcula el valor de x
                              addi s0, zero, 1
// tal que 2 a la x es 128
                              add s1, zero, zero
int pow = 1:
                              \#t0 = 128
int x = 0;
                              addi t0, zero, 128
                              while:
while (pow != 128) {
                              beg s0, t0, fin
    pow = pow * 2;
                              slli s0, s0, 1 #pow=pow*2
   x = x + 1;
                              addi s1, s1, 1 \#x+=1
                              j while
                              fin:
```



```
C RISC V
```

```
\#s0=pow, s1=x
// calcula el valor de x
                              addi s0, zero, 1
// tal que 2 a la x es 128
                              add s1, zero, zero
                              \#t0 = 128
int pow = 1:
int x = 0;
                              addi t0, zero, 128
                              while:
while (pow != 128) {
                              beg s0, t0, fin
    pow = pow * 2;
                              slli s0, s0, 1 #pow=pow*2
   x = x + 1;
                              addi s1, s1, 1 \#x+=1
                              i while
                              fin:
```

Esta traducción indica como podemos implementar un ciclo while con un salto condicional y uno incondicional.

Intervalo

Lenguaje de máquina

### Lenguaje de máquina



El lenguaje ensamblador es un lenguaje de bajo nivel pero los programas escritos en este lenguaje no pueden ser ejecutados por el procesador, es por eso que el código fuente debe ser ensamblado para producir el archivo binario cuyos contenidos pueden ser cargados en memoria y ejecutados.



Las instrucciones de tipo R utilizan dos registros como operandos fuente (rs1, rs2) y uno como operando destino rd. El campo op junto con funct7 y funct3 determinan el tipo de instrucción codificada.

| R-Type |        |         |        |        |        |        |  |  |  |  |  |
|--------|--------|---------|--------|--------|--------|--------|--|--|--|--|--|
|        | 31:25  | 24:20   | 19:15  | 14:12  | 11:7   | 6:0    |  |  |  |  |  |
|        | funct7 | rs2 rs1 |        | funct3 | rd     | op     |  |  |  |  |  |
| •      | 7 bits | 5 bits  | 5 bits | 3 bits | 5 bits | 7 bits |  |  |  |  |  |

# Instrucciones R, ejemplos



| Assembly                          |        | Field Values |        |        |        |        |  |  |
|-----------------------------------|--------|--------------|--------|--------|--------|--------|--|--|
|                                   | funct7 | rs2          | rs1    | funct3 | rd     | ор     |  |  |
| add s2, s3, s4<br>add x18,x19,x20 | 0      | 20           | 19     | 0      | 18     | 51     |  |  |
| sub t0, t1, t2<br>sub x5, x6, x7  | 32     | 7            | 6      | 0      | 5      | 51     |  |  |
| 000 110 / 110 / 111               | 7 bits | 5 bits       | 5 bits | 3 bits | 5 bits | 7 bits |  |  |



Las instrucciones de tipo I utilizan un registros como operando fuente (rs1), un inmediato de 12 bits (imm) y uno como operando destino rd. El campo op junto con funct3 determinan el tipo de instrucción codificada.

| I-Type              |        |        |        |        |  |  |  |  |  |  |  |
|---------------------|--------|--------|--------|--------|--|--|--|--|--|--|--|
| 31:20               | 19:15  | 14:12  | 11:7   | 6:0    |  |  |  |  |  |  |  |
| imm <sub>11:0</sub> | rs1    | funct3 | rd     | ор     |  |  |  |  |  |  |  |
| 12 bits             | 5 bits | 3 bits | 5 bits | 7 bits |  |  |  |  |  |  |  |

# Instrucciones I, ejemplos



| Assembly                                   | Field Values              |        |        |        |        |  |  |
|--------------------------------------------|---------------------------|--------|--------|--------|--------|--|--|
|                                            | imm <sub>11:0</sub>       | rs1    | funct3 | rd     | ор     |  |  |
| addi s0, s1, 12<br>addi x8, x9, 12         | 12                        | 9      | 0      | 8      | 19     |  |  |
| addi s2, t1, -14<br>addi x18,x6, -14       | -14                       | 6      | 0      | 18     | 19     |  |  |
| lw t2, -6(s3)<br>lw x7, -6(x19)            | -6                        | 19     | 2      | 7      | 3      |  |  |
| lb s4, 0x1F(s4)<br>lb x20,0x1F(x20)        | 0x1F                      | 20     | 0      | 20     | 3      |  |  |
| slli s2, s7, 5<br>slli x18, x23, 5         | 5                         | 23     | 1      | 18     | 19     |  |  |
| <pre>srai t1, t2, 29 srai x6, x7, 29</pre> | (upper 7 bits = 32)<br>29 | 7      | 5      | 6      | 19     |  |  |
|                                            | 12 bits                   | 5 bits | 3 bits | 5 bits | 7 bits |  |  |

# Instrucciones S/B



Las instrucciones de carga (S) y de saltos condicionales (B) se codifican como se indica a continuación. Ambos formatos codifican un inmediato en la instrucción, en el caso de las isntrucciones de carga es de 12 bits, en los saltos condicionales es de 13 bits y expresa el desplazamiento en complemento a 2 al que se debe saltar en relación al valor actual del PC. Este desplazamiento (offset) siempre se desplaza una posición a izquierda antes de sumarlo al PC ya que se encuentra siempre en posiciones pares.

| 31:25                  | 24:20  | 19:15  | 14:12  | 11:7                  | 6:0    |        |
|------------------------|--------|--------|--------|-----------------------|--------|--------|
| imm <sub>11:5</sub>    | rs2    | rs1    | funct3 | imm <sub>4:0</sub>    | op     | S-Type |
| imm <sub>12,10:5</sub> | rs2    | rs1    | funct3 | imm <sub>4:1,11</sub> | op     | B-Type |
| 7 bits                 | 5 bits | 5 bits | 3 bits | 5 bits                | 7 bits |        |



| Assembly                                     |                     | Field Values |        |        |             |        |  |  |  |
|----------------------------------------------|---------------------|--------------|--------|--------|-------------|--------|--|--|--|
| +2                                           | imm <sub>11:5</sub> | rs2          | rs1    | funct3 | $imm_{4:0}$ | ор     |  |  |  |
| sw t2, $-6$ (s3)<br>sw x7, $-6$ (x19)        | 1111 111            | 7            | 19     | 2      | 11010       | 35     |  |  |  |
| sh s4, 23(t0)<br>sh x20,23(x5)               | 0000 0000           | 20           | 5      | 1      | 10111       | 35     |  |  |  |
| <pre>sb t5, 0x2D(zero) sb x30,0x2D(x0)</pre> | 0000 001            | 30           | 0      | 0      | 01101       | 35     |  |  |  |
| SD ASO, OAZD(AO)                             | 7 bits              | 5 bits       | 5 bits | 3 bits | 5 bits      | 7 bits |  |  |  |



```
#Address # RISC-V Assembly
                                         0x70 beq s0, t5, L1
0x74 add s1, s2, s3
0x78 sub s5, s6, s7
0x7C lw t0, 0(s1)
                                         0x80 L1: addi s1, s1, -15
                                     L1 is 4 instructions (i.e., 16 bytes) past beq
                          imm_{12:0} = 16
                          bit number
                                            12
                                                   11 10 9 8
                                                                                          3 2 1 0
  Assembly
                                 Field Values
                                                                                Machine Code
                   imm<sub>12 10:5</sub> rs2 rs1 funct3 imm<sub>4:1 11</sub>
                                                                   imm<sub>12 10:5</sub> rs2 rs1 funct3 imm<sub>4:1.11</sub>
                                                           QO
beq s0, t5, L1
                    0000 000 30
                                            0
                                                  1000 0
                                                            99
                                                                    0000 000 11110 01000
                                                                                          000
                                                                                                 1000 0 110 0011 (0x01E40863)
beg x8, x30, 16
                      7 bits
                                   5 bits
                                                  5 bits
                                                           7 bits
                                                                     7 bits
                                                                             5 bits 5 bits
                                                                                                           7 bits
                             5 bits
                                          3 bits
                                                                                          3 bits
                                                                                                  5 bits
```

# Instrucciones U/J



Las instrucciones de inmediato superior (U) y de saltos incondicionales (J) se codifican como se indica a continuación. Ambos formatos codifican un inmediato en la instrucción, en el caso de las instrucciones de inmediato superior es de 20 bits, en los saltos incondicionales es de 21 bits y expresa el valor de los 21 bits más altos de la dirección a la que se debe saltar en relación al valor actual del PC. Este desplazamiento (offset) siempre se desplaza una posición a izquierda antes de sumarlo al PC ya que se encuentra siempre en posiciones pares.

| 31:12                           | 11:7   | 6:0    | _      |
|---------------------------------|--------|--------|--------|
| imm <sub>31:12</sub>            | rd     | ор     | U-Type |
| imm <sub>20,10:1,11,19:12</sub> | rd     | ор     | J-Type |
| 20 bits                         | 5 bits | 7 bits | •      |



| Assembly        | Field Values         |        |        |  |  |  |
|-----------------|----------------------|--------|--------|--|--|--|
|                 | imm <sub>31:12</sub> | rd     | ор     |  |  |  |
| lui s5, 0x8CDEF | 0x8CDEF              | 21     | 55     |  |  |  |
|                 | 20 bits              | 5 bits | 7 bits |  |  |  |

### Instrucciones J, ejemplos

jal ra, func1

jal x1, 0xA67F8



```
# Address
                                         RISC-V Assembly
                    0x0000540C
                                         jal ra, func1
                    0x00005410
                                         add s1, s2, s3
                    0x000ABC04 func1: add s4, s5, s8
                        func1 is 0xA67F8 bytes past jal
imm = 0xA67F8
bit number
              20
                  19 18 17 16 15 14 13 12
                                              11 10 9 8
                                                                      3 2 1 0
 Assembly
                       Field Values
                                                      Machine Code
```

rd

00001

5 bits

op

110 1111

7 bits

(0x7F8A60EF)

imm<sub>20,10:1,11,19:12</sub>

0111 1111 1000 1010 0110

20 bits

rd

5 bits

op

111

7 bits

imm<sub>20,10:1,11,19:12</sub>

0111 1111 1000 1010 0110

20 bits

### Decodificación



Es importante comprender el formato con el que se codifican las instrucciones al traducirlas al lenguaje máquina para poder realizar tanto la codificación como la decodificación de las mismas en caso de ser necesario.

# Ejemplo de decodificación



| Machine Code |                  |        |        |        |        |          |                  | Field Values |        |        |        | Assembly |                                      |
|--------------|------------------|--------|--------|--------|--------|----------|------------------|--------------|--------|--------|--------|----------|--------------------------------------|
|              | funct7           | rs2    | rs1    | funct3 | rd     | op       | funct7           | rs2          | rs1    | funct3 | rd     | op       |                                      |
| (0x41FE83B3) | 0100 000         | 11111  | 11101  | 000    | 00111  | 011 0011 | 32               | 31           | 29     | 0      | 7      | 51       | sub x7, x29,x31<br>sub t2, t4, t6    |
|              | 7 bits           | 5 bits | 5 bits | 3 bits | 5 bits | 7 bits   | 7 bits           | 5 bits       | 5 bits | 3 bits | 5 bits | 7 bits   | 3 3 4 5 6 6 7 6 7 6 9                |
|              | imm <sub>1</sub> | 1:0    | rs1    | funct3 | rd     | ор       | imm <sub>1</sub> | 1:0          | rs1    | funct3 | rd     | ор       |                                      |
| (0xFDA48293) | 1111 1101        | 1010   | 01001  | 000    | 00101  | 001 0011 | -38              |              | 9      | 0      | 5      | 19       | addi x5, x9, -38<br>addi t0, s1, -38 |
|              | 12 bit           | s      | 5 bits | 3 bits | 5 bits | 7 bits   | 12 bit           | ts           | 5 bits | 3 bits | 5 bits | 7 bits   | add1 co, 31, -30                     |

Compilación, ensamblado y ejecución

## Cadena de compilación



Habíamos presentado anteriormente el esquema de traducciones que nos permite llegar de código de alto nivel a un formato binario que pueda cargarse en la memoria principal para poder ejecutar, vamos a repasarlo y a presentar el mapa de memoria.

# Repaso de la cadena de compilación











El mapa de memoria divide a la memoria principal según su uso:



El mapa de memoria divide a la memoria principal según su uso:

 La región más alta se reserva para comunicación de entrada y salida.



El mapa de memoria divide a la memoria principal según su uso:

- La región más alta se reserva para comunicación de entrada y salida.
- Luego se encuentra la región de datos dinámicos donde en las direcciones altas vamos a encontrar la pila (stack)y en las direcciones bajas el heap que es la estructura que permite a un programa hacer un pedido explícito de memoria (malloc, free, sin usar el stack).



El mapa de memoria divide a la memoria principal según su uso:

- La región más alta se reserva para comunicación de entrada y salida.
- Luego se encuentra la región de datos dinámicos donde en las direcciones altas vamos a encontrar la pila (stack)y en las direcciones bajas el heap que es la estructura que permite a un programa hacer un pedido explícito de memoria (malloc, free, sin usar el stack).
- Luego se encuentran los datos globales(.global), donde se almacenan variables y constantes globales.

### El mapa de memoria



El mapa de memoria divide a la memoria principal según su uso:

- La región más alta se reserva para comunicación de entrada y salida.
- Luego se encuentra la región de datos dinámicos donde en las direcciones altas vamos a encontrar la pila (stack)y en las direcciones bajas el heap que es la estructura que permite a un programa hacer un pedido explícito de memoria (malloc, free, sin usar el stack).
- Luego se encuentran los datos globales(.global), donde se almacenan variables y constantes globales.
- Y luego el texto(.text), que es donde se encuentra el contenido binario de nuestro programa.

## El mapa de memoria





#### Directivas de ensamblado



Existen algunas directivas, que no son realmente instrucciones, sino indicaciones para que el progama ensamblador puede reservar memoria, definir constantes y ubicar el programa y los datos según las secciones definidas en el mapa de memoria, a continuación presentamos algunas.

### Directivas de ensamblado



| Assembler Directive | Description                                                  |
|---------------------|--------------------------------------------------------------|
| .text               | Text section                                                 |
| .data               | Global data section                                          |
| .bss                | Global data initialized to 0                                 |
| .section .foo       | Section named .foo                                           |
| .align N            | Align next data/instruction on 2 <sup>N</sup> -byte boundary |
| .balign N           | Align next data/instruction on N-byte boundary               |
| .globl sym          | Label sym is global                                          |
| .string "str"       | Store string "str" in memory                                 |
| .word w1,w2,,wN     | Store $N$ 32-bit values in successive memory words           |
| .byte b1, b2,,bN    | Store N 8-bit values in successive memory bytes              |
| .space N            | Reserve N bytes to store variable                            |
| .equ name, constant | Define symbol name with value constant                       |
| .end                | End of assembly code                                         |



Veamos por ejemplo cómo se inicializan los datos en la sección de .data que va a ubicar la información en lo que el mapa se muestra como Global Data, arriba del código (.text), mostramos:



Veamos por ejemplo cómo se inicializan los datos en la sección de .data que va a ubicar la información en lo que el mapa se muestra como Global Data, arriba del código (.text), mostramos:

• Una constante largo de 32 bits (una palabra o word).



Veamos por ejemplo cómo se inicializan los datos en la sección de .data que va a ubicar la información en lo que el mapa se muestra como Global Data, arriba del código (.text), mostramos:

- Una constante largo de 32 bits (una palabra o word).
- Una constante caracter de 8 bits (un byte).



Veamos por ejemplo cómo se inicializan los datos en la sección de .data que va a ubicar la información en lo que el mapa se muestra como Global Data, arriba del código (.text), mostramos:

- Una constante largo de 32 bits (una palabra o word).
- Una constante caracter de 8 bits (un byte).
- Un arreglo arreglo de palabras de 32 bits.





Al igual que con los saltos en el programa, las etiquetas que declaran constantes van a indicar la posición de memoria desde donde debe cargarse el dato.

# Cierre



### Hoy vimos:

• Definición de arquitecturas.



### Hoy vimos:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.



### Hoy vimos:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.
- Lenguaje máquina y programa almacenado en memoria.



### Hoy vimos:

- Definición de arquitecturas.
- El lenguaje ensamblador de RISC V.
- Lenguaje máquina y programa almacenado en memoria.
- Codificación de instrucciones, compilación y ensamblado.

¡Eso es todo por hoy!