# Máquinas Virtuales de Stack y de Registros
Notas de clase sobre Teoría de la Compilación

**Juan David Velásquez Henao**   
jdvelasq@unal.edu.co  
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia  

[Licencia](https://github.com/jdvelasq/teoria-de-la-compilacion/blob/master/LICENCIA.txt)  
[Readme](https://github.com/jdvelasq/teoria-de-la-compilacion/blob/master/readme.md)

**Software utilizado**.

> Este es un documento interactivo escrito como un notebook de [Jupyter](http://jupyter.org), en el cual se presenta una introducción al diseño de lectores, generadores, traductores, interpretes y compiladores. Los notebooks de Jupyter permiten incoporar simultáneamente código, texto, gráficos y ecuaciones. El código presentado en este notebook puede ejecutarse en los sistemas operativos Windows, Linux y OS X.

> Haga click [aquí](https://github.com/jdvelasq/guias-de-instalacion) para obtener instrucciones detalladas sobre como instalar Jupyter en Windows y Mac OS X.

> Haga clic [aquí](http://nbviewer.jupyter.org/github/jdvelasq/teoria-de-la-compilacion/blob/master/compiladores-08-maquinas-virtuales.ipynb) para ver la última versión de este documento en nbviewer.

> Descargue la última versión de este documento, los archivos de datos y los programas en Python a su disco duro; luego, carguelos y ejecutelos en línea en [Try Jupyter!](https://try.jupyter.org)

#### Contenido

> * [Máquinas abstractas y reales](#Máquinas-abstractas-y-reales)
    * [Estructura general del procesador y memoria](#Estructura-general-del-procesador-y-memoria)
    * [Clasificación por el número de direcciones en las instrucciones](#Clasificación-por-el-número-de-direcciones-en-las-instrucciones)
    * [Arquitectura Load/Store](#Arquitectura-Load/Store)
    * [Clasificación por complejidad de las instrucciones](#Clasificación-por-complejidad-de-las-instrucciones)
    * [Control del flujo del programa](#Control-del-flujo-del-programa)
* [Características del Lenguaje de Alto Nivel del Proyecto de Clase](#Características-del-Lenguaje-de-Alto-Nivel-del-Proyecto-de-Clase)
    * [Conjunto de Instrucciones](#Conjunto-de-Instrucciones)
* [Máquina de cero direcciones (máquina de stack)](#Máquina-de-cero-direcciones)
    * [Implementación de una máquina virtual de stack](#Implementación-de-una-máquina-virtual-de-stack)
    * [Ejemplos de programación](#Ejemplos-de-programación---sbm)
      * [Operaciones aritméticas simples](#Operaciones-aritméticas-simples---sbm)
      * [Asignación de variables](#Asignación-de-variables---sbm)
      * [Impresión de los números del 1 al 5](#Impresión-de-los-números-del-1-al-5---sbm)
      * [Funciones de usuario](#Funciones-de-usuario---sbm)
* [Máquina de tres direcciones](#Máquina-de-tres-direcciones)
    * [Implementación de una máquina virtual de registros](#Implementación-de-una-máquina-virtual-de-registros)
    * [Ejemplos de programación](#Ejemplos-de-programación---rbm)
      * [Operaciones aritméticas simples](#Operaciones-aritméticas-simples---rbm)
      * [Asignación de Variables](#Asignación-de-Variables---rbm)
      * [Impresión de los números del 1 al 5](#Impresión-de-los-números-del-1-al-5---rbm)
      * [Funciones de usuario](#Funciones-de-usuario---rbm)

# Máquinas abstractas y reales

[Contenido](#Contenido)

## Estructura general del procesador y memoria

[Contenido](#Contenido)

![alt text](images/tcc-09-1-estruct.jpg) 

*El registro IP también se conoce como PC (program counter)

## Clasificación por el número de direcciones en las instrucciones

[Contenido](#Contenido)

Código de ejemplo:   
```
A = B + C * D  - E + F + A
```

**Máquina de tres direcciones**

    mult T, C, D
    add  T, T, B
    sub  T, T, E
    add  T, T, F
    add  A, A, T


**Máquina de dos direcciones**

    load T, C
    mult T, D
    add  T, B
    sub  T, E
    add  T, F
    add  A, T

** Máquina de una dirección**


    load  C
    mult  D
    add   B
    sub   E
    add   F
    add   A
    store A

**Máquina de 0 direcciones** (hay un stack de operandos).

    push B
    push C
    push D
    mult
    sum
    push E
    sub
    push F
    sum
    push A
    sum
    pop  A

## Arquitectura Load/Store

[Contenido](#Contenido)

Las instrucciones operan únicamente en los registros del procesador; las instrucciones load y store mueven los datos entre la memoria y los registros.

Código de ejemplo:   `A = B + C * D  - E + F + A` 

    load   R1, B
    load   R2, C
    load   R3, D
    load   R4, E
    load   R5, F
    load   R6, A
    mult   R2, R2, R3
    add    R2, R2, R1
    sub    R2, R2, R4
    add    R2, R2, R5
    add    R2, R2, R6
    store  A,  R2

## Clasificación por complejidad de las instrucciones

[Contenido](#Contenido)

**Complex Instruction Set Computer  (CISC):** 
* Tamaño variable en bytes de las instrucciones.
* Mayor cantidad de instrucciones.
* Operaciones register–to–register,  register–to–memory, memory–to–register; note que no se permiten operaciones memory–to–memory. 

Ejemplos:  VAX 11/780, Intel 486

**Reduced Instruction Set Computer (RISC):** 
* Tamaño fijo en bytes de las instrucciones.
* Menor cantidad de instrucciones.
* Operaciones únicamente register–to–register.

Ejemplos: MIPS R4000, SPARC, PowerPC, 

## Control del flujo del programa

[Contenido](#Contenido)

**IP**:  Contiene la dirección de la instrucción a ser ejecutada

* **Bifurcación**: <br><br>

   * Salto incondicional:   <br> <BR>
     * `j target` --  salto (jump) hacia target usando dirección absoluta
     * `b target` --  salto (branch) hacia target usando dirección relativa al IP. <br><br>
   * Salto condicional: <br><br>
     * `Set–then–jump` -- usa registros de condición; la condición y el salto son instrucciones separadas.
     * `Test–then–jump` -- chequea la condición y salta en una sola instrucción.

* **Llamada de procedimientos**:

  * Punto de entrada.
  * Final de procedimiento.
  * Dirección de retorno.

![alt text](images/tcc-09-2-llamadafunciones.jpg) 

* **Paso de parámetros**:

  * Paso usando registros.
  * Paso directo a memoria.
  * Paso usando el stack.

* **Valor de retorno**:

  * Retorno usando registro específico.
  * Retorno usando una posición específica de memoria.
  * Retorno usando el stack.

# Características del Lenguaje de Alto Nivel del Proyecto de Clase

[Contenido](#Contenido)

El diseño del compilador y la máquina virtual están interrelacionados. 

Las características del lenguaje de alto nivel (nuestro lenguaje *S*) son las siguientes:

* Todas las variables son locales al procedimiento donde están definidas; no hay variables globales.    
* No hay punteros ni asignación dinámica de memoria.
* Las rutinas no pueden ser llamadas recursivamente, ni directa ni indirectamente.
* Una rutina puede llamar a otra.

## Conjunto de Instrucciones

[Contenido](#Contenido)

Las instrucciones deben ejecutar las siguientes operaciones:

* Evaluación de expresiones.

* Acceso y actualización de variables locales (asignación).

* Manejo del stack.

* Acceso a literales.

* Saltos.

* Impresión

* Repetición

* Llamado de rutinas.

* Retorno de rutinas.

# Máquina de cero direcciones

[Contenido](#Contenido)

## Implementación de una máquina virtual de stack

[Contenido](#Contenido)

La celda de abajo debe ser ejecutada para generar el archivo `sbm.py` el cual se requiere para poder correr los ejemplos que siguen en esta misma sección.

In [None]:
%%sh
pygmentize -O linenos=1 -g sbm.py

## Ejemplos de programación - sbm

[Contenido](#Contenido)

### Operaciones aritméticas simples - sbm

[Contenido](#Contenido)

In [5]:
%%writefile example.txt
# ------------------------------
# write (10 * 20 + 30 * 40);
# end
# ------------------------------
#
#       Stack
#----#---------------------------
%%
     #  []
10   #  [10]
20   #  [10, 20]
*    #  [200]
30   #  [200, 30]
40   #  [200, 30, 40]
*    #  [200, 1200]
+    #  [1400]
PRN  #  [], imprime 1400
HLT  #  [], termina el programa
     #

Overwriting example.txt


In [6]:
%%sh
python sbm.py example.txt

1400


### Asignación de variables - sbm

[Contenido](#Contenido)

In [7]:
%%writefile example.txt

# ----------------------------
# var x:num, y:num;
# x := 20;
# y := x + 10;
# write(y);
# end
# ----------------------------
#
# x tendria la posicion 0 en el DS y
# y tendria la posicion 1
#
#           Stack     DS (memory)
#--------#--------------------------
%%
         #
         #  []        [0, 0]
20       #  [20]      [0, 0]
STO  0   #  []        [20, 0]
RCL  0   #  [20]      [20, 0]
10       #  [20, 10]  [20, 0]
+        #  [30]      [20, 0]
STO  1   #  []        [20, 30]
RCL  1   #  [30]      [20, 30]
PRN      #  []        [20, 30]
HLT      #  []        [20, 30]
         #


Overwriting example.txt


In [8]:
%%sh
python sbm.py example.txt

30


### Impresión de los números del 1 al 5 - sbm

[Contenido](#Contenido)

In [9]:
%%writefile example.txt

# ------------------------------------
# var n:num;
# n := 1;
# while (n <= 5) do
#     {
#     write(n);
#     n := n + 1;
#     }
# end
# ------------------------------------
%%
        1          #
        STO  0     #
LBL 0              #
        RCL  0     #
        5          #
        <=         #
        IFZ  1     # salto al LBL 1 cuando la condicion sea False
        RCL  0     #
        PRN        #
        RCL  0     #
        INCR       # incrementa en +1 la cima del stack
        STO  0     #
        GTO  0     # salto incondicional al LBL 0
LBL 1              #
        HLT        #


Overwriting example.txt


In [10]:
%%sh
python sbm.py example.txt

1
2
3
4
5


### Funciones de usuario - sbm

[Contenido](#Contenido)

In [11]:
%%writefile example.txt

# ----------------------------------------------
# function @sum2:num(x:num, y:num)
#     {
#     return x + y;
#     }
#
# function @sum4(x:num, y:num, z:num, w:num)
#     {
#     return @sum2(x, y) + @sum2(z, w);
#     }
#
# write( @sum4(10, 20, 30, 40) );
# end
# ----------------------------------------------
#
#  DR  contenido
#   0  x:@sum2
#   1  y:@sum2
#   2  x:@sum4
#   3  y:@sum4
#   4  z:@sum4
#   5  w:@sum4
#   6  ret:@sum2
#   7  ret:@sum4
#
#------------------------------------------------------
%%
        GTO  2

LBL 0             # entry point @sum2()

        RCL  0    # x:@sum2
        RCL  1    # y:@sum2
        +         #
        STO  6    # ret:@sum2
        RET
LBL 1             # entry point @sum4()

        RCL  2    # x:@sum4
        STO  0    # x:@sum2
        RCL  3    # y:@sum4
        STO  1    # y:@sum2
        GSB  0    # call @sum2
        RCL  6    # ret:@sum2

        RCL  4    # z:@sum4
        STO  0    # x:@sum2
        RCL  5    # w:@sum4
        STO  1    # y:@sum2
        GSB  0    # call @sum2
        RCL  6    # ret:@sum2

        +
        STO  7    # ret:@sum4
        RET

LBL 2             # programa principal

        10
        STO  2    # x:@summ4
        20
        STO  3    # y:@sum4
        30
        STO  4    # z:@sum4
        40
        STO  5    # w:@sum4
        GSB  1    # call @sum4
        RCL  7    # ret:@sum4
        PRN
        HLT

Overwriting example.txt


In [12]:
%%sh
python sbm.py example.txt

100


# Máquina de tres direcciones

[Contenido](#Contenido)

## Implementación de una máquina virtual de registros

[Contenido](#Contenido)

In [13]:
%%sh
pygmentize -O linenos=1 -g rbm.py

0001: [37m###< 2016-08-28 18:12:00.911927 >###[39;49;00m
0002: 
0003: [37m#[39;49;00m
0004: [37m#  rbm.py[39;49;00m
0005: [37m#    maquina virtual de registros[39;49;00m
0006: [37m#[39;49;00m
0007: 
0008: [34mimport[39;49;00m [04m[36mshlex[39;49;00m, [04m[36msys[39;49;00m, [04m[36mmath[39;49;00m
0009: 
0010: 
0011: [34mdef[39;49;00m [32mrbm[39;49;00m(filename):
0012:     [37m#[39;49;00m
0013:     [37m# registros del procesador[39;49;00m
0014:     [37m#[39;49;00m
0015:     DR  = [[34m0[39;49;00m]    * [34m256[39;49;00m   [37m# Data Registers[39;49;00m
0016:     TR  = [[34m0[39;49;00m]    * [34m256[39;49;00m   [37m# Temporary Registers[39;49;00m
0017:     JT  = [[36mNone[39;49;00m] * [34m256[39;49;00m   [37m# Jump Table[39;49;00m
0018:     SF  = []             [37m# Stack Frame[39;49;00m
0019:     SS  = []             [37m# Stack[39;49;00m
0020:     LP  = []             [37m# Literal Pool[39;49;00m
0021:     IP  = [34m0[39;49;00m  

## Ejemplos de programación - rbm

[Contenido](#Contenido)

### Operaciones aritméticas simples - rbm

[Contenido](#Contenido)

In [16]:
%%writefile example.txt

# ------------------------------
# write (10 * 20 + 30 * 40);
# end
# ------------------------------
#
#       r   s   t
# ------------------------------------
%%
ADD+    1   0  10   #  $1 <- $0 + 10
ADD+    2   0  20   #  $2 <- $0 + 20
ADD+    3   0  30   #  $3 <- $0 + 30
ADD+    4   0  40   #  $4 <- $0 + 40
*       1   1   2   #  $1 <- $1 * $2
*       3   3   4   #  $3 <- $3 * $4
+       1   1   3   #  $1 <- $1 + $3
PRN     1           #  print $1
HLT                 #  halt


Overwriting example.txt


In [17]:
%%sh
python rbm.py example.txt

1400


### Asignación de Variables - rbm

[Contenido](#Contenido)

In [18]:
%%writefile example.txt
# ------------------------------
# var x:num, y:num;
# x := 20;
# y := x + 10;
# write(y);
# end
# ------------------------------
#
# x tendria la posicion 0 en el DR y
# y tendria la posicion 1
#
#       r   s   t
#--------------------------------------------
%%
ADD+    1   0  20   #  $1 <- $0 + 20
STO     1   0       #  DR[0] <- $1
RCL     1   0       #  $1 <- DR[0]
ADD+    2   0  10   #  $2 <- $0 + 10
+       1   1   2   #  $1 <- $1 + $2
STO     1   1       #  DR[1] <- $1
RCL     1   1       #  $1 <- DR[1]
PRN     1           #  print $1
HLT                 #  halt


Overwriting example.txt


In [19]:
%%sh
python rbm.py example.txt

30


### Impresión de los números del 1 al 5 - rbm

[Contenido](#Contenido)

In [15]:
%%writefile example.txt

# ------------------------------------
# var n:num;
# n := 1;
# while (n <= 5) do
#     {
#     write(n);
#     n := n + 1;
#     }
# end
# ---------------------------------------------------------
%%
                        #
        ADD+  1  0  1   #       $1 <- $0 + 1
        STO   1  0      #       DR[0] <- $1
LBL 0                   #  L0:
        RCL   1  0      #       $1 <- DR[0]
        ADD+  2  0  5   #       $2 <- $0 + 5
        <=    1  1  2   #       $1 <- $1 <= $2
        IFZ   1  1      #       if ($1 == 0) goto L1
        RCL   1  0      #       $1 <- DR[0]
        PRN   1         #       print $1
        ADD+  1  1  1   #       $1 <- $1 + 1
        STO   1  0      #       DR[0] <- $1
        GTO   0         #       goto L0
LBL 1                   #  L1:
        HLT             #       halt



In [20]:
%%sh
python rbm.py example.txt

30


### Funciones de usuario - rbm

[Contenido](#Contenido)

In [23]:
%%writefile example.txt

# ------------------------------------------------
# function @sum2:num(x:num, y:num)
#     {
#     return x + y;
#     }
#
# function @sum4:num(x:num, y:num, z:num, w:num)
#     {
#     return @sum2(x, y) + @sum2(z, w);
#     }
#
# write( @sum4(10, 20, 30, 40) );
# end
# ------------------------------------------------
#
#  DR  contenido
#   0  x:@sum2
#   1  y:@sum2
#   2  x:@sum4
#   3  y:@sum4
#   4  z:@sum4
#   5  w:@sum4
#   6  ret:@sum2
#   7  ret:@sum4
#
#--------------------------------------------------------------
%%

        GTO  2

LBL 0                  # entry point @sum2()

        RCL   1  0     # x:@sum2
        RCL   2  1     # y:@sum2
        +     1  1  2  #
        STO   1  6     # ret:@sum2
        RET            #

LBL 1                  # entry point @sum4()

        RCL   1  2     # $1 <- x:@sum4
        STO   1  0     # $1 -> x:@sum2
        RCL   1  3     # $1 <- y:@sum4
        STO   1  1     # $1 -> y:@sum2
        GSB   0
        RCL   1  6     # $1 <- ret:@sum2

        RCL   2  4     # $2 <- z:@sum4
        STO   2  0     # $2 -> x:@sum2
        RCL   2  5     # $2 <- w:@sum4
        STO   2  1     # $2 -> y:@sum2
        GSB   0
        RCL   2  6     # $2 <- ret:@sum2

        +     1  1  2  # $1 <- $1 + $2
        STO   1  7     # $1 -> ret:@sum4
        RET

LBL 2                  # programa principal

        ADD+  1  0 10  # $1 <- $0 + 10
        STO   1  2     # $1 -> x:@sum4
        ADD+  1  0 20  # $1 <- $0 + 10
        STO   1  3     # $1 -> y:s@sum4
        ADD+  1  0 30  # $1 <- $0 + 30
        STO   1  4     # $1 -> z:@sum4
        ADD+  1  0 40  # $1 <- $0 + 40
        STO   1  5     # $1 -> w:@sum4
        GSB   1
        RCL   1  7     # $1 <- ret:@sum4
        PRN   1        # PRT $1
        HLT            #


Overwriting example.txt


In [24]:
%%sh
python rbm.py example.txt

100


---

[Contenido](#Contenido)