# Lenguajes máquina

Los lenguajes de programación son una forma de comunicar instrucciones a una
computadora.
Los hay de muchos tipos, con sus respectivas ventajas y desventajas.
Se dice que un lenguaje de programación es de *alto nivel* cuando está más
cercano al lenguaje humano, y de *bajo nivel* cuando está más cercano al
lenguaje de las máquinas.
En este cuaderno vamos a explorar los lenguajes de programación de más bajo
nivel: los **lenguajes máquina** y sus primos cercanos, los **lenguajes
ensambladores**.



## 1. Máquinas e intérpretes

Para hablar de lenguajes máquina primero necesitamos entender qué es una
*máquina*.
Concretamente, vamos a hablar de *máquinas abstractas*, que son los modelos
que nos permiten entender cómo funcionan las computadoras de una manera muy
simplificada pero general.
Veamos algunos ejemplos de máquinas muy simples antes de poder generalizar una
definición.

- Una linterna de mano es una máquina muy simple: tiene dos estados, *encendida*
  y *apagada*, y podemos cambiar de un estado a otro presionando un botón.
- Un temporizador de cocina es otra máquina simple: tiene tres estados,
  *apagado*, *encendido* y *sonando*.
  Para pasar de *apagado* a *encendido* giramos una perilla que ajusta el tiempo
  que deseamos esperar.
  En el estado *encendido*, el temporizador suena *tick-tick-tick* hasta que
  llega al tiempo programado; en ese momento pasa al estado *sonando* y emite
  un sonido.
  Acto seguido, el temporizador pasa al estado *apagado*.
- El estado civil de una persona puede ser *soltero*, *casado*, *viudo*, o
  *divorciado*.
  Una persona nace soltera.
  Para cambiar de estado, la persona puede casarse, divorciarse, o enviudar.
  Una vez que dejas de ser soltero, no puedes volver a serlo.
- Un ventilador de pedestal puede estar apagado, y en velocidad 1, 2 o 3;
  además, puede estar girando o no.
  Esto da un total de 7 estados posibles: *apagado*, *velocidad 1*,
  *velocidad 2*, *velocidad 3*, *velocidad 1 con giro*, *velocidad 2 con giro* y
  *velocidad 3 con giro*.
  Para pasar entre estos estados, podemos presionar botones que cambian la
  velocidad, así como jalar/presionar la cabeza del ventilador para permitir
  o bloquear el giro.

¿Qué tienen en común estos sistemas?
- El sistema está determinado por un conjunto de estados posibles.
  Cada estado describe de forma precisa cómo se encuentra el sistema en un
  momento dado.
- Hay un conjunto de instrucciones que permiten cambiar de un estado a otro.
  Estas instrucciones pueden ser acciones físicas (como presionar un botón o
  girar una perilla), eventos externos (como casarse o enviudar), o cualquier
  otra índole.
  Lo importante es que podemos escribir estas instrucciones y comunicarlas a
  alguien más.
- El efecto de cada instrucción está determinado por una regla precisa y
  determinista (es decir, no hay lugar a interpretaciones).
- Antes de que hagamos cualquier acción, el sistema ya se encuentra en un estado
  inicial determinado.

A los sistemas que tengan estas cuatro características los llamaremos
*máquinas abstractas*.
Estos modelos son *máquinas* porque permiten la ejecución paso a paso de
instrucciones, y son *abstractas* porque no estamos considerando sus
limitaciones físicas ni detalles específicos de su funcionamiento.

Hasta ahora hemos visto máquinas abstractas con un número fijo y finito de
estados, pero no hay ninguna restricción sobre esto.

**Ejemplo** Una pila de platos sucios es un sistema, y puede tener cualquier
cantidad arbitraria de platos en ella; es decir que el número de estados
posibles es infinito.
Solamente hay dos acciones posibles: agregar un plato a la cima de la pila, o
quitar un plato de la cima de la pila para lavarlo.
Cada vez que agregamos un plato, el estado de la pila cambia, pues ahora hay
un plato más.

Las computadoras en realidad son máquinas abstractas muy complejas pero finitas.
El estado de una computadora moderna incluye la información almacenada en la
memoria RAM, en el disco duro, en la tarjeta de video, en la tarjeta de red, y
en muchos otros dispositivos.
Para un humano es imposible entender todos los estados posibles de una
computadora, así que en nuestra abstracta simplicidad vamos a considerar que
una computadora tiene un número finito de estados (memoria infinita), y que
cada estado es una secuencia de bits.


### Estudio de caso: La máquina de pila

La máquina de pila es un modelo muy simple de máquina abstracta en la que todas
las operaciones se realizan sobre una pila de datos.
Una pila de datos funciona igual que una pila de platos: se pueden ir apilando
los elementos uno sobre otro, pero siempre entran y salen por la cima de la
pila, nunca por el medio o el fondo.


He preparado una máquina de pila en los materiales del curso para que podamos
explorarla juntos.

In [1]:
from materiales.maquinas import MaquinaDePila

maq = MaquinaDePila()

In [2]:
maq.apilar('a')
maq.apilar('b')
maq.apilar('c')

| Nivel | Elemento |
|---|---|
| 2 | `'c'` |
| 1 | `'b'` |
| 0 | `'a'` |

Las máquinas de pila generalmente cuentan con un conjunto limitado pero útil
de instrucciones, como sumar, restar, multiplicar, dividir, comparar, etc.
Cada una de estas operaciones toma uno o más elementos de la pila, los procesa,
y coloca el resultado de vuelta en la pila.

In [3]:
maq.suma()

| Nivel | Elemento |
|---|---|
| 1 | `'bc'` |
| 0 | `'a'` |

In [4]:
maq.vaciar()  # Vaciamos la pila

| Nivel | Elemento |
|---|---|

Podemos hacer cáculos con una máquina de pila, pero debemos considerar que
las operaciones se escriben al final y no en medio.
Por ejemplo, para calcular `3 + 4 * 5` en una máquina de pila, primero
colocamos `3` y `4` en la pila, luego `5`, luego multiplicamos, y finalmente
sumamos.

In [5]:
maq.apilar(3)
maq.apilar(4)
maq.apilar(5)

| Nivel | Elemento |
|---|---|
| 2 | `5` |
| 1 | `4` |
| 0 | `3` |

In [6]:
maq.multiplicacion()

| Nivel | Elemento |
|---|---|
| 1 | `20` |
| 0 | `3` |

In [7]:
maq.suma()

| Nivel | Elemento |
|---|---|
| 0 | `23` |

Como último ejemplo, calculamos el número áureo, usado en arquitectura y arte
desde la antigüedad.
El número áureo está definido por la ecuación $\phi + 1 = \phi^2$.

$$\phi = \frac{1 + \sqrt{5}}{2}$$

In [8]:
# Calcular (1 + 5**(0.5))/2 = 1.618... (el número áureo)

maq.vaciar()
maq.apilar(1)
maq.apilar(5)
maq.apilar(0.5)
maq.potencia()
maq.suma()
maq.apilar(2)
maq.division()


| Nivel | Elemento |
|---|---|
| 0 | `1.618033988749895` |

A pesar de su aparente simplicidad, las máquinas de pila son capaces de realizar
cáculos complejos, y son la base de muchos lenguajes de programación de bajo
nivel.

### Estudio de caso: La Computadora del Hombre Pequeño


A continuación vamos a estudiar una máquina abstracta muy simple que modela las
computadoras con arquitectura de von Neumann.
Esta arquitectura es la base de la mayoría de las computadoras modernas, y se
fundamenta en ideas muy simples:

- La computadora tiene una **memoria** que almacena datos en celdas numeradas.
- Existe un **procesador** que puede realizar determinadas operaciones de una
  lista predefinida llamada **conjunto de instrucciones**.
- Los **programas** son suceseciones de estas instrucciones, y se almacenan en
  la memoria misma.

No puedo enfatizar suficientemente lo revolucionaria que fue la idea de von
Neumann de almacenar los programas en la memoria como si fueran meros datos.

Intuitivamente las máquinas abstractas son abstracciones simplificadas e
idealizadas de las computadoras reales.
En este sentido, uno de los modelos didácticos más simples es el de la
[*Computadora del Hombre Pequeño*](https://en.wikipedia.org/wiki/Little_man_computer)
(CHP), que ilustra de manera muy simplificada el funcionamiento de una
computadora con arquitecura de Von Neumann (como las computadoras actuales).
- La CHP consiste en un hombre pequeño que vive en una sala de correos con una
  bandeja de entrada y una bandeja de salida.
- El hombre pequeño cuenta con un ábaco (*acumulador*) para almacenar un número
  de tres dígitos así como realizar sumas y restas.
- La sala tiene 100 cajones numerados del 00 al 99 y cada cajón contiene una 
  carta con un número de tres dígitos.
- El hombre puede leer el contenido de un cajón, escribir en él, y moverse
  a otro cajón.
- El hombre puede leer el número de la carta en el cajón en el que se encuentra,
  y en base a ese número puede decidir qué hacer a continuación.

En cada paso, el hombre pequeño realiza un ciclo de tres pasos, mejor conocido
como ciclo de *fetch-decode-execute*:
1. **Traer**: El hombre lee el número de la carta en el cajón en el que se
   encuentra.
2. **Decodificar**: El hombre decide qué hacer en base al número de la carta.
3. **Ejecutar**: El hombre realiza la acción correspondiente y se mueve al
   siguiente cajón a menos que la acción sea moverse a un cajón específico.

Para decodificar el número de la carta, el hombre pequeño utiliza una tabla como
esta:

Instrucción | Número de la carta | Descripción
:---------- | :----------------: | :----------
**HALT** | 000 | Detente (hora de tomar un descanso).
**ADD** | 1xx | Suma a tu ábaco el número de la carta `xx`.
**SUBTRACT** | 2xx | Resta de tu ábaco el número de la carta `xx`.
**STORE** | 3xx | Escribe el número de tu ábaco en una carta y ponla en el cajón `xx`.
**LOAD** | 5xx | Pon en tu ábaco el número que está escrito la carta del cajón `xx`.
**BRANCH** | 6xx | Dirígete al cajón `xx`.
**BRANCH IF ZERO** | 7xx | Dirígete al cajón `xx` si el número en tu ábaco es cero.
**BRANCH IF POSITIVE**| 8xx | Dirígete al cajón `xx` si el número en tu ábaco es positivo.
**INPUT** | 901 | Toma una carta de la bandeja de entrada y copia el número en tu ábaco.
**OUTPUT** | 902 | Escribe el número de tu ábaco en una carta y ponla en la bandeja de salida.

In [9]:
from materiales.maquinas import ComputadoraHombrePequenno

In [10]:
# Ejemplo: sumar dos números de la bandeja de entrada y poner el
# resultado en la bandeja de salida
maq = ComputadoraHombrePequenno()
maq.cargar_entrada([2, 3, 9, 19, 4, 2, 0])
maq.cargar_programa([901, 310, 901, 110, 902])

0,1,2,3,4,5,6,7,8,9,10
000,X0,X1,X2,X3,X4,X5,X6,X7,X8,X9
0X,▶901,310,901,110,902,000,000,000,000,000
1X,000,000,000,000,000,000,000,000,000,000
2X,000,000,000,000,000,000,000,000,000,000
3X,000,000,000,000,000,000,000,000,000,000
4X,000,000,000,000,000,000,000,000,000,000
5X,000,000,000,000,000,000,000,000,000,000
6X,000,000,000,000,000,000,000,000,000,000
7X,000,000,000,000,000,000,000,000,000,000
8X,000,000,000,000,000,000,000,000,000,000


In [11]:
# NOTA: Ejecuta esta celda varias veces para ver el resultado
maq.transicion()

0,1,2,3,4,5,6,7,8,9,10
002,X0,X1,X2,X3,X4,X5,X6,X7,X8,X9
0X,901,▶310,901,110,902,000,000,000,000,000
1X,000,000,000,000,000,000,000,000,000,000
2X,000,000,000,000,000,000,000,000,000,000
3X,000,000,000,000,000,000,000,000,000,000
4X,000,000,000,000,000,000,000,000,000,000
5X,000,000,000,000,000,000,000,000,000,000
6X,000,000,000,000,000,000,000,000,000,000
7X,000,000,000,000,000,000,000,000,000,000
8X,000,000,000,000,000,000,000,000,000,000


### Estudio de caso: El desensamblador de Python

Python también se puede ver como una máquina abstracta.
En este caso, la máquina abstracta de Python es una máquina de pila, al igual
que ocurre con la mayoría de los lenguajes de programación de alto nivel.
Python incluye un módulo llamado `dis` que muestra las instrucciones de la
máquina de pila.
Esta máquina usa instrucciones como `LOAD_NAME` y `LOAD_CONST`
para colocar un valor en la cima de la pila, y `BINARY_OP` para realizar
operaciones binarias como sumar, restar, multiplicar, etc.

In [12]:
import dis

programa = "(base * altura) / 2"
dis.dis(programa)  # Mostrar en pantalla el programa de la máquina

  0           0 RESUME                   0

  1           2 LOAD_NAME                0 (base)
              4 LOAD_NAME                1 (altura)
              6 BINARY_OP                5 (*)
             10 LOAD_CONST               0 (2)
             12 BINARY_OP               11 (/)
             16 RETURN_VALUE


La saida del desensaamblador de Python es una secuencia de instrucciones
divididas las siguientes columnas:
- La primera columna indica el número de línea en el texto original.
- La segunda columna indica la posición de la instrucción la memoria de la
  máquina abstracta.
  Los números que faltan en la secuencia casi siempre indican que esa posición
  está ocupada por un dato, como puede ser un número o una cadena de texto.
  Si una de estas instrucciones es el objetivo de un salto condicional, se
  indica con una marca `>>`.
- La tercera columna indica la instrucción en lenguaje de la máquina.
- La cuarta columna indica el argumento de la instrucción, seguido del nombre
  entre paréntesis.

En nuestro siguiente ejemplo tenemos un programa ligeramente más complejo.
Este almacena la edad en una *variable* llamada *edad* y luego imprime un
mensaje dependiendo de si la edad es mayor o menor que 18.

In [13]:
edad = 23  # Cambia este valor para ver qué pasa
mensaje = "Vamos por un Yakult"
if edad >= 18:
    mensaje = "Vamos por unas chelas"
print(mensaje)

Vamos por unas chelas


In [14]:
# La triple comilla doble permite escribir cadenas de texto en varias
# líneas:
programa = """
edad = 23
mensaje = "Vamos por un Yakult"
if edad >= 18:
    mensaje = "Vamos por unas chelas"
print(mensaje)
"""
dis.dis(programa)

  0           0 RESUME                   0

  2           2 LOAD_CONST               0 (23)
              4 STORE_NAME               0 (edad)

  3           6 LOAD_CONST               1 ('Vamos por un Yakult')
              8 STORE_NAME               1 (mensaje)

  4          10 LOAD_NAME                0 (edad)
             12 LOAD_CONST               2 (18)
             14 COMPARE_OP               5 (>=)
             20 POP_JUMP_FORWARD_IF_FALSE     2 (to 26)

  5          22 LOAD_CONST               3 ('Vamos por unas chelas')
             24 STORE_NAME               1 (mensaje)

  6     >>   26 PUSH_NULL
             28 LOAD_NAME                2 (print)
             30 LOAD_NAME                1 (mensaje)
             32 PRECALL                  1
             36 CALL                     1
             46 POP_TOP
             48 LOAD_CONST               4 (None)
             50 RETURN_VALUE


**Actividad extra**: Si tienes la oportunidad, te recomiendo mucho el videojuego
[Human Resource Machine](https://tomorrowcorporation.com/humanresourcemachine),
lanzado en 2015 por la compañía *Tomorrow Corporation* para Windows, Mac, Linux,
iOS y Android.
Este es un juego de programación inspirado en la computadora del hombre pequeño.
Ahí te enfrentarás a varios acertijos de programación en una máquina RAM con
un conjunto de instrucciones muy limitado.
Comienzas con instrucciones muy básicas, pero a medida que avanzas en el juego
se te presentan retos más desafiantes con instrucciones más complejas.

## 2. Implementación de lenguajes de programación

Ahora que comprendemos qué es una máquina abstracta, podemos empezar a hablar
de los lenguajes máquina.
Ya vimos que una máquina abstracta recibe y ejecuta instrucciones para cambiar
de estado, así que, si anotamos estas instrucciones en un papel, tendremos una
receta para hacer que la máquina haga algo; a esto le llamamos un *programa*.

**Definición** Sea $M$ una máquina abstracta
- Un *programa* $P$ de $M$ es un texto finito que contiene solo instrucciones de
  $M$.
- Definimos a $L(M)$ “*el lenguaje máquina de $M$*” como el conjunto de todos
  los programas de $M$.


**Definición** Sea $L$ un lenguaje de programación. Una *implementación* de $L$
es una máquina abstracta $M$ tal que $L=L(M)$.

Sea $L=L(M)$. Por definición, $M$ es una máquina que permite la ejecución de
programas escritos en lenguaje $L$.
De forma recíproca, $L$ es un lenguaje que puede ser ejecutado por muchas
(infinitas) máquinas abstractas.

**Ejemplo** El procesador de [Intel 8086][x86] es una máquina abstracta que
ejecuta programas escritos su propio lenguaje máquina (por definición).
Sin embargo, este lenguaje máquina define el estándar de facto *lenguaje máquina
x86*.
Actualmente muchos procesadores modernos, incluyendo los de Intel y AMD, son
capaces de ejecutar programas escritos en lenguaje máquina x86.
Es decir que varios de los programas que fueron escritos para el procesador 8086
en los años 80 aún pueden ser ejecutados en las computadoras actuales.

**Ejemplo** El lenguaje de programación Python es un lenguaje de alto nivel; de
hecho, es el lenguaje de programación que usamos en este mismo cuaderno.
El intéprete oficial de Python es una máquina abstracta llamada *CPython* y,
aunque es la más común, existen otras [implementaciones alternativas][cpython].

[x86]: https://es.wikipedia.org/wiki/Intel_8086_y_8088
[cpython]: https://docs.python.org/es/3.8/reference/introduction.html#alternate-implementations

La implementación de un lenguaje de programación se puede dar de varias maneras,
pero en general es una combinación de estos tres casos:

### 2.1. Implementación en hardware


Implementar un lenguaje en hardware significa construir una máquina real que
ejecute programas escritos en el lenguaje.
- Utiliza circuitos digitales para implementar las instrucciones de la máquina
  así como la memoria.
- El lenguaje de programación es el lenguaje de la máquina.
- Los programas corren directamente en la máquina, por lo que son generalmente
  muy rápidos.
- Una vez construidia la máquina, es muy difícil modificarla.


**Ejemplo** La computadora Burroughs B5500 fue una computadora de la década
de 1960 que utilizaba un lenguaje de programación llamado *ALGOL 60*, cuyos
programas se ejecutaban directamente en la máquina.
Este es un ejemplo de un programa en ALGOL 60 que calcula el elemento más grande
en valor absoluto de una matriz:

```plaintext
procedure Absmax(a) Size:(n, m) Result:(y) Subscripts:(i, k);
    value n, m; array a; integer n, m, i, k; real y;
comment El elemento más grande en valor absoluto de la matriz a, de tamaño n por
    m, se copia en y, y los subíndices de este elemento en i y k;
begin
    integer p, q;
    y := 0; i := k := 1;
    for p := 1 step 1 until n do
        for q := 1 step 1 until m do
            if abs(a[p, q]) > y then
                begin y := abs(a[p, q]);
                    i := p; k := q
                end
end Absmax
```

**Actividad**
Hojear el [panfleto de la computadora Burroughs B5500][1] de 1964
y señalar las partes que corresponden a la implementación de ALGOL 60.

[1]: http://s3data.computerhistory.org/brochures/burroughs.b5500.1964.102646215.pdf

### 2.2. Implementación en microcódigo

Si disponemos de una máquina $M$ cuyas instrucciones son muy básicas pero muy
rápidas, podemos implementar un lenguaje $L$ en $M$ convirtiendo las complejas
instrucciones de $L$ en una secuencia de pequeñas instrucciones de $M$.
A esta técnica se le conoce como *microprogramación*, *simulación* o
*emulación*.

- La implementación tiene que simular las instrucciones de $L$ utilizando una
  o varias instrucciones de $M$.
- Posiblemente se requiera de implementar el propio ciclo de
  *traer-decodificar-ejecutar* en $M$.
- Más lento que la implementación en hardware, pero aporta flexibilidad.

Actualmente muchos de los programas que usamos en el día a día se implementan
en microcódigo a través de técnicas como la *compilación*, que veremos más
adelante.

**Ejemplo** El lenguaje de programación C es un lenguaje de alto nivel que
usualmente se implementa en microcódigo: para cada tipo de computadora, como
una PC, un teléfono móvil, o un microcontrolador, se cuenta con una herramienta
llamada *compilador* que convierte los programas escritos en lenguaje C en
instrucciones de máquina (microcódigo) que la computadora que se desea usar.

**Actividad** Hojear el [panfleto del sistema IBM 360][1] de 1964 y señalar las
partes que corresponden a la implementación de su lenguaje máquina.

[1]: https://es.scribd.com/document/338361531/A22-6821-0-360PrincOps-pdf

### 2.3. Implementación en software
A veces las instrucciones de un lenguaje $L$ son tan complejas que no es
práctico implementarlas en hardware o microcódigo.
En estos casos tenemos que simular la máquina $M$ en un lenguaje de programación
$L^\prime$ que ya esté implementado en hardware o microcódigo.
A la máquina $M$ se le conoce como *máquina virtual* y al lenguaje $L(M)$ se le
conoce como *lenguaje de alto nivel*.

- Requiere programar en $L^\prime$ un *intérprete* de $L$.
- Aún más lento que la implementación en microcódigo, pero aporta mucha
  flexibilidad, ya que solo requiere implementar una máquina virtual para cada
  máquina hospedera.



### 2.4. Implementación mixta
En la práctica, la implementación de un lenguaje de programación suele ser una
combinación de las tres técnicas anteriores.
La forma más común es implementar un compilador que convierte los programas
escritos en un lenguaje de alto nivel $L$ en instrucciones de un *lenguaje
intermedio* $L^\prime$ que a su vez es fácil de implementar en microcódigo para
una o varias máquinas $M$.

**Ejemplo** Java es un lenguaje de programación de alto nivel que se jacta de
ser *multiplataforma*, y con justa razón:
- Cada programa escrito en Java se compila a un lenguaje intermedio llamado
  *Java Bytecode*.
- El Java Bytecode es el lenguaje de la *máquina virtual de Java* (JVM), que es
  una máquina abstracta.
- La JVM es implementada en microcódigo para cada tipo de computadora,
  incluyendo PCs, teléfonos móviles, y microcontroladores.

**Ejemplo** El lenguaje de programación C# fue creado por Microsoft para
competir con Java, y tiene una arquitectura similar:
- Los programas escritos en C# se compilan a *Common Intermediate Language*
  (CIL).
- La *Common Language Runtime* (CLR) es la máquina virtual de C# que ejecuta
  las instrucciones de CIL.
- La CLR es implementada en microcódigo para cada tipo de computadora soportada
  por Microsoft.
  
**Ejemplo** Aunque muchos creen que Python es un lenguaje interpretado, en
realidad tiene una implementación mixta:
- Cuando un usuario desea ejecutar un programa en Python, el intérprete de
  Python (CPython) lo compila de forma inmediata a *código objeto*, que es un
  lenguaje intermedio específico de cada versión de CPython.
- El código objeto es interpretado y ejecutado por el *intérprete de Python*,
  que en realidad es una máquina virtual.
- CPython es implementado en microcódigo para varias plataformas, incluyendo
  Windows, macOS, y Linux.


## 3. Compilación vs. interpretación
Denotaremos con $P^L$ a un programa escrito en lenguaje $L$, y con $D$ al
conjunto de todos los *datos* de entrada y salida de $P$.
Matemáticamente $P$ es una función que mapea $D$ (entradas) a $D$ (salidas),
denotado en teoría de conjuntos así:
$$P^L: D \to D$$

Sin embargo hay un detalle técnico importante: $P$ no es una función definida en
todo su dominio $D$, sino que está definida solamente en un subconjunto (¿por
qué?).
A esto se le conoce en matemáticas como *función parcial*.


### 3.1 Intérpretes
**Definición** Sea $A$ un lenguaje de programación y $D$ el conjunto de todos
los datos de entrada y salida de $A$.
Un *intérprete* del lenguaje $A$ es un programa $I^B$, escrito en lenguaje $B$,
que recibe como entrada un programa $P^A$, escrito en lenguaje $A$, junto con su
entrada $e\in D$ y lo ejecuta; es decir, define la función parcial siguiente:
$$I^B: A \times D \to D$$

Vamos a diseccionar esta fórmula:
- $I^B$ es el intéprete, y actúa como una función.
- Esta función recibe dos argumentos, el primero pertenece al lenguaje $A$
  (es un programa) y el segundo pertenece a $D$ (es uno o más datos de entrada).
- La función $I^B$ transforma ($\to$) estos dos argumentos en un resultado que
  pertenece a $D$ (uno o más datos de salida). 

**Observación** El intérprete de $A$ es necesario para ejecutar cualquier
programa de $A$; este actúa como una *máquina virtual* de $A$.

Muchos intérpretes incluyen una consola interactiva que permite ejecutar
programas de $A$ sin necesidad de escribirlos en un archivo.
A este proceso se le conoce como *REPL* (del inglés *Read-Eval-Print Loop*)
porque es un ciclo de tres pasos:
1. **Leer**: El intérprete lee una línea de texto escrita en lenguaje $A$.
2. **Evaluar**: El intérprete ejecuta la línea de texto como una instrucción de
   $A$.
3. **Imprimir**: El intérprete imprime el resultado de la instrucción en la
   pantalla.


**Ejemplo 1** El intérprete de Python, CPython, se llama así porque es un
programa escrito en lenguaje C.
CPython recibe como entrada un programa de Python y lo ejecuta.
Cuando un programa de Python recibe una entrada o produce una salida, el
intérprete de Python se encarga de leer o escribir los datos en la consola.

**Ejemplo 2** JavaScript es un lenguaje de programación que se ejecuta
directamente en el navegador web.

**Actividad** Probar el intérprete de JavaScript directamente en el navegador
web.
- Abrir un navegador web moderno (Chrome, Firefox, Edge, etc.).
- Abrir las herramientas del desarrollador (tecla F12).
- Ir a la pestaña *Consola*.
- Escribir el siguiente programa en JavaScript:
  ```javascript
  console.log("Hola mundo");
  ```
- Probar con otros programas.

**Actividad** Analizar la implementación de la CHP en Python, así como
proporcionar un intérprete de de acuerdo a la definición anterior.

En la CHP, el lenguaje consiste de listas de números de tres dígitos, y los
datos de entrada y salida son listas de números de tres dígitos.

In [15]:
from materiales.maquinas.hombre import ComputadoraHombrePequenno


def interprete_chp(programa: list[int], entrada: list[int]) -> list[int]:
    maq = ComputadoraHombrePequenno(programa=programa, entrada=entrada)
    maq.ejecutar()
    return list(maq.salida)

In [16]:
# Ejemplo: multiplicar dos números de la bandeja de entrada y poner el
# resultado en la bandeja de salida.
# Para multiplicar m por n, sumamos m veces n.
# Este programa coloca m, n y el resultado en las posiciones 50, 51 y 52
# de la memoria, respectivamente.
programa_de_multiplicar = [
    603,  # IR A 3
    # Preparar constantes:
    0,  # CERO
    1,  # UNO
    # Línea 3 (inicio del programa):
    901,  # entrada -> acumulador
    350,  # acumulador -> memoria[50]
    901,  # entrada -> acumulador
    351,  # acumulador -> memoria[51]
    501,  # CERO -> acumulador
    352,  # acumulador -> memoria[52]
    # Línea 9 (inicio del ciclo):
    550,  # memoria[50] -> acumulador
    717,  # SI acumulador = 0 ENTONCES IR A 17
    202,  # acumulador - UNO -> acumulador
    350,  # acumulador -> memoria[50]
    551,  # memoria[51] -> acumulador
    152,  # acumulador + memoria[52] -> acumulador
    352,  # acumulador -> memoria[52]
    609,  # IR A 9
    # Línea 17 (fin del ciclo):
    552,  # memoria[52] -> acumulador
    902,  # acumulador -> salida
]
print("Programa para multiplicar dos números en CHP:")
print(programa_de_multiplicar)

Programa para multiplicar dos números en CHP:
[603, 0, 1, 901, 350, 901, 351, 501, 352, 550, 717, 202, 350, 551, 152, 352, 609, 552, 902]


In [17]:
# Usamos el intéreprete para multiplicar los números de la entrada:
entrada = [5, 8]
salida = interprete_chp(programa_de_multiplicar, entrada)

print(salida)

La computadora se detuvo.
[40]


**Actividad** Implementar un intérprete de Python en Python.

In [18]:
?exec

[0;31mSignature:[0m [0mexec[0m[0;34m([0m[0msource[0m[0;34m,[0m [0mglobals[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mlocals[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mclosure[0m[0;34m=[0m[0;32mNone[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Execute the given source in the context of globals and locals.

The source may be a string representing one or more Python statements
or a code object as returned by compile().
The globals must be a dictionary and locals can be any mapping,
defaulting to the current globals and locals.
If only globals is given, locals defaults to it.
The closure must be a tuple of cellvars, and can only be used
when source is a code object requiring exactly that many cellvars.
[0;31mType:[0m      builtin_function_or_method

In [19]:
# Ejemplo de programa minimal en Python
x = 10
y = 20
print(x + y)

30


In [20]:
exec("x = 10; y = 20; print(x + y)")

30


De lo anterior podemos concluir que para implementar un REPL de Python en Python
podemos hacer lo siguiente:

```python
while True:
    linea = input(">>> ")  # Leer
    resultado = exec(linea)  # Evaluar
    print(resultado)  # Imprimir
```

### 3.2 Compiladores

Intuitivamente, un compilador es un programa que traduce un programa de un
lenguaje a otro.
Sin embargo, la definición formal requiere que especifiquemos que el programa
traducido debe ser *equivalente* al original, y ese es un detalle técnico
muy importante.
¿Qué significa que dos programas sean equivalentes?
Que ante la misma entrada, ambos programas producen la misma salida.

**Definición** Sean $A$ y $B$ lenguajes de programación.
Un *compilador* de $A$ a $B$ es un programa $T$ que recibe como entrada un
programa $P^A$ escrito en $A$ y produce como salida un programa $P^B$ escrito en
$B$; es decir, define una función
$$T: A \to B\text{;}$$
más aún, $P^B$ es tal que para toda entrada $e\in D$ se cumple que
$$P^B(e) = P^A(e)\text{.}$$

**Observación** Usualmente $B$ es un lenguaje máquina, por lo que $P^B$ es un
programa que puede ser ejecutado directamente en una máquina, sin necesidad de
un intérprete.
Cuando esto no es así, se requiere de un intérprete de $B$ o bien otro
compilador de $B$ a un lenguaje máquina.

**Actividad** Realiza la práctica de compilación de un programa en lenguaje
ensamblador que se encuentra en el directorio `practicas/ensamblador/hola`.

**Actividad** Usar el compilador de C (*gcc*), incluido en el contenedor de
Docker para estas notas, para compilar y ejecutar el programa "*Hola mundo*".
Luego usar un editor de hexadecimales para analizar el código objeto generado.

```c
#include <stdio.h>
int main() {
   printf("¡Hola, mundo!");
   return 0;
}
```

### 3.3 Lenguajes intermedios y máquinas virtuales

En la realidad, la mayoría de los compiladores no traducen directamente de un
lenguaje a otro, sino que utilizan un *lenguaje intermedio* y una *máquina
virtual*, es decir un híbrido de las técnicas de compilación e interpretación.

**Actividad** Usar el compilador integrado de Python para analizar el código
objeto de un programa, y compararlo con la salida  del deseasamblador de Python.

In [21]:
# Compilamos el código
programa = """
base = 5
altura = 7
area = base * altura / 2
print(area)
"""
obj = compile(programa, filename="<string>", mode="exec")

In [22]:
# obj.co_code es un objeto de tipo bytes que contiene el programa.
type(obj.co_code)

bytes

In [23]:
# La salida en bytes es ilegible:
print(obj.co_code)

b'\x97\x00d\x00Z\x00d\x01Z\x01e\x00e\x01z\x05\x00\x00d\x02z\x0b\x00\x00Z\x02\x02\x00e\x03e\x02\xa6\x01\x00\x00\xab\x01\x00\x00\x00\x00\x00\x00\x00\x00\x01\x00d\x03S\x00'


In [24]:
# Usar un visor hexadecimal puede ayudar a entender el programa,
# aunque no mucho.
from materiales.visualizaciones import VisorHexadecimal

visor = VisorHexadecimal(n_renglon=10)  # Mostrar 10 bytes por renglón
visor.mostrar_bytes(obj.co_code)

97 00 64 00 5A 00 64 01 5A 01│· · d · Z · d · Z ·
65 00 65 01 7A 05 00 00 64 02│e · e · z · · · d ·
7A 0B 00 00 5A 02 02 00 65 03│z  · · Z · · · e ·
65 02 A6 01 00 00 AB 01 00 00│e · · · · · · · · ·
00 00 00 00 00 00 01 00 64 03│· · · · · · · · d ·
53 00                        │S ·


In [25]:
# Podemos comparar el código hexadecimal con el código ensamblador
# para observar los códigos de operación así como los operadores.
import dis

dis.disassemble(obj)

  0           0 RESUME                   0

  2           2 LOAD_CONST               0 (5)
              4 STORE_NAME               0 (base)

  3           6 LOAD_CONST               1 (7)
              8 STORE_NAME               1 (altura)

  4          10 LOAD_NAME                0 (base)
             12 LOAD_NAME                1 (altura)
             14 BINARY_OP                5 (*)
             18 LOAD_CONST               2 (2)
             20 BINARY_OP               11 (/)
             24 STORE_NAME               2 (area)

  5          26 PUSH_NULL
             28 LOAD_NAME                3 (print)
             30 LOAD_NAME                2 (area)
             32 PRECALL                  1
             36 CALL                     1
             46 POP_TOP
             48 LOAD_CONST               3 (None)
             50 RETURN_VALUE


**Actividad** Comparar las ventajas y desventajas de la compilación y la
interpretación.

## 4. Jerarquías de máquinas abstractas

Las máquinas microprogramadas (virtualmente todas las computadoras actuales)
tienen tres niveles de abstracción básicos, cada uno con su propio lenguaje de
programación:
- *Hardware*: Es la parte física de la máquina, con componentes electrónicos,
  mecánicos, y periféricos. Utiliza lenguaje máquina, escrito con voltajes y
  corrientes eléctricas.
- *Firmware*: Es un tipo de programa que permite controlar y comunicarse con el
  hardware de manera directa, generalmente se encuentra programado en un chip
  de memoria.
- *Software*: Es la parte lógica de un sistema computacional, confoirmado por
  programas, datos, y procedimientos que utilizan el hardware para realizar
  tareas específicas. Estos programas se escriben en lenguajes de alto nivel
  pero se compilan a lenguaje máquina para que puedan ser ejecutados por el
  hardware.

Esta jerarquía de abstracción se puede ver como una *pila* de máquinas, cada una
implementada sobre la anterior, con su propio lenguaje de programación, y
proveyendo la funcionalidad básica de la siguiente.
En la práctica existen más niveles de abstracción.


**Ejemplo** Las aplicaciones web se suelen implementar en la nube bajo el modelo
de *Software como Servicio* (SaaS, por sus siglas en inglés).
En este modelo,
- Existen uno o más servidores físicos que proveen la infraestructura de
  hardware.
  Estos centros de datos están ubicados en ciudades al rededor del mundo como en
  Querétaro, o bajo el mar.
- En estos centros de datos proveen varias máquinas virtuales para que los
  desarrolladores puedan instalar y ejecutar sus aplicaciones.
- Muchas de estas aplicaciones están escritas en lenguajes de alto nivel como
  Python, Java, o JavaScript, y son ejecutadas por una máquina virtual como la
  JVM o la CLR.
- Estas aplicaciones interactúan con los usuarios a través de un navegador web.

Ahora entiendes la frase “no existe la nube, solo es la computadora de alguien
más”.

**Ejemplo** Los chavos de ahora a veces instalan emuladores de videojuegos en
su teléfono móvil para jugar los viejos juegos de consola.
- El teléfono móvil es la máquina física, con un procesador, usualmente con un
  conjunto de instrucciones ARM.
- Los teléfonos de Android en realidad ejecutan un sistema operativo llamado
  *Android*, que es una versión modificada de Linux.
- El sistema operativo Android provee una máquina virtual de Java, llamada
  *Dalvik*, que ejecuta las aplicaciones escritas en Java.
- El emulador de videojuegos es un programa de Java que simula ser una
  computadora, con procesador, memoria, y tarjeta de video propias de una
  consola.
- Los videojuegos corren sobre la máquina virtual provista por el emulador.

Espero que puedas apreciar la maravilla de la computación moderna, donde podemos
simular máquinas dentro de máquinas, y donde cada máquina tiene su propio
lenguaje de programación.


**Actividad** Usar una aplicación de máquina virtual para ejecutar un sistema
operativo diferente al que se tiene instalado en la computadora.
¿Puedes correr un programa de Java en una máquina virtual de Java que a su vez
corre en la máquina virtual de otro sistema operativo?