# Lenguajes máquina

Los lenguajes de programación son una forma de comunicar instrucciones a una
computadora.
Los hay de muchos tipos, con sus respectivas ventajas y desventajas.
Se dice que un lenguaje de programación es de *alto nivel* cuando está más
cercano al lenguaje humano, y de *bajo nivel* cuando está más cercano al
lenguaje de las máquinas.
En este cuaderno vamos a explorar los lenguajes de programación de más bajo
nivel: los **lenguajes máquina** y sus primos cercanos, los **lenguajes
ensambladores**.



## 1. Máquinas e intérpretes

Para hablar de lenguajes máquina primero necesitamos entender qué es una
*máquina*.
Concretamente, vamos a hablar de *máquinas abstractas*, que son los modelos
que nos permiten entender cómo funcionan las computadoras de una manera muy
simplificada pero general.


Una *máquina abstracta* es un modelo de sistema computacional que recibe 
entradas y produce salidas de acuerdo a un conjunto de reglas.
Estos modelos son *máquinas* porque permiten la ejecución paso a paso de
instrucciones, y son *abstractas* porque no están limitadas por las leyes
físicas.
Toda máquina abstracta particular define un conjunto de *estados* en los que se
puede encontrar, y cuentan con un conjunto de *instrucciones* que permiten 
alterar el estado de la máquina.

**Ejemplo** El estatus civil de una persona puede ser soltero, casado, viudo,
divorciado, etc. Estos son los estados posibles de una persona. Las
instrucciones que permiten alterar el estado civil son casarse, divorciarse,
enviudar, etc.

**Ejemplo** Una máquina expendedora de café es una máquina física, pero la 
podemos abstraer si ignoramos detalles como los materiales, los componentes
eléctricos o mecánicos, etc.
La máquina expendedora tiene muchos estados internos posibles, como *esperando
moneda*, *preparando café*, *agregando azúcar*, etc.; y transita de un estado a
otro cuando recibe una moneda, al presionar un botón, o cuando finalizae el
temporizador que calienta el agua.

### Estudio de caso: La máquina de pila

La máquina de pila es un modelo muy simple de máquina abstracta en la que todas
las operaciones se realizan sobre una pila de datos.
Una pila de datos funciona igual que una pila de platos: se pueden ir apilando
los elementos uno sobre otro, pero siempre entran y salen por la cima de la
pila, nunca por el medio o el fondo.


He preparado una máquina de pila en los materiales del curso para que podamos
explorarla juntos.

In [None]:
from materiales.maquinas import MaquinaDePila

maq = MaquinaDePila()

In [None]:
maq.apilar('a')
maq.apilar('b')
maq.apilar('c')

Las máquinas de pila generalmente cuentan con un conjunto limitado pero útil
de instrucciones, como sumar, restar, multiplicar, dividir, comparar, etc.
Cada una de estas operaciones toma uno o más elementos de la pila, los procesa,
y coloca el resultado de vuelta en la pila.

In [None]:
maq.suma()

In [None]:
maq.vaciar()  # Vaciamos la pila

Podemos hacer cáculos con una máquina de pila, pero debemos considerar que
las operaciones se escriben al final y no en medio.
Por ejemplo, para calcular `3 + 4 * 5` en una máquina de pila, primero
colocamos `3` y `4` en la pila, luego `5`, luego multiplicamos, y finalmente
sumamos.

In [None]:
maq.apilar(3)
maq.apilar(4)
maq.apilar(5)

In [None]:
maq.multiplicacion()

In [None]:
maq.suma()

In [None]:
# Calcular (1 + 5**(0.5))/2 = 1.618... (el número áureo)

maq.vaciar()
maq.apilar(1)
maq.apilar(5)
maq.apilar(0.5)
maq.potencia()
maq.suma()
maq.apilar(2)
maq.division()


A pesar de su aparente simplicidad, las máquinas de pila son capaces de realizar
cáculos complejos, y son la base de muchos lenguajes de programación de bajo
nivel.

### Estudio de caso: La Computadora del Hombre Pequeño


A continuación vamos a estudiar una máquina abstracta muy simple que modela las
computadoras con arquitectura de von Neumann.
Esta arquitectura es la base de la mayoría de las computadoras modernas, y se
fundamenta en ideas muy simples:

- La computadora tiene una **memoria** que almacena datos en celdas numeradas.
- Existe un **procesador** que puede realizar determinadas operaciones de una
  lista predefinida llamada **conjunto de instrucciones**.
- Los **programas** son suceseciones de estas instrucciones, y se almacenan en
  la memoria misma.

No puedo enfatizar suficientemente lo revolucionaria que fue la idea de von
Neumann de almacenar los programas en la memoria como si fueran meros datos.

Intuitivamente las máquinas abstractas son abstracciones simplificadas e
idealizadas de las computadoras reales.
En este sentido, uno de los modelos didácticos más simples es el de la
[*Computadora del Hombre Pequeño*](https://en.wikipedia.org/wiki/Little_man_computer)
(CHP), que ilustra de manera muy simplificada el funcionamiento de una
computadora con arquitecura de Von Neumann (como las computadoras actuales).
- La CHP consiste en un hombre pequeño que vive en una sala de correos con una
  bandeja de entrada y una bandeja de salida.
- El hombre pequeño cuenta con un ábaco (*acumulador*) para almacenar un número
  de tres dígitos así como realizar sumas y restas.
- La sala tiene 100 cajones numerados del 00 al 99 y cada cajón contiene una 
  carta con un número de tres dígitos.
- El hombre puede leer el contenido de un cajón, escribir en él, y moverse
  a otro cajón.
- El hombre puede leer el número de la carta en el cajón en el que se encuentra,
  y en base a ese número puede decidir qué hacer a continuación.

En cada paso, el hombre pequeño realiza un ciclo de tres pasos, mejor conocido
como ciclo de *fetch-decode-execute*:
1. **Traer**: El hombre lee el número de la carta en el cajón en el que se
   encuentra.
2. **Decodificar**: El hombre decide qué hacer en base al número de la carta.
3. **Ejecutar**: El hombre realiza la acción correspondiente y se mueve al
   siguiente cajón a menos que la acción sea moverse a un cajón específico.

Para decodificar el número de la carta, el hombre pequeño utiliza una tabla como
esta:

Instrucción | Número de la carta | Descripción
:---------- | :----------------: | :----------
**HALT** | 000 | Detente (hora de tomar un descanso).
**ADD** | 1xx | Suma a tu ábaco el número de la carta `xx`.
**SUBTRACT** | 2xx | Resta de tu ábaco el número de la carta `xx`.
**STORE** | 3xx | Escribe el número de tu ábaco en una carta y ponla en el cajón `xx`.
**LOAD** | 5xx | Pon en tu ábaco el número que está escrito la carta del cajón `xx`.
**BRANCH** | 6xx | Dirígete al cajón `xx`.
**BRANCH IF ZERO** | 7xx | Dirígete al cajón `xx` si el número en tu ábaco es cero.
**BRANCH IF POSITIVE**| 8xx | Dirígete al cajón `xx` si el número en tu ábaco es positivo.
**INPUT** | 901 | Toma una carta de la bandeja de entrada y copia el número en tu ábaco.
**OUTPUT** | 902 | Escribe el número de tu ábaco en una carta y ponla en la bandeja de salida.

In [None]:
from materiales.maquinas import ComputadoraHombrePequenno

In [None]:
# Ejemplo: sumar dos números de la bandeja de entrada y poner el
# resultado en la bandeja de salida
maq = ComputadoraHombrePequenno()
maq.cargar_entrada([2, 3, 9, 19, 4, 2, 0])
maq.cargar_programa([901, 310, 901, 110, 902])

In [None]:
# NOTA: Ejecuta esta celda varias veces para ver el resultado
maq.transicion()

### Estudio de caso: El desensamblador de Python

Python también se puede ver como una máquina abstracta.
En este caso, la máquina abstracta de Python es una máquina de pila, al igual
que ocurre con la mayoría de los lenguajes de programación de alto nivel.
Python incluye un módulo llamado `dis` que permite observar el programa que se
ejecuta en la máquina de pila de Python cada vez que nostros ejecutamos un
programa.

La máquina de pila de Python usa instrucciones como `LOAD_NAME` y `LOAD_CONST`
para colocar un valor en la cima de la pila, y `BINARY_OP` para realizar
operaciones binarias como sumar, restar, multiplicar, etc.

In [None]:
import dis

programa = "(base * altura) / 2"
dis.dis(programa)  # Mostrar en pantalla el programa de la máquina

La saida del desensaamblador de Python es una secuencia de instrucciones
divididas las siguientes columnas:
- La primera columna indica el número de línea en el texto original.
- La segunda columna indica la posición de la instrucción la memoria de la
  máquina abstracta.
  Los números que faltan en la secuencia casi siempre indican que esa posición
  está ocupada por un dato, como puede ser un número o una cadena de texto.
  Si una de estas instrucciones es el objetivo de un salto condicional, se
  indica con una marca `>>`.
- La tercera columna indica la instrucción en lenguaje de la máquina.
- La cuarta columna indica el argumento de la instrucción, seguido del nombre
  entre paréntesis.

En nuestro siguiente ejemplo tenemos un programa ligeramente más complejo.
Este almacena la edad en una *variable* llamada *edad* y luego imprime un
mensaje dependiendo de si la edad es mayor o menor que 18.

In [None]:
edad = 23  # Cambia este valor para ver qué pasa
mensaje = "Vamos por un Yakult"
if edad >= 18:
    mensaje = "Vamos por unas chelas"
print(mensaje)

In [None]:
# La triple comilla doble permite escribir cadenas de texto en varias
# líneas:
programa = """
edad = 23
mensaje = "Vamos por un Yakult"
if edad >= 18:
    mensaje = "Vamos por unas chelas"
print(mensaje)
"""
dis.dis(programa)

## 2. Implementación de lenguajes de programación

**Definición** Sea $M$ una máquina abstracta
- Un *programa* $P$ de $M$ es un texto finito que define operaciones de $M$ y
  que hace que $M$ transite de un estado a otro de forma legal.
- Definimos a $L(M)$ “*el lenguaje máquina de $M$*” como el conjunto de todos
  los programas de $M$.

Sea $L=L(M)$. Por definición, $M$ es una máquina que permite la ejecución de
programas escritos en lenguaje $L$.
De forma recíproca, $L$ es un lenguaje que puede ser ejecutado por muchas
(infinitas) máquinas abstractas.


**Definición** Sea $L$ un lenguaje de programación. Una *implementación* de $L$
es una máquina abstracta $M$ tal que $L=L(M)$.

La implementación de un lenguaje de programación se puede dar de varias maneras,
pero en general es una combinación de estos tres casos:

### 2.1. Implementación en hardware


Implementar un lenguaje en hardware significa construir una máquina real que
ejecute programas escritos en el lenguaje.
- Utiliza circuitos digitales para implementar las instrucciones de la máquina
  así como la memoria.
- El lenguaje de programación es el lenguaje de la máquina.
- Los programas corren directamente en la máquina, por lo que son generalmente
  muy rápidos.
- Una vez construidia la máquina, es muy difícil modificarla.


**Ejemplo** La computadora Burroughs B5500 fue una computadora de la década
de 1960 que utilizaba un lenguaje de programación llamado *ALGOL 60*, cuyos
programas se ejecutaban directamente en la máquina.
Este es un ejemplo de un programa en ALGOL 60 que calcula el elemento más grande
en valor absoluto de una matriz:

```
procedure Absmax(a) Size:(n, m) Result:(y) Subscripts:(i, k);
    value n, m; array a; integer n, m, i, k; real y;
comment El elemento más grande en valor absoluto de la matriz a, de tamaño n por
    m, se copia en y, y los subíndices de este elemento en i y k;
begin
    integer p, q;
    y := 0; i := k := 1;
    for p := 1 step 1 until n do
        for q := 1 step 1 until m do
            if abs(a[p, q]) > y then
                begin y := abs(a[p, q]);
                    i := p; k := q
                end
end Absmax
```

**Actividad**
Hojear el [panfleto de la computadora Burroughs B5500][1] de 1964
y señalar las partes que corresponden a la implementación de ALGOL 60.

[1]: http://s3data.computerhistory.org/brochures/burroughs.b5500.1964.102646215.pdf

### 2.2. Implementación en microcódigo
Si disponemos de una máquina $M$ cuyas instrucciones son muy básicas pero muy
rápidas, podemos implementar un lenguaje $L$ en $M$ convirtiendo las complejas
instrucciones de $L$ encon una secuencia de pequeñas instrucciones de $M$.
A esta técnica se le conoce como *microprogramación*, *simulación* o
*emulación*.

- La implementación tiene que simular las instrucciones de $L$ utilizando una
  o varias instrucciones de $M$.
- Posiblemente se requiera de implementar el propio cilco de
  *traer-decodificar-ejecutar* en $M$.
- Más lento que la implementación en hardware, pero aporta flexibilidad.

Actualmente muchos de los programas que usamos en el día a día se implementan
en microcódigo a través de técnicas como la *compilación*, que veremos más
adelante.

**Actividad** Hojear el [panfleto del sistema IBM 360][1] de 1964 y señalar las
partes que corresponden a la implementación de su lenguaje máquina.

[1]: https://es.scribd.com/document/338361531/A22-6821-0-360PrincOps-pdf

### 2.3. Implementación en software
A veces las instrucciones de un lenguaje $L$ son tan complejas que no es
práctico implementarlas en hardware o microcódigo.
En estos casos tenemos que simular la máquina $M$ en un lenguaje de programación
$L^\prime$ que ya esté implementado en hardware o microcódigo.
A la máquina $M$ se le conoce como *máquina virtual* y al lenguaje $L(M)$ se le
conoce como *lenguaje de alto nivel*.

- Requiere programar en $L^\prime$ un *intérprete* de $L$.
- Aún más lento que la implementación en microcódigo, pero aporta mucha
  flexibilidad, ya que solo requiere implementar una máquina virtual para cada
  máquina hospedera.

### 2.4. Implementación mixta
En la práctica, la implementación de un lenguaje de programación suele ser una
combinación de las tres técnicas anteriores.
Por ejemplo, el lenguaje de programación Python se implementa mediante un
intérprete en lenguaje C (con su respectiva máquina virtual de Python que vimos
en el estudio de caso anterior), y a su vez el lenguaje C se implementa en
microcódigo en la mayoría de las computadoras modernas.

## 3. Compilación vs. interpretación
Denotaremos con $P^L$ a un programa escrito en lenguaje $L$, y con $D$ al
conjunto de todos los *datos* de entrada y salida de $P$.
Matemáticamente $P$ es una función que mapea $D$ (entradas) a $D$ (salidas),
denotado en teoría de conjuntos así:
$$P^L: D \to D$$

Sin embargo hay un detalle técnico importante: $P$ no es una función definida en
todo su dominio $D$, sino que está definida solamente en un subconjunto (¿por
qué?).
A esto se le conoce en matemáticas como *función parcial*.


### 3.1 Intérpretes
**Definición** Sea $A$ un lenguaje de programación y $D$ el conjunto de todos
los datos de entrada y salida de $A$.
Un *intérprete* del lenguaje $A$ es un programa $I^B$, escrito en lenguaje $B$,
que recibe como entrada un programa $P^A$, escrito en lenguaje $A$, junto con su
entrada $e\in D$ y lo ejecuta; es decir, define la función parcial siguiente:
$$I^B: A \times D \to D$$

**Observación** El intérprete de $A$ es necesario para ejecutar cualquier
programa de $A$; este actúa como una *máquina virtual* de $A$.

Muchos intérpretes incluyen una consola interactiva que permite ejecutar
programas de $A$ sin necesidad de escribirlos en un archivo.
A este proceso se le conoce como *REPL* (del inglés *Read-Eval-Print Loop*)
porque es un ciclo de tres pasos:
1. **Leer**: El intérprete lee una línea de texto escrita en lenguaje $A$.
2. **Evaluar**: El intérprete ejecuta la línea de texto como una instrucción de
   $A$.
3. **Imprimir**: El intérprete imprime el resultado de la instrucción en la
   pantalla.


**Ejemplo 1** El intérprete de Python es un programa escrito en C que recibe como
entrada un programa de Python y lo ejecuta. Cuando un programa de Python recibe
una entrada o produce una salida, el intérprete de Python se encarga de leer o
escribir los datos en la consola.

**Ejemplo 2** JavaScript es un lenguaje de programación que se ejecuta
directamente en el navegador web.

**Actividad** Probar el intérprete de JavaScript directamente en el navegador
web.
- Abrir un navegador web moderno (Chrome, Firefox, Edge, etc.).
- Abrir las herramientas del desarrollador (tecla F12).
- Ir a la pestaña *Consola*.
- Escribir el siguiente programa en JavaScript:
  ```javascript
  console.log("Hola mundo");
  ```
- Probar con otros programas.

**Actividad** Analizar la implementación de la CHP en Python, así como
proporcionar un intérprete de de acuerdo a la definición anterior.

En la CHP, el lenguaje consiste de listas de números de tres dígitos, y los
datos de entrada y salida son listas de números de tres dígitos.

In [None]:
from materiales.maquinas.hombre import ComputadoraHombrePequenno


def interprete_chp(programa: list[int], entrada: list[int]) -> list[int]:
    maq = ComputadoraHombrePequenno(programa=programa, entrada=entrada)
    maq.ejecutar()
    return list(maq.salida)

In [None]:
# Ejemplo: multiplicar dos números de la bandeja de entrada y poner el
# resultado en la bandeja de salida.
# Para multiplicar m por n, sumamos m veces n.
# Este programa coloca m, n y el resultado en las posiciones 50, 51 y 52
# de la memoria, respectivamente.
programa_de_multiplicar = [
    603,  # IR A 3
    # Preparar constantes:
    0,  # CERO
    1,  # UNO
    # Línea 3 (inicio del programa):
    901,  # entrada -> acumulador
    350,  # acumulador -> memoria[50]
    901,  # entrada -> acumulador
    351,  # acumulador -> memoria[51]
    501,  # CERO -> acumulador
    352,  # acumulador -> memoria[52]
    # Línea 9 (inicio del ciclo):
    550,  # memoria[50] -> acumulador
    717,  # SI acumulador = 0 ENTONCES IR A 17
    202,  # acumulador - UNO -> acumulador
    350,  # acumulador -> memoria[50]
    551,  # memoria[51] -> acumulador
    152,  # acumulador + memoria[52] -> acumulador
    352,  # acumulador -> memoria[52]
    609,  # IR A 9
    # Línea 17 (fin del ciclo):
    552,  # memoria[52] -> acumulador
    902,  # acumulador -> salida
]
print("Programa para multiplicar dos números en CHP:")
print(programa_de_multiplicar)

In [None]:
# Usamos el intéreprete para multiplicar los números de la entrada:
entrada = [5, 8]
salida = interprete_chp(programa_de_multiplicar, entrada)

print(salida)

**Actividad** Implementar un intérprete de Python en Python.

In [None]:
?exec

In [None]:
# Ejemplo de programa minimal en Python
x = 10
y = 20
print(x + y)

In [None]:
exec("x = 10; y = 20; print(x + y)")

De lo anterior podemos concluir que para implementar un REPL de Python en Python
podemos hacer lo siguiente:

```python
while True:
    linea = input(">>> ")  # Leer
    resultado = exec(linea)  # Evaluar
    print(resultado)  # Imprimir
```

### 3.2 Compiladores

Intuitivamente, un compilador es un programa que traduce un programa de un
lenguaje a otro.
Sin embargo, la definición formal requiere que especifiquemos que el programa
traducido debe ser *equivalente* al original, y ese es un detalle técnico
muy importante.

**Definición** Sean $A$ y $B$ lenguajes de programación.
Un *compilador* de $A$ a $B$ es un programa $T$ que recibe como entrada un
programa $P^A$ escrito en $A$ y produce como salida un programa $P^B$ escrito en
$B$; es decir, define una función
$$T: A \to B\text{;}$$
más aún, $P^B$ es tal que para toda entrada $e\in D$ se cumple que
$$P^B(e) = P^A(e)\text{.}$$

**Observación** Usualmente $B$ es un lenguaje máquina, por lo que $P^B$ es un
programa que puede ser ejecutado directamente en una máquina, sin necesidad de
un intérprete.
Cuando esto no es así, se requiere de un intérprete de $B$ o bien otro
compilador de $B$ a un lenguaje máquina.

**Actividad** Realiza la práctica de compilación de un programa en lenguaje
ensamblador que se encuentra en el directorio `practicas/ensamblador/hola`.

**Actividad** Usar el compilador de C (*gcc*), incluido en el contenedor de
Docker para estas notas, para compilar y ejecutar el programa "*Hola mundo*".
Luego usar un editor de hexadecimales para analizar el código objeto generado.

```c
#include <stdio.h>
int main() {
   printf("¡Hola, mundo!");
   return 0;
}
```

### 3.3 Lenguajes intermedios y máquinas virtuales

En la realidad, la mayoría de los compiladores no traducen directamente de un
lenguaje a otro, sino que utilizan un *lenguaje intermedio* y una *máquina
virtual*, es decir un híbrido de las técnicas de compilación e interpretación.

**Actividad** Usar el compilador integrado de Python para analizar el código
objeto de un programa, y compararlo con la salida  del deseasamblador de Python.

In [None]:
# Compilamos el código
programa = """
base = 5
altura = 7
area = base * altura / 2
print(area)
"""
obj = compile(programa, filename="<string>", mode="exec")

In [None]:
# obj.co_code es un objeto de tipo bytes que contiene el programa.
type(obj.co_code)

In [None]:
# La salida en bytes es ilegible:
print(obj.co_code)

In [None]:
# Usar un visor hexadecimal puede ayudar a entender el programa,
# aunque no mucho.
from materiales.visualizaciones import VisorHexadecimal

visor = VisorHexadecimal(n_renglon=10)  # Mostrar 10 bytes por renglón
visor.mostrar_bytes(obj.co_code)

In [None]:
# Podemos comparar el código hexadecimal con el código ensamblador
# para observar los códigos de operación así como los operadores.
import dis

dis.disassemble(obj)

**Actividad** Comparar las ventajas y desventajas de la compilación y la
interpretación.

## 4. Jerarquías de máquinas abstractas

Las máquinas microprogramadas (virtualmente todas las computadoras actuales)
tienen tres niveles de abstracción básicos, cada uno con su propio lenguaje de
programación:
- *Hardware*: Es la parte física de la máquina, con componentes electrónicos,
  mecánicos, y periféricos. Utiliza lenguaje máquina, escrito con voltajes y
  corrientes eléctricas.
- *Firmware*: Es un tipo de programa que permite controlar y comunicarse con el
  hardware de manera directa, generalmente se encuentra programado en un chip
  de memoria.
- *Software*: Es la parte lógica de un sistema computacional, confoirmado por
  programas, datos, y procedimientos que utilizan el hardware para realizar
  tareas específicas. Estos programas se escriben en lenguajes de alto nivel
  pero se compilan a lenguaje máquina para que puedan ser ejecutados por el
  hardware.

Esta jerarquía de abstracción se puede ver como una *pila* de máquinas, cada una
implementada sobre la anterior, con su propio lenguaje de programación, y
proveyendo la funcionalidad básica de la siguiente.
En la práctica existen más niveles de abstracción.

**Ejemplo** Las aplicaciones web se suelen implementar en la nube bajo el modelo
de *Software como Servicio* (SaaS, por sus siglas en inglés).
En este modelo, el usuario final interactúa con una aplicación web a través de
un navegador web, pero la aplicación en sí se ejecuta en un servidor remoto.
Este servidor remoto se encuentra en un centro de datos, que es un conjunto de
computadoras conectadas a Internet, donde se ejecuta una máquina virtual que
ejecuta un sistema operativo que a su vez ejecuta un servidor web que ejecuta
una aplicación web que se comunica con el navegador web del usuario.

| Nivel | Abstracción |
| --- | --- |
| 5 | Procesos de negocio |
| 4 | Software de aplicación |
| 3 | Middleware |
| 2 | Sistema operativo |
| 1 | Máquina virtual |
| 0 | Máquina física |



**Actividad** Usar una aplicación de máquina virtual para ejecutar un sistema
operativo diferente al que se tiene instalado en la computadora.