# Programación imperativa

En general, existen dos maneras fundamentalmente distintas de programar:

- **Programación imperativa**: los programas consisten en series de instrucciones
  que indican a la computadora qué hacer y cómo hacerlo.
- **Programación declarativa**: los programas consisten en descripciones de hechos
  y problemas que deben ser resueltos.
  El cómo se resuelven estos problemas queda a cargo de la computadora.

Históricamente los lenguajes de programación han evolucionado mediante
abstracciones que permiten expresar conceptos de manera más simple comenzando
por la máquina y terminando en el problema a resolver, de manera que los
lenguajes imperativos han sido los más utilizados hasta el momento, aunque
últimamente los lenguajes declarativos han ganado gran popularidad.

En este módulo vamos a aprender diferentes conceptos de la programación
imperativa y en el próximo módulo vamos a aprender los conceptos de la
programación declarativa; solo hay que tomar en cuenta que el buen programador
usa ambos tipos de lenguajes y sus distintos paradigmas como una caja de
herramientas para resolver los problemas que se le presenten.

## 1. Identificadores y el entorno de referencia

### 1.1. Identificadores y objetos denotables


Quizá la abstracción de datos más importante que se ha hecho en la programación
imperativa es la de **identificador** o **nombre**.
Los identificadores son cadenas de caracteres que se utilizan para referirse a
**objetos denotables** en el lenguaje de programación.

Un objeto denotable es básicamente cualquier cosa que se pueda construir en
lenguaje de programación, por ejemplo, un número, una cadena de caracteres, una
lista, una función, etc. siempre que el lenguaje te permita construirlo y
asignarle un nombre.

Es importante mencionar que los identificadores no son los objetos que denotan,
sino que son una manera de referirse a ellos. 

**Notación** Usamos las *metavariables* (variables que representan variables)
`foo`, `bar`, `baz`, `qux`, `quux`, para referirnos a identificadores arbitrarios.
Estas son de uso común en la literatura de programación.

**Ejemplo** En Python los nombres son *etiquetas* que se colocan sobre objetos.
Puedes pensar en ellas como notas post-it que se pegan sobre los objetos que 
identifican, y que además los puedes cambiar de objeto cuando quieras.

<img src="img/variablespostit.svg" height="256" />


In [None]:
# En Python todos los objetos denotables tienen un número identificador
# único mientras existen en la memoria.
id("Hola")

Cuando dos variables se refieren al mismo objeto, se dice que son *alias* una
de la otra.

In [None]:
# Colocamos foo sobre la cadena "Jamón" y bar sobre la misma cadena
bar = "Calculadora"
print(f"{bar=} hace referencia al objeto {id(bar)=}")
foo = "Jamón"
print(f"{foo=} hace referencia al objeto {id(foo)=}")
bar = foo  # bar es un alias de foo
print(f"{bar=} hace referencia al objeto {id(bar)=}")
# Movemos foo a otra cadena
foo = "Monja"
print(f"{foo=} hace referencia al objeto {id(foo)=}")
print(f"{bar=} hace referencia al objeto {id(bar)=}")
bar = "Tortas"  # Aquí ya no hay referencias al jamón
bar = "Jamón"
print(f"{bar=} hace referencia al objeto {id(bar)=}")

In [None]:
# Este es un error muy común entre los programadores novatos que aún no
# entienden cómo funciona la asignación de variables en Python.
foo = [1, 2, 3]
print(f"{foo=}")

bar = foo  # bar hace referencia la misma lista que foo
print(f"{bar=}")

print("Modificamos foo...")
foo.append(4)
print(f"{foo=}")
print(f"{bar=}")  # bar también se modifica!

En los lenguajes de programación imperativos no cualquier cadena de caracteres
es un identificador ni todos los identificadores son variables.
- Los identificadores están delimitados por la sintaxis del lenguaje.
- Las palabras reservadas del lenguaje no pueden ser usadas como
  identificadores.
- Algunos identificadores son provistos por el lenguaje y en general no se
  pueden modificar.


In [None]:
# En Python, los identificadores pueden tener letras UNICODE, dígitos y
# guiones bajos, pero no pueden comenzar con un dígito.
perrito1 = "🐶"
_toro_malo95 = "🐱"
δ = 0.0001
未知 = [...]

In [None]:
# Estas variables están prohibidas en Python. Producen un SyntaxError
# 1perrito = "Hola"
# 🐶 = "Guau"

A pesar de que en teoría es posible que un lenguaje de programación permita
usar cualquier cadena de caracteres como identificador, en la práctica solo se
recomienda usar identificadores escritos en inglés.

Python tiene 35 palabras reservadas que no pueden ser usadas como
identificadores:
1. `False`
1. `None`
1. `True`
1. `and`
1. `as`
1. `assert`
1. `async`
1. `await`
1. `break`
1. `class`
1. `continue`
1. `def`
1. `del`
1. `elif`
1. `else`
1. `except`
1. `finally`
1. `for`
1. `from`
1. `global`
1. `if`
1. `import`
1. `in`
1. `is`
1. `lambda`
1. `nonlocal`
1. `not`
1. `or`
1. `pass`
1. `raise`
1. `return`
1. `try`
1. `while`
1. `with`
1. `yield`

**Definición**: El conjunto de identificadores accesibles desde una instrucción
concreta durante la ejecución de un programa es su **entorno de referencia** o
simplemente el **entorno**.

In [None]:
# En Python, el entorno de referencia es un diccionario que mapea
# nombres de variables locales y globales a objetos.
globals() | locals()

La *declaración* de un identificador es la instrucción que lo introduce en el
entorno de referencia.
Existen dos tipos:
- La *declaración implícita* es la que se hace al asignarle un valor a un
  identificador por primera vez.
- La *declaración explícita* es la que se hace con una instrucción especial
  para declarar identificadores, como `var` en JavaScript.

In [None]:
# Python usa la declaración implícita:
baz = 42
print(f"{baz=}")

| Lenguaje   | Tipo de declaración | Ejemplo      |
|------------|---------------------|--------------|
| Python     | Implícita           | `x = 1`      |
| C++        | Explícita           | `int x = 1;` |
| Java       | Explícita           | `int x = 1;` |
| JavaScript | Implícita           | `x = 1`      |
| R          | Implícita           | `x <- 1`     |

Algunos lenguajes también ofrecen una instrucción para *eliminar* un
identificador del entorno de referencia.
Por ejemplo, Python usa `del foo` para eliminar el identificador `foo`, y
JavaScript usa `delete foo`.

In [None]:
foo = "Defenestrar"
bar = foo
del foo  # Borramos el nombre foo, no el objeto al que hacía referencia
# print(foo)  # Esta instrucción produce un NameError
print(bar)  # bar sigue existiendo

## 2. Estructuras de control y las reglas de alcance

### 2.1 Programación no estructurada

Recordemos que la programación imperativa evolucionó a partir del lenguaje
máquina:

- La máquina tiene **contador de programa** que indica el número de instrucción
  (posición en la memoria) que se ejecutará a continuación.
- Cuando se termina de ejecutar una instrucción, el contador de programa se
  incrementa en uno a menos que la instrucción sea una **instrucción de
  salto**, en cuyo caso el valor cambia al que la instrucción de salto indique.

En los lenguajes de programación imperativos modernos, esta instrucción de salto
se conoce como `goto` y se utiliza para saltar a una instrucción arbitraria del
programa, generalmente indicada por una etiqueta.
Al tipo de programación que abusa de la instrucción `goto` se le conoce como
**programación no estructurada**.


**Ejemplo**  En C++ las etiquetas se indican con el símbolo `:`.
Consideremos el siguiente programa escrito en C++ que imprime los
números de Fibonacci menores o iguales a un número `n_max` dado por el usuario.
Las variables `i` y `j` se declaran explícitamente como enteros, y contienen dos
números consecutivos de la sucesión de Fibonacci.
Podemos observar que el programa tiene tres etiquetas: `loop`, `iterate` y
`exit`:

```C++
#include <iostream>

int main() {
  int n_max, i = 1, j = 0;
  std::cout << "n = ";
  std::cin >> n_max;

loop:
  if (j <= n_max) goto iterate;
  goto exit;

iterate:
  std::cout << j << " ";
  j += i;
  i = j - i;
  goto loop;

exit:
  std::cout << std::endl;
  return 0;
}
```

**Actividad**: Usar el depurador de Visual Studio Code para ejecutar el programa
anterior paso a paso y seguir el flujo de ejecución.

Muchos lenguajes de programación modernos como Python y JavaScript no
implementan la instrucción `goto` porque se considera una **mala práctica de
programación**.
Ya en 1966 se sabía que la instrucción  `goto` es innecesaria para construir
cualquier programa (veremos este resultado en la siguiente subsección), pero en
1968 se publicó un influyente ensayo titulado [*Go To Statement Considered
Harmful*][1] donde Edsger Dijkstra critica el esta instrucción `goto` porque
produce código ilegible, que en terminología moderna conocemos popularmente como
[*código espagueti*](https://en.wikipedia.org/wiki/Spaghetti_code).

[1]: https://doi.org/10.1145/362929.362947

En la programación no estructurada el entorno de referencia son todas los
identificadores que se han declarado hasta el momento de la ejecución de una
instrucción.

### 2.2 La programación estructurada

En 1957 [FORTRAN](https://en.wikipedia.org/wiki/Fortran) se convirtió el primer
lenguaje de programación en no depender de la instrucción `goto` para construir
programas.
El truco estaba en la capacidad de organizar el código en **bloques** y usar
**estructuras de control** para controlar el flujo de ejecución del programa.

**Definición** (de bloques de código) Un **bloque de código** se define
recursivamente de la siguiente manera:
- Una instrucción es un bloque de código por sí misma.
- **Estructura secuencial**: Si $A$ y $B$ son bloques de código, entonces
  “$A$`; `$B$” es el bloque de código que ejecuta $A$ y después ejecuta $B$.
- **Estructura condicional**: Si $c$ es una expresión booleana y $A$ un bloque
  de código, entonces “`si` $c$ `entonces` $A$ `fin`” es el bloque de código que
  ejecuta $A$ si y sólo si $c$ es verdadera.
- **Estructura iterativa**: Si $c$ es una expresión booleana y $A$ un bloque de
  código, entonces “`mientras` $c$ `hacer` $A$ `fin`” es el bloque de código que
  ejecuta $A$ mientras $c$ sea verdadera.
  

#### La estructura secuencial

La estructura más simple de todas es la evolución natural de que el contador
de programa se incremente en uno después de ejecutar una instrucción: las 
instrucciones se ejecutan una detrás de otra en el orden en que aparecen.
Para separar las instrucciones en bloques de código se usa algún símbolo como el
punto y coma `;` en C++ o el salto de línea en Python.

Si $B_1$, $B_2$, $\ldots$, $B_n$ son bloques de código, entonces la estructura
secuencial tiene la siguiente forma:

- $B_1$`;`
- $B_2$`;`
- $\quad\vdots$
- $B_n$`;`

En particular, si cada bloque de código es una instrucción, se vería así:

- $\textit{instrucción}_1$
- $\textit{instrucción}_2$
- $\qquad\vdots$
- $\textit{instrucción}_n$

Algunos lenguajes de programación incluso tienen símbolos especiales para
agrupar instrucciones en bloques de código:
- Las palabras `begin` y `end` se usan ALGOL, Pascal, Ada y otros.
- Las llaves `{` y `}` se usan en los descendientes del lenguaje B (C, C++,
  Java, JavaScript, C#, etc.).


**Actividad** En el siguiente programa escrito en C++; `std::cout` se usa para
imprimir en la terminal, y `std::endl` representa un salto de línea.
Determina qué imprime el programa y por qué.


```C++
#include <iostream>
int foo = 1;

void bloque_d() {
  // Bloque D
  std::cout << "Bloque D: foo=" << foo << std::endl;  
}

int main() {
  // Bloque A
  std::cout << "Bloque A: foo=" << foo << std::endl;
  int foo = 2;

  {
    // Bloque B
    int foo = 3;
    std::cout << "Bloque B: foo=" << foo << std::endl;
  }

  {
    // Bloque C
    std::cout << "Bloque C: foo=" << foo << std::endl;
  }

  bloque_d();  // Llamada a la función bloque_d

  std::cout << "Bloque A: foo=" << foo << std::endl;
  return 0;
}
```

#### La estructura condicional

La estructura condicional evoluciona a partir de las instrucciones de salto
condicional del lenguaje máquina, en donde el contador de programa cambia al
valor de una etiqueta si y sólo si una condición es verdadera.

Si $c$ es una expresión booleana y $B$ un bloque de código, entonces la
estructura condicional tiene la siguiente forma:

- `si` $\mathit{c}$ `entonces`
  - $\mathit{B}$`;`

Es equivalente al siguiente pseudocódigo que usa la instrucción “`vaya a`”
(*goto*) y la etiqueta $L$:

- `si` $\neg\mathit{c}$ `entonces vaya a` $L$`;`
- $B$`;`
- $L: \ldots$

**Actividad** Explorar la estructura condicional en Python y sus variantes.

In [None]:
edad = 18
if edad > 18:
    print("Vamos por unas chelas.")
elif edad > 16:
    print("Vamos a dar un paseo en coche.")
else:
    print("Vamos por un Yakult.")

In [None]:
estado = "MTY"
match estado:
    case "MOR":
        print("Eres guayabo.")
    case "CDMX":
        print("Eres chilango.")
    case "AGS":
        print("Eres hidrocálido.")
    case "GRO":
        print("Eres guerrerense.")
    case "MTY":
        print("Eres regiomontano.")
    case _:
        print("Eres del interior, provinciano.")


#### La estructura iterativa

La estructura iterativa evoluciona a partir de las instrucciones de salto
condicional que apuntan a una instrucción anterior, de manera que el contador de
programa regresa a un valor menor.

Si $c$ es una expresión booleana y $B$ un bloque de código, entonces la
estructura iterativa tiene la siguiente forma:

- `mientras` $\mathit{c}$ `haga`
  - $\mathit{B}$`;`

Es equivalente al siguiente pseudocódigo que usa la instrucción “`vaya a`”
(*goto*) y las etiquetas $L$ y $M$:

- $L:$ `si` $\neg\mathit{c}$ `entonces vaya a` $M$`;`
- $B$`;`
- `vaya a` $L$`;`
- $M: \ldots$

**Actividad** Explorar la estructura iterativa en Python y sus variantes.

In [None]:
edad = 15
while edad < 18:
    print(f"Tienes {edad}; vamos por un Yakult.")
    print("Esperamos un año.")
    edad += 1
print("Vamos por una chela.")

In [None]:
list(range(10, 18))

In [None]:
for edad in range(10, 18):
    print(f"Tienes {edad}; vamos por un Yakult.")
print("Vamos por una chela.")

In [None]:
for edad in range(99):
    if edad < 1:
        continue
    if edad >= 18:
        print(f"Tienes {edad}; vamos por una chela.")
        break
    print(f"Tienes {edad}; vamos por un Yakult.")


#### El Teorema del programa estructurado

En [1966 Böhm y Jacopini][1] demostraron matemáticamente que cualquier programa
se puede escribir, al menos en principio, usando únicamente las estructuras de
control secuencial, condicional e iterativa.
Este resultado es completamente teóríco, pues las transformaciones que usan para
convertir un programa no estructurado en uno que sí es estructurado lo vuelven
aún más ilegible que el programa original.

[1]: https://dl.acm.org/doi/10.1145/355592.365646

El teorma de Böhm y Jacopini se refiere concretamente a [diagramas de flujo][1],
pero se puede extender de forma natural a cualquier lenguaje de programación.
Específicamente demostraron que cualquier diagrama de flujo se puede convertir
a otro equivalente que tiene solamente estos tres artefactos con sus respectivas
representaciones gráficas:

![Diagramas de estructuras de control](img/Structured_program_patterns.svg)

[1]: https://en.wikipedia.org/wiki/Flowchart

A este resultado famoso se conoce como el **Teorema del programa estructurado**
y muchos argumentan que es la justificación teórica de que la programación no
estructurada es innecesaria.
En la práctica se sabe que en algunos *muy raros* casos, la instrucción `goto`
no solamente hace al programa más eficiente, sino más legible.

En lo particular, como docente de programación, no recomiendo usar la
instrucción `goto` a menos que tengas muchos años de experiencia programando y
una muy buena razón para hacerlo.
Antes de escribir ese `goto` pregúntate si la eficiencia que ganas es
significativa y si no perderás legibilidad en el proceso.

