# Clase 6: Estructuras de Datos Básicas y Aplicaciones

- *Autor*: [Dr. Mario Abarca](https://www.knkillname.org/)
- *Objetivo*: Aprender a usar iteración en Python y aplicarla a problemas matemáticos y físicos.

<a href="https://colab.research.google.com/github/knkillname/uaem.notas.introcomp/blob/master/cuadernos/6.EstructurasDeDatos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En matemáticas y computación, una **estructura de datos** describe cómo organizamos la información.
Cada tipo de estructura tiene propiedades y reglas específicas para almacenar y recuperar datos.
Las estructuras de datos más comunes son:

- **Listas**: Colecciones ordenadas de elementos.  
- **Pilas (Stacks)**: Estructura con acceso tipo LIFO *(Last In, First Out)*.  
- **Colas (Queues)**: Estructura con acceso tipo FIFO *(First In, First Out)*.  
- **Diccionarios (Mappings)**: Conjunto de pares clave-valor, como una especie de “función” que asocia cada clave con un valor.

Previamente hemos visto cómo trabajar con listas en Python. En esta clase ahondaremos en el uso de listas así como otras estructuras de datos.

## 6.1 Más sobre listas

En la clase anterior vimos qué son y cómo manipular listas en Python de manera básica. Ahora veremos algunas operaciones más avanzadas.

### Comprensión de listas

La **comprensión de listas** es una forma concisa de crear listas en Python usando una notación especial que asemela a la notación matemática de conjuntos.
En su forma más básica tiene la siguiente sintaxis:

```python
[expresion for elemento in iterable]
```

- `expresion` es cualquier expresión válida en Python.
- `elemento` es una variable que toma los valores de `iterable`.
- `iterable` es cualquier objeto que se pueda iterar, como una lista o un generador.

**Ejemplo**: En matemáticas, dado que tenemos un conjunto $A = \{1, 2, 3, 4, 5\}$, podemos definir un conjunto $B = \{x^2 \mid x \in A\}$ de los cuadrados de los elementos de $A$. En Python, podemos hacer lo mismo con listas:

In [None]:
A = [1, 2, 3, 4, 5]
B = [x**2 for x in A]
print(B)

La comprensión de listas se suele usar para transformar una lista en otra lista, de manera similar a la notación $\{f(x) \mid x \in A\}$ en matemáticas.

**Ejemplo**: Dada una lista de temperaturas en grados Celsius, podemos convertirlas a grados Fahrenheit con la fórmula $F = \frac{9}{5}\,C + 32$.

In [None]:
def celsius_a_fahrenheit(celsius):
    return 9/5 * celsius + 32

temperaturas_celsius = [0, 10, 20, 30, 40]
temperaturas_fahrenheit = [celsius_a_fahrenheit(c) for c in temperaturas_celsius]
temperaturas_fahrenheit

**Ejercicio**: La función `range` genera una secuencia de números enteros, pero ¿qué pasa si necesitamos una secuencia de números reales? Implementa una función `frange` que reciba los parámetros $a$, $b$ y $n$ y genere una lista de $n$ números reales equidistantes entre $a$ y $b$; por ejemplo, `frange(0, 1, 5)` debería devolver `[0.0, 0.25, 0.5, 0.75, 1.0]`.

**Ejercicio**: Dado que tenemos `frange`, podemos _graficar_ el tiro parabólico de un proyectil. Implementa las funciones `x(t)` y `y(t)` que devuelvan la posición en $x$ y $y$ de un proyectil lanzado con una velocidad inicial $v_0$ y un ángulo $\theta$ con respecto a la horizontal. Utiliza las fórmulas:

$$
\begin{align*}
x(t) &= v_0\,\cos(\theta)\,t, \\
y(t) &= v_0\,\sin(\theta)\,t - \frac{1}{2}\,g\,t^2,
\end{align*}
$$

donde $g = 9.81$ m/s² es la aceleración de la gravedad. Grafica la trayectoria del proyectil para $v_0 = 10$ m/s y $\theta = 45°$.

La comprensión de listas también se puede usar para filtrar elementos de una lista.

**Ejemplo**: Dada una lista de números, podemos filtrar los números pares.

In [None]:
numeros = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
pares = [x for x in numeros if x % 2 == 0]
pares

**Ejercicio**: Se tiene una cadena de texto que contiene palabras separadas por espacios, algunas de estas palabras terminan en "ión", por ejemplo `"La canción de la revolución promueve la unión"`. Implementa una función `terminan_en_ion` que reciba una cadena de texto y devuelva una lista con las palabras que terminan en "ión".

Ambas operaciones se pueden combinar en una sola comprensión de listas.
La notación $\{f(x) \mid x \in A \land P(x)\}$ en matemáticas se puede traducir a Python como `[f(x) for x in A if P(x)]`.

**Ejemplo**: Se desea extraer los números enteros de una cadena de texto que contiene palabras y números separados por espacios.

In [None]:
texto = "hola 123 mundo 456"
numeros = [int(palabra) for palabra in texto.split() if palabra.isnumeric()]
numeros

**Ejercicio**: Se nos dice que una moneda se ha lanzado 30 veces, y 18 veces ha salido *águila*. ¿Es sólo una coincidencia o hay algo raro?
Para determinar qué tan probable es que esto ocurra lo podemos simular por computadora.

1. Implementa una función `lanzamiento(p)` que simule el lanzamiento de una moneda y devuelva `True` (águila) con probabilidad $p$ y `False` (sol) con probabilidad $1 - p$.
2. Implementa una función `lanzamientos(n, p)` que simule $n$ lanzamientos de una moneda con probabilidad $p$ y devuelva una lista con los resultados.
3. Puedes usar la función `sum` para contar cuántas veces ha salido *águila* en la lista de resultados.
4. Para responder la pregunta, puedes simular 1000 experimentos con 30 lanzamientos y contar cuántas veces ha salido *águila* 18 o más veces. La probabilidad de que esto ocurra por casualidad es la proporción de experimentos que cumplen esta condición.

**Discusión**: Discute las siguientes preguntas con tu asistente:
- ¿En qué escenarios una comprensión de listas es más rápida o más conveniente que un bucle for tradicional, y en qué casos el for podría resultar más claro o flexible?
- Si necesito transformar y filtrar datos en varios pasos, ¿hasta qué punto es recomendable encadenar varias condiciones o expresiones dentro de una única list comprehension? ¿Dónde trazamos la línea entre escribir código conciso y mantenerlo legible?
- ¿Qué patrones o trucos avanzados se pueden usar dentro de una comprensión de listas?

### Listas anidadas

Las listas anidadas son listas que contienen otras listas como elementos. Esta estructura es muy útil para representar datos multidimensionales, como matrices, tableros de juego o tablas de datos. De hecho, una matriz $m \times n$ se puede representar como una lista de $m$ listas de $n$ elementos cada una.
Para acceder a un elemento en una lista anidada, se utilizan dos (o más) índices. Por ejemplo, `matriz[i][j]` accede al elemento en la fila $i$ y columna $j$.

**Ejemplo** (Gato): El juego del _gato_ consiste en un tablero de $3 \times 3$ celdas, donde dos jugadores se turnan para colocar una _X_ o un _O_ en una celda vacía. El juego termina cuando un jugador coloca tres de sus símbolos en línea horizontal, vertical o diagonal.

In [None]:
tablero = [
    [' ', 'X', 'O'],
    ['O', 'X', 'X'],
    ['O', ' ', 'O']
]

En este caso, `tablero[0][1]` es `'X'`, `tablero[1][0]` es `'O'` y `tablero[2][2]` es `'O'`.
Primero, vamos a implementar una función que imprima el tablero en la consola.

In [None]:
def imprimir_tablero(tablero):
    for fila in tablero:
        print('|'.join(fila))
        print('-' * 5)


Para generar el tablero inicial, podemos usar una lista de listas con espacios en blanco.

In [None]:
tablero = [[' ' for _ in range(3)] for _ in range(3)]


Luego, podemos implementar una función que permita a un jugador colocar su símbolo en una celda vacía.

In [None]:
def jugar(tablero, jugador, fila, columna):
    if tablero[fila][columna] == ' ':
        tablero[fila][columna] = jugador
        return True
    else:
        return False

La función `jugar` recibe el tablero, el jugador (que puede ser `'X'` o `'O'`) y las coordenadas de la celda a jugar. Si la celda está vacía, se coloca el símbolo del jugador y se devuelve `True`; de lo contrario, se devuelve `False`. Para determinar si un jugador ha ganado, se pueden verificar todas las líneas posibles en el tablero.

In [None]:
def gana(tablero, jugador):
    # Verificar filas
    for i in range(3):
        if all(tablero[i][j] == jugador for j in range(3)):
            return True
    # Verificar columnas
    for j in range(3):
        if all(tablero[i][j] == jugador for i in range(3)):
            return True
    # Verificar diagonales
    if all(tablero[i][i] == jugador for i in range(3)) or all(tablero[i][2 - i] == jugador for i in range(3)):
        return True
    
    # Si no hay línea ganadora
    return False

### La lista como pila

En la clase de recursividad definimos qué es una pila, ahora la definiremos de manera más formal.

**Definición** Una **pila** es una colección de elementos en el que el último elemento que entra es el primero en salir (*Last In, First Out* o LIFO). Tiene dos operaciones básicas:

- `push(x)`: Agrega un elemento `x` a la cima de la pila.
- `pop()`: Elimina y devuelve el elemento en la cima de la pila.

Una lista en Python puede usarse como pila, ya que tiene los métodos `append` y `pop` que permiten agregar y eliminar elementos al final de la lista, respectivamente; es decir, la cima de la pila es el último elemento de la lista.

**Ejemplo**: Decimos que una cadena de texto tiene **paréntesis balanceados** si cada paréntesis de apertura `(` tiene un paréntesis de cierre `)` correspondiente y en el orden correcto. Por ejemplo, `"((a + b) * (c - d))"` tiene paréntesis balanceados, pero `"((a + b) * (c - d)"` no.
Podemos usar una pila para verificar si una cadena de texto tiene paréntesis balanceados:

1. Inicializamos una pila vacía.
2. Para cada carácter en la cadena:
   - Si es un paréntesis de apertura, lo agregamos a la pila.
   - Si es un paréntesis de cierre, verificamos si la pila no está vacía y si el último elemento de la pila es un paréntesis de apertura correspondiente.
3. Al final, la pila debe estar vacía si la cadena tiene paréntesis balanceados.

In [None]:
def parentesis_balanceados(cadena):
    pila = []
    for c in cadena:
        if c == '(':
            pila.append(c)
        elif c == ')':
            if not pila or pila.pop() != '(':
                return False
    return not pila

**Ejercicio**: La **notación posfija** (o **notación polaca inversa**) es una forma de escribir expresiones matemáticas sin paréntesis, y tiene mucha utilidad en computación.
En esta notación, los operadores se colocan después de sus operandos, por ejemplo, la expresión `(1 + 2) * (3 - 4)` se escribe como `1 2 + 3 4 - *`.
Para evaluar una expresión en notación posfija, se puede usar una pila para almacenar los operandos y operadores.
Implementa una función `evaluar_posfija` que reciba una lista de cadenas con los elementos de una expresión en notación posfija y devuelva el resultado de evaluarla.
Por simplicidad asumiremos que la expresión es válida y que sólo contiene números enteros y los operadores `+`, `-`, `*` y `/`.

**Discusión**: Discute las siguientes preguntas con tu asistente:

- ¿Cómo se pueden combinar las operaciones de las listas en Python (por ejemplo, slicing, list comprehensions) para crear estructuras de datos?
- ¿Dos pilas pueden ser usadas para simular otra estructura de datos?
- ¿Cómo se puede simular una lista doblemente infinita usando solamente listas de Python que son finitas?

## 6.2 Conjuntos

En matemáticas, un **conjunto** es una colección de elementos sin orden ni repetición. En Python, además se pide que los elementos de un conjunto sean *inmutables*, es decir, que no se puedan modificar una vez que se han creado, y que además el conjunto sea finito.
Los conjuntos en Python se crean con llaves `{}` o con la función `set`.

In [None]:
A = {1, 2, 3}
B = set([3, 5, 4, 1, 2, 3])

La operación más básica de un conjunto es la **pertenencia**, que se verifica con el operador `in`.


In [None]:
1 in A  # True
4 in A  # False

Los conjuntos también soportan operaciones de conjuntos, como la unión, intersección y diferencia.

In [None]:
A = {1, 2, 3}
B = {3, 4, 5}
print("Unión:", A | B)  # {1, 2, 3, 4, 5}
print("Intersección:", A & B)  # {3}
print("Diferencia:", A - B)  # {1, 2}
print("Diferencia simétrica:", A ^ B)  # {1, 2, 4, 5}
print("Subconjunto:", A <= B)  # False
print("Superconjunto:", A >= B)  # False

Los conjuntos como estructura de datos son útiles para eliminar duplicados de una lista, verificar rápidamente si varios elementos están presentes o realizar operaciones de conjuntos.

**Ejercicio**: (Anagramas) Dos palabras son **anagramas** si tienen las mismas letras, pero en un orden diferente, por ejemplo, `"roma"` y `"amor"`.
Implementa una función `anagramas` que reciba dos cadenas de texto y devuelva `True` si son anagramas y `False` en caso contrario.

**Ejercicio**: (Filtrado y eliminación de duplicados) Dada una cadena con palabras separadas por espacios, nos gustaría contar cuántas palabras únicas hay; sin embargo, a veces la misma palabra se escribe con mayúsculas o minúsculas, o tiene signos de puntuación al final, por ejemplo `"El hombre bajo toca el Bajo bajo el puente"`.
Implementa una función `palabras_unicas` que reciba una cadena de texto y devuelva un conjunto con las palabras únicas, ignorando mayúsculas y minúsculas.

También es posible usar la **comprensión de conjuntos** para crear conjuntos de manera concisa. Por ejemplo, podemos extraer las vocales de una cadena de texto.

In [None]:
texto = "¡Me amarraron como PUERCO!"
vocales = {letra.lower() for letra in texto if letra.lower() in "aeiou"}
vocales

## 6.3 Diccionarios

Un **diccionario** es una colección de pares clave-valor, donde cada clave es única y se asocia con un valor. En Python, los diccionarios se crean con llaves `{}` y los pares clave-valor se separan con dos puntos `:`. Son equivalentes a las funciones finitas en matemáticas, es decir, que tienen un dominio finito.

In [None]:
{"nombre": "Fulano", "telefono": "1234567890", "email": "fulano@hombressanos.com"}

Los diccionarios son útiles para almacenar información estructurada, como datos de contacto, configuraciones o resultados de cálculos.
Por ejemplo, una lista de contactos:

In [None]:
hombres_sanos = [
    {"nombre": "Fulano", "telefono": "1234567890", "email": "fulano@hombressanos.com"},
    {"nombre": "Mengano", "telefono": "0987654321", "email": "mengano@hombressanos.com"},
    {"nombre": "Zutano", "telefono": "6789012345", "email": "zutano@hombressanos.com"}
]

Para acceder a un valor en un diccionario, se utiliza la clave correspondiente.

In [None]:
contacto = hombres_sanos[0]  # hombres_sanos es una lista de diccionarios
print(contacto["nombre"])  # contacto es un diccionario, y tiene una clave "nombre"

Si la clave no existe en el diccionario, se produce un error de tipo `KeyError`. Para evitar este error, se puede usar el método `get`, que devuelve un valor predeterminado si la clave no existe.

In [None]:
print(contacto["direccion"])  # KeyError

Las claves del diccionario son iterables, por lo que se pueden recorrer con un bucle `for`.

In [None]:
for clave in contacto:
    print(clave, contacto[clave])

Los diccionarios también soportan la comprensión de diccionarios, que es similar a la comprensión de listas pero con pares clave-valor.

In [None]:
cuadrados = {x: x**2 for x in range(1, 6)}
cuadrados

**Ejemplo**: Dado que tenemos una lista de estudiantes con sus calificaciones, podemos calcular el promedio de cada estudiante.

In [None]:
estudiantes = {
    "2023001": {
        "nombre": "Ana Martínez",
        "edad": 20,
        "cursos": {
            "Matemáticas": {"nota": 9.0, "profesor": "Dr. Ruiz"},
            "Física": {"nota": 8.5, "profesor": "Dra. Gómez"},
            "Computación": {"nota": 9.2, "profesor": "Dr. Pérez"}
        }
    },
    "2023002": {
        "nombre": "Luis García",
        "edad": 21,
        "cursos": {
            "Matemáticas": {"nota": 7.8, "profesor": "Dr. Ruiz"},
            "Física": {"nota": 8.0, "profesor": "Dra. Gómez"},
            "Computación": {"nota": 8.5, "profesor": "Dr. Pérez"}
        }
    },
    "2023003": {
        "nombre": "María López",
        "edad": 19,
        "cursos": {
            "Matemáticas": {"nota": 9.5, "profesor": "Dr. Ruiz"},
            "Física": {"nota": 9.0, "profesor": "Dra. Gómez"},
            "Computación": {"nota": 9.8, "profesor": "Dr. Pérez"}
        }
    }
}

for matricula, datos in estudiantes.items():
    nombre = datos["nombre"]
    cursos = datos["cursos"]
    promedio = sum(curso["nota"] for curso in cursos.values()) / len(cursos)
    print(f"Estudiante: {nombre} (Matrícula: {matricula}) - Promedio: {promedio:.2f}")


**Ejercicio**: (Conteo de palabras) Dada una cadena de texto, queremos contar cuántas veces aparece cada palabra en ella. Implementa una función `conteo_palabras` que reciba una cadena de texto y devuelva un diccionario con las palabras como claves y el número de veces que aparecen como valores.


## 6.4 Colecciones inmutables vs. mutables

No todos los objetos de Python pueden ser usados como claves de un diccionario o elementos de un conjunto, solamente aquellos que son **inmutables**.

**Definición** Un objeto es **mutable** si su valor puede cambiar después de haber sido creado, y es **inmutable** si su valor no puede cambiar.

Los números y cadenas de texto son inmutables, mientras que las listas y diccionarios son mutables.

**Ejemplo**: Las listas y diccionarios no pueden ser usados como claves de un diccionario:

In [None]:
# Esto produce un error
diccionario = {[1, 2]: "valor"}

La versión *inmutable* de una lista es una **tupla**, que se crea al separar los elementos con comas `,` y opcionalmente encerrarlos entre paréntesis `()`:

In [None]:
tupla = 1, 2, 3

Las tuplas son útiles para representar datos heterogéneos, como coordenadas, fechas o configuraciones.
Por ejemplo, una fecha se puede representar como una tupla de tres elementos `(año, mes, día)` y, dado que los números son inmutables, se pueden usar como claves de un diccionario:

In [None]:
fecha1 = (2021, 10, 12)
fecha2 = (2021, 10, 13)
temperaturas = {fecha1: 25, fecha2: 26}

**Ejemplo** (mazo de cartas): El mazo de cartas del Poker tiene 52 cartas, cada una con un palo (corazones, diamantes, tréboles, picas) y un valor (A, 2-10, J, Q, K).
Podemos representar una carta como una tupla `(palo, valor)` y el mazo como un conjunto de cartas.

In [None]:
palos = "♠♣♥♦"
valores = "A23456789TJQK"
mazo = {(palo, valor) for palo in palos for valor in valores}
mazo

Ahora hasta podemos barajar el mazo y repartir cartas a los jugadores.

In [None]:
import random

mazo = list(mazo)
random.shuffle(mazo)
jugadores = ["fulano", "mengano", "perengano"]

manos = {jugador: mazo[i::len(jugadores)] for (i, jugador) in enumerate(jugadores)}

for jugador, mano in manos.items():
    print(f"{jugador}: {mano}")

En este ejemplo hemos usado el generador `enumerate` para obtener los índices de los jugadores. En general, `enumerate` devuelve una secuencia de pares `(índice, elemento)` que se puede desempaquetar en dos variables.


**Ejercicio** (mazo del Tarot) El mazo de cartas del Tarot tiene 78 cartas divididas en 22 *arcanos mayores*, representados por figuras simbólicas, y 56 *arcanos menores*, representados por palos y números, como en el Poker.

- Los arcanos mayores se pueden representar como una lista de cadenas de texto, como `["El Loco", "La Emperatriz", ...]`.
- Los arcanos menores se pueden representar como un conjunto de tuplas `(palo, número)`, como `{("Espadas", 1), ("Espadas", 2), ...}`.
- Cada carta tiene dos o más significados, que se pueden representar como un diccionario con las cartas como claves y una lista de significados como valores, como `{"El Loco": ["libertad", "espontaneidad"], ...}`.
- Implementa una función que genere un mazo de cartas del Tarot como un diccionario con las cartas como claves y los significados como valores.
- Escribe una función que permita a un jugador barajar el mazo y seleccionar tres cartas al azar, y devuelva los significados de las cartas seleccionadas.

**Nota**: Este curso es laico no considera la práctica de la adivinación ni la creencia en lo sobrenatural, y se recomienda tratar el Tarot como un juego de cartas simbólico y artístico.
En nuestro caso, es un ejercicio de programación y creemos que el generador de números aleatorios de Python es, de hecho, mejor que cualquier habilidad adivinatoria si sabes de probabilidad y estadística.

### A profundidad: la función `hash`

La magia detrás de los diccionarios y conjuntos en Python es un truco matemático llamado **función hash**.
Una función hash toma un objeto y devuelve un número entero, llamado **hash**, de manera que dos objetos iguales tienen el mismo hash, pero dos objetos diferentes tienen hashes muy diferentes, incluso si difieren en un solo bit.

La función `hash` en Python devuelve el hash de un objeto, que se puede usar como clave de un diccionario o elemento de un conjunto.

In [None]:
print(f"{hash(42)=}")  # El hash de un número entero es el mismo número
print(f"{hash('hola')=}")  # El hash de una cadena de texto es único
print(f"{hash((1, 2, 3))=}")  # El hash de una tupla es el mismo si sus elementos son iguales

Los objetos mutables, como las listas y diccionarios, no tienen un hash definido, ya que su valor puede cambiar después de haber sido creado.

In [None]:
# Esto produce un error de tipo TypeError
print(f"{hash([1, 2, 3])=}")

Los diccionarios y conjuntos en Python usan la función hash para almacenar y buscar elementos de manera eficiente, ya que es muy rápido calcular el hash de un objeto y buscarlo en una tabla que asocia hashes con valores.

**Discusión** Discute las siguientes preguntas con tu asistente:

- ¿Qué es una **función hash universal** y por qué es importante en la implementación de diccionarios y conjuntos?
- ¿Cómo se puede implementar una **función hash** para un objeto personalizado en Python?
- ¿Qué es una **colisión** en una función hash y cómo se puede resolver?
- ¿Qué es una **tabla hash** y cómo se puede implementar en Python?