<div style="padding:10px;background-color: #FF4D4D; color:white;font-size:28px;"><strong>Estructuras Básicas - Diccionarios</strong></div>

Un diccionario es un tipo de dato muy importante en Python que nos permite organizar información de forma distinta: 

En lugar de usar índices numéricos como en listas o tuplas, usamos claves (keys) para acceder a los valores.

Por ejemplo, si quisiéramos guardar definiciones de palabras, podríamos usar un diccionario así:

In [3]:
diccionario = {
    "Python": "Un lenguaje de programación de alto nivel.",
    "Variable": "Un contenedor para almacenar datos.",
    "Secuencia": "Disposición ordenada de elementos"
}

Aquí, cada llave (como "Python") está asociada a un valor (como "Un lenguaje de programación de alto nivel."). Este tipo de estructura se llama llave-valor (key-value).

Podemos acceder a una definición fácilmente por medio de la llave:

In [5]:
diccionario["Python"]

'Un lenguaje de programación de alto nivel.'

Pero no sirve únicamente para crear un diccionario de significados de palabras, los diccionarios tienen gran versatilidad

In [7]:
persona = {
    "nombre": "Emanuel",
    "edad": 34,
    "país": "México"
}

A diferencia de las secuencias como listas o tuplas, que almacenan elementos en orden (posición 0, 1, 2…), un diccionario no tiene un orden natural.
Por eso, si imprimes un diccionario, el orden en que aparecen los elementos puede cambiar, y no afecta el contenido ni la funcionalidad.

In [9]:
teacher = {
    "país": "México",
    "edad": 34,
    "nombre": "Emanuel"
}

In [10]:
persona == teacher

True

Ambos diccionarios son equivalentes aunque el orden de los pares sea diferente.

Antes de seguir, es bueno saber que hay otras formas de crear un diccionario en Python. Una de ellas es usando el constructor dict(), que intenta convertir lo que le pasamos en un diccionario, siempre que tenga un formato adecuado.

In [12]:
# Pares clave-valor usando el constructor dict()
actuario = dict(nombre="Emanuel", edad=34, país="México")
print(actuario)

{'nombre': 'Emanuel', 'edad': 34, 'país': 'México'}


In [13]:
# A partir de una lista de tuplas
pares = [('nombre', 'Emanuel'), ('edad', 34), ('país','México')]
ciudadano = dict(pares)
print(ciudadano)

{'nombre': 'Emanuel', 'edad': 34, 'país': 'México'}


In [14]:
# Usando zip()
llaves = ["nombre", "edad", "país"]
valores = ["Emanuel", 34, "México"]
socio = dict(zip(llaves, valores))
socio

{'nombre': 'Emanuel', 'edad': 34, 'país': 'México'}

Y podemos corroborar que todos los diccionarios son iguales a pesar de haber sido creados de maneras distintas.

In [16]:
persona == actuario == ciudadano == socio

True

Manipular diccionarios en Python es muy sencillo.

Para insertar o acceder a un valor, usamos la clave dentro de corchetes [].

Esto se parece a cómo accedemos a una lista, pero en lugar de usar un índice numérico, usamos una clave personalizada (como un string o un número).

In [18]:
persona["nombre"]

'Emanuel'

In [19]:
persona["profesión"] = "Actuario"
persona

{'nombre': 'Emanuel', 'edad': 34, 'país': 'México', 'profesión': 'Actuario'}

De esta misma manera podemos modificar el valor de una llave ya existente

In [21]:
persona["profesión"] = "Maestro"
persona

{'nombre': 'Emanuel', 'edad': 34, 'país': 'México', 'profesión': 'Maestro'}

Como ejemplo crearemos ahora un diccionario que representa números de socio y su nombre. Vamos a crear un diccionario vacío y luego insertamos dos valores:

In [23]:
socios = {}
socios[11795947827] = "Carmen"
socios[45089012241] = "Emanuel"
print(socios)

{11795947827: 'Carmen', 45089012241: 'Emanuel'}


Así que ahora, cuando llega un socio y queremos saber quién es, simplemente escribimos su número en el mismo formato para buscarlo en el diccionario.

In [25]:
socios[11795947827]

'Carmen'

¿Y qué sucedería si buscamos una clave que no existe en un diccionario?

In [27]:
socios[11795947821]

KeyError: 11795947821

Obtenemos un error llamado `KeyError`. Esto ocurre porque las claves son esenciales en un diccionario: si la clave no está, no podemos recuperar el valor asociado.

Igual que con listas, podemos usar `del`, pero en lugar de pasar un índice, pasamos la clave:

In [48]:
del socios[45089012241]

In [50]:
print(socios)

{11795947827: 'Carmen'}


Si se intenta eliminar una clave que no existe, también obtendremos un `KeyError`. 

Así como usamos el método `.pop()` en listas, también podemos usar `pop()` en diccionarios para eliminar una clave específica y obtener su valor al mismo tiempo.

In [52]:
socios.pop(11795947827)

'Carmen'

También en este caso, si la llave no está, obtendremos un `KeyError`. Pero si damos un **valor por defecto**, no pasa nada malo:

In [54]:
socios.pop(11795947832, "No se encuentra el número solicitado")

'No se encuentra el número solicitado'

También podemos usar el método `len` en un diccionario, en este caso nos arrojará el número de llaves en él

In [56]:
len(socios)

0

En los diccionarios de Python, los **valores** pueden ser prácticamente de cualquier tipo: listas, tuplas, otros diccionarios, etc.

Sin embargo, las **llaves** deben seguir reglas más estrictas: las claves deben ser objetos inmutables, como strings, números y tuplas. Pero no pueden ser claves listas, otros diccionarios.

In [58]:
# Por ejemplo una tupla como clave (válido porque es inmutable)
coordenada = (40.7128, -74.0060)
ciudades = {coordenada: "Nueva York"}

In [60]:
# Usar una lista como clave (no permitido)
coordenada = [40.7128, -74.0060]
ciudades = {coordenada: "Nueva York"}
# Esto lanza: TypeError: unhashable type: 'list'

TypeError: unhashable type: 'list'

Esto sucede por cómo están implementados los diccionarios en Python: Los diccionarios usan una estructura interna llamada tabla hash.

Una función hash se puede usar para mapear datos de tamaño arbitrario a valores de tamaño fijo. Los valores devueltos por una función hash se llaman valores hash, códigos hash, resúmenes (digests) o simplemente hashes. 

Esta función,  permite buscar o agregar elementos muy rápidamente, toma prácticamente el mismo tiempo, sin importar cuántos elementos haya. Sin embargo, para funcionar, cada clave pasa por una función matemática llamada hash. Pero esa función necesita que las claves no cambien, o de lo contrario el diccionario se rompería.

Ahora utilizaremos un ejemplo que incluye una estructura más compleja. Pondremos diccionarios, dentro de nuestro diccionario. 

Para empezar podemos utilizar el operador `in` para saber si una llave está en nuestro diccionario, que es algo que podríamos hacer antes de intentar obtener un valor.

In [62]:
ubicaciones = {
    "CDMX": {"coordenada": (19.4326, -99.1332), "pais": "México"},
    "Nueva York": {"coordenada": (40.7128, -74.0060), "pais": "Estados Unidos"},
    "París": {"coordenada": (48.8566, 2.3522), "pais": "Francia"},
    "Tokio": {"coordenada": (35.6895, 139.6917), "pais": "Japón"}
}

In [64]:
"Toluca" in ubicaciones

False

In [66]:
"Monterrey" not in ubicaciones

True

En ciertas ocasiones puede ser necesario obtener únicamente las llaves o valores de un diccionario. Para eso existe una variedad de métodos.

1. keys() — Devuelve todas las llaves (ciudades en nuestro caso).
2. values() — Devuelve los valores (información de cada lugar).
3. items() — Devuelve pares (ciudad, información).

In [68]:
print(ubicaciones.keys())

dict_keys(['CDMX', 'Nueva York', 'París', 'Tokio'])


In [70]:
print(ubicaciones.values())

dict_values([{'coordenada': (19.4326, -99.1332), 'pais': 'México'}, {'coordenada': (40.7128, -74.006), 'pais': 'Estados Unidos'}, {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'}, {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'}])


In [72]:
print(ubicaciones.items())

dict_items([('CDMX', {'coordenada': (19.4326, -99.1332), 'pais': 'México'}), ('Nueva York', {'coordenada': (40.7128, -74.006), 'pais': 'Estados Unidos'}), ('París', {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'}), ('Tokio', {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'})])


Al igual que las listas, los diccionarios pueden copiarse utilizando el método `copy`. Sin embargo, recordemos que esto crea una *copia superficial*, por lo que debemos tener cuidado al modificar objetos dentro de los diccionarios.

In [74]:
ubicaciones_copy = ubicaciones.copy()
ubicaciones_copy

{'CDMX': {'coordenada': (19.4326, -99.1332), 'pais': 'México'},
 'Nueva York': {'coordenada': (40.7128, -74.006), 'pais': 'Estados Unidos'},
 'París': {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'},
 'Tokio': {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'}}

In [76]:
ubicaciones_copy['Nueva York'].clear()

In [78]:
ubicaciones

{'CDMX': {'coordenada': (19.4326, -99.1332), 'pais': 'México'},
 'Nueva York': {},
 'París': {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'},
 'Tokio': {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'}}

El método `clear` elimina todos los pares llave-valor de un diccionario. 

En este caso, lo hemos aplicado al objeto diccionario que está almacenado en `ubicaciones_copy`. 

Este es el mismo objeto que está almacenado en `ubicaciones`, por lo que cuando imprimimos `ubicaciones`, nos muestra vacío el diccionario que eliminamos.

Esto sucede porque tanto `ubicaciones` como `ubicaciones_copy` apuntan al mismo objeto en memoria debido a la naturaleza de las copias superficiales.

Uno de los métodos más útiles de los diccionarios es el método `get`. Este método intenta recuperar un valor basado en una llave, pero también nos permite establecer un resultado predeterminada. 

Esto significa que si la llave que buscamos no está en el diccionario, obtendremos el resultado predeterminado en su lugar. 

Aquí tratamos de obtener una frase en otro idioma de nuestro diccionario de traducciones, pero incluimos un mensaje de error útil por si la frase no está en el diccionario.

In [80]:
ubicaciones.get("CDMX", "Ciudad no encontrada")

{'coordenada': (19.4326, -99.1332), 'pais': 'México'}

In [84]:
ubicaciones.get("Casablanca", "Ciudad no encontrada")

'Ciudad no encontrada'

Si queremos unir dos diccionarios, podemos utilizar el método `update`. Esto sobreescribirá las llaves que sean compartidas por ambos diccionarios.

In [86]:
lugares = {
    "CDMX": {"coordenada": (19.4326, -99.1332), "pais": "México"},
    'Nueva York': {'coordenada': (40.7128, -74.006), 'pais': 'Estados Unidos'},
    "Casablanca": {"coordenada": (33.5731, -7.5898), "pais": "Marruecos"},
    "Sidney": {"coordenada": (-33.8688, 151.2093), "pais": "Australia"}
}

In [88]:
ubicaciones

{'CDMX': {'coordenada': (19.4326, -99.1332), 'pais': 'México'},
 'Nueva York': {},
 'París': {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'},
 'Tokio': {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'}}

In [90]:
ubicaciones.update(lugares)

In [92]:
ubicaciones

{'CDMX': {'coordenada': (19.4326, -99.1332), 'pais': 'México'},
 'Nueva York': {'coordenada': (40.7128, -74.006), 'pais': 'Estados Unidos'},
 'París': {'coordenada': (48.8566, 2.3522), 'pais': 'Francia'},
 'Tokio': {'coordenada': (35.6895, 139.6917), 'pais': 'Japón'},
 'Casablanca': {'coordenada': (33.5731, -7.5898), 'pais': 'Marruecos'},
 'Sidney': {'coordenada': (-33.8688, 151.2093), 'pais': 'Australia'}}