# Estructuras de datos: Diccionarios / Hash tables

En esta lección te voy a contar un poco sobre la estructura que es mi favorita: los que en Python específicamente se conoce como diccionarios, pero en la mayoría de los otros lenguajes se les llama mapas de hash (hash maps) o tablas de hash (hash tables). Para explicarlo, me parece más intuitivo empezarles llamando "diccionarios".

Si alguna vez utilizaste un diccionario (espero que sí), recordarás que un diccionario es una lista de palabras ordenadas alfabéticamente en las que cada palabra tiene un significado. Cuando buscas una palabra, y la encuentras, después de los dos puntos ":" obtienes la definición o definiciones de qué significa esa palabra. Así mismo, en la programación existen estructuras en las que puedes ligar una llave única, o nombre, con cualquier otro tipo de dato que define lo que debería contener cuando se busca la información relacionada a esa palabra.

Esto significa que yo puedo, por ejemplo, guardar la relación entre el nombre de una persona y toda la información que representa a esa persona, y podemos a acceder a esa información usando como "llave" el nombre de esa persona. Puedes imaginarlo como una especie de arreglo en el que en lugar de referirte a los elementos que contiene por un índice numérico, el índice puede ser casi lo que tú quieras, más comunmente una cadena.

## Sintaxis de un diccionario en Python

Lo primero que tenemos que hacer, igual que con arreglos o con cualquier otra estructura, es inicializarlo, y puede inicializarse completamente vacío o con elementos por defecto, igual que los arreglos, y de hecho la sintaxis no es tan diferente.

Para inicializar un diccionario sólo hace falta asignar a una variable unas llaves vacías (`{}`).

In [43]:
mi_diccionario = {}
print(mi_diccionario)

{}


Para asignar elementos esto es algo bastante más sencillo que con los arreglos, porque sólo tienes que asignar entre corchetes la cadena o valor que quieres utilizar como llave, y asignarle, con el signo "`=`" el valor que quieras (`diccionario[llave] = valor`). Y como sería casi evidente con esa sintaxis, la forma de acceder al valor que guarda un diccionario en una llave es escribiendo entre los corchetes el nombre de la llave, después del nombre de la variable que contiene tu diccionario (`diccionario[llave]`)

In [44]:
mi_diccionario["una_cadena"] = "contiene una cadena"
print(mi_diccionario["una_cadena"])

mi_diccionario["un_numero"] = 12345
print(mi_diccionario["un_numero"])

mi_diccionario["un bool"] = True
print(mi_diccionario["un bool"])

contiene una cadena
12345
True


Otra de las cosas que vuelven tan flexibles los diccionarios es que las llaves pueden ser de cualquier tipo de dato primitivo.

In [45]:
mi_diccionario[True] = "La llave es True"
print(mi_diccionario[True])

mi_diccionario[54321] = "La llave es un entero"
print(mi_diccionario[54321])

mi_diccionario[3.14] = "La llave es un flotante"
print(mi_diccionario[3.14])

La llave es True
La llave es un entero
La llave es un flotante


### Sobreescritura y valores faltantes

Ahora que vimos cómo declarar una variable que guarde un diccionario y cómo asignarle valores, podemos mencionar cuáles son los comportamientos peculiares en un diccionario en algunos casos comunes.

Igual que en un arreglo, cuando nos referimos a nuestro diccionario utilizando un índice que existe, y le asignamos un valor, éste se sobreescribe y se descarta el valor anterior.

In [46]:
mi_diccionario["llave_nueva"] = "Valor original"
print(mi_diccionario["llave_nueva"])

mi_diccionario["llave_nueva"] = 9019
print(mi_diccionario["llave_nueva"])

Valor original
9019


Hay una cosa que no hemos mencionado hasta este punto: ¿qué pasa si intentamos acceder a una llave en nuestro diccionario que no existe todavía? La respuesta es algo que probablemente ya esperas: Python mostrará un enunciado de error.

In [47]:
print(mi_diccionario["llave que no existe"])

KeyError: 'llave que no existe'

La forma de evitar esta clase de errores es primero revisando si la llave existe en nuestro diccionario, utilizando la palabra "`in`" para saber si un elemento está "en" nuestro diccionario. Esta comprobación devuelve un valor booleano.

In [48]:
def llave_existe(llave, diccionario):
    if llave in diccionario:
        print("La llave '", llave, "' existe en el diccionario")
    else:
        print("La llave '", llave, "' no existe en el diccionario")

llave_A = "uno"
llave_B = "dos"

# Creamos una entrada para llave A, pero no para llave B
mi_diccionario[llave_A] = "cadena de prueba"

llave_existe(llave_A, mi_diccionario)
llave_existe(llave_B, mi_diccionario)

La llave ' uno ' existe en el diccionario
La llave ' dos ' no existe en el diccionario


### Eliminar elementos de un diccionario

La forma de remover elementos de un diccionario te resultará familiar, porque es casi idéntica a la de un arreglo, excepto que esta vez utilizarás llaves en vez de índices exclusivamente numéricos. Los diccionarios tienen un método llamado `pop` que recibe como parámetro el nombre de la llave que se desea remover. Pero ten cuidado, porque si intentas botar un elemento que no existe, igual que en los arreglos, Python arrojará un error.

In [50]:
llave_C = "elemento para eliminar"

mi_diccionario[llave_C] = "Vamos a eliminar este elemento"
print(mi_diccionario[llave_C])

if llave_C in mi_diccionario:
    mi_diccionario.pop(llave_C) #Eliminamos la llave especificada
else:
    print("La llave '", llave_C, "' no existe en el diccionario")

# Como ya eliminamos ese elemento del diccionario, no podemos hacerlo de nuevo
# porque la llave ya no existe
if llave_C in mi_diccionario:
    mi_diccionario.pop(llave_C)
else:
    print("La llave '", llave_C, "' no existe en el diccionario")

# Y si lo intentamos eliminar sin preguntar primero si existe,
# Python arrojará un error
mi_diccionario.pop(llave_C)

Vamos a eliminar este elemento
La llave ' elemento para eliminar ' no existe en el diccionario


KeyError: 'elemento para eliminar'

### Iterar los elementos de un diccionario

Hay varias formas de desplazarte entre todos los elementos que contiene un diccionario, además de directamente por una llave específica, pero principalmente son 3:

- Iterando las llaves guardadas en el diccionario
- Iterando la lista de valores (si no te interesan las llaves)
- Iterar ambos al mismo tiempo (llaves y valores)

Y todas se utilizan dentro de un ciclo `for ... in ... :`

A continuación están los tres métodos.

#### Iterar utilizando las llaves de un diccionario

Para iterar las llaves de un diccionario se puede utilizar un ciclo "`for`" que defina `for [variable] in [diccionario]:` en el que la variable que usas como primer parámetro del ciclo for tomará el valor de cada llave.

Adicionalmente, se puede guardar la lista de llaves en otra variable usando el método `keys` de los diccionarios, que regresa un arreglo con la lista de llaves existentes.

In [55]:
print("Iterar las llaves directamente con un ciclo for")
# El siguiente ciclo hace que la variable "llave" tome el valor
# de cada llave guardada en el diccionario
for llave in mi_diccionario:
    print("La llave '", llave, "' en el diccionario contiene el valor:", mi_diccionario[llave])

print("\nIterar la lista de llaves usando el método `keys`")
lista_de_llaves = mi_diccionario.keys()
print("\nLista de llaves:", lista_de_llaves, "\n")
# Y otra forma de iterar las llaves es con el método `keys` del diccionario
for llave in lista_de_llaves:
    print("La llave '", llave, "' en el diccionario contiene el valor:", mi_diccionario[llave])

Iterar las llaves directamente con un ciclo for
La llave ' una_cadena ' en el diccionario contiene el valor: contiene una cadena
La llave ' un_numero ' en el diccionario contiene el valor: 12345
La llave ' un bool ' en el diccionario contiene el valor: True
La llave ' True ' en el diccionario contiene el valor: La llave es True
La llave ' 54321 ' en el diccionario contiene el valor: La llave es un entero
La llave ' 3.14 ' en el diccionario contiene el valor: La llave es un flotante
La llave ' llave_nueva ' en el diccionario contiene el valor: 9019
La llave ' uno ' en el diccionario contiene el valor: cadena de prueba

Iterar la lista de llaves usando el método `keys`

Lista de llaves: dict_keys(['una_cadena', 'un_numero', 'un bool', True, 54321, 3.14, 'llave_nueva', 'uno']) 

La llave ' una_cadena ' en el diccionario contiene el valor: contiene una cadena
La llave ' un_numero ' en el diccionario contiene el valor: 12345
La llave ' un bool ' en el diccionario contiene el valor: True
La 

#### Iterar los valores del diccionario

Si solamente necesitas los valores y no necesitas las llaves, puedes utilizar el método `values` de los diccionarios para obtener un arreglo con los valores que guarda el diccionario.

In [56]:
valores = mi_diccionario.values()
print("Lista de valores:", valores, "\n")
for valor in valores:
    print(valor)

Lista de valores: dict_values(['contiene una cadena', 12345, True, 'La llave es True', 'La llave es un entero', 'La llave es un flotante', 9019, 'cadena de prueba']) 

contiene una cadena
12345
True
La llave es True
La llave es un entero
La llave es un flotante
9019
cadena de prueba


#### Iterar llaves y valores simultáneamente

Y la tercera forma, un tanto peculiar, devuelve simultáneamente las llaves y valores de un diccionario. Esto se logra separando por comas los nombres de variables que vas a utilizar para asignar temporalmente cada llave y valor que guarda tu diccionario.

In [57]:
for llave, valor in mi_diccionario.items():
    print("La llave '", llave, "' guarda el valor:", valor)

La llave ' una_cadena ' guarda el valor: contiene una cadena
La llave ' un_numero ' guarda el valor: 12345
La llave ' un bool ' guarda el valor: True
La llave ' True ' guarda el valor: La llave es True
La llave ' 54321 ' guarda el valor: La llave es un entero
La llave ' 3.14 ' guarda el valor: La llave es un flotante
La llave ' llave_nueva ' guarda el valor: 9019
La llave ' uno ' guarda el valor: cadena de prueba
