<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015 Karim Pichara - Christian Pieringer. Todos los derechos reservados.</font>
</p>

## Diccionarios

Supongamos que, dado un país, queremos saber cuál es su moneda. Una posible solución es escribir una función que reciba el nombre del país y que en una trama de `if - elif - else` retorne la moneda correspondiente:

In [2]:
def get_moneda(pais):
    if pais == "Chile":
        return "Peso"
    elif pais == "Perú":
        return "Soles"
    elif pais == "España" or pais == "Holanda":
        return "Euro"
    elif pais == "Brasil":
        return "Real"

No obstante, esta solución es larga, tediosa de escribir, y muy difícil de mantener. Tampoco nos permite extender o actualizar la información en tiempo de ejecución, con datos que podemos leer desde un archivo o desde un servicio web. Si nos fijamos, lo único que estamos haciendo es asociar un valor que conocemos de antemano con otro valor. Es esto lo que hacen precisamente los **diccionarios**.

Un **diccionario** es una estructura de datos **no ordenada** que permite asociar pares de elementos mediante la relación **llave-valor**. Al diccionario se le consulta por una **llave** y retorna su **valor** asociado. En el ejemplo de las monedas los países serían las llaves por las que consultamos, y los valores serían las distintas monedas.

![](img/hash-table.png)

Dado una llave, buscar su valor en un diccionario es una operación **muy eficiente** que toma tiempo constante, es decir, no depende de la cantidad de elementos que tenga la estructura. No obstante, esta estructura no está diseñada para buscar (en forma eficiente) una llave teniendo el valor.

Los diccionarios están implementados con una estructura llamada _tabla de hash_. En esta estructura, existe una función matemática que se le aplica a la llave para saber en qué lugar guardar un determinado valor. Esa función se llama _función de hash_.

### Llaves permitidas

No todas las llaves están permitidas en un diccionario. El primer requisito es que las llaves deben ser únicas, por lo que no pueden repetirse. El segundo requisito es que la llave debe ser [_hasheable_](https://docs.python.org/3/glossary.html#term-hashable).

Un objeto es [_hasheable_](https://docs.python.org/3/glossary.html#term-hashable) si:
1. Implementa la función `__hash__` y `__eq__`.
2. El valor que retorna `__hash__` **no cambia** en el ciclo de vida del objeto.
3. Si dos objetos son iguales según la función `__eq__`, entonces el valor que retorna `__hash__` debe ser el mismo. No es necesario que esto se cumpla al revés. 

En Python en particular, todos los _built-ins_ que son **inmutables** son _hasheables_. Esto significa que tipos como `int`, `str` o `tuple` se pueden usar como llave en un diccionario. 

También son _hasheables_ por defecto todos los objetos de clases creadas por el usuario, puesto que la función `__hash__` retorna un valor único y fijo para cada instancia, y la función `__eq__` devuelve `True` sólo si corresponde exactamente al mismo objeto.

### Diccionarios en Python

En Python, los diccionarios se escriben con `{}` y cada par llave-valor se asocia con `:` como muestra el ejemplo:

In [9]:
monedas = {"Chile": "Peso", "Perú": "Soles", "España": "Euro", "Holanda": "Euro", "Brasil": "Real"}

Los contenidos del diccionario **no están ordenados** según ingreso como ocurre en las tuplas y listas, podrían adoptar cualquier orden. Para acceder a cada valor asociado a cada llave utilizamos la llave como `diccionario[nombre_llave]`:

In [10]:
monedas["Chile"]

'Peso'

Los diccionarios son estructuras de datos **mutables**, es decir, su contenido puede cambiar a lo largo del programa. Si se asigna un valor a una llave, existen dos comportamientos posibles. Si la llave no existe, esta se crea y se le asigna un valor:

In [11]:
monedas["Vaticano"] = "Lira"
print(monedas)

{'Chile': 'Peso', 'Perú': 'Soles', 'España': 'Euro', 'Holanda': 'Euro', 'Brasil': 'Real', 'Vaticano': 'Lira'}


Si la llave ya existe, se actualiza con el nuevo valor:

In [12]:
monedas["Vaticano"] = "Euro"
print(monedas)

{'Chile': 'Peso', 'Perú': 'Soles', 'España': 'Euro', 'Holanda': 'Euro', 'Brasil': 'Real', 'Vaticano': 'Euro'}


Se puede eliminar items desde el diccionario utilizando la sentencia `del` como `del diccionario[<llave>]`:

In [13]:
del monedas["España"]
print(monedas)

{'Chile': 'Peso', 'Perú': 'Soles', 'Holanda': 'Euro', 'Brasil': 'Real', 'Vaticano': 'Euro'}


Se puede comprobar la existencia de una llave en el diccionario utilizando la sentencia `in`. El comportamiento por defecto al utilizar sentencias sobre el diccionario es operar sobre los valores de las llaves. En el caso de `in`, devuelve `True` si la llave requerida existe dentro de las llaves en el diccionario:

In [14]:
print('Chile' in monedas)
print('Argentina' in monedas)

True
False


Otra forma consiste en utilizar el método get que posee la clase diccionario. Este método require dos parámetros: la llave buscada y un valor en caso que la llave no exista.

In [18]:
print(monedas.get('Chile', 'No tiene moneda'))
print(monedas.get('Vaticano', 0))
print(monedas.get('Argentina', 'No tiene moneda'))
print(monedas.get('Colombia', False))

Peso
Euro
No tiene moneda
False


Una aplicación típica de esto es el llenado de diccionarios vacíos, como por ejemplo contando letras, debido a que en principio es difícil saber que letras aparecerán y cuántas.

In [8]:
msg = 'supercalifragilisticoespialidoso'
vocales = dict() # Crea un diccionario vacío para contabilizar las letras

for v in msg:
    if v not in 'aeiou': # Revisa si v es una vocal
        continue
        
    if v not in vocales: # Revisa si v existe en el diccionario, si no la crea en 0
        vocales[v] = 0

    vocales[v] += 1 # si ya existe, agrega una cuenta mas

print(vocales)

{'a': 3, 'i': 6, 'o': 3, 'e': 2, 'u': 1}


Tres métodos útiles que existen en los diccionarios son: ```keys()```, ```values()```, y ```items()```. Estos permiten obtener elementos del diccionario a distintos niveles. El resultado de cada uno de estos métodos es una lista con los elementos solicitados.

In [9]:
monedas = {'chile':'peso', 'brasil':'real', 'peru':'sol','españa':'euro','italia':'euro'}

print(monedas.keys()) # una lista con todas las llaves
print(monedas.values()) # una lista con todos los valores
print(monedas.items()) # una lista con tuplas de pares llave-valor

dict_keys(['brasil', 'peru', 'chile', 'italia', 'españa'])
dict_values(['real', 'sol', 'peso', 'euro', 'euro'])
dict_items([('brasil', 'real'), ('peru', 'sol'), ('chile', 'peso'), ('italia', 'euro'), ('españa', 'euro')])


Estos métodos son prácticos y útiles durante la iteración sobre diccionarios.

In [10]:
print('Las llaves en el diccionario son las siguientes:')

for m in monedas.keys():
    print('{0}'.format(m))

print()
for m in monedas: # por defecto recorremos las llaves
    print('{0}'.format(m))

Las llaves en el diccionario son las siguientes:
brasil
peru
chile
italia
españa

brasil
peru
chile
italia
españa


In [11]:
print('Los valores en el diccionario:')
for v in monedas.values():
    print('{0}'.format(v))

Los valores en el diccionario:
real
sol
peso
euro
euro


In [12]:
print('Los pares en el diccionario:')
for k, v in monedas.items():
    print('la moneda de {0} es {1}'.format(k,v))

Los pares en el diccionario:
la moneda de brasil es real
la moneda de peru es sol
la moneda de chile es peso
la moneda de italia es euro
la moneda de españa es euro


## Defaultdicts

Los `defaultdict`s son diccionarios que nos permiten asignar un valor por defecto a cada *key* con la que se llama el diccionario. Esto nos ahorra el problema de tener que escribir código preocupándonos de los casos en que el valor que se intenta obtener el diccionario no existe. Otra cualidad importante de los `defaultdics` es que aceptan una función para ser asignada como valor por defecto, la cual puede realizar cualquier acción y retornar cualquier objeto (a ser asignado como valor para el respectivo key en el diccionario).
 
Por ejemplo, supongamos que queremos un diccionario en donde cada elemento nuevo tiene como valor inicial una lista con un string equivalente al número de elementos nuevos insertados hasta el momento en el diccionario:

In [13]:
from collections import defaultdict

num_items = 0

def funcion_ej():
    global num_items
    num_items += 1
    return ([str(num_items)])

d = defaultdict(funcion_ej)

print(d['a'])
print(d['b'])
print(d['c'])
print(d['d'])
print(d['d'])
print(d['e'])

print(d)



['1']
['2']
['3']
['4']
['4']
['5']
defaultdict(<function funcion_ej at 0x7f60081fb730>, {'a': ['1'], 'b': ['2'], 'c': ['3'], 'd': ['4'], 'e': ['5']})
