# Diccionarios

Supongamos que tenemos la lista de precios de la cafetería de la facultad como una lista de pares `(producto, precio)`

|              |          |        |                |          |                |           |
| ------------ | -------- | ------ | -------------- | -------- | -------------- | --------- |
| **Producto** | Menú     | Café   | Sándwich mixto | Refresco | Bocadillo lomo | Croquetas |
| **Precio**   | 6.10     | 1.10   | 1.80           | 1.20     | 2.15           | 3.50      |

In [1]:
lista_precios_cafetería = [('menú', 6.10), ('café', 1.10),
                           ('sándwich mixto', 1.80)]  # etc.

y queremos calcular el precio total de un determinado tique (es decir, una lista de los productos adquiridos con su número de unidades).

In [2]:
tique = [('café', 2), ('sándwich mixto', 1)]  # (producto, cantidad)

In [3]:
def precio_tique(tique):
    """Calcula el precio del tique"""
    
    total = 0.0
    
    for producto, cantidad in tique:
        # Buscamos el producto en la lista de precios
        for prod, precio in lista_precios_cafetería:
            if producto == prod:
                total += precio * cantidad
                break
    
    return total

In [4]:
precio_tique(tique)

4.0

La implementación de `precio_tique` consulta la tabla de precios recorriéndola hasta encontrar el producto buscado. Si bien la búsqueda se podría hacer más eficiente ordenando la lista y utilizando la búsqueda binaria, consultar una tabla de datos es una operación suficientemente común como para que el lenguaje proporcione un tipo de datos para hacerlo eficiente y cómodamente. Este tipo en Python se llama *diccionario* (`dict`) y sus literales se escriben así:

In [5]:
precios_cafetería = {
    'menú': 6.10,
    'café': 1.10,
    'sándwich mixto': 1.80,
    'refresco': 1.20,
    'bocadillo lomo': 2.15,
    'croquetas': 3.50,
}

El acceso se realiza con el operador corchete `[]` como veremos, por ejemplo:

In [6]:
precios_cafetería['menú']

6.1

 Los objetos a la izquierda de los dos puntos se llaman *claves* y los objetos a la derecha se llaman *valores*. El nombre *diccionario* es apropiado, pues permite encontrar a partir de un término su definición, sea lo que sea lo que signifique término y definición en cada caso.

In [7]:
diccionario_rae = {
    'a': 'Primera letra del abecedario español',
    'abáa': 'Casa comunal',
    'ababillarse': 'Dicho de un animal: enfermar de la babilla',
    'ababol': 'amapola',  # etc.
}

Los valores también pueden ser objetos estructurados y así describir entidades más complejas. 

In [8]:
ficha = {
    'nombre': 'Anselmo',
    'apellidos': ['García', 'López'],
    'fecha_nacimiento': {'día': 1, 'mes': 1, 'año': 2000},
    'activo': True,
    'asignaturas_matriculadas': {2019: 6, 2020: 4, 2021: 5},
}

Cualquier objeto puede ser valor y cualquier objeto inmutable puede ser clave. Que las claves sean inmutables es razonable, puesto que es la dirección que permite encontrar el objeto y la implementación se basa en ella para organizar los datos de forma que el acceso sea eficiente.

Los diccionarios son útiles para organizar información estructurada, como en el diccionario de ejemplo `ficha` o en las bases de datos documentales que se utilizan para el procesamiento de datos masivos. También son útiles como estructuras de datos auxiliares en aquellos algoritmos en los que resulte necesario acceder eficientemente a unos valores a través de unas claves, como veremos en un ejemplo. En otros lenguajes de programación también existen los diccionarios, aunque tal vez con otro nombre como *map*. La implementación en Python se corresponde con el `unordered_map` en C++, el `HashMap` en Java, etc.

## Construcción de diccionarios

Como se acaba de ver, los diccionarios se pueden construir explícitamente como la notación `{clave: valor, ...}`, siendo `{}` o `dict()` el diccionario vacío. También es posible construirlos a partir de una lista de pares.

In [9]:
dict(lista_precios_cafetería)  # definida al principio

{'menú': 6.1, 'café': 1.1, 'sándwich mixto': 1.8}

Al igual que hiciéramos para las listas, también se pueden definir diccionarios intensionalmente, con `{clave: valor for vars in dominio}`.

In [10]:
{k ** 2: k for k in range(3, 20) if k % 2 != 0}  # raíces cuadradas impares

{9: 3, 25: 5, 49: 7, 81: 9, 121: 11, 169: 13, 225: 15, 289: 17, 361: 19}

Igualmente, se pueden mezclar diccionarios.

In [11]:
precios_cafetería | {'botella de agua': 1.0}

{'menú': 6.1,
 'café': 1.1,
 'sándwich mixto': 1.8,
 'refresco': 1.2,
 'bocadillo lomo': 2.15,
 'croquetas': 3.5,
 'botella de agua': 1.0}

Los diccionarios son objetos mutables, por lo que también es posible construirlos paso a paso asignando nuevas o antiguas claves a nuevos valores. Antes de volver a esto, veamos cómo se pueden consultar las entradas del diccionario.

## Operaciones de consulta

La consulta de la clave `k` en el diccionario `d` se escribe `d[k]`. La notación es la misma que en las listas, pero aquí la clave puede ser cualquier objeto inmutable, no solo un rango de índices consecutivos.

In [12]:
precios_cafetería['menú']

6.1

Si se intenta acceder a un campo que no existe se producirá un error.

In [13]:
precios_cafetería['turrón de chocolate']

KeyError: 'turrón de chocolate'

Es posible consultar si una clave está definida en un diccionario con el operador `in` que ya se ha visto para las secuencias.

In [14]:
'turrón de chocolate' in precios_cafetería

False

En ocasiones, interesa considerar un valor por defecto para el caso de que no esté definida una clave. Para ello está el método `get(key, default=None)` que podríamos definir como sigue (si no estuviera definido ya).

In [15]:
def dict_get(dicc, clave, default=None):
    if clave in dicc:
        return dicc[clave]
    else:
        return default

In [16]:
dict_get(precios_cafetería, 'turrón de chocolate', 'no hay')

'no hay'

In [17]:
precios_cafetería.get('menú')

6.1

In [18]:
print(precios_cafetería.get('turrón de chocolate'))

None


**Ejemplo 1 bis:** rehacemos la función `precio_tique` con diccionarios.

In [19]:
def precio_tique(tique):
    """Calcula el precio del tique"""
    
    total = 0.0
    
    for producto, cantidad in tique:
        precio = precios_cafetería.get(producto, 0.0)
        total += precio * cantidad
    
    return total

In [20]:
precio_tique(tique)

4.0

Además de consultar claves individuales, existen diversas funciones para conocer el estado global del diccionario. Por ejemplo, podemos obtener las claves y los valores con los métodos `keys` y `values`, respectivamente.

In [21]:
precios_cafetería.keys()

dict_keys(['menú', 'café', 'sándwich mixto', 'refresco', 'bocadillo lomo', 'croquetas'])

In [22]:
precios_cafetería.values()

dict_values([6.1, 1.1, 1.8, 1.2, 2.15, 3.5])

Estos métodos devuelven objetos iterables que podemos utilizar como hemos visto en el primer tema del cuatrimestre (aunque aparezcan impresos como listas no lo son y no se puede acceder a ellos por índice con el corchete). Iterar sobre el diccionario (`for clave in dicc`) es equivalente a iterar sobre `keys`. Además existe otro método `items` que devuelve un iterador sobre los pares de la relación que define el diccionario.

In [23]:
precios_cafetería.items()

dict_items([('menú', 6.1), ('café', 1.1), ('sándwich mixto', 1.8), ('refresco', 1.2), ('bocadillo lomo', 2.15), ('croquetas', 3.5)])

Por ejemplo, podemos calcular los precios de la cafetería si se les aplicase una subida por el IPC.

In [24]:
{producto: precio * 1.058 
 for producto, precio in precios_cafetería.items()}

{'menú': 6.4538,
 'café': 1.1638000000000002,
 'sándwich mixto': 1.9044,
 'refresco': 1.2696,
 'bocadillo lomo': 2.2747,
 'croquetas': 3.7030000000000003}

O imprimir una tabla con los precios.

In [25]:
for clave, valor in precios_cafetería.items():
    # los números en las f-cadenas indican la anchura
    print(f'| {clave:15} | {valor:6} |')

| menú            |    6.1 |
| café            |    1.1 |
| sándwich mixto  |    1.8 |
| refresco        |    1.2 |
| bocadillo lomo  |   2.15 |
| croquetas       |    3.5 |


**Inciso**: las cadenas con formato (*format string*) son cadenas normales precedidas de una letra `f` que reemplazan las expresiones entre llaves por sus valores. Para ajustar mejor el texto, es posible indicar una anchura del campo tras dos puntos y el espacio sobrante se rellenará con espacios. Hay muchas otras opciones de formato, que se pueden consultar [aquí](https://docs.python.org/3/library/string.html#format-string-syntax).

In [26]:
f'4 * 5 = {4 * 5:5}'

'4 * 5 =    20'

Finalmente, es posible conocer el número de entradas del diccionario con `len`.

In [27]:
len(precios_cafetería)

6

## Operaciones de modificación

Como se ha dicho anteriormente, los diccionarios son estructuras de datos mutables, en las que se pueden añadir nuevas asignaciones o eliminar otras ya existentes.

In [28]:
precios_cafetería['bollo'] = 2.40  # añade una nueva entrada

In [29]:
precios_cafetería['bollo'] = 2.39  # modifica la existente

In [30]:
precios_cafetería.pop('bocadillo lomo')  # elimina y devuelve lo eliminado

2.15

In [31]:
del precios_cafetería['refresco']  # elimina sin más

In [32]:
precios_cafetería

{'menú': 6.1,
 'café': 1.1,
 'sándwich mixto': 1.8,
 'croquetas': 3.5,
 'bollo': 2.39}

**Ejemplo 2 (recuento de frecuencias)**: usando un diccionario, vamos a escribir una función que calcula la frecuencia de cada objeto en una colección.

In [33]:
def frecuencias(colección) -> dict:
    """Número de apariciones de cada objeto en la colección"""
    
    fqs = {}
    
    for elem in colección:
        fqs[elem] = fqs.get(elem, 0) + 1
    
    return fqs

In [34]:
# Mi gato (Rosario Flores)
letra = '''Algo hay que me empuja a saltar
A vivir en libertad
En los tejados de esta gran ciudad, ay, ay, ay
Uy, uy, uy, mi gato hace uy, uy, uy
Uy, uy, uy, mi gato hace ay, ay, ay, ay
Uy, uy, uy, mi gato hace uy, uy, uy
Uy, uy, uy, mi gato hace ay, ay, ay, ay
Ay, ay, ay, ay, ay'''.replace(',', '').lower().split()

In [35]:
frecuencias(letra)

{'algo': 1,
 'hay': 1,
 'que': 1,
 'me': 1,
 'empuja': 1,
 'a': 2,
 'saltar': 1,
 'vivir': 1,
 'en': 2,
 'libertad': 1,
 'los': 1,
 'tejados': 1,
 'de': 1,
 'esta': 1,
 'gran': 1,
 'ciudad': 1,
 'ay': 16,
 'uy': 18,
 'mi': 4,
 'gato': 4,
 'hace': 4}

**Ejercicio** (7 de la hoja)**:** obtener el ranking de las palabras más repetidas. <bigskip/>

**Recapitulación**: esto es un resumen de las operaciones sobre diccionarios:

* `{}` o `dict()` es el diccionario vacío.
* `dict(xs)` es el diccionario dado por una lista de pares `xs`.
* `d[k]` accede al diccionario `d` con la clave `k`.
* `d.get(k, default=None)` hace lo mismo que `d[k]` pero devuelve un valor por defecto en caso de que no exista la entrada
* `k in d` comprueba si la clave `k` está definida.
* `d[k] = v` asigna el valor `v` a la clave `k`, reemplazando el valor anterior si lo hubiera.
* `del d[k]` o `d.pop(k)` elimina la asignación a `k` en el diccionario.
* `d.keys()` es un iterador sobre las claves del diccionario. 
* `d.values()` es un iterador sobre los valores del diccionario.
* `d.items()` es un iterador sobre los pares clave/valor del diccionario.

## Conjuntos

Un diccionario se puede utilizar rudimentariamente como un conjunto, con el operador `in` y la mezcla de diccionarios como unión.

In [36]:
A = {1: None, 4: None}
B = {11: None, 8: None, 3: None}

A | B, 11 in A, 11 in B

({1: None, 4: None, 11: None, 8: None, 3: None}, False, True)

Sin embargo, no resulta cómodo y faltan operaciones importantes como la intersección o la diferencia. El repertorio de tipos predefinidos de Python incluye también un tipo conjunto `set`. El conjunto vacío se escribe `set()` (no `{}`, que sería un diccionario) y un conjunto no vacío se puede definir extensionalmente enumerando sus elementos separados por comas y entre llaves (`{}`).

In [37]:
{1, 2, 2, 3, 1}

{1, 2, 3}

Los conjuntos también se pueden describir intensionalmente, como las listas pero con llaves en lugar de corchetes.

In [38]:
{3 * k for k in range(11)}

{0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30}

Y se puede generar un diccionario a partir de cualquier objeto iterable.

In [39]:
set(range(0, 10))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

Además están definidas las siguientes operaciones:

|            |            |            |                 |                 |                  |               |
| ---------- | ---------- | ---------- | --------------- | --------------- | ---------------- |-------------- |
| $\emptyset$| $A \cup B$ | $A \cap B$ | $A \setminus B$ | $A \subseteq B$ | $A \subsetneq B$ | $A \oplus B$  |
| `set()`    | `A \| B`    | `A & B`    | `A - B`         | `A <= B`        | `A < B`          | `A ^ B`       |

    
* `add` para añadir un elemento.
* `discard` para eliminar un elemento dado (`remove` hace lo mismo, pero produciendo un error si no está en el conjunto).
* `pop` para obtener un elemento cualquiera del conjunto, eliminándolo.
* `len` para obtener el cardinal del conjunto.
* `issubset` e `issuperset` (o los operadores `<=` y `>=`) para comprobar si un conjunto es subconjunto o superconjunto de otro.
* `union` (o el operador `|`) para obtener la unión de dos conjuntos.
* `difference` (o el operador `-`) para obtener la diferencia entre dos conjuntos.
* `intersection` (o el operador `&`) para calcular la intersección de dos conjuntos.
* `symmetric_difference` (o el operador `^`) para calcular la diferencia simétrica.

Los cuatro últimos métodos devuelven un conjunto nuevo sin modificar los originales, aunque existen versiones de cada operador terminadas en `update` (o el operador precedido de `=`) en los que se modifica el primer conjunto. Además es un objeto iterable.

## Referencias

* [§5.5 «Diccionarios»](https://docs.python.org/es/3/tutorial/datastructures.html#dictionaries) y [§5.4 «Conjuntos»](https://docs.python.org/es/3/tutorial/datastructures.html#sets) del tutorial de Python.
* §5.7 «Dictionaries» del [libro de Guttag](https://ucm.on.worldcat.org/oclc/1347116367) (§5.5 en la [edición de 2013](https://ucm.on.worldcat.org/oclc/1025935018)).