# Diccionarios, mapas y tablas hash

En Python, los diccionarios (o "dicts" para abreviar) son una estructura de datos central. Los diccionarios almacenan un número arbitrario de objetos, cada uno identificado por una clave única del diccionario.

Los diccionarios también se denominan mapas, hashmaps, tablas de búsqueda o matrices asociativas. Permiten buscar, insertar y eliminar de forma eficiente cualquier objeto asociado a una clave determinada.

En resumen, los diccionarios son una de las estructuras de datos más utilizadas e importantes en informática.

### Diccionario normal

In [1]:
guiaTelefonica = {
    "Alicia": 657484930,
    "Juan": 647939010,
    "Pedro": 658938401,
}

cuadrados = {x: x * x for x in range(6)}

In [2]:
guiaTelefonica

{'Alicia': 657484930, 'Juan': 647939010, 'Pedro': 658938401}

In [3]:
guiaTelefonica["Alicia"]

657484930

In [4]:
cuadrados

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}

In [5]:
cuadrados[3]

9

Existen algunas restricciones sobre los objetos que pueden utilizarse como claves válidas.

Los diccionarios de Python están indexados por claves que pueden ser de cualquier tipo hashable: Un objeto hashable tiene un valor hash que nunca cambia durante su vida (ver \__hash\__), y puede ser comparado con otros objetos (ver \__eq\__). 

Además, **los objetos hashables que se comparan como iguales deben tener el mismo valor hash. Los tipos inmutables, como las cadenas y los números, son hashables y funcionan bien como claves de diccionario.**

También puedes usar objetos tupla como claves de diccionario, siempre que contengan sólo tipos hashables.

Para la mayoría de los casos de uso, la implementación de diccionario incorporada en Python hará todo lo que necesitas. 

Los diccionarios están altamente optimizados y son la base de muchas partes del lenguaje, por ejemplo, los atributos de clase y las variables en un marco de pila se almacenan internamente en diccionarios.

Los diccionarios de Python se basan en una implementación de tabla hash bien probada y ajustada que proporciona las características de rendimiento que se esperan: Complejidad de tiempo O(1) para las operaciones de búsqueda, inserción, actualización y eliminación en el caso medio.

No hay muchas razones para no utilizar la implementación estándar de diccionario incluida en Python. Sin embargo, existen implementaciones especializadas de diccionarios de terceros, por ejemplo, listas de salto o diccionarios basados en árboles B.

Además de los objetos dict "normales", la biblioteca estándar de Python también incluye una serie de implementaciones de diccionarios especializados. Estos diccionarios especializados se basan en la clase de diccionario incorporada (y comparten sus características de rendimiento), pero añaden algunas características de comodidad.

## Orden de inserción de las claves

### collections.OrderedDict: Recuerda el orden de inserción de las claves

Python incluye una subclase especializada de dict que recuerda el orden de inserción de las claves añadidas: collections.OrderedDict.

Mientras que las instancias de dict estándar preservan el orden de inserción de las claves en CPython 3.6 y superior, esto es sólo un efecto secundario de la implementación de CPython y no está definido en la especificación del lenguaje. Por lo tanto, si el orden de las claves es importante para que tu algoritmo funcione, es mejor comunicar esto claramente mediante el uso explícito de la clase OrderDict.

Por cierto, OrderedDict no es una parte incorporada al núcleo del lenguaje y debe importarse desde el módulo de colecciones de la biblioteca estándar.

In [6]:
import collections

d = collections.OrderedDict(one=1, two=2, three=3)
d

OrderedDict([('one', 1), ('two', 2), ('three', 3)])

In [7]:
d['four'] = 4
d

OrderedDict([('one', 1), ('two', 2), ('three', 3), ('four', 4)])

In [8]:
d.keys()

odict_keys(['one', 'two', 'three', 'four'])

### collections.defaultdict: Devolución de valores por defecto para las claves que faltan

La clase defaultdict es otra subclase de diccionario que acepta un objeto invocable en su constructor cuyo valor de retorno se utilizará si no se puede encontrar una clave solicitada.

Esto puede ahorrarte algo de escritura y hacer que las intenciones del programador sean más claras, en comparación con el uso de los métodos get() o la captura de una excepción KeyError en los diccionarios regulares.

In [10]:
from collections import defaultdict

dd = defaultdict(list)

dd['dogs'].append('Rufus')
dd['dogs'].append('Kathrin')
dd['dogs'].append('Mr Sniffles')
dd['dogs']

['Rufus', 'Kathrin', 'Mr Sniffles']

En este ejemplo, se está diciendo que en caso de acceder a una clave que no estuviera ya, se cree esa clave y se le añada automáticamente el valor de una lista.

### collections.ChainMap: Buscar en varios diccionarios como una sola asignación

La estructura de datos collections.ChainMap agrupa varios diccionarios en una asignación. Las búsquedas buscan las asignaciones subyacentes una por una hasta encontrar una clave. Las inserciones, actualizaciones y eliminaciones sólo afectan a la primera asignación añadida a la cadena.

In [11]:
from collections import ChainMap

dict1 = {'one': 1, 'two': 2}
dict2 = {'three': 3, 'four': 4}
chain = ChainMap(dict1, dict2)

chain

ChainMap({'one': 1, 'two': 2}, {'three': 3, 'four': 4})

In [12]:
chain['three']

3

In [13]:
chain['one']

1

In [14]:
chain['missing']

KeyError: 'missing'

### types.MappingProxyType: Un envoltorio (wrapper) para crear diccionarios de solo lectura

MappingProxyType es una envoltura alrededor de un diccionario estándar que proporciona una vista de sólo lectura en los datos del diccionario envuelto. Esta clase fue añadida en Python 3.3, y puede ser usada para crear versiones proxy inmutables de diccionarios.

Por ejemplo, esto puede ser útil si se desea devolver un diccionario que contenga el estado interno de una clase o módulo, mientras se desalienta el acceso de escritura a este objeto. El uso de MappingProxyType permite establecer estas restricciones sin tener que crear primero una copia completa del diccionario.

In [16]:
from types import MappingProxyType

writable = {'one': 1, 'two': 2}
read_only = MappingProxyType(writable)

In [17]:
read_only['one']

1

In [18]:
read_only['one'] = 23

TypeError: 'mappingproxy' object does not support item assignment

## Conclusión

Todas las implementaciones de diccionarios de Python listadas en este capítulo son implementaciones válidas que están incorporadas en la biblioteca estándar de Python.

Si estás buscando una recomendación general sobre qué tipo de mapeo usar en tus programas, te indicaría el tipo de datos dict incorporado. Es una implementación de tabla hash versátil y optimizada que está incorporada directamente en el núcleo del lenguaje.

Sólo te recomendaría que usaras uno de los otros tipos de datos listados aquí si tienes requisitos especiales que van más allá de lo que se proporcionan los diccionarios.

## Claves

* Los diccionarios son la estructura de datos central de Python.
* El tipo dict incorporado será "suficientemente bueno" la mayor parte del tiempo. 
* Implementaciones especializadas, como dictos de sólo lectura u ordenados,
están disponibles en la biblioteca estándar de Python.