# 9. Colecciones

## 9.1 defaultdict
A diferencia de dict con defaultdict no tienes que verificar que una llave o key este presente. Es decir, puedes hacer lo siguiente:

In [1]:
from collections import defaultdict

colours = (
    ('Asturias', 'Oviedo'),
    ('Galicia', 'Ourense'),
    ('Extremadura', 'Cáceres'),
    ('Galicia', 'Pontevedra'),
    ('Asturias', 'Gijón'),
    ('Cataluña', 'Barcelona'),
)

ciudades = defaultdict(list)

for name, colour in colours:
    ciudades[name].append(colour)

print(ciudades)

# Salida
# defaultdict(<type 'list'>,
#    {'Extremadura': ['Cáceres'],
#     'Asturias': ['Oviedo', 'Gijón'],
#     'Cataluña': ['Silver'],
#     'Galicia': ['Ourense', 'Pontevedra']
# })

defaultdict(<class 'list'>, {'Asturias': ['Oviedo', 'Gijón'], 'Galicia': ['Ourense', 'Pontevedra'], 'Extremadura': ['Cáceres'], 'Cataluña': ['Barcelona']})


Una de las ocasiones en las que son más útiles, es si quieres añadir elementos a listas anidadas dentro e un diccionario. Si la llave o key no está ya presente en el diccionario, tendrás un error tipo KeyError. El uso de defaultdict permite evitar este problema. Antes de nada, vamos a ver un ejemplo con dict que daría un error KeyError como hemos mencionado, y después veremos la solución usando defaultdict.

In [2]:
# Problema
some_dict = {}
some_dict['region']['ciudad'] = "Oviedo"
# Raises KeyError: 'region'

KeyError: 'region'

In [7]:
# Solución
from collections import defaultdict
import json

tree = lambda: defaultdict(tree)
some_dict = tree()
some_dict['region']['ciudad'] = "Oviedo"

print(json.dumps(some_dict))
# Output: {"region": {"ciudad": "Oviedo"}}
# ¡Funciona!

{"region": {"ciudad": "Oviedo"}}


## 9.2 OrderedDict
OrderedDict es un diccionario que mantiene ordenadas sus entradas según van siendo añadidas. Es importante saber también que sobreescribir un valor existente no cambia la posición de la llave o key. Sin embargo, eliminar y reinsertar una entrar mueve la llave al final del diccionario.

In [8]:
# Problema

colours =  {"Rojo" : 198, "Verde" : 170, "Azul" : 160}
for key, value in colours.items():
    print(key, value)
    
# Salida:
#   Verde 170
#   Azul 160
#   Rojo 198
# Las entradas son recuperadas en un orden no predecible.

Rojo 198
Verde 170
Azul 160


In [9]:
from collections import OrderedDict

colours = OrderedDict([("Rojo", 198), ("Verde", 170), ("Azul", 160)])
for key, value in colours.items():
    print(key, value)
# Output:
#   Rojo 198
#   Verde 170
#   Azul 160
# El orden de inserción se mantiene.

Rojo 198
Verde 170
Azul 160


## 9.3 Counter
El uso de counter nos permite contar el número de elementos que una llave tiene. Por ejemplo, puede ser usado para contar el número de colores favoritos de diferentes personas.

In [10]:
from collections import Counter

colours = (
    ('Covadonga', 'Amarillo'),
    ('Pelayo', 'Azul'),
    ('Xavier', 'Verde'),
    ('Pelayo', 'Negro'),
    ('Covadonga', 'Rojo'),
    ('Amaya', 'Plata'),
)

favs = Counter(name for name, colour in colours)
print(favs)
# Salida: Counter({
#    'Covadonga': 2,
#    'Pelayo': 2,
#    'Xavier': 1,
#    'Amaya': 1
# })

Counter({'Covadonga': 2, 'Pelayo': 2, 'Xavier': 1, 'Amaya': 1})


## 9.4 Deque

deque proporciona una cola con dos lados, lo que significa que puedes añadir y eliminar elementos de cualquiera de los lados de la cola. Primero debes importar el módulo de la librería de colecciones o collections:

In [12]:
from collections import deque
d = deque()

d.append('1')
d.append('2')
d.append('3')

print(len(d))
# Salida: 3

print(d[0])
# Salida: '1'

print(d[-1])
# Salida: '3'

3
1
3


También puedes tomar elementos de los dos lados de la cola, una funcionalidad conocida como pop. Es importante notar que pop devuelve el elemento eliminado.

In [13]:
d = deque(range(5))
print(len(d))
# Salida: 5

d.popleft()
# Salida: 0

d.pop()
# Salida: 4

print(d)
# Salida: deque([1, 2, 3])

5
deque([1, 2, 3])


También podemos limitar la cantidad de elementos que la cola deque puede almacenar. Al hacer esto, simplemente quitará elementos del otro lado de la cola si el límite es superado. Se ve mejor con un ejemplo como se muestra a continuación:

In [14]:
d = deque([0, 1, 2, 3, 5], maxlen=5)
print(d)
# Salida: deque([0, 1, 2, 3, 5], maxlen=5)

d.extend([6])
print(d)
#Salida: deque([1, 2, 3, 5, 6], maxlen=5)

deque([0, 1, 2, 3, 5], maxlen=5)
deque([1, 2, 3, 5, 6], maxlen=5)


Ahora cuando insertamos valores después del 5, la parte más a la izquierda será eliminada de la lista. También puedes expandir la lista en cualquier dirección con valores nuevos.

In [15]:
d = deque([1,2,3,4,5])
d.extendleft([0])
d.extend([6,7,8])
print(d)
# Salida: deque([0, 1, 2, 3, 4, 5, 6, 7, 8])

deque([0, 1, 2, 3, 4, 5, 6, 7, 8])


## 9.5 Namedtuple

Tal vez conozcas ya las tupas, que son listas inmutables que permiten almacenar una secuencia de valores separados por coma. Son simplemente como las listas pero con algunas diferencias importantes. La principal es que a diferencia de las listas no puedes reasignar el valor de un elemento una vez inicializada. Para acceder a un índice de la tupla se hace de la siguiente manera:

In [16]:
from collections import namedtuple

Animal = namedtuple('Animal', 'nombre edad tipo')
perry = Animal(nombre="perry", edad=31, tipo="cat")

print(perry)
# Salida: Animal(nombre='perry', edad=31, tipo='cat')

print(perry.nombre)
# Salida: 'perry'

Animal(nombre='perry', edad=31, tipo='cat')
perry


Puedes ver como es posible acceder a los elementos a través de su nombre, simplemente haciendo uso de .. Vamos a verlo con más detalle. Una namedtuple requiere de dos argumentos. Estos son, el nombre de la tupla y los campos de la misma. En el ejemplo anterior hemos visto como el nombre de la tupla era “Animal” y tenía tres atributos: “nombre”, “edad” y “tipo”.

Las namedtuple son muy útiles ya que hacen que las tuplas tengan una especie de documentación propia, y apenas sea necesaria una explicación de como usarlas, ya que puedes verlo con un simple vistazo al código. Además, dado que no es necesario usar índices, hace que sea más fácil de mantener.

Otra de las ventajas es que son bastante ligeras, y no necesitan mas memoria que las tuplas normales. Esto hace que sean mas rápidas que los diccionarios. Sin embargo, recuerda que los atributos de las tuplas son inmutables, por lo que no pueden ser modificados. El siguiente ejemplo no funcionaría:

In [17]:
from collections import namedtuple

Animal = namedtuple('Animal', 'nombre edad tipo')
perry = Animal(nombre="perry", edad=31, tipo="cat")
perry.edad = 42

# Salida: Traceback (most recent call last):
#            File "", line 1, in
#         AttributeError: can't set attribute

AttributeError: can't set attribute