El módulo integrado de colecciones nos porvé de distintas alternativas. Vanos a comenzar echando un vistazo a los contadores, las cuales son una de las colecciones más interesantes que incorpora el módulo y representan una subclase del diccionario que nos ayuda a contar objetos. Son muy útiles en conjunto con otras colecciones para contar por ejemplo cuántas se repite los elementos de una lista o los caracteres de una cadena.

Vamos a comenzar importando...

In [1]:
from collections import Counter

In [2]:
l = [1,2,3,4,1,2,3,1,2,1]

Vamos a transformar esta lista a un contador:

In [3]:
Counter (l)

Counter({1: 4, 2: 3, 3: 2, 4: 1})

Nos está indicando que:

el número 1 está cuatro veces;

el número 2, está tres veces;

el número 3, está dos veces;

y el número 4, está una vez.

Probamos ahora con una cadena:

In [4]:
p = 'palabra'

In [5]:
Counter(p)

Counter({'a': 3, 'b': 1, 'l': 1, 'p': 1, 'r': 1})

In [13]:
mascotas = 'perro gato pez gato loro perro perro'

In [14]:
Counter(mascotas)

Counter({' ': 6,
         'a': 2,
         'e': 4,
         'g': 2,
         'l': 1,
         'o': 7,
         'p': 4,
         'r': 7,
         't': 2,
         'z': 1})

Cuenta como anteriormentes, las letras. Sin embargo, si quisiéramos contar las palabras en lugar de las letras:

Utilizamos 'split' para separar por espacios:

In [15]:
mascotas.split()

['perro', 'gato', 'pez', 'gato', 'loro', 'perro', 'perro']

In [16]:
Counter(mascotas.split())

Counter({'gato': 2, 'loro': 1, 'perro': 3, 'pez': 1})

Utilicemos otros counters:

In [17]:
#Guardamos como variable el split de mascotas
c = Counter(mascotas.split())

In [18]:
c.most_common() #Nos dice cuáles son los elementos más comunes

[('perro', 3), ('gato', 2), ('pez', 1), ('loro', 1)]

Si quisiéramos solo el que más se repite, indicamos un 1:

In [19]:
c.most_common(1)

[('perro', 3)]

Ahora probamos todo los que sabemos con una lista de números repetidos:

In [21]:
l = [10,30,10,10,20,10,20,20,30,10]

In [22]:
c = Counter(l)

In [23]:
c.items()

dict_items([(10, 5), (30, 2), (20, 3)])

In [24]:
c.keys()

dict_keys([10, 30, 20])

In [25]:
c.values()

dict_values([5, 2, 3])

In [26]:
sum(c.values())

10

In [27]:
list(c)

[10, 30, 20]

In [28]:
dict(c)

{10: 5, 20: 3, 30: 2}

In [29]:
d = dict(c)

In [30]:
d.most_common(1)

AttributeError: ignored

Este último ya no nos funciona porque es un diccionario normal.

In [31]:
set(c)  #Devuelve lo mismo de la lista pero en conjunto

{10, 20, 30}

Si queremos contar con un diccionario que nunca dé error pese a que no contiene una determinada clave, podemos utilizar un diccionario con un tipo por defecto. Y este se inicializará automáticamente al acceder a uno de sus  elementos por primera vez aunque este no exista.

Veamos un ejemplo:

In [34]:
d = {}

In [35]:
d['algo']

KeyError: ignored

Da error porque no existe esa clave, no existe ese elemento en el diccionario.

En cambio, si hacemos:

In [36]:
from collections import defaultdict

defaultdict, que es el diccionario con valor por defecto, automáticamente cuando accedamos a la clave o intentemos consultarla, se creará con un valor por defecto.

In [37]:
d = defaultdict(float) #y le tenemos que indicar un tipo por defecto, por ejemplo: float

In [38]:
d['algo']

0.0

In [39]:
d = defaultdict(str)

In [40]:
d['algo']

''

In [41]:
d = defaultdict(object)

In [42]:
d['algo']

<object at 0x7ff7444b0f30>

In [43]:
d

defaultdict(object, {'algo': <object at 0x7ff7444b0f30>})

In [44]:
d = defaultdict(int)

In [45]:
d['algo'] = 10.5

In [46]:
d['algo']

10.5

In [47]:
d['algomas']

0

In [48]:
d

defaultdict(int, {'algo': 10.5, 'algomas': 0})

Otro de los problemas de los diccionarios, es que son colecciones desordenadas.

In [49]:
n = {}

In [50]:
n['uno'] = ['one']
n['dos'] = ['two']
n['tres'] = ['three']

In [51]:
n

{'dos': ['two'], 'tres': ['three'], 'uno': ['one']}

In [52]:
from collections import OrderedDict

In [53]:
n = OrderedDict()

In [54]:
n['uno'] = ['one']
n['dos'] = ['two']
n['tres'] = ['three']

In [55]:
n

OrderedDict([('uno', ['one']), ('dos', ['two']), ('tres', ['three'])])

Y de esta manera nos lo pone en el mismo orden que nosotros decidimos crear el diccionario.

Lo único que tenemos que tener en cuenta (con estos diccionarios ordenados), es que no son equivalentes como serían por ejemplo dos diccionarios con los mismos elementos (aunque estén desordenados). Como son normales en realidad son iguales.

In [58]:
n1 = {}
n1['uno'] = ['one']
n1['dos'] = ['two']

n2 = {}
n2['dos'] = ['two']
n2['uno'] = ['one']

Si comparamos ambos diccionarios:

In [59]:
n1 == n2

True

Como son desordenados por defecto, en realidad son equivalentes.

Pero si hacemos lo mismo utilizando OrderedDict, la cosa cambia:

In [60]:
n1 = OrderedDict()
n1['uno'] = ['one']
n1['dos'] = ['two']

n2 = OrderedDict()
n2['dos'] = ['two']
n2['uno'] = ['one']

In [61]:
n1 == n2

False

Ahora si que se tiene en cuenta el orden y por tanto son diferentes.

Trabajamos ahora con tuplas.

In [62]:
from collections import namedtuple

In [63]:
Persona = namedtuple('Persona','nombre apellido edad')

In [64]:
p = Persona(nombre = 'Paco', apellido = 'Porras', edad = 24)

In [65]:
p.nombre

'Paco'

In [66]:
p.apellido

'Porras'

In [67]:
p.edad

24

In [69]:
p #Una tupla con nombre. Una persona con nombre, apellido y edad

Persona(nombre='Paco', apellido='Porras', edad=24)

In [70]:
p[0]

'Paco'

Es como unas clases muy sencillas para guardar información estructurada e inmutable.