# Modulo Collections

El módulo Collections es un módulo integrado que implementa tipos de datos de contenedores especializados que brindan alternativas a los contenedores integrados de propósito general de Python. Ya hemos repasado los conceptos básicos: dict, list, set y tuple.

Ahora conoceremos las alternativas que brinda el módulo de colecciones.

## Counter

* Counter *es una subclase* *dict* que ayuda a contar los objetos que se pueden hash. Dentro de él, los elementos se almacenan como claves de diccionario y los recuentos de los objetos se almacenan como el valor.

Veamos cómo se puede utilizar:

In [1]:
from collections import Counter

**Counter() con listas**

In [2]:
lst = [1,2,2,2,2,3,3,3,1,2,1,12,3,2,32,1,21,1,223,1]

Counter(lst)

Counter({1: 6, 2: 6, 3: 4, 12: 1, 32: 1, 21: 1, 223: 1})

**Counter con cadenas**

In [3]:
Counter('aabsbsbsbhshhbbsbs')

Counter({'a': 2, 'b': 7, 's': 6, 'h': 3})

**Counter con palabras en una sentencia**

In [4]:
s = '¿Cuántas veces aparece cada palabra en esta oración, palabra multiplicada por cada palabra?'

palabras = s.split()

Counter(palabras)

Counter({'¿Cuántas': 1,
         'veces': 1,
         'aparece': 1,
         'cada': 2,
         'palabra': 2,
         'en': 1,
         'esta': 1,
         'oración,': 1,
         'multiplicada': 1,
         'por': 1,
         'palabra?': 1})

In [5]:
# Metodos con Counter()
c = Counter(palabras)

c.most_common(2)

[('cada', 2), ('palabra', 2)]

## Patrones comunes al usar el objeto Counter ()

    sum(c.values())                 # total de todos los recuentos
    c.clear()                       # restablecer todos los recuentos
    list(c)                         # enumerar elementos únicos
    set(c)                          # convertir a un conjunto
    dict(c)                         # convertir a un diccionario regular
    c.items()                       # convertir a una lista (elem, cnt) pares
    Counter(dict(list_of_pairs))    # convertir a una lista (elem, cnt) pares
    c.most_common()[:-n-1:-1]       # n menos comun elementos
    c += Counter()                  # elimina cero y cuentas negativas

## defaultdict

defaultdict es un objeto similar a un diccionario que proporciona todos los métodos proporcionados por un diccionario, pero toma un primer argumento (default_factory) como tipo de datos predeterminado para el diccionario. Usar defaultdict es más rápido que hacer lo mismo usando el método dict.set_default.

**Un defaultdict nunca generará un KeyError. Cualquier clave que no exista obtiene el valor devuelto por la fábrica predeterminada.**

In [6]:
from collections import defaultdict

In [7]:
d = {}

In [8]:
d['uno'] 

KeyError: 'uno'

In [9]:
d  = defaultdict(object)

In [10]:
d['uno'] 

<object at 0x161c8720990>

In [11]:
for articulo in d:
    print(articulo)

uno


También se puede inicializar con valores predeterminados:

In [12]:
d = defaultdict(lambda: 0)

In [13]:
d['uno']

0

# namedtuple
La tupla estándar usa índices numéricos para acceder a sus miembros, por ejemplo:

In [14]:
t = (12,13,14)

In [15]:
t[0]

12

Para casos de uso simples, esto suele ser suficiente. Por otro lado, recordar qué índice se debe usar para cada valor puede generar errores, especialmente si la tupla tiene muchos campos y está construida lejos de donde se usa. Un namedtuple asigna nombres, así como el índice numérico, a cada miembro.

Cada tipo de namedtuple está representado por su propia clase, creada usando la función de fábrica namedtuple (). Los argumentos son el nombre de la nueva clase y una cadena que contiene los nombres de los elementos.

Básicamente, puede pensar en las tuplas con nombre como una forma muy rápida de crear un nuevo tipo de objeto / clase con algunos campos de atributos.
Por ejemplo:

In [16]:
from collections import namedtuple

In [17]:
Perro = namedtuple('Perro',['edad','raza','nombre'])

sam = Perro(edad=2,raza='Lab',nombre='Sammy')

frank = Perro(edad=2,raza='Shepard',nombre="Frankie")

Construimos la tupla con nombre pasando primero el nombre del tipo de objeto (Perro) y luego pasando una cadena con la variedad de campos como una cadena con espacios entre los nombres de los campos. Luego podemos invocar los distintos atributos:

In [18]:
sam

Perro(edad=2, raza='Lab', nombre='Sammy')

In [19]:
sam.edad

2

In [20]:
sam.raza

'Lab'

In [21]:
sam[0]

2

## Conclusión

¡Esperamos que ahora vea lo increíblemente útil que es el módulo de colecciones en Python y debería ser su módulo de referencia para una variedad de tareas comunes!