# Módulo de coleções

O módulo de coleções é um módulo interno que implementa tipos de dados de contêiner especializados que fornecem alternativas aos contêineres incorporados de uso geral da Python. Nós já abordamos os conceitos básicos: dict, list, set e tuple.

Agora, aprenderemos sobre as alternativas que o módulo de coleções fornece.

## Counter

* Counter * é uma subclasse * dict * que ajuda a contar objetos hash-able. Dentro disso, os elementos são armazenados como chaves de dicionário e as contagens dos objetos são armazenadas como o valor.

Vamos ver como isso pode ser usado:

In [1]:
from collections import Counter

**Counter() com listas**

In [2]:
l = [1,2,2,2,2,3,3,3,1,2,1,12,3,2,32,1,21,1,223,1]

Counter(l)

Counter({1: 6, 2: 6, 3: 4, 32: 1, 12: 1, 21: 1, 223: 1})

**Counter com strings**

In [3]:
Counter('aabsbsbsbhshhbbsbs')

Counter({'b': 7, 's': 6, 'h': 3, 'a': 2})

**Counter com palavras em uma sentença.**

In [4]:
s = 'How many times does each word show up in this sentence word times each each word'

words = s.split()

Counter(words)

Counter({'word': 3, 'each': 3, 'times': 2, 'show': 1, 'this': 1, 'many': 1, 'in': 1, 'up': 1, 'How': 1, 'does': 1, 'sentence': 1})

In [5]:
# Métodos com Counter()
c = Counter(words)

c.most_common(2)

[('word', 3), ('each', 3)]

## Padrões comuns ao usar o objeto Counter()

In [None]:
sum(c.values())                 # total de todas as contagens
c.clear()                       # redefinir todas as contagens
list(c)                         # elementos exclusivos da lista
set(c)                          # converter para um conjunto
dict(c)                         # converter para um dicionário regular
c.items()                       # converter para uma lista de pares (elem, cnt)
Counter(dict(list_of_pairs))    # converter de uma lista de pares (elem, cnt)
c.most_common()[:-n-1:-1]       # n elementos menos comuns
c += Counter()                  # remove zero e contagens negativas

## defaultdict

defaultdict é um dicionário como objeto que fornece todos os métodos fornecidos pelo dicionário, mas leva o primeiro argumento (default_factory) como tipo de dados padrão para o dicionário. Usar defaultdict é mais rápido do que fazer o mesmo usando o método dict.set_default.

** Um defaultdict nunca gerará um KeyError. Qualquer chave que não existe obtém o valor retornado pela fábrica padrão. **

In [12]:
from collections import defaultdict

In [14]:
d = {}

In [22]:
d['one'] 

KeyError: 'one'

In [23]:
d  = defaultdict(object)

In [24]:
d['one'] 

<object at 0x1002c3a50>

In [26]:
for item in d:
    print item

one


Também pode inicializar com valores padrão:

In [27]:
d = defaultdict(lambda: 0)

In [28]:
d['one']

0

## OrderedDict
Um OrderedDict é uma subclasse de dicionário que lembra a ordem em que seu conteúdo é adicionado.

Um exemplo de um dicionário normal:

In [32]:
print 'Normal dictionary:'

d = {}

d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'

for k, v in d.items():
    print k, v

Normal dictionary:
a A
c C
b B
e E
d D


Um dicionário ordenado:

In [33]:
print 'OrderedDict:'

d = collections.OrderedDict()

d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'

for k, v in d.items():
    print k, v

OrderedDict:
a A
b B
c C
d D
e E


## Igualdade com um Dicionário Ordenado
Um dicionario normal olha para seu próprio conteúdo quando testa por igualdade. Um OrderedDict também considera a ordem em que os itens foram adicionados.

Um dicionário normal:

In [36]:
print 'Dictionaries are equal? '

d1 = {}
d1['a'] = 'A'
d1['b'] = 'B'

d2 = {}
d2['b'] = 'B'
d2['a'] = 'A'

print d1 == d2

Dictionaries are equal? 
True


Um dicionário ordenado:

In [37]:
print 'Dictionaries are equal? '

d1 = collections.OrderedDict()
d1['a'] = 'A'
d1['b'] = 'B'


d2 = collections.OrderedDict()

d2['b'] = 'B'
d2['a'] = 'A'

print d1 == d2

Dictionaries are equal? 
False


# namedtuple
A tupla padrão usa índices numéricos para acessar seus membros, por exemplo:

In [38]:
t = (12,13,14)

In [39]:
t[0]

12

Para casos de uso simples, isso geralmente é suficiente. Por outro lado, lembrar qual índice deve ser usado para cada valor pode levar a erros, especialmente se a tupla tiver muitos campos e for construída longe de onde ela é usada. Um namedtuple atribui nomes, bem como o índice numérico, a cada membro.

Cada tipo de namedtuple é representado por sua própria classe, criado usando a função de fábrica namedtuple(). Os argumentos são o nome da nova classe e uma string contendo os nomes dos elementos.

Você basicamente deve pensar o namedtuple como uma maneira muito rápida de criar um novo tipo de objeto / classe com alguns campos de atributos.
Por exemplo:

In [40]:
from collections import namedtuple

In [47]:
Dog = namedtuple('Dog','age breed name')

sam = Dog(age=2,breed='Lab',name='Sammy')

frank = Dog(age=2,breed='Shepard',name="Frankie")

Construímos o namedtuple primeiro passando o nome do tipo de objeto (Dog) e depois passando uma string com a variedade de campos como uma string com espaços entre os nomes dos campos. Podemos chamar os vários atributos:

In [42]:
sam

Dog(age=2, breed='Lab', name='Sammy')

In [43]:
sam.age

2

In [44]:
sam.breed

'Lab'

In [45]:
sam[0]

2

## Conclusão

Esperemos que você veja agora quão incrivelmente útil o módulo de coleções está em Python e deve ser o seu módulo de acesso para uma variedade de tarefas comuns!