## Coleções em Python e a classe Counter

Coleções em Python são contêineres empregados para o armazenamento de dados com estruturas como Dicionários, Listas, Tuplas e Conjuntos.

Neste tutorial vamos tratar especificamente da classe Counter do módulo collections.

### A classe Counter

A classe Counter é uma subclasse  da classe dict (dicionários) que permite realizar a contagem de objetos hasheáveis. Trata-se de uma coleção na qual os elementos estão armazenados como chaves de um dicionário, e suas contagens como os valores associados a essas chaves.

Os elementos são mostrados em ordem decrescente de frequência de ocorrência.

In [9]:
from collections import Counter

# Criar um objeto contador vazio
c = Counter()
print (c)

# Passamos uma lista para contagem dos elementos em um contador
c1 = Counter([2,4,3,6,2,1,3,6,5,2])

#As chaves mostram os elementos e os valores, suas frequências:
print (c1)

# Os elementos podem ser de qualquer tipo, como caracteres. Podemos passar também
# um mapeamento de itens em vez de uma lista para contagem:
c2 = Counter({'B':3,'O':6,'N':2,'A':4})
print (c2)

# Ou ainda pasar os elementos separados por vírgulas
c3 = Counter(a=9,b=18)
print (c3)

# Podemos contar as ocorrências de um elemento em particular
print('Contagem de c1:',c1[6])

# Ou ainda excluir um elemento do objeto contador
del c1[6]
print(c1)

Counter()
Counter({2: 3, 3: 2, 6: 2, 4: 1, 1: 1, 5: 1})
Counter({'O': 6, 'A': 4, 'B': 3, 'N': 2})
Counter({'b': 18, 'a': 9})
Contagem de c1: 2
Counter({2: 3, 3: 2, 4: 1, 1: 1, 5: 1})


In [30]:
# Contar caracteres em uma string

from collections import Counter

texto = 'Bóson Treinamentos'
ctx = Counter(texto)
print(ctx)

Counter({'n': 3, 's': 2, 'o': 2, 'e': 2, 'B': 1, 'ó': 1, ' ': 1, 'T': 1, 'r': 1, 'i': 1, 'a': 1, 'm': 1, 't': 1})


## Acessar a contagem de um elemento

Podemos acessar a contagem de um elemento em particular em um objeto Counter usando o elemento como índice de acesso. Por exemplo, para saber a contagem de um elemento de nome 'Maçã' em um contador cFrutas, podemos executar:

cFrutas['Maçã']

Isso retornará a quantidade de ocorrências do elemento específico Maçã no objeto Counter.

In [37]:
# Acessar um elemento específico e sua contagem

from collections import Counter

# Criar um contador
c1 = Counter(('A','A','B','C','A','D','E','A','D','E','D','B','C','A','D','E','D','B'))
print('Ocorrências do elemento E: {}'.format(c1['E']))

# Acesso a elemento não existente (retorna valor zero)
print('Ocorrências do elemento H: {}'.format(c1['H']))

Ocorrências do elemento E: 3
Ocorrências do elemento H: 0


## Métodos do objeto contador

Além dos métodos disponíveis para dicionários comuns, como o método update(), um Counter também suporta os seguintes métodos:

- elements()
- most_common(n)
- subtract(iterável ou mapeamento)

In [40]:
# 1. Método elements()
# O método elements() permite listar todos os elementos em um objeto contador.
# Retorna um objeto iterável contendo os valores do objeto Counter.
# O iterador retornado pode ser passado para ua outra função, como por exemplo preencher uma lista.

from collections import Counter

# Criar contador
c1 = Counter({'B':3,'O':6,'N':2,'A':4,'F':8,'I':10,'D':2,'E':1})
itens = list(c1.elements())
print(itens)

# Os elementos são retornados na ordem em que aparecem no contador, e não em ordem decrescente de frequências.


['B', 'B', 'B', 'O', 'O', 'O', 'O', 'O', 'O', 'N', 'N', 'A', 'A', 'A', 'A', 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'I', 'I', 'I', 'I', 'I', 'I', 'I', 'I', 'I', 'I', 'D', 'D', 'E']


In [72]:
# Imprimir cada elemento com sua contagem, em forma de tabela

from collections import Counter

# Criar contador a partir de lista
c1 = Counter([2,4,3,6,2,1,3,6,5,2,2,3,4,2])

# Imprimir elementos e frequências
for k,v in c1.items():
         print(k,v)

2 5
4 2
3 3
6 2
1 1
5 1


In [1]:
# 2. Método most_common(n)
# Retorna a lista dos n objetos mais comuns no contador, com sua contagem, do mais 
# comum para o menos comum. Se n for omitido, todos os elementos são retornados.

from collections import Counter

# Criar contador a partir de lista
c1 = Counter([2,4,3,6,2,1,3,6,5,2,2,3,4,2,8])

# Retornar o elemento com mais ocorrências
mais_comum = c1.most_common(1)
print(mais_comum)

# Retornar todos os elementos com suas ocorrências
cont_elem = c1.most_common()
print(cont_elem)

# Retornar o elemento com menos ocorrências (eu que bolei esse algoritmo!)
menos_comum = [k for k,v in c1.items() if v == c1.most_common()[-1][1]]
print(menos_comum)
# Aqui, usei uma compreensão de lista para iterar pelos elementos e valores de c1, retornando
# apenas os elementos (chaves k) quando o valor (frequência v) for igual ao menor valor encontrado
# usando o método most_common() e extraindo o valor da tupla retornada ([-1][1] - último item, segundo valor da tupla).

# Exemplo #2: Dos países que ganharam Copas do Mundo, retornar os que menos títulos ganharam
# Criar contador
c2 = Counter({'Alemanha':4,'Argentina':2,'Brasil':5,'Espanha':1,'França':2,'Inglaterra':1,'Itália':4,'Uruguai':2})
menos_comum = [k for k,v in c2.items() if v == c2.most_common()[-1][1]]
print(menos_comum)

[(2, 5)]
[(2, 5), (3, 3), (4, 2), (6, 2), (1, 1), (5, 1), (8, 1)]
[1, 5, 8]
['Espanha', 'Inglaterra']


In [16]:
# 3. Método subtract(iterável ou mapeamento)
# Os elementos são subtraídos de um iterável ou de outro mapeamento ou contador.

from collections import Counter

# Criar contador 1 a partir de um dicionário
c1 = Counter({'A':2,'B':4,'C':3,'D':6,'E':2,'F':1,'G':3})
# Criar contador 2
c2 = Counter({'A':2,'D':3,'F':4})

# Subtrair as contagens de c2 de elementos similares em c1
c1.subtract(c2)
print(c1)

Counter({'B': 4, 'C': 3, 'D': 3, 'G': 3, 'E': 2, 'A': 0, 'F': -3})


In [29]:
# 4. Método update()
# O método Update() acrescenta novos elementos ao contador se a chave fornecida 
# não estiver presente no dicionário. Se achave existir (elemento já existe), seu 
# valor é atualizado.

from collections import Counter

# Criar contadores
u1=Counter({'a':3,'b':1,'c':8,'d':7})
u2=Counter({'a':1,'b':4,'e':9,'f':10})

# Atualizar o conteúdo de u1 com base nos valores de u2
u1.update(u2)
print(u1)

Counter({'f': 10, 'e': 9, 'c': 8, 'd': 7, 'b': 5, 'a': 4})


## Funções de conversão
Podemos converter um objeto contador para outro tipo de coleção por meio de funções e métodos específicos. São eles:

- list() - Converte um objeto Counter para um objeto List (lista), contendo os elementos do contador sem repetição.
- dict() - Converte um objeto Counter para um objeto Dictionary (dicionário normal), contendo os elementos do contador
- items() - Método que converte um objeto Counter para uma lista de tuplas, contendo pares no formato (elemento,contagem)
- set() - Converte um objeto Counter para um objeto Set (conjunto), contendo os elementos do contador

In [26]:
# Convertendo contadores

from collections import Counter
u2 = Counter(['a','b','e','f','b','e','f','b','e','f','b','e','f','e','f','e','f','e','f','e','f','e','f','f'])
print('Contador:\n{}\n'.format(u2))

# Retornar elementos como lista
print(list(u2))

# Retornar elementos como dicionário comum
print(dict(u2))

# Retornar elementos como conjunto
print(set(u2))

# Retornar elementos como lista de tuplas
print(u2.items())

Contador:
Counter({'f': 10, 'e': 9, 'b': 4, 'a': 1})

['a', 'b', 'e', 'f']
{'a': 1, 'b': 4, 'e': 9, 'f': 10}
{'b', 'f', 'e', 'a'}
dict_items([('a', 1), ('b', 4), ('e', 9), ('f', 10)])


## Contagem total de elementos

Podemos obter a contagem total dos elementos de um objeto contador usando a função sum() combinada com o método values():

In [27]:
from collections import Counter
u2 = Counter(['a','b','e','f','b','e','f','b','e','f','b','e','f','e','f','e','f','e','f','e','f','e','f','f'])

soma = sum(u2.values())
print('Total de elementos:{}'.format(soma))

Total de elementos:24


### Documentação oficial dos objetos Counter:
https://docs.python.org/3.8/library/collections.html#counter-objects