# Collections

Estudo sobre o módulo collections da biblioteca padrão do python.

Por Bruno C. B. Pereira, 07/08/2021.

## Motivação

Na biblioteca padrão do python temos as estruturas simples como listas, dicionários, conjuntos e tuplas.

No entanto, as vezes essas estruturas são ineficientes em modelar dados com estruturas mais complexas.
Além disso, existem problemas de performance nessas estruturas, bem como de legibilidade.

A biblioteca collections se propõe a resolver esses problemas atráves de outras estruturas de dados
especialmente desenhadas para atacar esses problemas. A saber:

- Tupla Nomeada (namedtuple)
- Deck (deque)
- Contador (Counter)
- Mapa em cadeia (ChainMap)
<br><br>
- Dicionário Padrão (defaultdict)
- Dicionário Ordenado (OrderedDict)
<br><br>
- Dicionário de Usuário (Userdict)
- Lista de Usuário (UserList)
- String de Usuário (Userstring)

Dessa forma, o presente notebook descreve as principais vantagens de cada uma dessas estruturas,
bem como exemplos de criação e utilização.

Collections Abstract Base Classes foi movida para o módulo collections.abc

# Named Tuple

A principal vantagem da tupla nomeada é  ser mais explícita e legível que a tupla tradicional.
Além disso, é facil de acessar seus elementos nomeados através do ponto "."  e não através de um indíce.
<br>

A caráter de exemplo faz-se a modelagem de um ponto no espaço 2D.


In [None]:
# ============
# Tupla normal
# ============

# Criação do objeto
ponto = (2,4) #coordenadas x e y

# Acessando e printando seus elementos
print(ponto) # (2, 4)
print(ponto[0]) # 2
print(ponto[1]) # 4

for _ in ponto:
    print(_)
# 2
# 4

In [None]:
# ============
# Tupla nomeada
# ============

from collections import namedtuple

# Primeiro se cria-se uma subclasse "Ponto" a partir da função factory namedtuple()
# Passa-se para ela o nome do tipo que será criado ("Ponto") e 
# o nome dos campos que podem ser passados via lista (['x',  'y']) 
# ou separadas por espaços ou vírgulas ("x y" ou "x, y")
Ponto = namedtuple("Ponto", ['x',  'y'])
print(Ponto) #<class '__main__.Ponto'>

# Observa-se, de fato, que esta é uma subclasse da classe tupla
issubclass(Ponto, tuple) # True

# Agora instancia-se um objeto da subclasse Ponto criada.
ponto = Ponto(2, 4)

# Acessando e printando seus elementos
print(ponto) # Ponto(x=2, y=4)
print(ponto.x) # 2
print(ponto.y) # 4

Observa-se principalmente no print como foi fácil de acessar seus elementos, além de que printar a tupla nomeada em si gerou uma representação mais legível.

In [None]:
# Outras vantagens

# Ainda pode-se utilizar indíces numéricos
print(ponto[0]) # 2

# Pode-se retornar o nome dos  com _fields
print(ponto._fields) # ('x', 'y')

# Pode-se converter para dicionário com _asdict()
ponto._asdict() # {'x': 2, 'y': 4}

# Apesar de imutável, pode-se criar uma nova tupla através do método _replace(**kwargs)
ponto._replace(x = 33) # Ponto(x=33, y=4)


Para mais info:
<br>
https://realpython.com/python-namedtuple/
<br>
https://docs.python.org/3/library/collections.html#collections.namedtuple

# Deque

Deque (pronuncia-se "deck") é uma estrutura de dados em fila com métodos de retirada e inserção em ambas as pontas da fila (começo e fim).

Ela é a generalização de duas estruturas de dados, a stack (pilha) e a queue (filas). <br>
- Na pilha, o último elemento a ser adicionado será o primeiro a ser removido (como em um pilha de cartas) <br>
- Já na fila, o primeiro elemento a ser adicionado séra o primeiro a ser removido (como em uma fila de bilheteria de cinema)

Essa estrutura propõe a resolver o problema de complexidade computacional (append e pop a esquerda de listas tem complexidade de tempo O(n)),
bem como problemas de estabilidade de alocação de memória quando listas grandes aceitam novos elementos.

In [None]:
# ============================
# Simulando uma fila com deque
# ============================

from collections import deque

fila_cinema = deque()

# Pessoas chegando na fila
fila_cinema.append("Fulano")
fila_cinema.append("Beltrano")
fila_cinema.append("Ciclano")

fila_cinema
# deque(['Fulano', 'Beltrano', 'Ciclano'])

# Nesse momento quando formos retirar o elemento, o PRIMEIRO que foi inserido será retirado
fila_cinema.popleft()

fila_cinema
# deque(['Beltrano', 'Ciclano'])

In [None]:
# =============================
# Simulando uma pilha com deque
# =============================

from collections import deque

pilha_cartas = deque()
pilha_cartas.append('A♥')
pilha_cartas.append('K♣')
pilha_cartas.append('10♦')

pilha_cartas
# deque(['A♥', 'K♣', '10♦'])

# Nesse momento quando formos retirar a carta, o ÚLTIMO elemento que foi inserido será retirado
pilha_cartas.pop()

pilha_cartas
# deque(['A♥', 'K♣'])

Além disso, outras duas funcionalidades interessantes dessa estrutura:
- Quando construído com o parâmetro maxlen, ao adicionar um novo elemento em uma lista cheia, o elemento da outra ponta será retirado
- O método .rotate(x) faz cada elemento da deque ir de sua respectiva posição i, para a posição i + x

In [None]:
# ================
# deque com maxlen
# ================

from collections import deque

deque_exemplo = deque(maxlen=3)

deque_exemplo.append('A')
deque_exemplo.append('B')
deque_exemplo.append('C')

deque_exemplo
# deque(['A', 'B', 'C'])

deque_exemplo.append('D')

deque_exemplo
# deque(['B', 'C', 'D'])

deque_exemplo.appendleft('E')
deque_exemplo
# deque(['E', 'B', 'C'])

In [None]:
# ===============
# deque.rotate(x)
# ===============

from collections import deque

deque_exemplo = deque()

deque_exemplo.append('A')
deque_exemplo.append('B')
deque_exemplo.append('C')
deque_exemplo
# deque(['A', 'B', 'C'])

deque_exemplo.rotate()
deque_exemplo
# deque(['C', 'A', 'B'])

deque_exemplo.rotate(-1)
deque_exemplo
# deque(['A', 'B', 'C'])

deque_exemplo.rotate(2)
deque_exemplo
# deque(['B', 'C', 'A'])

Outros métodos comuns de lista também estão implementados no deque:
- clear()
- copy()
- count(info)
- remove(info)
- extend (iterável)

__No entanto, apesar do deque suportar indexação, ele não suporta fatiamento__

Para mais info:
<br>
https://docs.python.org/3/library/collections.html#collections.deque
<br>
https://realpython.com/preview/python-deque/

# Counter

A subclasse Counter se propõe a resolver o problema prático, muitas vezes encontrado, de ter que implementar um contador através de dicionários em python.

Apesar de simples a implementação, devido ao fato de ser muito comum e repetitiva, 
subclasse pronta resolve esse problema de maneira muito resumida em código além de trazer outros métodos consigo interessantes.

In [None]:
# ========================
# Dicionário como contador
# ========================

def contador(interavel) -> dict:
    counter = {}
    for elemento in interavel:
        if elemento not in counter:
            counter[elemento] = 0
        counter[elemento] += 1
    return counter

contador_1 = contador('abacate')
contador_1
# {'a': 3, 'b': 1, 'c': 1, 't': 1, 'e': 1}

contador_2 = contador(['banana', 'maca', 'abacate', 'banana', 'banana', 'maca'])
contador_2
# {'banana': 3, 'maca': 2, 'abacate': 1}

contador_2['banana']
# 3

In [None]:
# =====================
# Counter como contador
# =====================

from collections import Counter

contador = Counter('abacate')
contador
# Counter({'a': 3, 'b': 1, 'c': 1, 't': 1, 'e': 1})

contador = Counter(['banana', 'maca', 'abacate', 'banana', 'banana', 'maca'])
contador
# Counter({'banana': 3, 'maca': 2, 'abacate': 1})

contador['banana']
# 3

Outras características interessantes da subclasse Counter:
- Quando se acessa um elemento não existente no contador, este retorna 0 ao invés de TypeError.
- A sua representação, __somente na sua criação__, mostra o elemento mais comum primeiro e os seguintes em ordem decrescente.
- Para acessar essas frequências, usamos o método most_common() que retornará uma lista de tuplas.
- Podemos atualizar essas frequências usando o método update() passando outro objeto Counter ou outro interável.

In [None]:
# ====================
# Método most_common()
# ====================

contador
# Counter({'banana': 3, 'maca': 2, 'abacate': 1})

# Acessando o mais frequente
contador.most_common()[0]
# ('banana', 3)

# Acessando o menos frequente
contador.most_common()[-1]
# ('abacate', 1)

# Invertendo a ordem
contador.most_common()[::-1]
# [('abacate', 1), ('maca', 2), ('banana', 3)]

In [None]:
# ===============
# Método update()
# ===============

contador = Counter(['banana', 'maca', 'abacate', 'banana', 'banana', 'maca'])
contador
# Counter({'banana': 3, 'maca': 2, 'abacate': 1})

# Atualizando contagem de banana e maca.
# A representação perde o ordenamento, mas o método most_common funciona normalmente
contador.update(banana = 5, maca = 10)
contador.update()
# Counter({'banana': 8, 'maca': 12, 'abacate': 1})

# Adicionando um novo elemento
contador.update(melancia = 23)
contador
# Counter({'banana': 8, 'maca': 12, 'abacate': 1, 'melancia': 23})

# Adicionando um novo contador
contador.update(Counter(['abacate', 'jaca']))
contador
# Counter({'banana': 8, 'maca': 12, 'abacate': 2, 'melancia': 23, 'jaca': 1}

# ChainMap

# DefaultDict, OrderedDict

# UserObjects (UserDict, UserList, UserString)

# Mais Info

https://realpython.com/python-data-structures