# Common Python Data Structures (Guide)

[https://realpython.com/python-data-structures/](https://realpython.com/python-data-structures/)

Neste tutorial, você aprenderá:

- Quais tipos de dados abstratos comuns são integrados à biblioteca padrão do Python
- Como os tipos de dados abstratos mais comuns são mapeados para o esquema de nomenclatura do Python
- Como colocar tipos de dados abstratos em uso prático em vários algoritmos

## Dictionaries, Maps and Hash Tables

[https://realpython.com/python-data-structures/#dictionaries-maps-and-hash-tables](https://realpython.com/python-data-structures/#dictionaries-maps-and-hash-tables)

Dicionários (ou `dicts`) são estruturas de dados que armazenam um número arbitrário de objetos, cada um deles associado a um identificador único, uma chave (key).

Os dicionários também são chamados de mapas, hashmaps, hookup tables ou associative arrays. Eles permitem a pesquisa, inserção e exclusão eficientes de qualquer objeto associado a uma determinada chave.

Uma analogia com o mundo real são as agendas de telefone. Você não sai olhando a agenda inteira, do início, para achar um telefone. Você, a partir do nome (a chave) da pessoa ou empresa, vai direto no nome dela e obtém o número.

Os dicionários, portanto, tem como característica uma performance de pesquisa, inserção e remoção muito maior que outras estruturas de dados como listas e vetores.

Dicionáris são estruturas de dados muito importantes e usadas com bastante frequências.

### `dict`: Seu dicionário do dia a dia

Dicionários são tão importantes que o Python mantém uma implementação padrão, bastante robusta, diretamente no núcleo da linguagem, o tipo de dado `dict`.

Python define 3 maneiras de se criar um dicionário:
    - Usando a função `dict()`
    - Usando os literais de dicionários, com chaves `{}`
    - Usando dict comprehentions

In [1]:
# Criando um dicionário usando a função dict()
agenda_dict = dict()
agenda_dict['maria'] = '11-11111-1111'
agenda_dict['pedro'] = '22-22222-2222'
agenda_dict['joao'] = '33-33333-3333'
agenda_dict

{'maria': '11-11111-1111', 'pedro': '22-22222-2222', 'joao': '33-33333-3333'}

In [2]:
# criando um dicionário usando um literal
agenda_literal = {
    "alice": '44-44444-4444',
    "mário": '55-55555-5555',
    "joão": '66-66666-6666',
}
agenda_literal

{'alice': '44-44444-4444', 'mário': '55-55555-5555', 'joão': '66-66666-6666'}

In [3]:
# Criando um dicionário usando um dict comprehension
nomes = ['ciro', 'mula', 'bozo']
numeros = ['77-77777-77', '88-88888-8888', '99-99999-9999']

agenda_comprehension = {chave: valor for chave, valor in zip(nomes, numeros)}
agenda_comprehension

{'ciro': '77-77777-77', 'mula': '88-88888-8888', 'bozo': '99-99999-9999'}

Para acessar um dicionário, você usa a sintaxe índice, passando a chave buscada entre colchetes.

In [4]:
print(agenda_dict["maria"])
print(agenda_literal["alice"])
print(agenda_comprehension["ciro"])

11-11111-1111
44-44444-4444
77-77777-77


Existem algumas restrições sobre os objetos que podem ser usados ​​como chaves válidas.

Os dicionários do Python são indexados por chaves que podem ser de qualquer tipo *hashable*. Um objeto *hashable* tem um valor *hash* que nunca muda durante seu tempo de vida (consulte `__hash__`) e pode ser comparado a outros objetos (consulte `__eq__`).

Tipos imutáveis, como strings e números, são *hashables* e, portanto, ótimos candidatos a chave. Também podemos usar tuplas como chaves, desde que elas contenham apenas objetos *hashables*.

Python forcene uma implementação padrão bastante robusta para dicionários, mas você pode usar qualquer outra implementação de dicionário que você desejar. Além da implementação padrão, Python também oferece algums implementações especializadas, para dicionários mais específicos.

### `collections.OrderedDict`: Lembre-se da ordem de inserção das chaves

O dicionário padrão mantém as ordens de inserção das chaves, mas isso é meramente um efeito colateral de sua implementação, não sendo definido na especificação. Desse moto, se precisamos garantir a ordem de de inserção das chaves, devemos usar o `collections.OrderedDict`.

Como ele não é uma implementação built-in, você precisa importar a classe `OrderedDict`.

In [5]:
import collections  # noqa E402

d = collections.OrderedDict(one=1, two=2, three=3)
print(d)

OrderedDict([('one', 1), ('two', 2), ('three', 3)])


In [6]:
d["four"] = 4
d

OrderedDict([('one', 1), ('two', 2), ('three', 3), ('four', 4)])

In [7]:
d.keys()

odict_keys(['one', 'two', 'three', 'four'])

Até o Python 3.8, você não podia iterar sobre itens de dicionário em ordem inversa usando `reversed()`. Apenas as instâncias de `OrderedDict` ofereciam essa funcionalidade. Mesmo no Python 3.8, objetos `dict` e `OrderedDict` não são exatamente a mesma coisa.

A classe `OrderedDict` possui um método `.move_to_end()`, que não está disponível na classe `dict`. Ela também tem um método `.popitem()` mais customizável que o `.popitem()` da classe `dict`.

### `collections.defaultdict`: Retornar valores padrão para chaves ausentes

A classe `defaultdict` é outra subclasse de dicionário que aceita um `callable` em seu construtor cujo valor de retorno será usado se uma chave solicitada não puder ser encontrada.

Isso pode economizar alguma digitação e tornar suas intenções mais claras em comparação com o método `get()` ou pegando uma exceção `KeyError` em dicionários regulares.

In [8]:
from collections import defaultdict  # noqa E402

dd = defaultdict(list)

# Acessar uma chave ausente a cria e inicializa usando a fábrica padrão,
# isto é, a list() neste exemplo:
dd["dogs"].append("Rufus")
dd["dogs"].append("Spike")
dd["cats"].append("Sophie")
dd["dogs"].append("Mr Sniffles")

print(dd)
print(dd["dogs"])
print(dd["cats"])

defaultdict(<class 'list'>, {'dogs': ['Rufus', 'Spike', 'Mr Sniffles'], 'cats': ['Sophie']})
['Rufus', 'Spike', 'Mr Sniffles']
['Sophie']


### `collections.ChainMap`: Pesquise múltiplos dicionários como um único mapeamento

A estrutura de dados `collections.ChainMap` agrupa múltiplos dicionários em um único mapeamento. A busca procura nos mapeamentos subjacentes, um por um, até que uma chave seja encontrada. Inserções, atualizações e exclusões afetam apenas o primeiro mapeamento adicionado à cadeia:

In [9]:
from collections import ChainMap  # noqa E402

dict1 = {"a": 1, "b": 2}
dict2 = {"c": 3, "d": 4}
chain = ChainMap(dict1, dict2)

chain

ChainMap({'a': 1, 'b': 2}, {'c': 3, 'd': 4})

In [10]:
chain["a"]

1

In [11]:
chain["c"]

3

In [12]:
import traceback  # noqa E402

try:
    chain["e"]
except KeyError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_15724/528609166.py", line 4, in <module>
    chain["e"]
  File "E:\repositorios\alura\.venv\lib\collections\__init__.py", line 941, in __getitem__
    return self.__missing__(key)            # support subclasses that define __missing__
  File "E:\repositorios\alura\.venv\lib\collections\__init__.py", line 933, in __missing__
    raise KeyError(key)
KeyError: 'e'


### `types.MappingProxyType`: Um wrapper para fazer dicionários somente leitura

O `MappingProxyType` é um wreapper ao redor do dicionário padrão, que provê uma interface somente para leitura aos dados do dicionário. Essa classe foi adicionada no Python 3.3 e pode ser usada pra criar uma versão proxy imutável de dicionários.

`MappingProxyType` pode ser útil se, por exemplo, você quer retornar um dicionário que carrega o estado interno de uma classe ou modulo, enquanto desoncoraja acesssos de escrita a esse objeto. Usar o `MappingProxyType` é mais eficiente que usar uma cópia de um dicionário, e ainda permite que você possa colocar as restrições necessárias.

In [13]:
from types import MappingProxyType  # noqa E402

gravavel = {'a': 1, 'b': 2}
somente_leitura = MappingProxyType(gravavel)

somente_leitura['a']

1

In [14]:
import traceback  # noqa E402

try:
    somente_leitura['a'] = 3
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_15724/1520983300.py", line 4, in <module>
    somente_leitura['a'] = 3
TypeError: 'mappingproxy' object does not support item assignment


In [15]:
# alteraçoes no dicionário original se refletem no proxy
gravavel['a'] = 4
somente_leitura

mappingproxy({'a': 4, 'b': 2})

### Dicionários em Python: Resumo

Todas essas implementações estão presentes a biblioteca padrão do Python. Se possível, use o dicionário padrão. Além de ser bastante versátil e bem otimizado, seu código será mais limpo. Porém, em caso de requisitos especiais, não hesite em usar os dicionários especiais.

Nesse capítulo, nós vemos:

- dict: Dicionário padrão
- collections.OrderedDict: Dicionário que mantém a ordem de inserção das chaves
- collections.defaultdict: Dicionário que retorna um valor padrão para chaves ausentes
- collections.ChainMap: Dicionário que agrupa múltiplos dicionários em um único mapeamento
- types.MappingProxyType: Wrapper para dicionários somente leitura