# Dicionários e conjuntos

## Introdução

ABCs (Abstract Base Classes) tem como importância fundamental documentar e formalizar as interfaces mínimas para mapeamentos.

In [None]:
from collections import abc
my_dict = {}
isinstance(my_dict, abc.Mapping)

True

Um objeto é hashable se tiver um valor de hash que nunca mude durante seu tempo de vida e puder ser comparado com outros objetos.
- str, bytes, tipos números, frosenzet são todos hashable;
- tuple só é hashable se todos os itens forem hashable.

In [None]:
t = (1, 2, (30, 40))
hash(t)

8027212646858338501

In [None]:
t = (1, 2, [30, 40])
hash(t)

TypeError: ignored

In [None]:
m = frozenset([10, 20, 30, 40])
m

frozenset({10, 20, 30, 40})

In [None]:
len(m)

4

In [None]:
tf = (1, 2, frozenset([30, 40]))
hash(tf)

985328935373711578

## Tipos de construção de um dicionário

In [None]:
a = dict(one=1, two=2, three=3)
b = {'three': 3, 'two': 2, 'one': 1}
c = dict([('two', 2), ('one', 1), ('three', 3)])
d = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

True

In [None]:
list(d.keys())

['one', 'two', 'three']

In [None]:
c.popitem()
c

{'one': 1, 'two': 2}

In [None]:
pop = b.popitem()
pop

('one', 1)

In [None]:
b

{'three': 3, 'two': 2}

## Dict Comprehensions

In [None]:
dial_codes = [
    (880, 'Bangladesh'),
    (55,  'Brazil'),
    (86,  'China'),
    (91,  'India'),
    (62,  'Indonesia'),
    (81,  'Japan'),
    (234, 'Nigeria'),
    (92,  'Pakistan'),
    (7,   'Russia'),
    (1,   'United States'),
]

In [None]:
country_dial = {country: code for code, country in dial_codes}
country_dial

{'Bangladesh': 880,
 'Brazil': 55,
 'China': 86,
 'India': 91,
 'Indonesia': 62,
 'Japan': 81,
 'Nigeria': 234,
 'Pakistan': 92,
 'Russia': 7,
 'United States': 1}

In [None]:
country_dial.items()

dict_items([('Bangladesh', 880), ('Brazil', 55), ('China', 86), ('India', 91), ('Indonesia', 62), ('Japan', 81), ('Nigeria', 234), ('Pakistan', 92), ('Russia', 7), ('United States', 1)])

In [None]:
for country, code in sorted(country_dial.items()):
    print(country, code)

Bangladesh 880
Brazil 55
China 86
India 91
Indonesia 62
Japan 81
Nigeria 234
Pakistan 92
Russia 7
United States 1


In [None]:
countries_and_codes = {
    code: country.upper() 
    for country, code in sorted(country_dial.items())
    if code < 70
}
countries_and_codes

{1: 'UNITED STATES', 7: 'RUSSIA', 55: 'BRAZIL', 62: 'INDONESIA'}

In [None]:
from random import shuffle

shuffle(dial_codes)
dial_codes

[(234, 'Nigeria'),
 (7, 'Russia'),
 (91, 'India'),
 (1, 'United States'),
 (62, 'Indonesia'),
 (81, 'Japan'),
 (86, 'China'),
 (880, 'Bangladesh'),
 (55, 'Brazil'),
 (92, 'Pakistan')]

In [None]:
shuffle(dial_codes)
dial_codes

[(7, 'Russia'),
 (62, 'Indonesia'),
 (55, 'Brazil'),
 (1, 'United States'),
 (86, 'China'),
 (91, 'India'),
 (81, 'Japan'),
 (92, 'Pakistan'),
 (234, 'Nigeria'),
 (880, 'Bangladesh')]

In [None]:
new_cc = countries_and_codes.copy()
new_cc

{1: 'UNITED STATES', 7: 'RUSSIA', 55: 'BRAZIL', 62: 'INDONESIA'}

In [None]:
countries_and_codes.clear()

In [None]:
countries_and_codes

{}

In [None]:
new_cc

{1: 'UNITED STATES', 7: 'RUSSIA', 55: 'BRAZIL', 62: 'INDONESIA'}

In [None]:
new_cc.fromkeys((1, 2))

{1: None, 2: None}

In [None]:
new_cc

{1: 'UNITED STATES', 7: 'RUSSIA', 55: 'BRAZIL', 62: 'INDONESIA'}

In [None]:
new_cc.fromkeys((1, 2), 'Mari')

{1: 'Mari', 2: 'Mari'}

In [None]:
new_cc.items()

dict_items([(55, 'BRAZIL'), (62, 'INDONESIA'), (7, 'RUSSIA'), (1, 'UNITED STATES')])

In [None]:
new_cc.keys()

dict_keys([55, 62, 7, 1])

In [None]:
new_cc.values()

dict_values(['BRAZIL', 'INDONESIA', 'RUSSIA', 'UNITED STATES'])

In [None]:
new_cc.update({'Mari': 759})

In [None]:
new_cc

{1: 'UNITED STATES', 55: 'BRAZIL', 62: 'INDONESIA', 7: 'RUSSIA', 'Mari': 759}

## setdefault

In [None]:
new_cc

{1: 'UNITED STATES', 55: 'BRAZIL', 62: 'INDONESIA', 7: 'RUSSIA', 'Mari': 759}

In [None]:
new_cc['Mari']

759

In [None]:
new_cc['Pinheiro']

KeyError: ignored

In [None]:
new_cc.get('Pinheiro')

In [None]:
new_cc.get('Pinheiro', 0)

0

In [None]:
from collections import defaultdict

new_dict = defaultdict(lambda: 0)
new_dict['Mari'] = 759
new_dict['Pinheiro'] = 957

new_dict

defaultdict(<function __main__.<lambda>>, {'Mari': 759, 'Pinheiro': 957})

In [None]:
new_dict['Mariana']

0

In [None]:
new_dict

defaultdict(<function __main__.<lambda>>,
            {'Mari': 759, 'Mariana': 0, 'Pinheiro': 957})

## Variações de dict

OrderedDict: Mantém as chaves na ordem de inserção, permitindo que a iteração dos itens seja feita em uma ordem previsível.

In [None]:
from collections import OrderedDict

m = OrderedDict()
m[1] = 'abc'
m[2] = 'cde'
m[3] = 'efg'
m

OrderedDict([(1, 'abc'), (2, 'cde'), (3, 'efg')])

In [None]:
m.popitem()
m

OrderedDict([(1, 'abc'), (2, 'cde')])

In [None]:
m[4] = 'ghi'
m.popitem(last=False)
m

OrderedDict([(2, 'cde'), (4, 'ghi')])

ChainMap: armazena lista de mapeamentos que podem ser buscados como se fossem um só. A consulta é feita em cada mapeamento na sequência e será bem-sucedida se a chave for encontrada em qualquer um deles.

In [None]:
from collections import ChainMap
import builtins

pylookup = ChainMap(locals(), globals(), vars(builtins))
pylookup

All Rights Reserved.

Copyright (c) 2000 BeOpen.com.
All Rights Reserved.

Copyright (c) 1995-2001 Corporation for National Research Initiatives.
All Rights Reserved.

Copyright (c) 1991-1995 Stichting Mathematisch Centrum, Amsterdam.
All Rights Reserved., 'credits':     Thanks to CWI, CNRI, BeOpen.com, Zope Corporation and a cast of thousands
    for supporting Python development.  See www.python.org for more information., 'license': Type license() to see the full license text, 'help': Type help() for interactive help, or help(object) for help about object., '__IPYTHON__': True, 'display': <function display at 0x7fbede9e5290>, 'execfile': <function execfile at 0x7fbebf00ba70>, 'runfile': <function runfile at 0x7fbebecc23b0>, 'get_ipython': <bound method InteractiveShell.get_ipython of <google.colab._shell.Shell object at 0x7fbec49eee50>>, 'dreload': <function _dreload at 0x7fbec47cae60>})

In [None]:
c = ChainMap()
d = c.new_child()
e = c.new_child()
e.maps[0]
e.maps[-1]
e.parents

ChainMap({})

In [None]:
e

ChainMap({}, {})

In [None]:
d['x'] = 1
d['x']

1

In [None]:
del d['x']

In [None]:
d['a'] = 2
d['b'] = 3

In [None]:
list(d)

['a', 'b']

In [None]:
d.items()

ItemsView(ChainMap({'a': 2, 'b': 3}, {}))

In [None]:
dict(d)

{'a': 2, 'b': 3}

In [None]:
e['c'] = 4
e['e'] = 5

In [None]:
l = ChainMap(e, d)
l['c']

4

Counter: Armazena um contador ineiro para cada chave e ao atualizar uma chave existente, o contador é incrementado.

In [None]:
from collections import Counter

c = Counter('Mariana')
c

Counter({'M': 1, 'a': 3, 'i': 1, 'n': 1, 'r': 1})

In [None]:
c.update('Pinheiro')
c

Counter({'M': 1,
         'P': 1,
         'a': 3,
         'e': 1,
         'h': 1,
         'i': 3,
         'n': 2,
         'o': 1,
         'r': 2})

In [None]:
c.most_common(3)

[('a', 3), ('i', 3), ('r', 2)]

In [None]:
d = Counter([1, 3, 4, 5, 5, 3, 2, 2])
d

Counter({1: 1, 2: 2, 3: 2, 4: 1, 5: 2})

## Subclasses de UserDict

collections.UserDict é uma implementação pura de um mapeamento que funciona como um dicionário padrão, foi concebido para que subclasses sejam criadas a partir dele.


In [None]:
# StrKeyDict sempre converte chaves que não são str para str
# (inserção, atualização e consulta).

from collections import UserDict

class StrKeyDict(UserDict):

    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]

    def __contains__(self, key):
        return str(key) in self.data

    def __setitem__(self, key, item):
        self.data[str(key)] = item

In [None]:
d = StrKeyDict([(2, 'two'), ('4', 'four')])
sorted(d.keys())

['2', '4']

In [None]:
d['2']

'two'

In [None]:
d[2]

'two'

In [None]:
d[1]

KeyError: ignored

In [None]:
d.get('2')

'two'

In [None]:
d.get(4)

'four'

In [None]:
d.get(1, 'N/A')

'N/A'

In [None]:
2 in d

True

In [None]:
'2' in d

True

In [None]:
1 in d

False

In [None]:
d[0] = 'zero'
d['0']

'zero'

In [None]:
d.update({6:'six', '8':'eight'})
sorted(d.keys())

['0', '2', '4', '6', '8']

In [None]:
d.update([(10, 'ten'), ('12', 'twelve')])
sorted(d.keys())

['0', '10', '12', '2', '4', '6', '8']

MutableMapping tem diversos métodos concretos úteis, apesar de ser classe-base abstrata (ABCs).

## Mapeamentos imutáveis

Classe wrapper, dada um mapeamento, a classe devolve uma instância de **mappingproxy** (uma view somente de leitura, mas dinâmica, do mapeamento original). Ou seja, as atualização no mapeamtno original podem ser vistas em mappingproxy, mas não é possível fazer alterações por meio dela.

In [None]:
from types import MappingProxyType

d = {1: 'A'}
d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [None]:
d_proxy[1]

'A'

In [None]:
d_proxy[2] = 'x'

TypeError: ignored

In [None]:
d[2] = 'B'

In [None]:
d_proxy

mappingproxy({1: 'A', 2: 'B'})

In [None]:
d_proxy[2]

'B'

## Teoria dos Conjuntos

"conjuntos" se referem a **set** e ao **frozenset**, seu irmão imutável.

In [None]:
l = ['spam', 'spam', 'eggs', 'spam']
set(l)

{'eggs', 'spam'}

In [None]:
list(set(l))

['spam', 'eggs']

Elementos de conjuntos devem ser hashable, e apesar disso, set não é, mas o frozenset sim.

Vantagens:
- Garante unicidade
- Implementa operações essenciais de conjuntos com operadores infixos:
    - a | b união
    - a & b intersecção
    - a - b diferença

O uso inteligente, reduz número de linhas e o tempo de execusão do programa. Além de deixar o código mais fácil de ler e compreender (removendo laços e lógicas condicionais).

In [None]:
m = ['mari', 'pinheiro', 'spam']

set(l) | set(m)

{'eggs', 'mari', 'pinheiro', 'spam'}

In [None]:
set(l) & set(m)

{'spam'}

In [None]:
set(l) - set(m)

{'eggs'}

In [None]:
set(m) - set(l)

{'mari', 'pinheiro'}

**{}** cria um dict vazio

**set()** um conjunto vazio

In [None]:
s = {1}
type(s)

set

In [None]:
s.pop()

1

In [None]:
s

set()

A sintaxe literal {1, 2} é mais rápida que chamar o construtor set([1, 2]), pois tem um bytecode especializado (BUILD_SET) e nesse caso não precisa encontrar o construtor.

In [None]:
from dis import dis
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              2 BUILD_SET                1
              4 RETURN_VALUE


In [None]:
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (1)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE


frozenset não tem sintaxe especial, é necessário a chamada ao construtor.

In [None]:
frozenset(range(10))

frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})

In [None]:
# Set comprehensions (setcoms)

from unicodedata import name

carac_with_sign = {
    chr(i)
    for i in range(32, 256)
    if 'SIGN' in name(chr(i), '')
}

carac_with_sign

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

**Operações matemáticas do set:** esses métodos geram um novo conjunto ou atualizam o conjunto-alvo in-place se ele for mutável.

In [None]:
a = {1, 2, 3, 4}
b = {2, 4, 5, 6}

Intersecção: A ∩ B

In [None]:
a & b

{2, 4}

In [None]:
# A ∩ B

# a & b: intersecção
a.__and__(b)

{2, 4}

In [None]:
# b & a: operador e reverso
a.__rand__(b)

{2, 4}

In [None]:
a.intersection(b)

{2, 4}

In [None]:
# a &= b: a atualizado com a intersecção entre a e b
a.__iand__(b)

{2, 4}

In [None]:
a

{2, 4}

In [None]:
a = {1, 2, 3, 4}

In [None]:
a.intersection_update(b)

In [None]:
a

{2, 4}

In [None]:
a = {1, 2, 3, 4}

União: A ∪ B

In [None]:
# a | b

a | b 

{1, 2, 3, 4, 5, 6}

In [None]:
a.__or__(b)

{1, 2, 3, 4, 5, 6}

In [None]:
a.__ror__(b)

{1, 2, 3, 4, 5, 6}

In [None]:
a.union(b)

{1, 2, 3, 4, 5, 6}

In [None]:
# a atualizado com união de a e b
a |= b

In [None]:
a

{1, 2, 3, 4, 5, 6}

In [None]:
a = {1, 2, 3, 4}

In [None]:
a.__ior__(b)

{1, 2, 3, 4, 5, 6}

In [None]:
a.update(b)

In [None]:
a

{1, 2, 3, 4, 5, 6}

Complemento relativo ou diferença de a e b

In [None]:
a - b

{1, 3}

In [None]:
a.__sub__(b)

{1, 3}

In [None]:
b - a

set()

In [None]:
a.__rsub__(b)

set()

In [None]:
print(a, b)

{1, 2, 3, 4, 5, 6} {2, 4, 5, 6}


In [None]:
a.difference(b)

{1, 3}

In [None]:
# a atualizado com a diferença entre a e b
a -= b

In [None]:
a

{1, 3}

In [50]:
a = {1, 2, 3, 4, 5, 6}
b = {2, 4, 5, 6}

In [44]:
a.__isub__(b)

{1, 3}

In [46]:
a.__rsub__(b)

set()

In [49]:
a.difference_update(b)

In [51]:
a.symmetric_difference(b)

{1, 3}

Diferença simétrica: A △ B

In [52]:
print(a, b)

{1, 2, 3, 4, 5, 6} {2, 4, 5, 6}


In [55]:
a ^ b

{1, 3}

In [56]:
a.__xor__(b)

{1, 3}

In [57]:
a.symmetric_difference_update(b)

In [58]:
a

{1, 3}

Conjuntos dijuntos: não têm nenhum elemento em comum

In [59]:
a.isdisjoint(b)

True

In [60]:
a.__contains__(b)

False

Subconjunto do conjunto principal

In [62]:
{1, 2}.__le__({1, 2, 3, 4})

True

In [64]:
{1, 2}.issubset({1, 2, 3, 4})

True

Superconjunto do conjunto principal

In [67]:
{1, 2, 3, 4, 5}.__ge__({1, 2, 3, 4})

True

In [68]:
{1, 2, 3, 4, 5}.issuperset({1, 2, 3, 4})

True

In [69]:
a

{1, 3}

In [70]:
a.add(2)

In [71]:
a

{1, 2, 3}

In [72]:
a.discard(2)

In [74]:
2 in a

False

In [75]:
hash(1) == hash(1.0)

True

In [78]:
m = {1: 'a', 1.0: 'b'}
m[1]

'b'

In [79]:
# Sobrescrita de valor
m

{1: 'b'}

Os métodos .keys(), .items() e .values() devolvem views de dicionários, que se comportam mais como conjuntos. São dinâmicas e refletem imediatamente qualquer mudança feita em dict.

In [82]:
n = m.keys()
n

dict_keys([1])

In [83]:
m[2] = 'c'

In [84]:
n

dict_keys([1, 2])

- Os elementos dos conjuntos devem ser objetos hashable.
- Os conjuntos têm um overhead significativo de memória.
- O teste de presença é muito eficiente.
- A ordem dos elementos depende da ordem de inserção.
- Adicionar elementos a um conjunto pode alterar a ordem de outros elementos.