# Dicionários e conjuntos

## Hashable
Um objeto é hashable se tiver um valor de hash (método \_\_hash\_\_() implementado) que nunca mude durante seu tempo de vida e puder ser comparado (método \_\_eq\_\_() implementado) com outros objetos. Objetos hashable iguais devem ter o mesmo valor de hash.

Obs: A maioria dos objetos embutidos imutáveis do Python são hasheáveis;  containers imutáveis (tais como tuplas e frozensets) são hasheáveis apenas se os seus elementos são hasheáveis. Objetos que são instâncias de classes definidas pelo usuário são hasheáveis por padrão. 
Todos eles comparam de forma desigual (exceto entre si mesmos), e o seu valor hash é derivado a partir do seu id().
1) https://docs.python.org/3/glossary.html#term-hashable 


Enquanto estávamos estudando ficamos em dúvida em relação ao _hash_, _id_, _hash(id)_ de um objeto. Alguns links que pode nos ajudar a entender isso:

1. https://stackoverflow.com/questions/11324271/what-is-the-default-hash-in-python

1. https://stackoverflow.com/questions/49722196/how-does-python-compute-the-hash-of-a-tuple

1. https://github.com/python/cpython/blob/master/Python/pyhash.c





In [27]:
tt = (1, 2, (30, 40))
hash(tt)

8027212646858338501

In [28]:
tl = (1, 2, [30, 40])
hash(tl)

TypeError: ignored

In [29]:
tf = (1, 2, frozenset([30, 40]))
hash(tf)

985328935373711578

In [54]:
class MinhaClasse():
  def __init__(self, a=10):
    self.a = a
  
  def __repr__(self):
    return f"{self.a} no objeto {id(self)}"

mc1 = MinhaClasse(a=10)
#print(mc1)
#print(hash(mc1))

mc2 = MinhaClasse(a=20)
#print(mc2)
#print(hash(mc2))

mc3 = MinhaClasse(a=[1, 2, 3])
print(id(mc3))
print(hash(id(mc3)))
print(hash(mc3))
print(repr(mc3))
print(mc3)

139716397530024
139716397530024
-9223363304579930182
[1, 2, 3] no objeto 139716397530024
[1, 2, 3] no objeto 139716397530024


In [47]:
a = f"abcde"
print(type(a))
print(hash(a))
print(id(a))

<class 'str'>
5670354481410751304
139716396819208


### Rapidinho: o que é um frozenset
O que é e pra que serve?

A set object is an unordered collection of distinct hashable objects. Common uses include membership testing, removing duplicates from a sequence, and computing mathematical operations such as intersection, union, difference, and symmetric difference.

1) https://docs.python.org/3/library/stdtypes.html#set-types-set-frozenset

2) ordem de sets unordered https://stackoverflow.com/questions/12165200/order-of-unordered-python-sets



In [55]:
s = set([3, 2, 4, 1, 'abc', mc1, mc2, mc3])
print(s)

{1, 2, 3, 4, 10 no objeto 139716397530808, 'abc', 20 no objeto 139716397529968, [1, 2, 3] no objeto 139716397530024}


In [56]:
a = frozenset([1, 2])
print(a)
print(len(a))
for item in a:
  print(f"{item} dentro do frozenset")
if 1 in a:
  print("Tá dentro")

for item in a:
  print(f"{item} dentro do frozenset")

frozenset({1, 2})
2
Tá dentro
1 dentro do frozenset
2 dentro do frozenset


In [57]:
b = frozenset([1, 2, 3, 4, 5])
print(b < a)
print(b > a)

False
True


In [30]:
c = frozenset([1, 5, 6, 7])
print(c)

print(a.union(c))

print(a)
print(c)

frozenset({1, 5, 6, 7})
frozenset({1, 2, 5, 6, 7})
frozenset({1, 2})
frozenset({1, 5, 6, 7})


In [33]:
hash(c)

-5809485022134541148

## Dict comprehensions

In [61]:
# BEGIN DIALCODES
# dial codes of the top 10 most populous countries
DIAL_CODES = [
        (86, 'China'),
        (91, 'India'),
        (1, 'United States'),
        (62, 'Indonesia'),
        (55, 'Brazil'),
        (92, 'Pakistan'),
        (880, 'Bangladesh'),
        (234, 'Nigeria'),
        (7, 'Russia'),
        (81, 'Japan'),
    ]

d1 = dict(DIAL_CODES)  # <1>
print('d1:', d1.keys())
d2 = dict(sorted(DIAL_CODES))  # <2>
print('d2:', d2.keys())
d3 = dict(sorted(DIAL_CODES, key=lambda x:x[1]))  # <3>
print('d3:', d3.keys())
assert d1 == d2 and d2 == d3  # <4>

print(d1 == d2)
print(d2 == d3)
print(d1)
print(d2)
# END DIALCODES

# # BEGIN DIALCODES_OUTPUT
# d1: dict_keys([880, 1, 86, 55, 7, 234, 91, 92, 62, 81])
# d2: dict_keys([880, 1, 91, 86, 81, 55, 234, 7, 92, 62])
# d3: dict_keys([880, 81, 1, 86, 55, 7, 234, 91, 92, 62])
# # END DIALCODES_OUTPUT



d1: dict_keys([86, 91, 1, 62, 55, 92, 880, 234, 7, 81])
d2: dict_keys([1, 7, 55, 62, 81, 86, 91, 92, 234, 880])
d3: dict_keys([880, 55, 86, 91, 62, 81, 234, 92, 7, 1])
True
True
{86: 'China', 91: 'India', 1: 'United States', 62: 'Indonesia', 55: 'Brazil', 92: 'Pakistan', 880: 'Bangladesh', 234: 'Nigeria', 7: 'Russia', 81: 'Japan'}
{1: 'United States', 7: 'Russia', 55: 'Brazil', 62: 'Indonesia', 81: 'Japan', 86: 'China', 91: 'India', 92: 'Pakistan', 234: 'Nigeria', 880: 'Bangladesh'}


In [2]:
novo_dict = {i: i+1 for i in range(10)}
print(novo_dict)

{0: 1, 1: 2, 2: 3, 3: 4, 4: 5, 5: 6, 6: 7, 7: 8, 8: 9, 9: 10}


In [69]:
nome = "Python fluente"
outro_dict = {c: i for i, c in enumerate(nome)}
print(outro_dict)
outro_dict['  '] = 123
print(outro_dict)
print(sorted(outro_dict))
outro_dict[(1, 2)] = 'abc'
print(outro_dict)
# outro_dict[(1, [2, 3])] = 'xyz' Não funciona
# print(sorted(outro_dict))

{'P': 0, 'y': 1, 't': 12, 'h': 3, 'o': 4, 'n': 11, ' ': 6, 'f': 7, 'l': 8, 'u': 9, 'e': 13}
{'P': 0, 'y': 1, 't': 12, 'h': 3, 'o': 4, 'n': 11, ' ': 6, 'f': 7, 'l': 8, 'u': 9, 'e': 13, '  ': 123}
[' ', '  ', 'P', 'e', 'f', 'h', 'l', 'n', 'o', 't', 'u', 'y']
{'P': 0, 'y': 1, 't': 12, 'h': 3, 'o': 4, 'n': 11, ' ': 6, 'f': 7, 'l': 8, 'u': 9, 'e': 13, '  ': 123, (1, 2): 'abc'}


In [71]:
mais_um = {(1, 2): 1, (5, 3): 2, (2, 4):3}
print(sorted(mais_um))

[(1, 2), (2, 4), (5, 3)]


## Visão geral dos métodos de mapeamento

dict: https://docs.python.org/3/library/stdtypes.html#dict


defaultdict: https://docs.python.org/3/library/collections.html#collections.defaultdict


ordered dict: https://docs.python.org/3/library/collections.html?highlight=collections#collections.OrderedDict


### Dict

1. https://github.com/python/cpython/blob/master/Objects/dictobject.c


In [93]:
d = dict({'c': 1, 'b': 2, 'alo': 3})
d['nova_chave'] = 'um valor'
d['d'] = None
print(d)
print(d['b'])

for item in d:
  print(item)

# print(d['abcde'])

{'c': 1, 'b': 2, 'alo': 3, 'nova_chave': 'um valor', 'd': None}
2
c
b
alo
nova_chave
d


### Default dict

o default dict tem uma default factory. Quando é acessada uma chave que não existe, ela é automaticamente criada com um valor do tipo da default factory

In [85]:
from collections import defaultdict
dd = defaultdict(tuple)
dd['a'] = 1
dd['e'] = 2
dd['d'] = 3
dd['b'] = 4
dd['c'] = None

print(dd)
# o que é esse None? 
# vamos trocar o default_factory

print(dd['b'])

for item in dd:
  print(item)

print(dd['abc'])

print(dd)


defaultdict(<class 'tuple'>, {'a': 1, 'e': 2, 'd': 3, 'b': 4, 'c': None})
4
a
e
d
b
c
()
defaultdict(<class 'tuple'>, {'a': 1, 'e': 2, 'd': 3, 'b': 4, 'c': None, 'abc': ()})


1

In [94]:
print(d.get('a'))
print(d.get('alo'))
print(d.get('abc', 400))
print(d.get('d', 400))
print(d)

None
3
400
None
{'c': 1, 'b': 2, 'alo': 3, 'nova_chave': 'um valor', 'd': None}


### Ordered dict

O ordered dict mantém a ordenação de **inserção** do objeto. Usando o método _popitem()_ é possível remover um elemento seguindo os padrões LIFO ou FIFO.

LIFO = Last in first out (pilha)
FIFO = First in last out (fila)

1. https://github.com/python/cpython/blob/master/Lib/collections/__init__.py
1. https://github.com/python/cpython/blob/master/Objects/odictobject.c

In [100]:
from collections import OrderedDict

od = OrderedDict()

od['c'] = 1
od['a'] = 2
od['e'] = 4
od['b'] = 5
od['d'] = 3


print(od)

for item in od:
  print(item)

OrderedDict([('c', 1), ('a', 2), ('e', 4), ('b', 5), ('d', 3)])

c
a
e
b
d


In [99]:
od = {}
od['c'] = 1
od['a'] = 2
od['e'] = 4
od['b'] = 5
od['d'] = 3


print(od)

for item in od:
  print(item)

{'c': 1, 'a': 2, 'e': 4, 'b': 5, 'd': 3}
c
a
e
b
d


### O método update
O método _update()_ espera receber como parâmetro um objeto iterável pelas chaves, _dict_ por exemplo, itera por elas e adiciona no objeto que a chamou.

In [102]:
m = {'chave': 'a', 'outra_chave': 1}
print(d)
d.update(m)
print(d)
d.update(od)
print(d)
d.update([1, 2, 4])


{'c': 1, 'b': 5, 'alo': 3, 'nova_chave': 'um valor', 'd': 3, 'chave': 'a', 'outra_chave': 1, 'a': 2, 'e': 4}
{'c': 1, 'b': 5, 'alo': 3, 'nova_chave': 'um valor', 'd': 3, 'chave': 'a', 'outra_chave': 1, 'a': 2, 'e': 4}
{'c': 1, 'b': 5, 'alo': 3, 'nova_chave': 'um valor', 'd': 3, 'chave': 'a', 'outra_chave': 1, 'a': 2, 'e': 4}


TypeError: ignored

### Tratando chaves ausentes com setdefault

setdefault: https://docs.python.org/3/library/stdtypes.html#dict.setdefault


In [None]:
# adapted from Alex Martelli's example in "Re-learning Python"
# http://www.aleax.it/Python/accu04_Relearn_Python_alex.pdf
# (slide 41) Ex: lines-by-word file index

# BEGIN INDEX0
"""Build an index mapping word -> list of occurrences"""

import sys
import re

WORD_RE = re.compile('\w+')

index = {}
with open(sys.argv[1], encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            # this is ugly; coded like this to make a point
            occurrences = index.get(word, [])  # <1>
            occurrences.append(location)       # <2>
            index[word] = occurrences          # <3>

# print in alphabetical order
for word in sorted(index, key=str.upper):
    print(word, index[word])
# END INDEX0


In [None]:
# adapted from Alex Martelli's example in "Re-learning Python"
# http://www.aleax.it/Python/accu04_Relearn_Python_alex.pdf
# (slide 41) Ex: lines-by-word file index

# BEGIN INDEX
"""Build an index mapping word -> list of occurrences"""

import sys
import re

WORD_RE = re.compile('\w+')

index = {}
with open(sys.argv[1], encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            index.setdefault(word, []).append(location)  # <1>

# print in alphabetical order
for word in sorted(index, key=str.upper):
    print(word, index[word])
# END INDEX


In [26]:
my_dict = {'nome': 'pessoa', 'idade': 10, 'sei la': 'beleza'}

my_dict.setdefault('a', 'se não existe a chave, me coloca')
my_dict.setdefault('nome', 'se não existe a chave, me coloca')

print(my_dict)

{'nome': 'pessoa', 'idade': 10, 'sei la': 'beleza', 'a': 'se não existe a chave, me coloca'}
