## Dicionários

O Python oferece uma estrutura de dados bastante eficiente para registo de correspondências (mappings). Podemos ver estra estrutura de dados (Dicionários) como a implementação de uma função finita entre um elemento chave e um elemento valor. O elemento valor pode ser complexo e até ser ele próprio um dicionário.

Para esta disciplina vai ser bastante úitl para a implementação de grafos e consequentemente a automatização dos autómatos dados nas aulas teóricas.

Dicionários sao uma generalização de arrays: em vez de somente valores inteiros dentro de uma determinada gama poderem ser índices dos array, em dicionários qualquer tipo de dado pode ser índice do "array". Na verdade, não falamos em índices mas sim em chaves. E temos uma coleção de chaves a fazer correpondencia com uma coleção de valores. Temos assim uma associação chave-valor, em que
a cada chave corresponde um único valor!

Um dicionário representa pois um mapeamento ("mapping") ou função finita entre chaves e valores. 

Subjacente à implementação de um dicionário existe normalmente uma estrutura de dados de mais baixo nível, conhecida como $hashtable$. 
Por trás desta correspondencia entre chaves e valor há um processo "mais ou menos complexo" de associar cada chave à posição de memória onde está o correspondente valor (tal qual os índices no array). Este processo chama-se $hashing$ e faz uso de uma função matemática de $hash$ para dada a chave obter a posição do valor. Devemos usar chaves simples e.g. inteiros, strings ou composição de ambos para facilitar o processo de hashing. As chaves não devem ser objetos mutáveis (como listas)!!!

As chavetas $\{ \}$ representam o dicionário vazio. Vamos ter este dicionário para criar uma associação entre palavras em inglês e em português. Podemos definir o mapeamento ponto a ponto (no exemplo em baixo entre 'one' palavra inglesa e 'um' palavra portuguesa), ou criar um conjunto de associações de uma vez só!

In [None]:
dict1 = dict()
print(dict1)

dict1['one'] = 'um'
print(dict1)

dict1 = {'one':'um', 'two': 'dois', 'three': 'três', 'four': 'quatro', 'five':'cinco', 'six':'seis', 'ten':'dez'}

print(dict1)

{}
{'one': 'um'}
{'one': 'um', 'two': 'dois', 'three': 'três', 'four': 'quatro', 'five': 'cinco', 'six': 'seis', 'ten': 'dez'}


A ordem de introdução dos dados
nem sempre tem a ver com a sua representação interna...
Dicionarios são das representações mais eficientes quando queremos ter informação que vai ser exaustivamente pesquisada e que tem poucas alterações. A complexidade da pesquisa da informação é de tempo (tendencialmente) constante!

In [None]:
# procurar uma informação dada a chave de acesso
A = dict1['two']
print(A)

# se a chave não existir obtemos um erro!
print(dict1['nine'])

dois


KeyError: ignored

In [None]:
# Eliminar uma correspondência num dicionário com o comando 'del'
del dict1['one']
print(dict1)

{'two': 'dois', 'three': 'três', 'four': 'quatro', 'five': 'cinco', 'six': 'seis', 'ten': 'dez'}


As funções `len`e `in` funcionam em dicionários. `in` testa a pertença de uma chave ao domínio de um dicionário

In [None]:
print(len(dict1))

print('two' in dict1)

print('nine' in dict1)

6
True
False


Os operadores `keys()` e `values()` devolvem listas contendo respectivamente as chaves e os valores de um dicionário. 

In [None]:
for x in dict1.keys():
    print(x)

two
three
four
five
six
ten


In [None]:
for x in dict1.values():
    print(x)

dois
três
quatro
cinco
seis
dez


A função seguinte recebe um texto (uma string) e cria um dicionário contendo uma contagem do número de ocorrências de cada letra (não distinguindo minúsculas e maiúsculas). É aquilo a que normalmente se chama um _histograma_.

In [None]:
import string


# função que produz um dicionário com a frequência das letras
def histo(texto):
    d = dict()
    texto = texto.upper()

    for c in list(string.ascii_uppercase): 
        d[c] = 0
    
#    for i in range(0,len(texto)):
#        if(texto[i] in d):      # Caracteres que não letras são ignorados
#            d[texto[i]] += 1
                
    for c in texto:
        if(c in d):      # Caracteres que não letras são ignorados
            d[c] += 1
                
    return d



# imprime o histograma
def printa_hist(d):
    for k in sorted(d.keys()):
        print(k+str(":  "), end="")
        for x in range(d[k]):
            print("*", end="")
        print()
        

texto = "I am a legend. You can be one"
a = histo(texto)
printa_hist(a)



A:  ***
B:  *
C:  *
D:  *
E:  ****
F:  
G:  *
H:  
I:  *
J:  
K:  
L:  *
M:  *
N:  ***
O:  **
P:  
Q:  
R:  
S:  
T:  
U:  *
V:  
W:  
X:  
Y:  *
Z:  


### Exercício 1

Implementar um função que dado um array de valores numéricos devolve a moda dessa coleção. Usar dicionários. 
N.B: se houver mais do que um elemento com a frequência máxima, deverá ser devolvida uma lista com todos eles. 

Por exemplo, para o array `[10,20,30,30,20,30,10,0,20]` a função deverá calcular como resultado `[20, 30]``. 

Será que o problema poderia ser resolvido com utilização de um array auxiliar como histograma, em vez de um dicionário? Que vantagens haverá na utilização de um dicionário? 



In [None]:
def moda(a) : 
    d = dict()
    for x in a : 
        if x not in d : d[x] = 1
        else : d[x] += 1
    print(d)            
    m = max(d.values())
    result = []
    for k in d : 
        if d[k]==m : result += [k]
    return result


moda([10,20,30,30,20,30,10,0,20])

{10: 2, 20: 3, 30: 3, 0: 1}


[20, 30]

### Exercício 2

Escrever uma função que inverte um dicionário. Note que a função representada por um dicionário pode não ser injectiva, e por essa razão o dicionário invertido deve ter listas como valores associados às chaves.

In [None]:
# Inversão de um dicionario
def invert_dict(d):
    inverse = dict()
    for key in d:
        val = d[key]
        if val not in inverse:
            inverse[val] = [key]
        else:
            inverse[val] += [key]
            
    return inverse

print(invert_dict(dict1))
print()


texto = "Algo para testar esta treta agora tambem"
a = histo(texto)
printa_hist(a)

print(invert_dict(a))

{'um': ['one'], 'dois': ['two'], 'três': ['three'], 'quatro': ['four'], 'cinco': ['five'], 'seis': ['six'], 'dez': ['ten']}

A:  *********
B:  *
C:  
D:  
E:  ****
F:  
G:  **
H:  
I:  
J:  
K:  
L:  *
M:  **
N:  
O:  **
P:  *
Q:  
R:  ****
S:  **
T:  ******
U:  
V:  
W:  
X:  
Y:  
Z:  
{9: ['A'], 1: ['B', 'L', 'P'], 0: ['C', 'D', 'F', 'H', 'I', 'J', 'K', 'N', 'Q', 'U', 'V', 'W', 'X', 'Y', 'Z'], 4: ['E', 'R'], 2: ['G', 'M', 'O', 'S'], 6: ['T']}


Os dicionários, tal como os _arrays_/listas são estruturas de dados mutáveis, e podem ser modificados pelas funções que os recebem.

In [None]:
# Função que recebe um dicionário cujos valores são listas, 
# e acrescenta um valor à lista associada a uma dada chave.
def add (d, k, v) : 
    if k not in d : d[k] = []
    d[k] += v    


dxy = dict()
add (dxy, 10, ["aa","bb"])
add (dxy, 20, ["cc","dd"])
add (dxy, 10, ["ee"])
print(dxy)


{10: ['aa', 'bb', 'ee'], 20: ['cc', 'dd']}


### Exercício  3 

Pretende-se representar as compras que cada cliente de um supermercado faz num dado período de tempo. Assim devemos manter uma estrutura de dados que associa números de cliente com lista de  compras. Nesta lista regista-se o código de cada item comprado. Desenvolva funções para cada uma das seguintes tarefas:

* adicionar novos items (novas compras) a um cliente,
* identificar os clientes que compraram um dado item,
* identificar o cliente com maior número de items comprados,
* contar o número de clientes que comprara um dado item.

Por exemplo uma sessão de interação com esta estrutura de dados podia ser: 

`dcompras = dict()`

`comprou (dcompras, 1237, ['batatas'])`

`quemComprou(dcompras,'batatas')`

`> [...,1237]`

`quemComprouMais(dcompras)`

`> [...,908]`

`quantosCompraram(dcompras,'manteiga')`


`> 27`
