<div style="text-align: center"> <h1> 
Dicionários
    </h1> </div>

Dicionários são um dos
melhores recursos do Python; eles são os blocos de montar de muitos algoritmos eficientes
e elegantes.

<div style="text-align: center"> <h2> 
Um dicionário é um mapeamento
    </h2> </div>

Um dicionário se parece com uma lista, mas é mais geral. Em uma lista, os índices têm
que ser números inteiros; em um dicionário, eles podem ser de (quase) qualquer tipo.
Um dicionário contém uma coleção de índices, que se chamam chaves e uma coleção de
valores. Cada chave é associada com um único valor. A associação de uma chave e um
valor chama-se par chave-valor ou item.
Em linguagem matemática, um dicionário representa um mapeamento de chaves a valores,
para que você possa dizer que cada chave “mostra o mapa a” um valor. Como exemplo,
vamos construir um dicionário que faz o mapa de palavras do inglês ao português, portanto
as chaves e os valores são todos strings.

In [5]:
"""A função dict cria um novo dicionário sem itens. Como dict é o nome de uma função
integrada, você deve evitar usá-lo como nome de variável.
"""
eng2pr = dict()
eng2pr

{}

In [7]:
"""As chaves {} representam um dicionário vazio. Para acrescentar itens ao dicionário, você
pode usar colchetes:
"""
eng2pr['one'] = 'um'

In [8]:
"""Esta linha cria um item que mapeia da chave ‘one’ ao valor ‘uno’. Se imprimirmos o
dicionário novamente, vemos um par chave-valor com dois pontos entre a chave e o valor:"""
eng2pr

{'one': 'um'}

In [10]:
"""Este formato de saída também é um formato de entrada. Por exemplo, você pode criar um
dicionário com três itens:"""
eng2pr = {'one': 'um', 'two': 'dois', 'three': 'três'}
eng2pr

{'one': 'um', 'two': 'dois', 'three': 'três'}

A ordem dos pares chave-valor pode não ser a mesma. Se você digitar o mesmo exemplo
no seu computador, pode receber um resultado diferente. Em geral, a ordem dos itens em
um dicionário é imprevisível.
No entanto, isso não é um problema porque os elementos de um dicionário nunca são
indexados com índices de números inteiros. Em vez disso, você usa as chaves para
procurar os valores correspondentes:

In [11]:
eng2pr['two']

'dois'

In [12]:
"""A chave 'two' sempre mapeia ao valor 'dos', assim a ordem dos itens não importa.
Se a chave não estiver no dicionário, você recebe uma exceção:"""
eng2pr['four']

KeyError: 'four'

In [13]:
"""A função len é compatível com dicionários; ela devolve o número de pares chave-valor:"""
len(eng2pr)

3

In [14]:
"""O operador in funciona em dicionários também; ele acusa se algo aparece como chave no
dicionário (aparecer como valor não é o suficiente)."""
'one' in eng2pr

True

In [16]:
'um' in eng2pr

False

In [18]:
"""Para ver se algo aparece como um valor em um dicionário, você pode usar o método
values, que devolve uma coleção de valores, e então usar o operador in:"""

vals = eng2pr.values()
'um' in vals

True

O operador in usa algoritmos diferentes para listas e dicionários. Para listas, ele procura
os elementos da lista em ordem, como descrito em “Busca”, na página 123. Conforme a
lista torna-se mais longa, o tempo de busca também fica proporcionalmente mais longo.
Para dicionários, o Python usa um algoritmo chamado hashtable (tabela de dispersão), que
tem uma propriedade notável: o operador in leva praticamente o mesmo tempo na busca,
não importa quantos itens estejam no dicionário.

<div style="text-align: center"> <h2> 
Um dicionário como uma coleção de contadores
    </h2> </div>

     Suponha que você receba uma string e queira contar quantas vezes cada letra aparece nela.
Há vários modos de fazer isso:
        
    1. Você pode criar 26 variáveis, uma para cada letra do alfabeto. Então pode atravessar a string e, para cada caractere, incrementar o contador correspondente, provavelmente usando uma condicional encadeada.
        
    2. Você pode criar uma lista com 26 elementos. Então pode converter cada caractere em um número (com a função integrada ord), usar o número como índice na lista e incrementar o respectivo contador.
        
    3. Você pode criar um dicionário com caracteres como chaves e contadores como valores correspondentes. Na primeira vez que visse um caractere, você acrescentaria um item ao dicionário. Depois disso, incrementaria o valor de um item existente.
    

In [21]:
"""Cada uma dessas opções executa o mesmo cálculo, mas o implementa de forma diferente.
Uma implementação é um modo de executar um cálculo; algumas implementações são
melhores que outras. Por exemplo, uma vantagem da implementação de dicionários é que
não precisamos saber de antemão quais letras aparecem na string e só é preciso criar
espaço para as letras que realmente venham a aparecer."""

def histogram(s): #O nome da função é histogram, um termo estatístico para uma coleção de contadores (ou frequências).
    d = dict()
    for c in s:
        if c not in d:
            d[c] = 1
        else:
            d[c] += 1
    return d

In [22]:
"""A primeira linha da função cria um dicionário vazio. O loop for atravessa a string. Cada
vez que passa pelo loop, se o caractere c não estiver no dicionário, criamos um item com a
chave c e o valor inicial 1 (pois já vimos esta letra uma vez). Se o c já estiver no
dicionário, incrementamos d [c].
Funciona assim:"""
h = histogram ("brontosaurus")
h

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

O histograma indica que as letras ‘a’ e ‘b’ aparecem uma vez; ‘o’ aparece duas vezes, e
assim por diante.

In [23]:
"""Os dicionários têm um método chamado get, que toma uma chave e um valor padrão. Se a
chave aparecer no dicionário, get retorna o valor correspondente; se não for o caso, ele
retorna o valor padrão. Por exemplo:"""
h = histogram ('a')
h

{'a': 1}

In [24]:
h.get('a',0)

1

In [25]:
h.get('b',0)

0

<div style="text-align: center"> <h2> 
Loop e dicionários
    </h2> </div>

In [26]:
"""Se usar um dicionário em uma instrução for, ela percorre as chaves do dicionário. Por
exemplo, print_hist exibe cada chave e o valor correspondente:"""
def print_hist(h):
    for c in h:
        print(c, h[c])

In [27]:
h = histogram('parrot')
print_hist(h)

p 1
a 1
r 2
o 1
t 1


In [28]:
"""Novamente, as chaves não estão em nenhuma ordem determinada. Para atravessar as
chaves em ordem ascendente, você pode usar a função integrada sorted:"""
for key in sorted(h):
    print(key, h[key])

a 1
o 1
p 1
r 2
t 1


<div style="text-align: center"> <h2> 
Busca reversa
    </h2> </div>

Considerando um dicionário d e uma chave k, é fácil encontrar o valor correspondente v =
d [k]. Esta operação chama-se busca.
Mas e se você tiver v e quiser encontrar k? Você tem dois problemas: em primeiro lugar,
pode haver mais de uma chave que esteja mapeada ao valor v. Dependendo da aplicação,
quem sabe você pode escolher um, ou talvez tenha de fazer uma lista que contenha todos
eles. Em segundo lugar, não há sintaxe simples para fazer uma busca reversa; é preciso
procurar.

In [31]:
"""Aqui está uma função que recebe um valor e retorna a primeira chave mapeada ao valor
dado:"""
def reverse_lookup(d,v):
    for k in d:
        if d[k] == v:
            return k
    raise LookupError()

Essa função é mais um exemplo do padrão de busca, mas usa um recurso que ainda não
tínhamos visto: raise. A instrução raise causa uma exceção; neste caso, causa um
LookupError, que é uma exceção integrada, usada para indicar que uma operação de busca
falhou.

In [33]:
"""Se chegarmos ao fim do loop significa que v não aparece no dicionário como um valor,
portanto apresentaremos uma exceção."""
h = histogram('parrot') #bem sucedida
k = reverse_lookup(h,2)
k

'r'

In [35]:
k = reverse_lookup(h,3) #mal sucedida

LookupError: 

O efeito causado por você ao apresentar uma exceção é igual ao causado pelo Python
quando faz o mesmo: ele exibe um traceback e uma mensagem de erro.
A instrução raise pode receber uma mensagem de erro detalhada como argumento
opcional. Por exemplo:

In [36]:
raise LookupError('value does not appear in the dictionary')

LookupError: value does not appear in the dictionary

Uma busca reversa é muito mais lenta que uma busca no sentido normal; se for preciso
fazê-lo muitas vezes, ou se o dicionário ficar muito grande, o desempenho do seu
programa será prejudicado.

<div style="text-align: center"> <h2> 
Dicionários e listas
    </h2> </div>

As listas podem aparecer como valores em um dicionário. Por exemplo, se você receber
um dicionário que mapeie letras e frequências, é uma boa ideia invertê-lo; isto é, crie um
dicionário que mapeie de frequências a letras. Como pode haver várias letras com a
mesma frequência, cada valor no dicionário invertido deve ser uma lista de letras.

In [37]:
"""Aqui está uma função que inverte um dicionário:"""
def invert_dict(d):
    inverse = dict()
    for key in d:
        val = d[key]
        if val not in inverse:
            inverse[val] = [key]
        else:
            inverse[val].append(key)
    return inverse

Cada vez que o programa passar pelo loop, a key recebe uma chave de d e val recebe o
valor correspondente. Se val não estiver em inverse significa que não foi vista antes, então
criamos um item e o inicializamos com um item avulso (em inglês, singleton, uma lista
que contém um único elemento). Se não for o caso é porque vimos esse valor antes, então
acrescentamos a chave correspondente à lista.

In [38]:
hist = histogram('parrot')
hist

{'p': 1, 'a': 1, 'r': 2, 'o': 1, 't': 1}

In [39]:
inverse = invert_dict(hist)
inverse

{1: ['p', 'a', 'o', 't'], 2: ['r']}

In [40]:
"""As listas podem ser valores em um dicionário, como mostra este exemplo, mas não podem
ser chaves. Isso é o que acontece se você tentar:"""
t = [1,2,3]
d = dict()
d[t] = 'oops'

TypeError: unhashable type: 'list'

Já mencionei que um dicionário é implementado usando uma hashtable e isso significa
que é preciso que as chaves possam ser hashable (que seja possível computar seu hash, e
que este valor de hash seja imutável).
hash é uma função que recebe um valor (de qualquer tipo) e devolve um número inteiro.
Dicionários usam esses números inteiros, chamados valores hash, para guardar e buscar
pares chave-valor.

Este sistema funciona perfeitamente se as chaves forem imutáveis. Porém, se as chaves
são mutáveis, como listas, coisas ruins acontecem. Por exemplo, quando você cria um par
chave-valor, o Python guarda a chave na posição correspondente. Se você modificar a
chave e então guardá-la novamente, ela iria para uma posição diferente. Nesse caso, você
poderia ter duas entradas para a mesma chave, ou pode não conseguir encontrar uma
chave. De qualquer forma, o dicionário não funcionaria corretamente.
É por isso que as chaves têm de ser hashable, e tipos mutáveis como listas, não são. A
forma mais simples de resolver esta limitação é usar tuplas, que serão vistas no próximo
capítulo.
Como os dicionários são mutáveis, eles não podem ser usados como chaves, mas podem
ser usados como valores.

<div style="text-align: center"> <h2> 
Variáveis globais
    </h2> </div>

<div>A estrutura known criada fora da função, então ao frame especial
chamado __main__. As variáveis em __main__ às vezes são chamadas de globais, porque
podem ser acessadas de qualquer função. Em contraste com as variáveis locais, que
desaparecem quando sua função termina, as variáveis globais persistem de uma chamada
da função à seguinte.</div>

In [41]:
"""É comum usar variáveis globais para flags; isto é, variáveis booleanas que indicam
(“flag”) se uma condição é verdadeira. Por exemplo, alguns programas usam um flag
denominado verbose para controlar o nível de detalhe da saída:"""

verbose = True
def example1():
    if verbose:
        print('Running example1')

In [42]:
"""Se tentar reatribuir uma variável global, você pode se surpreender. O próximo exemplo
mostra como acompanhar se a função foi chamada:"""
been_called = False
def example2():
    been_called = True #Errado
    

Porém, se executá-la, você verá que o valor de been_called não se altera. O problema é
que example2 cria uma nova variável local chamada been_called. A variável local some
quando a função termina e não tem efeito sobre a variável global.

In [43]:
"""Para reatribuir uma variável global dentro de uma função é preciso declarar a variável
como global antes de usá-la:"""
been_called = False 
def example2():
    global been_called
    been_called = True

A instrução global diz ao interpretador algo como “Nesta função, quando digo
been_called, estou falando da variável global; não crie uma local”.

In [44]:
"""Aqui está um exemplo que tenta atualizar uma variável global:"""
count = 0
def example3():
    count = count + 1 #Errado

In [50]:
a = example3()
a

UnboundLocalError: local variable 'count' referenced before assignment

O Python supõe que count seja local, e dentro desta suposição, a variável está sendo lida
antes de ser escrita. A solução, mais uma vez, é declarar count como global:

In [51]:
def example3():
    global count
    count + 1

In [55]:
a = example3()
a

In [56]:
"""Se uma variável global se referir a um valor mutável, você pode alterar o valor sem
declarar a variável:"""

known = {0:0, 1:1}
def example4():
    known[2] = 1

In [57]:
"""Então você pode adicionar, retirar e substituir elementos de uma lista global ou dicionário,
mas se quiser reatribuir a variável, precisa declará-la:"""
def example5():
    global known
    known = dict()

****As variáveis globais podem ser úteis, mas se você tiver muitas delas e alterá-las com
frequência, isso poderá dificultar a depuração do programa.

<div style="text-align: center"> <h2> 
Depuração
    </h2> </div>

<div>
    <p>
    Ao trabalhar com conjuntos de dados maiores, depurar exibindo e verificando a saída à
mão pode ser trabalhoso. Aqui estão algumas sugestões para depurar grandes conjuntos de
dados:
<br>Reduza a entrada</br>
Se for possível, reduza o tamanho do conjunto de dados. Por exemplo, se o programa
lê um arquivo de texto, comece com apenas as 10 primeiras linhas, ou com o menor
exemplo que puder encontrar. Você pode editar os próprios arquivos ou alterar o
programa para que leia só as primeiras n linhas (é melhor).
<br>Se houver um erro, você pode reduzir n ao menor valor que manifeste o erro, e então
aumentá-lo gradativamente até encontrar e corrigir o erro.</br>
<br>Verifique os resumos e tipos</br>
Em vez de imprimir e verificar o conjunto de dados inteiro, pense em exibir resumos
dos dados: por exemplo, o número de itens em um dicionário ou o total de uma lista
de números.
<br>Uma causa comum de erros em tempo de execução são valores de tipo incompatível.
Para depurar essa espécie de erro, muitas vezes basta exibir o tipo de um valor.</br>
<br>Crie autoverificações</br>
É possível escrever o código para verificar erros automaticamente. Por exemplo, se
estiver calculando a média de uma lista de números, você pode verificar se o
resultado não é mais alto que o maior elemento da lista ou mais baixo que o menor.
<br>Isso é chamado de “verificação de sanidade” porque descobre resultados “insanos”.
Outro tipo de verificação compara os resultados de dois cálculos diferentes para ver
se são consistentes. Isso é chamado de “verificação de consistência”.<br>
<br>Formate a saída</br>
A formatação da saída para depuração pode facilitar a busca de erros. 
Reforçando, o tempo que você passar construindo o scaffolding (o andaime) pode reduzir
o tempo de depuração.
    </p>
    </div>