# Capítulo 11: Dicionários

<h2> 11.1 - Um dicionário é um mapeamento </h2>

Um dicionário se parece com uma lista, mas é mais geral. Em uma lista, os índices têm que ser números inteiros; em um dicionário, eles podem ser de (quase) qualquer tipo.
Um dicionário contém uma coleção de índices, que se chamam chaves e uma coleção de valores. Cada chave é associada com um único valor. A associação de uma chave e um valor chama-se par chave-valor ou item.

Em linguagem matemática, um dicionário representa um mapeamento de chaves a valores, para que você possa dizer que cada chave “mostra o mapa a” um valor. Como exemplo, vamos construir um dicionário que faz o mapa de palavras do inglês ao espanhol, portanto as chaves e os valores são todos strings.

A função dict cria um novo dicionário sem itens. Como dict é o nome de uma função integrada, você deve evitar usá-lo como nome de variável.

In [1]:
eng2sp = dict()
eng2sp

{}

In [2]:
type(eng2sp)

dict

As chaves {} representam um dicionário vazio. Para acrescentar itens ao dicionário, você pode usar colchetes:

In [3]:
eng2sp['one'] = 'uno'

In [4]:
eng2sp

{'one': 'uno'}

Este formato de saída também é um formato de entrada. Por exemplo, você pode criar um dicionário com três itens:

In [5]:
eng2sp = {'one': 'uno', 'two': 'dos', 'three': 'tres'}
eng2sp

{'one': 'uno', 'two': 'dos', 'three': 'tres'}

In [6]:
eng2sp

{'one': 'uno', 'two': 'dos', 'three': 'tres'}

A ordem dos pares chave-valor pode não ser a mesma. Se você digitar o mesmo exemplo no seu computador, pode receber um resultado diferente. Em geral, a ordem dos itens em um dicionário é imprevisível.

No entanto, isso não é um problema porque os elementos de um dicionário nunca são indexados com índices de números inteiros. Em vez disso, você usa as chaves para procurar os valores correspondentes:

In [7]:
eng2sp['two']

'dos'

A chave 'two' sempre mapeia ao valor 'dos', assim a ordem dos itens não importa.

Se a chave não estiver no dicionário, você recebe uma exceção:

In [8]:
eng2sp['four']

KeyError: 'four'

A função len é compatível com dicionários; ela devolve o número de pares chave-valor:

In [11]:
len(eng2sp)

3

O operador in funciona em dicionários também; ele acusa se algo aparece como chave no dicionário (aparecer como valor não é o suficiente).

In [12]:
'one' in eng2sp

True

In [13]:
'uno' in eng2sp

False

Para ver se algo aparece como um valor em um dicionário, você pode usar o método
values, que devolve uma coleção de valores, e então usar o operador in:

In [14]:
valores = eng2sp.values()

In [15]:
'uno' in valores

True

In [16]:
type(valores)

dict_values

O operador in usa algoritmos diferentes para listas e dicionários. Para listas, ele procura os elementos da lista em ordem, como descrito em “Busca”, na página 123. Conforme a lista torna-se mais longa, o tempo de busca também fica proporcionalmente mais longo.
Para dicionários, o Python usa um algoritmo chamado hashtable (tabela de dispersão), que tem uma propriedade notável: o operador in leva praticamente o mesmo tempo na busca, não importa quantos itens estejam no dicionário. 

<h2> 11.2 - Um dicionário como uma coleção de contadores </h2>

Suponha que você receba uma string e queira contar quantas vezes cada letra aparece nela. Há vários modos de fazer isso:
1. Você pode criar 26 variáveis, uma para cada letra do alfabeto. Então pode atravessar a string e, para cada caractere, incrementar o contador correspondente, provavelmente usando uma condicional encadeada.
2. Você pode criar uma lista com 26 elementos. Então pode converter cada caractere em um número (com a função integrada ord), usar o número como índice na lista e incrementar o respectivo contador.
3. Você pode criar um dicionário com caracteres como chaves e contadores como
valores correspondentes. Na primeira vez que visse um caractere, você acrescentaria um item ao dicionário. Depois disso, incrementaria o valor de um item existente.


<h2> Criando os modos para testes: </h2>

1. Você pode criar 26 variáveis, uma para cada letra do alfabeto. Então pode 
atravessar a string e, para cada caractere, incrementar o contador correspondente, provavelmente usando uma condicional encadeada.

In [17]:
# 26 variáveis (contadores) para as 26 letras do alfabeto
var_a = 0
var_b = 0
var_c = 0
var_d = 0
var_e = 0
var_f = 0
var_g = 0
var_h = 0
var_i = 0
var_j = 0
var_k = 0
var_l = 0
var_m = 0
var_n = 0
var_o = 0
var_p = 0
var_q = 0
var_r = 0
var_s = 0
var_t = 0
var_u = 0
var_v = 0
var_w = 0
var_x = 0
var_y = 0
var_z = 0

In [18]:
string = 'abcdefghijklmnopqrstuvwxyz'

for letter in string:
    if letter == 'a':
        var_a += 1
    elif letter == 'b':
        var_b += 1
    elif letter == 'c':
        var_c += 1
    elif letter == 'd':
        var_d += 1
    elif letter == 'e':
        var_e += 1
    elif letter == 'f':
        var_f += 1
    elif letter == 'g':
        var_g += 1
    elif letter == 'h':
        var_h += 1
    elif letter == 'i':
        var_i += 1
    elif letter == 'j':
        var_j += 1
    elif letter == 'k':
        var_k += 1
    elif letter == 'l':
        var_l += 1
    elif letter == 'm':
        var_m += 1
    elif letter == 'n':
        var_n += 1
    elif letter == 'o':
        var_o += 1
    elif letter == 'p':
        var_p += 1
    elif letter == 'q':
        var_q += 1
    elif letter == 'r':
        var_r += 1
    elif letter == 's':
        var_s += 1
    elif letter == 't':
        var_t += 1
    elif letter == 'u':
        var_u += 1
    elif letter == 'v':
        var_v += 1
    elif letter == 'w':
        var_w += 1
    elif letter == 'x':
        var_x += 1
    elif letter == 'y':
        var_y += 1
    elif letter == 'z':
        var_z += 1

In [19]:
print(var_a)
print(var_b)
print(var_c)
print(var_d)
print(var_e)
print(var_f)
print(var_g)
print(var_h)
print(var_i)
print(var_j)
print(var_k)
print(var_l)
print(var_m)
print(var_n)
print(var_o)
print(var_p)
print(var_q)
print(var_r)
print(var_s)
print(var_t)
print(var_u)
print(var_v)
print(var_w)
print(var_x)
print(var_y)
print(var_z)

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1


2. Você pode criar uma lista com 26 elementos. Então pode converter cada caractere em um número (com a função integrada ord), usar o número como índice na lista e incrementar o respectivo contador.

In [31]:
lista_alfabeto = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
palavra = 'abcdefghijklmnopqrstuvwxyz'

In [32]:
def contar_letras(string):
    # Cria uma lista com 26 elementos, todos inicializados com 0
    contagem = [0] * 26

    # Itera sobre cada caractere no texto
    for letter in palavra:
        # verifica se o caractere é uma letra minúscula
        if 'a' <= letter <= 'z':
            # calcula o índice para o caractere
            index = ord(letter) - ord('a')
            # Incrementa o contador no índice correspondente
            contagem[index] += 1

    return contagem

In [33]:
contar_letras(palavra)

[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

3. Você pode criar um dicionário com caracteres como chaves e contadores como
valores correspondentes. Na primeira vez que visse um caractere, você acrescentaria um item ao dicionário. Depois disso, incrementaria o valor de um item existente.

In [34]:
dicionario_de_letras = {
    'a': 0, 'b': 0, 'c': 0, 'd': 0, 'e': 0, 'f': 0, 'g': 0, 'h': 0, 'i': 0, 
    'j': 0, 'k': 0, 'l': 0, 'm': 0, 'n': 0, 'o': 0, 'p': 0, 'q': 0, 'r': 0, 
    's': 0, 't': 0, 'u': 0, 'v': 0, 'w': 0, 'x': 0, 'y': 0, 'z': 0
}

string = 'aaaaabcdefghijklmnopqrstuvwwwwxyz'

In [38]:
def contadorLetras(string):
    quantidade = 0

    for letra in dicionario_de_letras:
        if letra in string:
            quantidade = string.count(letra)
            dicionario_de_letras[letra] =  quantidade
            quantidade = 0
        else:
            continue

    return dicionario_de_letras

In [39]:

contadorLetras(string)

{'a': 5,
 'b': 1,
 'c': 1,
 'd': 1,
 'e': 1,
 'f': 1,
 'g': 1,
 'h': 1,
 'i': 1,
 'j': 1,
 'k': 1,
 'l': 1,
 'm': 1,
 'n': 1,
 'o': 1,
 'p': 1,
 'q': 1,
 'r': 1,
 's': 1,
 't': 1,
 'u': 1,
 'v': 1,
 'w': 4,
 'x': 1,
 'y': 1,
 'z': 1}

Cada uma dessas opções executa o mesmo cálculo, mas o implementa de forma diferente. Uma implementação é um modo de executar um cálculo; algumas implementações são melhores que outras. Por exemplo, uma vantagem da implementação de dicionários é que não precisamos saber de antemão quais letras aparecem na string e só é preciso criar espaço para as letras que realmente venham a aparecer.

In [49]:
def histogram(s):
    d = dict()
    
    for c in s: # vai percorrer cada letra da string 's'
        if c not in d: # verifica se a letra não existe no dicionário
            d[c] = 1   # caso não exista, será inserido o valor de 1 para aquela letra (indice) 
        else: # se não
            d[c] += 1 # caso já tenha, vai somar o valor já existente + 1
    
    return d

O nome da função é histogram, um termo estatístico para uma coleção de contadores (ou frequências).
A primeira linha da função cria um dicionário vazio. O loop for atravessa a string. Cada vez que passa pelo loop, se o caractere c não estiver no dicionário, criamos um item com a chave c e o valor inicial 1 (pois já vimos esta letra uma vez). Se o c já estiver no
dicionário, incrementamos d [c].


In [50]:
h = histogram('brontosaurus')
h

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

O histograma indica que as letras ‘a’ e ‘b’ aparecem uma vez; ‘o’ aparece duas vezes, e assim por diante.
Os dicionários têm um método chamado get, que toma uma chave e um valor padrão. Se a chave aparecer no dicionário, get retorna o valor correspondente; se não for o caso, ele retorna o valor padrão. Por exemplo:

In [9]:
h = histogram('a')
h

{'a': 1}

In [10]:
h.get('a', 0)

1

In [11]:
h.get('b', 0)

0

<b> Como exercício, use o get para escrever a função histogram de forma mais concisa. Tente
eliminar a instrução if. </b>

<b> COMPARAÇÃO DE SOLUÇÕES </b>

<b> SOLUÇÃO PRÓPRIA </b>

In [12]:
def histogram(s):
    d = dict()
    
    for c in s: # vai percorrer cada letra da string 's'
        d[c] = d.get(c, 0) + 1 
    
    return d

In [13]:
h = histogram('brontosaurus')
h

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

<b> SOLUÇÃO CHATGPT </b>

In [3]:
def histogram(s):
    d = dict()
    
    for c in s: # percorre cada letra da string 's'
        d[c] = d.get(c, 0) + 1 # obtém o valor atual de d[c] ou 0, e soma 1
    
    return d

<h2> 11.3 - Loop e dicionários </h2>

Se usar um dicionário em uma instrução for, ela percorre as chaves do dicionário. Por exemplo, print_hist exibe cada chave e o valor correspondente:

In [15]:
def print_hist(h):
    for c in h:
        print(c, h[c])

In [16]:
h = histogram('parrot')
print_hist(h)

p 1
a 1
r 2
o 1
t 1


Novamente, as chaves não estão em nenhuma ordem determinada. Para atravessar as chaves em ordem ascendente, você pode usar a função integrada sorted:

In [17]:
for key in sorted(h):
    print(key, h[key])

a 1
o 1
p 1
r 2
t 1


<h2> 11.4 - Busca reversa </h2>

Considerando um dicionário d e uma chave k, é fácil encontrar o valor correspondente v =
d [k]. Esta operação chama-se busca.

Mas e se você tiver v e quiser encontrar k? Você tem dois problemas: em primeiro lugar,
pode haver mais de uma chave que esteja mapeada ao valor v. Dependendo da aplicação,
quem sabe você pode escolher um, ou talvez tenha de fazer uma lista que contenha todos
eles. Em segundo lugar, não há sintaxe simples para fazer uma busca reversa; é preciso
procurar. Aqui está uma função que recebe um valor e retorna a primeira chave mapeada ao valor
dado:

In [4]:
def reverse_lookup(d, v):
    for k in d:
        if d[k] == v:
            return k
    
    raise LookupError()

Essa função é mais um exemplo do padrão de busca, mas usa um recurso que ainda não
tínhamos visto: raise. A instrução raise causa uma exceção; neste caso, causa um
LookupError, que é uma exceção integrada, usada para indicar que uma operação de busca
falhou.
Se chegarmos ao fim do loop significa que v não aparece no dicionário como um valor,
portanto apresentaremos uma exceção.

Aqui está um exemplo de uma busca reversa bem sucedida:

In [5]:
h = histogram('parrot')
k = reverse_lookup(h, 2)
k

'r'

E uma mal sucedida:

In [6]:
k = reverse_lookup(h, 3)
k

LookupError: 

O efeito causado por você ao apresentar uma exceção é igual ao causado pelo Python
quando faz o mesmo: ele exibe um traceback e uma mensagem de erro.
A instrução raise pode receber uma mensagem de erro detalhada como argumento
opcional. Por exemplo:

<code> 
>>> raise LookupError('value does not appear in the dictionary')
Traceback (most recent call last):
File "<stdin>", line 1, in ?
LookupError: value does not appear in the dictionary
</code>

Uma busca reversa é muito mais lenta que uma busca no sentido normal; se for preciso
fazê-lo muitas vezes, ou se o dicionário ficar muito grande, o desempenho do seu
programa será prejudicado.

<h2> 11.5 - Dicionários e listas </h2>

As listas podem aparecer como valores em um dicionário. Por exemplo, se você receber
um dicionário que mapeie letras e frequências, é uma boa ideia invertê-lo; isto é, crie um
dicionário que mapeie de frequências a letras. Como pode haver várias letras com a
mesma frequência, cada valor no dicionário invertido deve ser uma lista de letras.

Aqui está uma função que inverte um dicionário:

In [7]:
def invert_dict(d):
    inverse = dict()

    for key in d: # a cada chave do dicionário
        val = d[key] # val é igual ao valor no índice 'key'
        if val not in inverse: # se val (chave) não existir no dicionário 'inverse'
            inverse[val] = [key] # inverse[val] na posição de val será igual ao valor da chave 
        else:
            inverse[val].append(key)
    
    return inverse

Cada vez que o programa passar pelo loop, a key recebe uma chave de d e val recebe o
valor correspondente. Se val não estiver em inverse significa que não foi vista antes, então
criamos um item e o inicializamos com um item avulso (em inglês, singleton, uma lista
que contém um único elemento). Se não for o caso é porque vimos esse valor antes, então
acrescentamos a chave correspondente à lista.
Aqui está um exemplo:

In [8]:
hist = histogram('parrot')
hist

{'p': 1, 'a': 1, 'r': 2, 'o': 1, 't': 1}

In [9]:
inverse = invert_dict(hist)
inverse

{1: ['p', 'a', 'o', 't'], 2: ['r']}

Essa função invert_dict(d) faz o seguinte:

- Ela cria um novo dicionário chamado inverse, que será usado para armazenar o dicionário invertido.

- Depois, ela percorre cada chave (key) do dicionário original d.

- Para cada chave, ela obtém o valor correspondente (val).

- Se esse valor (val) ainda não estiver no dicionário inverse, isso significa que é a primeira vez que encontramos esse valor, então:

- Criamos uma nova entrada no inverse, onde o valor (val) será a nova chave, e a chave original (key) será armazenada em uma lista. Se o valor (val) já estiver no inverse, significa que já vimos esse valor antes, então:

- Apenas adicionamos a chave original (key) à lista associada a esse valor.
Em resumo, a função inverte o dicionário: os valores viram as chaves e as chaves viram valores (em uma lista, porque pode haver mais de uma chave com o mesmo valor).

A Figura 11.1 é um diagrama de estado mostrando hist e inverse. Um dicionário é
representado como uma caixa com o tipo dict acima dela e os pares chave-valor no
interior. Se os valores forem números inteiros, de ponto flutuante ou strings, desenho-os
dentro da caixa, mas normalmente prefiro desenhar listas do lado de fora, para manter o
diagrama simples.

![image.png](attachment:image.png)

As listas podem ser valores em um dicionário, como mostra este exemplo, mas não podem
ser chaves. Isso é o que acontece se você tentar:

In [10]:
t = [1, 2, 3]
d = dict()
d[t] = 'oops'

TypeError: unhashable type: 'list'

<h2> 11.6 - Memos </h2>

Se usou a função de fibonacci em “Mais um exemplo”, na página 101, pode ter notado que
quanto maior o argumento dado mais tempo a função leva para ser executada. Além disso,
o tempo de execução aumenta rapidamente.
Para entender por que, considere a Figura 11.2, que mostra o gráfico de chamada de
fibonacci com n=4.

![image.png](attachment:image.png)

Um gráfico de chamada mostra um conjunto de frames de função, com linhas que unem
cada frame aos frames das funções que chama. Na parte de cima do gráfico, fibonacci
com n=4 chama fibonacci com n=3 e n=2. Por sua vez, fibonacci com n=3 chama
fibonacci com n=2 e n=1. E assim por diante.

Conte quantas vezes fibonacci(0) e fibonacci(1) são chamadas. Essa é uma solução
ineficiente para o problema, e piora conforme o argumento se torna maior.
Uma solução é acompanhar os valores que já foram calculados, guardando-os em um
dicionário. Um valor calculado anteriormente que é guardado para uso posterior é
chamado de <b> memo </b>. Aqui está uma versão com memos de fibonacci:

In [11]:
known = {0:0, 1:1} # já sabemos que fibonacci(0) = 0 e fibonacci(1) = 1

def fibonacci(n): # se já calculamos fibonacci(n), pegamos o valor do dicionário
    if n in known:
        return known[n]
    
    # caso contrário, calculamos fibonacci(n-1) e fibonacci(n-2)
    res = fibonacci(n-1) + fibonacci(n-2)
    known[n] = res # guardamos esse resultado no dicionário para uso futuro
    
    return res

known é um dicionário que monitora os números de Fibonacci que já conhecemos. Começa
com dois itens: 0 mapeia a 0 e 1 mapeia a 1.
Sempre que fibonacci é chamada, ela verifica known. Se o resultado já estiver lá, pode
voltar imediatamente. Se não for o caso, é preciso calcular o novo valor, acrescentá-lo ao
dicionário e devolvê-lo.
Se você executar essa versão de fibonacci e a comparar com a original, descobrirá que é
muito mais rápida.

<b> Inicialização </b>
Temos o dicionário inicial: known = {0: 0, 1: 1}
Chamamos <b>fibonacci(5)</b>
Passo a passo da execução:
Chamada: <b>fibonacci(5)</b>

5 não está no dicionário, então a função vai calcular <b>fibonacci(4)</b> + <b>fibonacci(3)</b>.
Chamada: <b>fibonacci(4)</b>

4 não está no dicionário, então a função vai calcular <b>fibonacci(3)</b> + <b>fibonacci(2)</b>.
Chamada: <b>fibonacci(3)</b>

3 não está no dicionário, então a função vai calcular <b>fibonacci(2)</b> + <b>fibonacci(1)</b>.
Chamada: <b>fibonacci(2)</b>

2 não está no dicionário, então a função vai calcular <b>fibonacci(1)</b> + <b>fibonacci(0)</b>.
Chamada: <b>fibonacci(1)</b>

1 está no dicionário! Retorna 1.
Chamada: <b>fibonacci(0)</b>

0 está no dicionário! Retorna 0.

Agora que temos <b>fibonacci(1)</b> e <b>fibonacci(0)</b>, podemos calcular <b>fibonacci(2)</b>:

<code>
res = 1 + 0 = 1
</code>

- Armazenamos fibonacci(2) no dicionário: known[2] = 1.
- O dicionário agora é: {0: 0, 1: 1, 2: 1}.
- Retorna 1 para a chamada anterior (fibonacci(3)).

Continuando: <b> fibonacci(3)</b>

Agora que já temos <b>fibonacci(2) = 1</b> e <b>fibonacci(1) = 1</b>, podemos calcular <b>fibonacci(3)</b>:

<code>
res = 1 + 1 = 2
</code>

- Armazenamos <b>fibonacci(3)</b> no dicionário: known[3] = 2.
- O dicionário agora é: {0: 0, 1: 1, 2: 1, 3: 2}.
- Retorna 2 para a chamada anterior (<b>fibonacci(4)</b>).

Continuando: <b>fibonacci(4)</b>

Agora que já temos <b>fibonacci(3) = 2</b> e <b>fibonacci(2) = 1</b>, podemos calcular <b>fibonacci(4)</b>:

<code>
res = 2 + 1 = 3
</code>

- Armazenamos <b>fibonacci(4)</b> no dicionário: known[4] = 3.
- O dicionário agora é: {0: 0, 1: 1, 2: 1, 3: 2, 4: 3}.
- Retorna 3 para a chamada anterior (<b>fibonacci(5)</b>).

Finalmente: <b>fibonacci(5)</b>

Agora que já temos <b>fibonacci(4) = 3</b> e <b>fibonacci(3) = 2</b>, podemos calcular <b>fibonacci(5)</b>:

<code>
res = 3 + 2 = 5
</code>

- Armazenamos <b>fibonacci(5)</b> no dicionário: known[5] = 5.

- O dicionário agora é: {0: 0, 1: 1, 2: 1, 3: 2, 4: 3, 5: 5}.
- Retorna 5.

<h2> 11.7 - Variáveis globais </h2>

No exemplo anterior, known é criada fora da função, então pertence ao frame especial
chamado __main__. <b>As variáveis em __main__ às vezes são chamadas de globais, porque
podem ser acessadas de qualquer função</b>. Em contraste com as variáveis locais, que
desaparecem quando sua função termina, as variáveis globais persistem de uma chamada
da função à seguinte.

É comum usar variáveis globais para flags; isto é, variáveis booleanas que indicam
(“flag”) se uma condição é verdadeira. Por exemplo, alguns programas usam um flag
denominado verbose para controlar o nível de detalhe da saída:

In [12]:
verbose = True

def example1():
    if verbose:
        print('Running example1')

Se tentar reatribuir uma variável global, você pode se surpreender. O próximo exemplo
mostra como acompanhar se a função foi chamada:

In [16]:
been_called = False

def example2():
    been_called = True # ERRADO

In [17]:
been_called

False

Porém, se executá-la, você verá que o valor de been_called não se altera. O problema é
que example2 cria uma nova variável local chamada been_called. A variável local some
quando a função termina e não tem efeito sobre a variável global.

Para reatribuir uma variável global dentro de uma função é preciso declarar a variável
como global antes de usá-la:

In [18]:
been_called = False

def example2():
    global been_called
    been_called = True

In [19]:
example2()
been_called

True

A instrução global diz ao interpretador algo como “Nesta função, quando digo
been_called, estou falando da variável global; não crie uma local”.

Aqui está um exemplo que tenta atualizar uma variável global:

In [20]:
count = 0

def example3():
    count = count + 1 # ERRADO

Se executá-la, você recebe:

<code>
UnboundLocalError: local variable 'count' referenced before assignment
</code>

In [22]:
example3() # retorna esse erro pois transforma ela em variável local, e sendo local, ela não foi inicializada anteriormente

UnboundLocalError: local variable 'count' referenced before assignment

O Python supõe que count seja local, e dentro desta suposição, a variável está sendo lida
antes de ser escrita. A solução, mais uma vez, é declarar count como global:

In [23]:
def example3():
    global count
    count += 1

In [25]:
example3()
count

2

Se uma variável global se referir a um valor mutável, você pode alterar o valor sem
declarar a variável:

In [26]:
known = {0:0, 1:1}

def example4():
    known[2] = 1

In [27]:
example4()
known

{0: 0, 1: 1, 2: 1}

Então você pode adicionar, retirar e substituir elementos de uma lista global ou dicionário,
mas se quiser reatribuir a variável, precisa declará-la:

In [28]:
def example5():
    global known
    known = dict()

In [29]:
example5()
known

{}

<b> As variáveis globais podem ser úteis, mas se você tiver muitas delas e alterá-las com
frequência, isso poderá dificultar a depuração do programa. </b>

Variáveis globais podem ser acessadas e modificadas em qualquer parte do programa, o que pode parecer conveniente em alguns casos. No entanto, o problema surge quando você tem muitas variáveis globais sendo alteradas em diferentes lugares. Isso torna o código confuso e difícil de entender por alguns motivos:

- <b>Dificuldade em rastrear mudanças</b>: Se uma variável global é alterada em várias partes do código, pode ser difícil saber de onde veio uma mudança específica. Isso dificulta a localização de bugs.

- <b>Interferência entre partes do programa</b>: Uma função ou parte do código pode acidentalmente alterar uma variável global, afetando outras partes do programa que também usam essa variável. Isso pode causar erros inesperados.

- <b>Mais difícil de testar e manter</b>: Como as variáveis globais podem ser alteradas de qualquer lugar, cada parte do código depende do estado dessas variáveis. Isso torna o programa mais difícil de testar e manter, porque qualquer mudança em uma variável global pode impactar muitas partes do código.

Por isso, é recomendado usar variáveis locais (dentro de funções) sempre que possível, para que as mudanças fiquem contidas e fáceis de rastrear.

<h2> 11.8 - Depuração </h2>

Ao trabalhar com conjuntos de dados maiores, depurar exibindo e verificando a saída à
mão pode ser trabalhoso. Aqui estão algumas sugestões para depurar grandes conjuntos de
dados:
- Reduza a entrada: 
Se for possível, reduza o tamanho do conjunto de dados. Por exemplo, se o programa
lê um arquivo de texto, comece com apenas as 10 primeiras linhas, ou com o menor
exemplo que puder encontrar. Você pode editar os próprios arquivos ou alterar o
programa para que leia só as primeiras n linhas (é melhor).
Se houver um erro, você pode reduzir n ao menor valor que manifeste o erro, e então
aumentá-lo gradativamente até encontrar e corrigir o erro.
- Verifique os resumos e tipos: 
Em vez de imprimir e verificar o conjunto de dados inteiro, pense em exibir resumos
dos dados: por exemplo, o número de itens em um dicionário ou o total de uma lista
de números.
Uma causa comum de erros em tempo de execução são valores de tipo incompatível.
Para depurar essa espécie de erro, muitas vezes basta exibir o tipo de um valor.
- Crie autoverificações: 
É possível escrever o código para verificar erros automaticamente. Por exemplo, se
estiver calculando a média de uma lista de números, você pode verificar se o
resultado não é mais alto que o maior elemento da lista ou mais baixo que o menor.
Isso é chamado de “verificação de sanidade” porque descobre resultados “insanos”.
Outro tipo de verificação compara os resultados de dois cálculos diferentes para ver
se são consistentes. Isso é chamado de “verificação de consistência”.
- Formate a saída: 
A formatação da saída para depuração pode facilitar a busca de erros. Vimos um
exemplo em “Depuração”, na página 172. O módulo pprint apresenta uma função
pprint que exibe tipos integrados em um formato mais legível para humanos
(pprint é a abreviação de “pretty print” (bela exibição)).
Reforçando, o tempo que você passar construindo o scaffolding (o andaime) pode reduzir
o tempo de depuração.

<h2> Verificação de Sanidade </h2>
Uma verificação de sanidade serve para garantir que os resultados de um cálculo não sejam absurdos. Você compara o resultado com algo que você já sabe ser verdade. Por exemplo:

Exemplo: Média de uma lista

Se você está calculando a média de uma lista de números, o resultado deve estar entre o menor e o maior número dessa lista.
Se a média for menor que o menor número ou maior que o maior número, isso indica que algo está errado no cálculo.

In [1]:
numeros = [10, 20, 30, 40, 50]
media = sum(numeros) / len(numeros)

# Verificação de sanidade
if media < min(numeros) or media > max(numeros):
    print("Erro: a média está fora dos limites dos valores da lista!")
else:
    print("Média calculada corretamente:", media)

Média calculada corretamente: 30.0


<h2> Verificação de Consistência </h2>

A verificação de consistência compara resultados de dois métodos diferentes para resolver o mesmo problema. Se ambos derem o mesmo resultado, é um bom sinal de que estão corretos.

Exemplo: Soma de uma lista

Você pode calcular a soma de uma lista somando cada número ou usando a função sum().
Depois, compara os resultados dos dois métodos.

In [2]:
numeros = [10, 20, 30, 40, 50]

# Método 1: usando sum()
soma1 = sum(numeros)

# Método 2: somando manualmente
soma2 = 0
for num in numeros:
    soma2 += num

# Verificação de consistência
if soma1 == soma2:
    print("Soma consistente:", soma1)
else:
    print("Erro: resultados inconsistentes!")


Soma consistente: 150


<b> Resumo </b>

- Verificação de Sanidade: Compara o resultado de um cálculo com valores esperados para garantir que o resultado não seja absurdo.

- Verificação de Consistência: Compara os resultados de dois métodos diferentes para garantir que ambos produzam o mesmo resultado.
Essas verificações ajudam a evitar erros inesperados e a detectar problemas mais cedo no desenvolvimento do seu código.

<h2>O Módulo pprint</h2>

O módulo pprint (abreviação de “pretty print”) é uma ferramenta útil no Python para formatar e exibir coleções de dados como listas e dicionários de forma organizada e legível. Ele melhora a visualização de dados complexos, que podem parecer confusos se simplesmente exibidos com print().

<h2> Quando usar pprint? </h2>
Exibição de Dados Complexos: Se você tem uma lista ou um dicionário grande, com várias camadas de aninhamento, pprint pode ajudar a ver a estrutura de forma clara.
Depuração: Facilita a visualização de erros ou valores inesperados nos dados.

<h2> Como Usar pprint </h2>
Primeiro, você precisa importar o módulo pprint:

In [87]:
from pprint import pprint

Em seguida, use a função pprint() para exibir a estrutura de dados.

Exemplo: Exibindo um dicionário aninhado

In [88]:
dados = {
    'nome': 'Ana',
    'idade': 28,
    'enderecos': [
        {'cidade': 'São Paulo', 'estado': 'SP'},
        {'cidade': 'Rio de Janeiro', 'estado': 'RJ'}
    ],
    'habilidades': {
        'programacao': ['Python', 'SQL'],
        'linguas': ['Português', 'Inglês']
    }
}

<b> Usando print </b>

In [5]:
print(dados)

{'nome': 'Ana', 'idade': 28, 'enderecos': [{'cidade': 'São Paulo', 'estado': 'SP'}, {'cidade': 'Rio de Janeiro', 'estado': 'RJ'}], 'habilidades': {'programacao': ['Python', 'SQL'], 'linguas': ['Português', 'Inglês']}}


<b> Usando pprint</b>

In [6]:
# Usando pprint para exibir o dicionário de forma legível
pprint(dados)

{'enderecos': [{'cidade': 'São Paulo', 'estado': 'SP'},
               {'cidade': 'Rio de Janeiro', 'estado': 'RJ'}],
 'habilidades': {'linguas': ['Português', 'Inglês'],
                 'programacao': ['Python', 'SQL']},
 'idade': 28,
 'nome': 'Ana'}


<b> Resumo </b>

- print() exibe os dados de forma simples e linear.
- pprint() organiza e formata os dados, facilitando a leitura, especialmente para estruturas complexas.
Usar pprint é uma boa prática quando você precisa entender ou depurar dados complicados no seu código.

<h2> 11.9 - Glossário </h2>

- <b>mapeamento</b>: Relação na qual cada elemento de um conjunto corresponde a um elemento de outro
conjunto.

- <b>dicionário</b>: Mapeamento de chaves aos seus valores correspondentes.

- <b>par chave-valor</b>: Representação do mapeamento de uma chave a um valor.

- <b>item</b>: Em um dicionário, outro nome para um par chave-valor.

- <b>chave</b>: Objeto que aparece em um dicionário como a primeira parte de um par chave-valor.

- <b>valor</b>: Objeto que aparece em um dicionário como a segunda parte de um par chave-valor.
Isso é mais específico que o nosso uso anterior da palavra “valor”.

- <b>implementação</b>: Uma forma de executar um cálculo.

- <b>hashtable</b>: Algoritmo usado para implementar dicionários de Python.

- <b>função hash</b>: Função usada por uma hashtable para calcular a posição de uma chave.

- <b>hashable</b>: Um tipo que tem uma função hash. Tipos imutáveis como números inteiros, de ponto
flutuante e strings são hashable; tipos mutáveis, como listas e dicionários, não são.

- <b>busca</b>: Operação de dicionário que recebe uma chave e encontra o valor correspondente.

- <b>busca reversa</b>: Operação de dicionário que recebe um valor e encontra uma ou várias chaves que o
mapeiem.

- <b>instrução raise</b>: Instrução que (deliberadamente) causa uma exceção.

- <b>item avulso (singleton)</b>: Uma lista (ou outra sequência) com um único elemento.

- <b>gráfico de chamada</b>: Um diagrama que mostra cada frame criado durante a execução de um programa,
com uma flecha apontando quem chama a quem é chamado.

- <b>memo</b>: Valor já calculado, guardado para não ter que fazer o mesmo cálculo no futuro.

- <b>variável global</b>: Variável definida fora de uma função. As variáveis globais podem ser acessadas de qualquer função.

- <b>instrução global</b>: Instrução que declara um nome de variável global.

- <b>flag</b>: Variável booleana usada para indicar se uma condição é verdadeira.

- <b>declaração</b>: Instrução tal como global, que diz ao interpretador algo a respeito de uma variável.

<h2> 11.10 - Exercícios </h2>

<h3> Exercício 11.1 </h3>

Escreva uma função que leia as palavras em words.txt e guarde-as como chaves em um
dicionário. Não importa quais são os valores. Então você pode usar o operador in como
uma forma rápida de verificar se uma string está no dicionário.
Se fez o Exercício 10.10, você pode comparar a velocidade desta implementação com o
operador in de listas e a busca por bisseção.


In [34]:
import pandas as pd 

In [35]:
caminho = 'C:/Users/brend/OneDrive/Documentos/GitHub/pense-em-python/capitulo_11/words.txt'
dicionario_de_palavras = {}

with open(caminho, 'r') as arquivo_words:
    for word in arquivo_words: 
        w = word.strip()
        dicionario_de_palavras[w] = None

In [36]:
dicionario_de_palavras

{'aa': None,
 'aah': None,
 'aahed': None,
 'aahing': None,
 'aahs': None,
 'aal': None,
 'aalii': None,
 'aaliis': None,
 'aals': None,
 'aardvark': None,
 'aardvarks': None,
 'aardwolf': None,
 'aardwolves': None,
 'aas': None,
 'aasvogel': None,
 'aasvogels': None,
 'aba': None,
 'abaca': None,
 'abacas': None,
 'abaci': None,
 'aback': None,
 'abacus': None,
 'abacuses': None,
 'abaft': None,
 'abaka': None,
 'abakas': None,
 'abalone': None,
 'abalones': None,
 'abamp': None,
 'abampere': None,
 'abamperes': None,
 'abamps': None,
 'abandon': None,
 'abandoned': None,
 'abandoning': None,
 'abandonment': None,
 'abandonments': None,
 'abandons': None,
 'abas': None,
 'abase': None,
 'abased': None,
 'abasedly': None,
 'abasement': None,
 'abasements': None,
 'abaser': None,
 'abasers': None,
 'abases': None,
 'abash': None,
 'abashed': None,
 'abashes': None,
 'abashing': None,
 'abasing': None,
 'abatable': None,
 'abate': None,
 'abated': None,
 'abatement': None,
 'abatements':

In [37]:
if 'aas' in dicionario_de_palavras:
   print('aas')
else:
    print('não tem essa palavra')

aas


<h3>Exercício 11.2</h3>
Leia a documentação do método de dicionário setdefault e use-o para escrever uma versão
mais concisa de invert_dict.


<b>VERSÃO ANTIGA</b>

In [38]:
def invert_dict(d):
    inverse = dict()

    for key in d: # a cada chave do dicionário
        val = d[key] # val é igual ao valor no índice 'key'
        if val not in inverse: # se val (chave) não existir no dicionário 'inverse'
            inverse[val] = [key] # inverse[val] na posição de val será igual ao valor da chave 
        else:
            inverse[val].append(key)
    
    return inverse

In [52]:
hist = histogram('parrot')
inverse = invert_dict(hist)
inverse

{1: ['p', 'a', 'o', 't'], 2: ['r']}

<b>VERSÃO CONCISA</b>

Por que utilizar uma lista vazia no lugar do "valor"? 

- Usar uma lista permite armazenar múltiplas chaves para o mesmo valor.
- Se usássemos apenas setdefault(val, key), qualquer valor repetido no dicionário original resultaria na perda de informações.

In [53]:
def better_invert_dict_(d):
    inverse = dict()

    for key in d: # a cada chave do dicionário
        val = d[key] # val é igual ao valor no índice 'key'
        
        inverse.setdefault(val, []).append(key) # inverse[val] na posição de val será igual ao valor da chave 
        
    return inverse

In [54]:
hist = histogram('parrot')
inverse = better_invert_dict_(hist)
inverse

{1: ['p', 'a', 'o', 't'], 2: ['r']}

<h3>Exercício 11.3</h3>
Memorize a função de Ackermann do Exercício 6.2 e veja se a memorização permite
avaliar a função com argumentos maiores. Dica: não.

**FUNÇÃO DE ACKERMANN: antiga**

In [9]:
# incrementando a função ack com o primeiro caso-base
def ack(m, n):
    # caso-base 1: Se m = 0, então ack(m, n) = n + 1
    if m == 0:
        return n + 1
    # caso-base 2: Se m > 0 e n = 0, então ack(m, n) = ack(m - 1, 1)
    elif m > 0 and n == 0:
        return ack(m - 1, 1)
    # caso recursivo: Se m > 0 e n > 0, então ack(m, n) = ack(m - 1, ack(m, n - 1))
    elif m > 0 and n > 0:
        return ack(m - 1, ack(m, n - 1))

In [10]:
# Vamos testar com 𝑚 = 3 e n = 0. De acordo com a definição, ack(3,0) = ack(2,1)
ack(3,0) # tese 3 > tem que retornar 5

5

**COM MEMORIZAÇÃO**

In [1]:
# incrementando a função ack com o primeiro caso-base
def ackMemorizando(m, n):
    # inicializa um dicionario vazio e variável para guardar o resultado da recursividade
    memo = {}
    result = 0

     # Verifica se o resultado já está memorizado
    if (m, n) in memo:
        return memo[(m, n)]

    # caso-base 1: Se m = 0, então ack(m, n) = n + 1
    if m == 0:
        result = n + 1
    
    # caso-base 2: Se m > 0 e n = 0, então ack(m, n) = ack(m - 1, 1)
    elif m > 0 and n == 0:
        result = ackMemorizando(m - 1, 1)
        memo[m] = result
    
    # caso recursivo: Se m > 0 e n > 0, então ack(m, n) = ack(m - 1, ack(m, n - 1))
    elif m > 0 and n > 0:
        result = ackMemorizando(m - 1, ackMemorizando(m, n - 1))
        memo[m] = result
        
    
    return result

In [3]:
# Vamos testar com 𝑚 = 10 e n = 0: retorna erro
ackMemorizando(10,0) 

: 

In [2]:
ackMemorizando(3,0) 

5

<h2> Exercício 11.4 </h2>
Se fez o Exercício 10.7, você já tem uma função chamada has_duplicates, que recebe uma
lista como parâmetro e retorna True se houver algum objeto que aparece mais de uma vez
na lista.
Use um dicionário para escrever uma versão mais rápida e simples de has_duplicates.

**SOLUÇÃO SEM DICIONÁRIO:**

In [1]:
def has_duplicates(lista):
  for i in lista:
    if lista.count(i) > 1:
      return True

  return False

In [2]:
has_duplicates(['a','a','a','b','c'])

True

**COM DICIONÁRIO:**

**COMPARAÇÃO DE SOLUÇÕES:**

**SOLUÇÃO PRÓPRIA:**

In [7]:
def has_duplicates_with_dict(lista):
    dicionario = {}

    for i in lista:
        if i not in dicionario:
            dicionario[i] = lista.count(i)
        else:
            continue
   
    for i in dicionario:
        if i.value() > 1:
            return True
    
    return False

In [8]:
has_duplicates(['a','a','a','b','c']) # True

True

In [9]:
has_duplicates(['a','b','c']) # False

False

**SOLUÇÃO CHATGPT:**

In [10]:
def has_duplicates(lista):
    # Dicionário para armazenar a contagem de cada elemento
    counts = {}

    # Itera sobre cada elemento na lista
    for item in lista:
        # Se o elemento já está no dicionário, há duplicata
        if item in counts:
            return True
        # Caso contrário, adiciona o elemento ao dicionário
        else:
            counts[item] = 1

    # Se não encontrou duplicatas, retorna False
    return False

# Teste da função
print(has_duplicates([1, 2, 3, 4]))  # Output: False
print(has_duplicates([1, 2, 3, 3]))  # Output: True

False
True


**POR QUE UTILIZAR DICIONÁRIO É MAIS PERFORMÁTICO?**

A lista não é eficiente pois, para cada elemento, a lista é percorrida inteira para contar as ocorrências desse elemento, o que resulta em uma complexidade de tempo O(n²).

Usando um dicionário, é possível iterar pela lista uma única vez e usar o dicionário para armazenar a contagem de cada elemento.

<h2> Exercício 11.5 </h2>
Duas palavras são “pares rotacionados” se for possível rotacionar um deles e chegar ao
outro (ver rotate_word no Exercício 8.5).
Escreva um programa que leia uma lista de palavras e encontre todos os pares
rotacionados.


**SCRIPT DE ROTAÇÃO ANTIGO:**

In [85]:
def rotate_word(string, numero_rotacao):
  nova_string = ''

  for letra in string:
    nova_string = nova_string + chr(ord(letra) + numero_rotacao)

  return nova_string

In [86]:
rotate_word('brenda', 4)

'fvirhe'

In [84]:
def pares_rotacionados(lista_de_palavras, numero_rotacao):
    verifica_palavras = {}
    nova_string = ''
    
    for palavra in lista_de_palavras:
        nova_string = ''
        
        for letra in palavra:
            nova_string += chr((ord(letra) - ord('a') + numero_rotacao) % 26 + ord('a'))
            
        if nova_string not in verifica_palavras and nova_string != palavra:
            for x in lista_de_palavras:
                if nova_string == x:
                    verifica_palavras[x] = nova_string
    
    return verifica_palavras

In [83]:
palavras_teste = ['abc', 'bcd', 'xyz', 'yza', 'def', 'mnop', 'nopq', 'wxyz', 'ace']
pares_rotacionados(palavras_teste, 1)

bcd
cde
yza
zab
efg
nopq
opqr
xyza
bdf


{'bcd': 'bcd', 'yza': 'yza', 'nopq': 'nopq'}

**Não encontrei os arquivos necessários, que são citados no exercício abaixo, para a realização dele.**

<h2> Exercício 11.6 </h2>
Aqui está outro quebra-cabeça do programa Car Talk
(http://www.cartalk.com/content/puzzlers):
Ele foi enviado por Dan O’Leary. Dan descobriu uma palavra comum, com uma sílaba e
cinco letras que tem a seguinte propriedade única. Ao removermos a primeira letra, as
letras restantes formam um homófono da palavra original, que é uma palavra que soa
exatamente da mesma forma. Substitua a primeira letra, isto é, coloque-a de volta, retire a
segunda letra e o resultado é um outro homófono da palavra original. E a pergunta é, qual
é a palavra?
Agora vou dar um exemplo que não funciona. Vamos usar a palavra de cinco letras,
‘wrack’ (mover, eliminar). W-R-A-C-K, como na expressão ‘wrack with pain’ (se
contorcer de dor). Se eu retirar a primeira letra, sobra uma palavra de quatro letras, ‘R-AC-K’ (galhada). Como na frase, ‘Holy cow, did you see the rack on that buck! It must have
been a nine-pointer!’ (‘Minha nossa, você viu a galhada daquele cervo! Deve ter nove
pontas!’). É um homófono perfeito. Se puser o ‘w’ de volta e retirar o ‘r’ em vez disso,
sobra a palavra ‘wack’, que é uma palavra de verdade, mas não é um homófono das outras
duas palavras.
Mas há pelo menos uma palavra que Dan e eu conhecemos, que produz dois homófonos se
você retirar qualquer uma das duas primeiras letras, e duas novas palavras de quatro letras
são formadas. A pergunta é, qual é a palavra?
Você pode usar o dicionário do Exercício 11.1 para verificar se uma string está na lista de
palavras.
Para verificar se duas palavras são homófonas, você pode usar o Dicionário de pronúncia
CMU. Ele pode ser baixado em http://www.speech.cs.cmu.edu/cgi-bin/cmudict ou em
http://thinkpython2.com/code/c06d. Você também pode baixar http://thinkpy
thon2.com/code/pronounce.py, que tem uma função chamada read_dictionary, que lê o
dicionário de pronúncia e retorna um dicionário de Python que mapeia cada palavra a uma
string que descreve sua pronúncia primária.
Escreva um programa que liste todas as palavras que resolvem o quebra-cabeça.