Você pode adquirir versões impressas e de e-book do *Think Python 3e* (em inglês) em
[Bookshop.org](https://bookshop.org/a/98697/9781098155438) e
[Amazon](https://www.amazon.com/_/dp/1098155432?smid=ATVPDKIKX0DER&_encoding=UTF8&tag=oreilly20-20&_encoding=UTF8&tag=greenteapre01-20&linkCode=ur2&linkId=e2a529f94920295d27ec8a06e757dc7c&camp=1789&creative=9325).

Uma versão em língua portuguesa da 3ª edição foi publicada pela editora [Novatec](https://novatec.com.br/livros/pense-em-python-3ed/).

In [None]:
from os.path import basename, exists

def download(url):
    filename = basename(url)
    if not exists(filename):
        from urllib.request import urlretrieve

        local, _ = urlretrieve(url, filename)
        print("Downloaded " + str(local))
    return filename

download('https://github.com/AllenDowney/ThinkPython/raw/v3/thinkpython.py');
download('https://github.com/AllenDowney/ThinkPython/raw/v3/diagram.py');

import thinkpython

# Iteração e Busca

Em 1939, Ernest Vincent Wright publicou um romance de 50.000 palavras chamado *Gadsby* que não contém a letra "e". Como "e" é a letra mais comum na língua inglesa, escrever até mesmo algumas palavras sem usá-la é difícil.
Para ter uma ideia de quão difícil, neste capítulo calcularemos a fração de palavras em inglês que têm pelo menos um "e".

Para isso, usaremos instruções `for` para percorrer as letras em uma *string* e as palavras em um arquivo, e atualizaremos as variáveis ​​em um laço para contar o número de palavras que contêm um "e".
Usaremos o operador `in` para verificar se uma letra aparece em uma palavra, e você aprenderá um padrão de programação chamado "busca linear".

Como exercício, você usará essas ferramentas para resolver um quebra-cabeça de palavras chamado "Spelling Bee".

## Laços de repetição e *strings*

No Capítulo 3, vimos um laço `for` que usa a função `range` para exibir uma sequência de números:

In [None]:
for i in range(3):
    print(i, end=' ')

Esta versão usa o argumento de palavra-chave `end` para que a função `print` coloque um espaço após cada número em vez de uma nova linha.

Também podemos usar um laço `for` para exibir as letras em uma *string*:

In [None]:
for letter in 'Gadsby':
    print(letter, end=' ')

Observe que alterei o nome da variável de `i` para `letter`, o que fornece mais informações sobre o valor ao qual ela se refere.
A variável definida em um laço `for` é chamada de **variável de iteração**.

Agora que podemos percorrer as letras em uma palavra, podemos verificar se ela contém a letra "e":

In [None]:
for letter in "Gadsby":
    if letter == 'E' or letter == 'e':
        print('This word has an "e"')

Antes de continuar, vamos encapsular esse laço de prepetição em uma função:

In [None]:
def has_e():
    for letter in "Gadsby":
        if letter == 'E' or letter == 'e':
            print('This word has an "e"')

E vamos torná-la uma função pura que devolve `True` se a palavra contém um "e" e `False` caso contrário:

In [None]:
def has_e():
    for letter in "Gadsby":
        if letter == 'E' or letter == 'e':
            return True
    return False

Podemos generalizá-la para receber a palavra como parâmetro:

In [None]:
def has_e(word):
    for letter in word:
        if letter == 'E' or letter == 'e':
            return True
    return False

Agora podemos testá-la assim:

In [None]:
has_e('Gadsby')

In [None]:
has_e('Emma')

## Lendo a lista de palavras

Para ver quantas palavras contêm um "e", precisaremos de uma lista de palavras.
A que usaremos é uma lista de cerca de 114.000 palavras oficiais de palavras cruzadas; ou seja, palavras que são consideradas válidas em palavras cruzadas e outros jogos de palavras.

A célula a seguir baixa a lista de palavras, que é uma versão modificada de uma lista coletada e cedida ao domínio público por Grady Ward como parte do projeto Moby Lexicon (consulte <http://wikipedia.org/wiki/Moby_Project>) (em inglês).

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/words.txt');

A lista de palavras está em um arquivo chamado `words.txt`, que é baixado no notebook para este capítulo.
Para lê-lo, usaremos a função interna `open`, que recebe o nome do arquivo como parâmetro e devolve um **objeto arquivo** que podemos usar para ler o arquivo.

In [None]:
file_object = open('words.txt')

O objeto arquivo fornece uma função chamada `readline`, que lê caracteres do arquivo até chegar a uma nova linha e retorna o resultado como uma *string*:

In [None]:
file_object.readline()

Observe que a sintaxe para chamar `readline` é diferente das funções que vimos até agora. Isso porque é um **método**, que é uma função associada a um objeto.
Neste caso, `readline` é associado ao objeto arquivo, então o chamamos usando o nome do objeto, o operador ponto e o nome do método.

A primeira palavra na lista é "aa", que é um tipo de lava.
A sequência `\n` representa o caractere de nova linha que separa esta palavra da próxima.

O objeto arquivo mantém o controle de onde ele está no arquivo, então se você chamar `readline` novamente, você obtém a próxima palavra:

In [None]:
line = file_object.readline()
line

Para remover a quebra de linha do final da palavra, podemos usar `strip`, que é um método associado a *strings*. Então podemos chamá-lo assim:

In [None]:
word = line.strip()
word

`strip` remove caracteres de espaço em branco -- incluindo espaços, tabulações e quebras de linha -- do início e do fim da *string*.

Você também pode usar um objeto arquivo como parte de um laço `for`.
Este programa lê `words.txt` e exibe cada palavra, uma por linha:

In [None]:
for line in open('words.txt'):
    word = line.strip()
    print(word)

Agora que podemos ler a lista de palavras, o próximo passo é contá-las.
Para isso, precisaremos da capacidade de atualizar variáveis.

## Atualizando variáveis

Como você deve ter descoberto, é legal fazer mais de uma atribuição
para a mesma variável.
Uma nova atribuição faz com que uma variável existente se refira a um novo valor (e pare de se referir ao valor antigo).

Por exemplo, aqui está uma atribuição inicial que cria uma variável.

In [None]:
x = 5
x

E aqui está uma atribuição que altera o valor de uma variável:

In [None]:
x = 7
x

A figura a seguir mostra como essas atribuições ficam em um diagrama de estado:

In [None]:
from diagram import make_rebind, draw_bindings

bindings = make_rebind('x', [5, 7])

In [None]:
from diagram import diagram, adjust

width, height, x, y = [0.54, 0.61, 0.07, 0.45]
ax = diagram(width, height)
bbox = draw_bindings(bindings, ax, x, y)
# adjust(x, y, bbox)

A seta pontilhada indica que `x` não se refere mais a `5`.
A seta sólida indica que agora se refere a `7`.

Um tipo comum de atribuição é uma **atualização**, onde o novo valor da variável depende do antigo.

In [None]:
x = 7

In [None]:
x = x + 1
x

Esta instrução significa "obtenha o valor atual de `x`, adicione um e atribua o resultado de volta a `x`."

Se você tentar atualizar uma variável que não existe, você obtém um erro, porque o Python avalia a expressão à direita antes de atribuir um valor à variável à esquerda:

In [None]:
%%expect NameError

z = z + 1

Antes de poder atualizar uma variável, você tem que **inicializá-la**, geralmente com uma atribuição simples:

In [None]:
z = 0
z = z + 1
z

Aumentar o valor de uma variável é chamado de **incremento**; diminuir o valor é chamado de **decremento**.
Como essas operações são tão comuns, o Python fornece **operadores de atribuição aumentados** que atualizam uma variável de forma mais concisa.
Por exemplo, o operador `+=` incrementa uma variável pelo valor fornecido:

In [None]:
z += 2
z

Existem operadores de atribuição aumentados para outros operadores aritméticos, incluindo `-=` e `*=`.

## Repetição e contagem

O programa a seguir conta o número de palavras na lista de palavras:

In [None]:
total = 0

for line in open('words.txt'):
    word = line.strip()
    total += 1

O programa começa inicializando `total` para `0`.
Cada vez que percorre o laço, ele incrementa `total` em `1`.
Então, quando o laço encerra, `total` se refere ao número total de palavras:

In [None]:
total

Uma variável como essa, usada para contar o número de vezes que algo acontece, é chamada de **contador**.

Podemos adicionar um segundo contador ao programa para manter o controle do número de palavras que contêm um "e":

In [None]:
total = 0
count = 0

for line in open('words.txt'):
    word = line.strip()
    total = total + 1
    if has_e(word):
        count += 1

Vamos ver quantas palavras contêm "e":

In [None]:
count

Como porcentagem do `total`, cerca de dois terços das palavras usam a letra "e":

In [None]:
count / total * 100

Então você consegue entender por que é difícil criar um livro sem usar essas palavras.

## O operador `in`

A versão de `has_e` que escrevemos neste capítulo é mais complicada do que precisa ser.
Python fornece um operador, `in`, que verifica se um caractere aparece em uma string:

In [None]:
word = 'Gadsby'
'e' in word

Então podemos reescrever `has_e` assim:

In [None]:
def has_e(word):
    if 'E' in word or 'e' in word:
        return True
    else:
        return False

E como o condicional da instrução `if` tem um valor booleano, podemos eliminar a instrução `if` e devolver o booleano diretamente:

In [None]:
def has_e(word):
    return 'E' in word or 'e' in word

Podemos simplificar essa função ainda mais usando o método `lower`, que converte as letras de uma string para minúsculas.
Aqui está um exemplo:

In [None]:
word.lower()

`lower` cria uma nova *string* -- não modifica a string existente -- então o valor de `word` permanece inalterado:

In [None]:
word

Veja como podemos usar `lower` em `has_e`:

In [None]:
def has_e(word):
    return 'e' in word.lower()

In [None]:
has_e('Gadsby')

In [None]:
has_e('Emma')

## Busca

Com base nessa versão mais simples de `has_e`, vamos escrever uma função mais geral chamada `uses_any` que recebe um segundo parâmetro que é uma sequência de letras.
Ela devolve `True` se a palavra usa qualquer uma das letras e `False` caso contrário.

In [None]:
def uses_any(word, letters):
    for letter in word.lower():
        if letter in letters.lower():
            return True
    return False

Aqui está um exemplo em que o resultado é `True`:

In [None]:
uses_any('banana', 'aeiou')

E outro em que é `Falso`:

In [None]:
uses_any('apple', 'xyz')

`uses_any` converte `word` e `letters` para minúsculas, portanto funciona com qualquer combinação de maiúsculas e minúsculas:

In [None]:
uses_any('Banana', 'AEIOU')

A estrutura de `uses_any` é semelhante a `has_e`.
Ela percorre as letras em `word` e as verifica uma de cada vez.
Se encontrar uma que apareça em `letters`, ela devolve `True` imediatamente.
Se executar todas as repetições do laço sem encontrar nenhuma, ela devolve `False`.

Esse padrão é chamado de **busca linear**.
Nos exercícios no final deste capítulo, você escreverá mais funções que usam esse padrão.

## Doctest

No [Capítulo 4](https://colab.research.google.com/github/rodrigocarlson/PensePython3ed/blob/main/capitulos/chap04.ipynb) usamos uma docstring para documentar uma função -- ou seja, para explicar o que ela faz.
Também é possível usar uma docstring para *testar* uma função.
Aqui está uma versão de `uses_any` com uma docstring que inclui testes.

In [None]:
def uses_any(word, letters):
    """Verifica se uma palavra usa alguma letra de uma lista de letras

    >>> uses_any('banana', 'aeiou')
    True
    >>> uses_any('apple', 'xyz')
    False
    """
    for letter in word.lower():
        if letter in letters.lower():
            return True
    return False

Cada teste começa com `>>>`, que é usado como um *prompt* em alguns ambientes Python para indicar onde o usuário pode digitar o código.
Em um doctest, o *prompt* é seguido por uma expressão, geralmente uma chamada de função.
A linha seguinte indica o valor que a expressão deve ter se a função funcionar corretamente.

No primeiro exemplo, `'banana'` usa `'a'`, então o resultado deve ser `True`.
No segundo exemplo, `'apple'` não usa nenhuma letra de `'xyz'`, então o resultado deve ser `False`.

Para executar esses testes, temos que importar o módulo `doctest` e executar uma função chamada `run_docstring_examples`.
Para tornar essa função mais fácil de usar, escrevi a seguinte função, que recebe um objeto função como argumento:

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
    run_docstring_examples(func, globals(), name=func.__name__)

Ainda não aprendemos sobre `globals` e `__name__` -- você pode ignorá-los.
Agora podemos testar `uses_any` assim:

In [None]:
run_doctests(uses_any)

`run_doctests` encontra as expressões na docstring e as avalia.
Se o resultado for o valor esperado, o teste **passa**.
Caso contrário, ele **falha**.

Se todos os testes passarem, `run_doctests` não exibe nenhuma saída -- nesse caso, nenhuma notícia é uma boa notícia.
Para ver o que acontece quando um teste falha, aqui está uma versão incorreta de `uses_any`:

In [None]:
def uses_any_incorrect(word, letters):
    """Verifica se a palavra usa alguma letra da lista

    >>> uses_any_incorrect('banana', 'aeiou')
    True
    >>> uses_any_incorrect('apple', 'xyz')
    False
    """
    for letter in word.lower():
        if letter in letters.lower():
            return True
        else:
            return False     # INCORRETO!

E aqui está o que acontece quando a testamos:

In [None]:
run_doctests(uses_any_incorrect)

A saída inclui o exemplo que falhou, o valor que a função deveria produzir e o valor que a função realmente produziu.

Se você não tem certeza do motivo pelo qual este teste falhou, você terá a chance de depurá-lo como um exercício.

## Glossário

**variável de iteração** (*loop variable*)**:**
Uma variável definida no cabeçalho de um laço `for`.

**objeto arquivo** (*file object*)**:**
Um objeto que representa um arquivo aberto e mantém o controle de quais partes do arquivo foram lidas ou gravadas.

**método** (*method*)**:**
Uma função que é associada a um objeto e chamada usando o operador ponto.

**atualização** (*update*)**:**
Uma declaração de atribuição que fornece um novo valor a uma variável que já existe, em vez de criar novas variáveis.

**inicializar** (*initialize*)**:**
Cria uma nova variável e atribuir um valor a ela.

**incremento** (*increment*)**:**
Aumentar o valor de uma variável.

**decremento** (*decrement*)**:**
Diminuir o valor de uma variável.

**contador** (*counter*)**:**
Uma variável usada para contar algo, geralmente inicializada em zero e então incrementada.

**busca linear** (*linear search*)**:**
Um padrão computacional que busca em uma sequência de elementos e interrompe quando encontra o que está procurando.

**passa** (*pass*)**:**
Se um teste for executado e o resultado for o esperado, o teste passa.

**falha** (*fail*)**:**
Se um teste for executado e o resultado não for o esperado, o teste falha.

## Exercícios

In [None]:
# Esta célula diz ao Jupyter para fornecer informações detalhadas de depuração
# quando ocorre um erro de tempo de execução. Execute-o antes de trabalhar nos
# exercícios.

%xmode Verbose

### Pergunte a um assistente virtual

Em `uses_any`, você pode ter notado que a primeira instrução `return` está dentro do laço e a segunda está fora:

In [None]:
def uses_any(word, letters):
    for letter in word.lower():
        if letter in letters.lower():
            return True
    return False

Quando as pessoas escrevem funções como essa pela primeira vez, é um erro comum colocar ambas as instruções `return` dentro do laço, assim:

In [None]:
def uses_any_incorrect(word, letters):
    for letter in word.lower():
        if letter in letters.lower():
            return True
        else:
            return False     # INCORRETO!

Pergunte a um assistente virtual o que há de errado com esta versão.

### Exercício

Escreva uma função chamada `uses_none` que receba uma palavra e uma sequência de letras proibidas e devolva `True` se a palavra não usar nenhuma das letras proibidas.

Aqui está um esboço da função que inclui dois doctests.
Preencha a função para que ela passe nesses testes e adicione pelo menos mais um doctest.

In [None]:
def uses_none(word, forbidden):
    """Verifica se uma palavra evita letras proibidas.

    >>> uses_none('banana', 'xyz')
    True
    >>> uses_none('apple', 'efg')
    False
    """
    return None

In [None]:
# A solução vai aqui

In [None]:
run_doctests(uses_none)

### Exercício

Escreva uma função chamada `uses_only` que receba uma palavra e uma sequência de letras, e que devolva `True` se a palavra contiver apenas letras da *string*.

Aqui está um esboço da função que inclui dois doctests.
Preencha a função para que ela passe nesses testes, e adicione pelo menos mais um doctest.

In [None]:
def uses_only(word, available):
    """Verifica se uma palavra usa apenas as letras disponíveis.

    >>> uses_only('banana', 'ban')
    True
    >>> uses_only('apple', 'apl')
    False
    """
    return None

In [None]:
# A solução vai aqui

In [None]:
run_doctests(uses_only)

### Exercício

Escreva uma função chamada `uses_all` que recebe uma palavra e uma sequência de letras, e que devolve `True` se a palavra contiver todas as letras na sequência pelo menos uma vez.

Aqui está um esboço da função que inclui dois doctests.
Preencha a função para que ela passe nesses testes, e adicione pelo menos mais um doctest.

In [None]:
def uses_all(word, required):
    """Verifica se uma palavra usa todas as letras necessárias.

    >>> uses_all('banana', 'ban')
    True
    >>> uses_all('apple', 'api')
    False
    """
    return None

In [None]:
# A solução vai aqui

In [None]:
run_doctests(uses_all)

### Exercício

O jornal *The New York Times* publica um quebra-cabeça diário chamado "Spelling Bee" que desafia os leitores a soletrar o máximo de palavras possível usando apenas sete letras, em que uma das letras é necessária.
As palavras devem ter pelo menos quatro letras.

Por exemplo, no dia em que escrevi isso, as letras eram `ACDLORT`, com `R` como a letra necessária.
Então "color" é uma palavra aceitável, mas "told" não é, porque não usa `R`, e "rat" não é porque tem apenas três letras.
As letras podem ser repetidas, então "ratatat" é aceitável.

Escreva uma função chamada `check_word` que verifica se uma determinada palavra é aceitável.
Ela deve ter como parâmetros a palavra a ser verificada, uma sequência de sete letras disponíveis e uma sequência contendo a única letra necessária.
Você pode usar as funções que escreveu em exercícios anteriores.

Aqui está um esboço da função que inclui doctests.
Preencha a função e verifique se todos os testes foram aprovados.

In [None]:
def check_word(word, available, required):
    """Verifique se uma palavra é aceitável.

    >>> check_word('color', 'ACDLORT', 'R')
    True
    >>> check_word('ratatat', 'ACDLORT', 'R')
    True
    >>> check_word('rat', 'ACDLORT', 'R')
    False
    >>> check_word('told', 'ACDLORT', 'R')
    False
    >>> check_word('bee', 'ACDLORT', 'R')
    False
    """
    return False

In [None]:
# A solução vai aqui

In [None]:
run_doctests(check_word)

De acordo com as regras do "Spelling Bee",

* Palavras de quatro letras valem 1 ponto cada.

* Palavras mais longas ganham 1 ponto por letra.

* Cada quebra-cabeça inclui pelo menos um "pangrama" que usa todas as letras. Eles valem 7 pontos extras!

Escreva uma função chamada `score_word` que recebe uma palavra e uma sequência de letras disponíveis e devolve sua pontuação.
Você pode assumir que a palavra é aceitável.

Novamente, aqui está um esboço da função com doctests:

In [None]:
def word_score(word, available):
    """Calcula a pontuação para uma palavra aceitável.

    >>> word_score('card', 'ACDLORT')
    1
    >>> word_score('color', 'ACDLORT')
    5
    >>> word_score('cartload', 'ACDLORT')
    15
    """
    return 0

In [None]:
# A solução vai aqui

In [None]:
run_doctests(word_score)

Quando todas as suas funções passarem nos testes, use o seguinte laço de repetição para buscar na lista de palavras por palavras aceitáveis ​​e somar suas pontuações:

In [None]:
available = 'ACDLORT'
required = 'R'

total = 0

file_object = open('words.txt')
for line in file_object:
    word = line.strip()
    if check_word(word, available, required):
        score = word_score(word, available)
        total = total + score
        print(word, score)

print("Total score", total)

Visite a página "Spelling Bee" em <https://www.nytimes.com/puzzles/spelling-bee> (em inglês) e digite as letras disponíveis para o dia. A letra do meio é obrigatória.

Encontrei um conjunto de letras que formam palavras com uma pontuação total de 5820 pontos. Você consegue superar isso? Encontrar o melhor conjunto de letras pode ser muito difícil -- você tem que ser realista.

### Exercício

Você deve ter notado que as funções que escreveu nos exercícios anteriores tinham muito em comum.
Na verdade, elas são tão semelhantes que você pode usar uma função para escrever outra.

Por exemplo, se uma palavra não usa nenhuma letra de um conjunto de letras proibidas, isso significa que ela não usa nenhuma. Então podemos escrever uma versão de `uses_none` assim:

In [None]:
def uses_none(word, forbidden):
    """Verifica se uma palavra evita letras proibidas.

    >>> uses_none('banana', 'xyz')
    True
    >>> uses_none('apple', 'efg')
    False
    >>> uses_none('', 'abc')
    True
    """
    return not uses_any(word, forbidden)

In [None]:
run_doctests(uses_none)

Também há uma similaridade entre `uses_only` e `uses_all` que você pode aproveitar. Se você tem uma versão funcional de `uses_only`, veja se consegue escrever uma versão de `uses_all` que chame `uses_only`.

### Exercício

Se você ficou preso na questão anterior, tente pedir a um assistente virtual, "Dada uma função, `uses_only`, que recebe duas *strings* e verifica se a primeira usa apenas as letras da segunda, use-a para escrever `uses_all`, que recebe duas *strings* e verifica se a primeira usa todas as letras da segunda, permitindo repetições." ("*Given a function, `uses_only`, which takes two strings and checks that the first uses only the letters in the second, use it to write `uses_all`, which takes two strings and checks whether the first uses all the letters in the second, allowing repeats.*").

Use `run_doctests` para verificar a resposta.

In [None]:
# A solução vai aqui

In [None]:
run_doctests(uses_all)

### Exercício

Agora vamos ver se podemos escrever `uses_all` com base em `uses_any`.

Peça a um assistente virtual: "Dada uma função, `uses_any`, que recebe duas *strings* e verifica se a primeira usa alguma das letras da segunda, você pode usá-la para escrever `uses_all`, que recebe duas *strings* e verifica se a primeira usa todas as letras da segunda, permitindo repetições." ("*Given a function, `uses_any`, which takes two strings and checks whether the first uses any of the letters in the second, can you use it to write `uses_all`, which takes two strings and checks whether the first uses all the letters in the second, allowing repeats.*")

Se disser que pode, certifique-se de testar o resultado!

In [None]:
# A solução vai aqui

In [None]:
# Aqui está o que obtive do ChatGPT 4o 26 em de dezembro de 2024
# Está correta, mas faz várias chamadas para uses_any

def uses_all(s1, s2):
    """Verifica se todos os caracteres em s2 estão em s1, permitindo repetições."""
    for char in s2:
        if not uses_any(s1, char):
            return False
    return True


In [None]:
# A solução vai aqui

[Pense Python: 3ª Edição](https://rodrigocarlson.github.io/PensePython3ed/)

Copyright 2024 [Allen B. Downey](https://allendowney.com/) (versão original)

Copyright 2025 [Rodrigo Castelan Carlson](https://rodrigocarlson.paginas.ufsc.br/) (desta versão)

Foram preservadas as mesmas licenças da versão original.

Licença dos códigos: [MIT License](https://mit-license.org/)

Licença dos textos: [Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International](https://creativecommons.org/licenses/by-nc-sa/4.0/)