# Capítulo 13: Estudo de caso: seleção de estrutura de dados

Este capítulo apresenta um estudo de caso com exercícios que fazem pensar sobre a
escolha de estruturas de dados e práticas de uso delas.

<h2> 13.1 - Análise de frequência de palavras </h2>

<h3> Exercício 13.1 </h3>

Escreva um programa que leia um arquivo, quebre cada linha em palavras, remova os
espaços em branco e a pontuação das palavras, e as converta em letras minúsculas.
Dica: O módulo string oferece uma string chamada whitespace, que contém espaço, tab,
newline etc., e punctuation, que contém os caracteres de pontuação. Vamos ver se
conseguimos fazer o Python falar palavrões:


<code>
>>> import string
>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\]^_`{|}~'
</code>

Além disso, você pode usar os métodos de string, strip, replace e translate.

**CONCEITOS:**

In [42]:
# importações:
import string

In [43]:
# declaração de string global (neste caso, o arquivo que a função vai ler)
arquivo_aberto = open('words.txt', 'r')

In [45]:
def lerArquivo(arquivo):
    for linha in arquivo_aberto:
        # remove  as pontuações da palavra
        palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
        
        # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
        palavra_sem_espacos = palavra_sem_pontuacao.strip().lower()
            
        print(palavra_sem_espacos)        

In [46]:
lerArquivo(arquivo_aberto)

aa
aah
aahed
aahing
aahs
aal
aalii
aaliis
aals
aardvark
aardvarks
aardwolf
aardwolves
aas
aasvogel
aasvogels
aba
abaca
abacas
abaci
aback
abacus
abacuses
abaft
abaka
abakas
abalone
abalones
abamp
abampere
abamperes
abamps
abandon
abandoned
abandoning
abandonment
abandonments
abandons
abas
abase
abased
abasedly
abasement
abasements
abaser
abasers
abases
abash
abashed
abashes
abashing
abasing
abatable
abate
abated
abatement
abatements
abater
abaters
abates
abating
abatis
abatises
abator
abators
abattis
abattises
abattoir
abattoirs
abaxial
abaxile
abbacies
abbacy
abbatial
abbe
abbes
abbess
abbesses
abbey
abbeys
abbot
abbotcies
abbotcy
abbots
abbreviate
abbreviated
abbreviates
abbreviating
abbreviation
abbreviations
abdicate
abdicated
abdicates
abdicating
abdication
abdications
abdomen
abdomens
abdomina
abdominal
abdominally
abduce
abduced
abducens
abducent
abducentes
abduces
abducing
abduct
abducted
abducting
abductor
abductores
abductors
abducts
abeam
abed
abele
abeles
abelmosk
abelmosks

**EXPLICAÇÃO DA LINHA:** 
<code> 
palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])  
</code>
<br>

<code> 
[char for char in linha]
</code>
<br>
Isso significa que para cada caractere CHAR na variável 'linha', o Python percorre a string 'linha' caractere por caractere.  
<br>

<br>
<code>
if char not in string.punctuation
</code>

- Aqui, estamos dizendo que só queremos incluir o char se ele não estiver na lista de pontuações fornecida por string.punctuation.
- string.punctuation é uma string que contém todos os caracteres de pontuação, como !, ., ,, etc.
- Se o caractere char for uma pontuação, ele será ignorado.
<br>

<br>
<code> ''.join([...]) </code>

A função join() é usada para juntar todos os caracteres da lista (aqueles que não eram pontuações) em uma única string.
O '' antes do .join() significa que os caracteres serão unidos sem nenhum separador.
<br>




<h3> Exercício 13.2 </h3>

Acesse o Projeto Gutenberg (http://gutenberg.org) e baixe seu livro favorito em domínio
público em formato de texto simples.
Altere seu programa do exercício anterior para ler o livro que você baixou, pulando as
informações do cabeçalho no início do arquivo e processando o resto das palavras como
antes.
Então altere o programa para contar o número total de palavras no livro e o número de
vezes que cada palavra é usada.
Exiba o número de palavras diferentes usadas no livro. Compare livros diferentes de
autores diferentes, escritos em eras diferentes. Que autor usa o vocabulário mais extenso?


**Altere seu programa do exercício anterior para ler o livro que você baixou, pulando as
informações do cabeçalho no início do arquivo e processando o resto das palavras como
antes.**

In [26]:
import string 

def lerLivro(arquivo):
    iniciar_leitura = ' CHAPTER XX.'.lower().strip()

    # flag para controle
    ignorar = True

    with open(arquivo, 'r', encoding='utf-8') as arquivo_aberto: 

        for linha in arquivo_aberto:
            linha_limpa = linha.strip().lower()

            if iniciar_leitura in linha_limpa:
                ignorar = False
                continue
            
            if ignorar or not linha_limpa:
                continue
                
            # remove  as pontuações da palavra
            palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
            
            # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
            palavra_sem_espacos = palavra_sem_pontuacao.strip().lower()
                
            print(palavra_sem_espacos)   

In [27]:
lerLivro('retrato_de_dorian_gray_ingles.txt')

the preface
the artist is the creator of beautiful things to reveal art and
conceal the artist is art’s aim the critic is he who can translate
into another manner or a new material his impression of beautiful
things
the highest as the lowest form of criticism is a mode of autobiography
those who find ugly meanings in beautiful things are corrupt without
being charming this is a fault
those who find beautiful meanings in beautiful things are the
cultivated for these there is hope they are the elect to whom
beautiful things mean only beauty
there is no such thing as a moral or an immoral book books are well
written or badly written that is all
the nineteenth century dislike of realism is the rage of caliban seeing
his own face in a glass
the nineteenth century dislike of romanticism is the rage of caliban
not seeing his own face in a glass the moral life of man forms part of
the subjectmatter of the artist but the morality of art consists in
the perfect use of an imperfect medium no arti

**Então altere o programa para contar o número total de palavras no livro**

In [36]:
import string 

def contarPalavrasDoLivro(arquivo):
    iniciar_leitura = ' CHAPTER XX.'.lower().strip()
    total_palavras = 0

    # flag para controle
    ignorar = True

    with open(arquivo, 'r', encoding='utf-8') as arquivo_aberto: 

        for linha in arquivo_aberto:
            linha_limpa = linha.strip().lower()

            if iniciar_leitura in linha_limpa:
                ignorar = False
                continue
            
            if ignorar or not linha_limpa:
                continue
                
            # remove  as pontuações da palavra
            palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
            
            # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
            palavra_sem_espacos = palavra_sem_pontuacao.strip().lower().split()

            for palavra in palavra_sem_espacos:
                total_palavras += 1

    return 'Este livro contém ' + str(total_palavras) + ' palavras'

In [37]:
contarPalavrasDoLivro('retrato_de_dorian_gray_ingles.txt')

'Este livro contém 81818 palavras'

**E o número de vezes que cada palavra é usada.**

In [39]:
import string 

def contadorPalavras(arquivo):
    iniciar_leitura = ' CHAPTER XX.'.lower().strip()
    total_palavras = 0
    contador_palavras = {}

    # flag para controle
    ignorar = True

    with open(arquivo, 'r', encoding='utf-8') as arquivo_aberto: 

        for linha in arquivo_aberto:
            linha_limpa = linha.strip().lower()

            if iniciar_leitura in linha_limpa:
                ignorar = False
                continue
            
            if ignorar or not linha_limpa:
                continue
                
            # remove  as pontuações da palavra
            palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
            
            # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
            palavra_sem_espacos = palavra_sem_pontuacao.strip().lower().split()

            for palavra in palavra_sem_espacos:
                total_palavras += 1

                if palavra not in contador_palavras:
                    contador_palavras[palavra] = 1
                else:
                    contador_palavras[palavra] += 1
    
    total_palavras_livro = 'Este livro contém ' + str(total_palavras) + ' palavras.'
    print(total_palavras_livro, end='\n')

    return contador_palavras 

In [40]:
contadorPalavras('retrato_de_dorian_gray_ingles.txt')

Este livro contém 81818 palavras


{'the': 3915,
 'preface': 1,
 'artist': 29,
 'is': 909,
 'creator': 1,
 'of': 2283,
 'beautiful': 42,
 'things': 125,
 'to': 2101,
 'reveal': 7,
 'art': 70,
 'and': 2208,
 'conceal': 1,
 'art’s': 1,
 'aim': 4,
 'critic': 1,
 'he': 1509,
 'who': 220,
 'can': 105,
 'translate': 1,
 'into': 159,
 'another': 16,
 'manner': 20,
 'or': 290,
 'a': 1708,
 'new': 39,
 'material': 3,
 'his': 989,
 'impression': 6,
 'highest': 4,
 'as': 580,
 'lowest': 1,
 'form': 25,
 'criticism': 1,
 'mode': 13,
 'autobiography': 2,
 'those': 63,
 'find': 33,
 'ugly': 8,
 'meanings': 2,
 'in': 1256,
 'are': 387,
 'corrupt': 5,
 'without': 37,
 'being': 61,
 'charming': 34,
 'this': 178,
 'fault': 8,
 'cultivated': 1,
 'for': 602,
 'these': 29,
 'there': 321,
 'hope': 23,
 'they': 304,
 'elect': 3,
 'whom': 28,
 'mean': 26,
 'only': 108,
 'beauty': 52,
 'no': 196,
 'such': 82,
 'thing': 118,
 'moral': 9,
 'an': 228,
 'immoral': 3,
 'book': 26,
 'books': 9,
 'well': 37,
 'written': 13,
 'badly': 6,
 'that': 1300,

<h3> Exercício 13.3 </h3>

Altere o programa do exercício anterior para exibir as 20 palavras mais frequentes do
livro.

In [62]:
import string 

def palavrasMaisFrequentes(arquivo):
    iniciar_leitura = ' CHAPTER XX.'.lower().strip()
    total_palavras = 0
    contador_palavras = {}

    # flag para controle
    ignorar = True

    with open(arquivo, 'r', encoding='utf-8') as arquivo_aberto: 

        for linha in arquivo_aberto:
            linha_limpa = linha.strip().lower()

            if iniciar_leitura in linha_limpa:
                ignorar = False
                continue
            
            if ignorar or not linha_limpa:
                continue
                
            # remove  as pontuações da palavra
            palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
            
            # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
            palavra_sem_espacos = palavra_sem_pontuacao.strip().lower().split()

            for palavra in palavra_sem_espacos:
                total_palavras += 1

                if palavra not in contador_palavras:
                    contador_palavras[palavra] = 1
                else:
                    contador_palavras[palavra] += 1
    
    total_palavras_livro = 'Este livro contém ' + str(total_palavras) + ' palavras.'
    print(total_palavras_livro, end='\n')

    dicionario_ordenado_por_valores = dict(sorted(contador_palavras.items(), key=lambda item: item[1], reverse=True))
    
    contador = 0

    for k, v in dicionario_ordenado_por_valores.items():
        if contador < 20:
            print(k+':',v)
            contador += 1

In [63]:
palavrasMaisFrequentes('retrato_de_dorian_gray_ingles.txt')

Este livro contém 81818 palavras.
the: 3915
of: 2283
and: 2208
to: 2101
a: 1708
he: 1509
i: 1388
you: 1326
that: 1300
in: 1256
it: 1227
was: 1074
his: 989
is: 909
had: 827
with: 700
him: 620
for: 602
as: 580
at: 565


<h3> Exercício 13.4 </h3>

Altere o programa anterior para ler uma lista de palavras (ver “Leitura de listas de
palavras”, na página 133) e então exiba todas as palavras do livro que não estão na lista de
palavras. Quantas delas são erros ortográficos? Quantas delas são palavras comuns que
deveriam estar na lista de palavras, e quantas são muito obscuras?

In [10]:
import string 

def palavrasForaDoLivro(arquivo, lista_palavras):
    iniciar_leitura = ' CHAPTER XX.'.lower().strip()
    palavras_fora_da_lista = []

    # flag para controle
    ignorar = True

    with open(arquivo, 'r', encoding='utf-8') as arquivo_aberto: 

        for linha in arquivo_aberto:
            linha_limpa = linha.strip().lower()

            if iniciar_leitura in linha_limpa:
                ignorar = False
                continue
            
            if ignorar or not linha_limpa:
                continue
                
            # remove  as pontuações da palavra
            palavra_sem_pontuacao = ''.join([char for char in linha if char not in string.punctuation])
            
            # remove os espaços da palavra e converte para uma palavra com letras minúsculas, apenas
            palavra_sem_espacos = palavra_sem_pontuacao.strip().lower().split()


            for p in palavra_sem_espacos:
                if p not in lista_palavras and p not in palavras_fora_da_lista:
                    palavras_fora_da_lista.append(p)

    return palavras_fora_da_lista

In [13]:
arquivo = 'retrato_de_dorian_gray_ingles.txt'
words = ["apple", "banana", "orange", "grape", "strawberry", "watermelon", "peach", "mango", "pineapple", "blueberry", 'the']

In [14]:
palavrasForaDoLivro(arquivo, words)

['preface',
 'artist',
 'is',
 'creator',
 'of',
 'beautiful',
 'things',
 'to',
 'reveal',
 'art',
 'and',
 'conceal',
 'art’s',
 'aim',
 'critic',
 'he',
 'who',
 'can',
 'translate',
 'into',
 'another',
 'manner',
 'or',
 'a',
 'new',
 'material',
 'his',
 'impression',
 'highest',
 'as',
 'lowest',
 'form',
 'criticism',
 'mode',
 'autobiography',
 'those',
 'find',
 'ugly',
 'meanings',
 'in',
 'are',
 'corrupt',
 'without',
 'being',
 'charming',
 'this',
 'fault',
 'cultivated',
 'for',
 'these',
 'there',
 'hope',
 'they',
 'elect',
 'whom',
 'mean',
 'only',
 'beauty',
 'no',
 'such',
 'thing',
 'moral',
 'an',
 'immoral',
 'book',
 'books',
 'well',
 'written',
 'badly',
 'that',
 'all',
 'nineteenth',
 'century',
 'dislike',
 'realism',
 'rage',
 'caliban',
 'seeing',
 'own',
 'face',
 'glass',
 'romanticism',
 'not',
 'life',
 'man',
 'forms',
 'part',
 'subjectmatter',
 'but',
 'morality',
 'consists',
 'perfect',
 'use',
 'imperfect',
 'medium',
 'desires',
 'prove',
 'a

<h3> 13.2 - Números aleatórios </h3>

Com as mesmas entradas, a maior parte dos programas gera as mesmas saídas a cada vez,
então eles são chamados de deterministas. Determinismo normalmente é uma coisa boa, já
que esperamos que o mesmo cálculo produza o mesmo resultado. Para algumas
aplicações, entretanto, queremos que o computador seja imprevisível. Os jogos são um
exemplo óbvio, mas há outros.
Fazer um programa não determinista de verdade é difícil; mas há formas de, pelo menos,
fazê-los parecer que não são. Uma delas é usar algoritmos que geram números
pseudoaleatórios. Os números pseudoaleatórios não são aleatórios mesmo porque são
gerados por um cálculo determinista, mas é quase impossível distingui-los dos aleatórios
só olhando para os números.
O módulo random fornece funções que geram números pseudoaleatórios (que chamarei
apenas de “aleatórios” daqui em diante).
A função random retorna um número de ponto flutuante entre 0,0 e 1,0 (incluindo 0,0, mas
não 1,0). Cada vez que random é chamada, você recebe o próximo número em uma longa
série. Para ver uma amostra, execute este loop:

<code>
import random

for i in range(10):<br>
    &nbsp;&nbsp;x = random.random()<br>
    &nbsp;&nbsp;print(x)
</code>

A função randint recebe os parâmetros low e high e retorna um número inteiro entre low
e high (inclusive ambos):

<code>
>>> random.randint(5, 10)<br>
5<br>
>>> random.randint(5, 10)<br>
9<br>
</code>

Para escolher aleatoriamente um elemento de uma sequência, você pode usar choice:

<code>
>>> t = [1, 2, 3]<br>
>>> random.choice(t)<br>
2<br>
>>> random.choice(t)<br>
3<br>
</code>

O módulo random também fornece funções para gerar valores aleatórios de distribuições
contínuas, incluindo gaussianas, exponenciais, gamma e algumas outras.

In [15]:
import random

for i in range(10):
    x = random.random()
    print(x)

0.5864997668580381
0.2224136788521941
0.9117529591246106
0.8462979882422675
0.3076942309607985
0.9674561588933928
0.1573315354042868
0.2604930866665869
0.40427570087864173
0.6176286038159207


In [18]:
random.randint(5, 10)

5

In [19]:
random.randint(5, 10)

6

In [21]:
# Para escolher aleatoriamente um elemento de uma sequência, você pode usar choice:
t = [1, 2, 3]
random.choice(t)

1

<h3> Exercício 13.5 </h3>

Escreva uma função chamada choose_from_hist que receba um histograma como
definido em “Um dicionário como uma coleção de contadores”, na página 163, e retorne
um valor aleatório do histograma, escolhido por probabilidade em proporção à frequência.
Por exemplo, para este histograma:

<code>
>>> t = ['a', 'a', 'b']<br>
>>> hist = histogram(t)<br>
>>> hist<br>
{'a': 2, 'b': 1}<br>
</code>


In [2]:
def histogram(s):
    d = dict()
    
    for c in s:
        if c not in d:
            d[c] = 1
        else:
            d[c] += 1
            
    return d

In [3]:
h = histogram('brontosaurus')
h

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

In [5]:
import random

def choose_from_hist(histograma):
    soma_frequencias = 0
    valor_acumulado = 0

    for i in histograma.values():
        soma_frequencias += i

    valor_aleatorio = random.randint(1, soma_frequencias)
    
    print('Soma das frequências: ', soma_frequencias)
    print('Valor aleatório escolhido: ', valor_aleatorio)

    for k, v in histograma.items():
        valor_acumulado += v
        if valor_aleatorio <= valor_acumulado:
            return k

In [36]:
choose_from_hist(h)

12
4


'o'

<h3> 13.3 - Histograma de palavras </h3>

É uma boa ideia tentar fazer os exercícios anteriores antes de continuar. Você pode baixar
minha solução em http://thinkpython2.com/code/analyze_book1.py. Também vai precisar
de http://thinkpython2.com/code/emma.txt.
Aqui está um programa que lê um arquivo e constrói um histograma das palavras no
arquivo:

In [5]:
import string

In [6]:
def process_file(filename):
    hist = dict()

    fp = open(filename)
    
    for line in fp:
        process_line(line, hist)
    return hist

In [7]:
def process_line(line, hist):
    line = line.replace('-', ' ')
    
    for word in line.split():
        word = word.strip(string.punctuation + string.whitespace)
        word = word.lower()
        hist[word] = hist.get(word, 0) + 1
        hist = process_file('emma.txt')

In [8]:
hist = process_file('emma.txt')

: 

Este programa lê emma.txt, que contém o texto de Emma, de Jane Austen.
**process_file** faz o loop pelas linhas do arquivo, passando-as uma a uma para
**process_line**. O histograma hist está sendo usado como um acumulador

**process_line** usa o método de string replace para substituir hifens por espaços antes de
usar split para quebrar a linha em uma lista de strings. Ele atravessa a lista de palavras e
usa strip e lower para retirar a pontuação e converter tudo em letras minúsculas. (Dizer
que as strings “são convertidas” é uma forma simples de explicar a coisa; lembre-se de
que as strings são imutáveis, então métodos como strip e lower retornam novas strings.)


Finalmente, **process_line** atualiza o histograma, criando um novo item ou incrementando
um existente.

Para contar o número total de palavras no arquivo, podemos somar as frequências no
histograma:

In [10]:
def total_words(hist):
    return sum(hist.values())

In [4]:
h = histogram('brontosaurus')

In [12]:
total_words(h)

12

O número de palavras diferentes é somente o número de itens no dicionário:

In [17]:
def different_words(h):
    return len(h) # número de chaves

In [16]:
different_words(h)

8

Aqui está o código para exibir os resultados:

In [19]:
print('Total number of words:', total_words(h))
print('Number of different words:', different_words(h))

Total number of words: 12
Number of different words: 8


E os resultados:
<code><br>
Total number of words: 161080 <br>
Number of different words: 7214 <br>
</code>

<h3> 13.4 - Palavras mais comuns </h3>

Para encontrar as palavras mais comuns, podemos fazer uma lista de tuplas, onde cada
tupla contenha uma palavra e a sua frequência, e ordenar a lista.
A função seguinte recebe um histograma e retorna uma lista de tuplas de palavras e
frequências:

In [5]:
def most_common(hist):
    t = []
    
    for key, value in hist.items():
        t.append((value, key))
        t.sort(reverse=True)
    
    return t

In [7]:
most_common(h) # brontosaurus

[(2, 'u'),
 (2, 's'),
 (2, 'r'),
 (2, 'o'),
 (1, 't'),
 (1, 'n'),
 (1, 'b'),
 (1, 'a')]

**POR QUE E COMO É CRIADO A TUPLA NESSA FUNÇÃO?**

Uma tupla é como uma lista, mas imutável (não pode ser alterada depois de criada). Você pode usar parênteses () para criar uma tupla. No código, **(value, key)** é uma tupla com dois elementos.

Quando dois primeiros valores de tuplas são iguais, o desempate acontece somente entre essas duas tuplas. Ou seja, o segundo elemento (a chave) será usado apenas para ordenar as tuplas que possuem o mesmo primeiro valor.

Vamos usar um exemplo para deixar isso mais claro.

Exemplo:
Imagine que a lista de tuplas seja:

<code>
t = [(3, 'b'), (3, 'a'), (2, 'c'), (1, 'd')]
</code>

Ao chamar **t.sort(reverse=True)**, a ordem seguirá esta lógica:

Primeiro, o Python compara o primeiro elemento de todas as tuplas.

**(3, 'b') e (3, 'a')** têm o mesmo primeiro **valor (3)**, então precisam ser desempates usando o segundo elemento.
**(2, 'c') e (1, 'd')** têm valores diferentes, então já ficam em suas respectivas posições sem necessidade de desempate.
O Python desempata as tuplas com **valor 3** comparando o segundo elemento (as chaves **'b'** e **'a'**).

Como **'a'** vem antes de **'b'** em ordem alfabética, **(3, 'a')** virá depois de **(3, 'b')** em uma ordenação decrescente.
Resultado final:
Após a ordenação, a lista ficará:

<code>
[(3, 'b'), (3, 'a'), (2, 'c'), (1, 'd')]
</code>

**Conclusão:**
O desempate pelo segundo elemento só acontece quando o primeiro elemento é igual.
As outras tuplas não são afetadas pelo desempate, apenas aquelas que compartilham o mesmo valor no primeiro elemento.
Ou seja, a lógica de desempate é local, válida apenas entre os elementos que precisam ser comparados diretamente.

Em cada tupla, a frequência aparece primeiro, então a lista resultante é ordenada por
frequência. Aqui está um loop que imprime as 10 palavras mais comuns:

In [17]:
t = most_common(h)

print('The most common words are:')

for freq, word in t[:10]:
    print(word, freq, sep='\t') # sep = separador entre um valor e outro. no nosso caso, será uma tabulação entre 'word' e 'freq'

The most common words are:
u	2
s	2
r	2
o	2
t	1
n	1
b	1
a	1


Este código pode ser simplificado usando o parâmetro key da função sort. Se tiver curiosidade, pode ler sobre ele em https://wiki.python.org/moin/HowTo/Sorting.

O parâmetro key da função sort() em Python é usado para definir como os elementos da lista serão comparados durante a ordenação.

De forma simples:
- O parâmetro key recebe uma função que transforma cada elemento da lista antes de fazer a comparação.
- O Python usa essa transformação para decidir a ordem dos elementos.

**Como funciona:**
Sem o key: A lista é ordenada diretamente pelos próprios valores dos elementos.

Exemplo:

In [18]:
lista = [5, 2, 9, 1]
lista.sort()  # Ordena diretamente pelos números
print(lista)  # Resultado: [1, 2, 5, 9]

[1, 2, 5, 9]


Com o key: A lista é ordenada com base na transformação definida pela função passada em key.

Exemplo:

In [19]:
lista = ['banana', 'apple', 'grape']
lista.sort(key=len)  # Ordena pela quantidade de letras (tamanho da string)
print(lista)  # Resultado: ['apple', 'grape', 'banana']

['apple', 'grape', 'banana']


Neste exemplo, a função len foi usada como key. Ela calcula o tamanho de cada string, e a lista é ordenada com base no comprimento de cada palavra.

**Exemplos práticos:**<br>
Ordenar por segundo elemento de uma tupla:

In [20]:
lista = [(1, 'banana'), (2, 'apple'), (3, 'grape')]
lista.sort(key=lambda x: x[1])  # Ordena pelo segundo item de cada tupla (frutas)
print(lista)  # Resultado: [(2, 'apple'), (1, 'banana'), (3, 'grape')]

[(2, 'apple'), (1, 'banana'), (3, 'grape')]


Aqui, a função lambda x: x[1] transforma cada tupla para seu segundo valor (o nome da fruta) antes de ordenar.

**Ordenar por valor absoluto:**

In [21]:
lista = [-3, 1, -10, 5]
lista.sort(key=abs)  # Ordena pelo valor absoluto
print(lista)  # Resultado: [1, -3, 5, -10]

[1, -3, 5, -10]


A função abs retorna o valor absoluto de cada número, então a lista é ordenada ignorando os sinais.

**Resumo:**
- O key transforma os elementos antes da comparação.
- É útil quando você quer ordenar de uma maneira específica, como por tamanho de string, por parte de uma tupla, ou por valor absoluto.

<h2> 13.5 - Parâmetros opcionais </h2>