# # Introdução a linguagem Python

## Classificação de listas simples: o algoritmo de classificação bubblesort

Agora que você pode efetivamente manipular os elementos das listas, é hora de aprender a classificá-las. Muitos algoritmos de classificação foram inventados até agora, que diferem muito na velocidade e na complexidade. Vamos mostrar um algoritmo muito simples, fácil de entender, mas infelizmente não muito eficiente. É usado muito raramente, e certamente não para listas grandes e extensas.

Digamos que uma lista pode ser classificada de duas maneiras:

- crescente (ou mais precisamente - não decrescente) - se, em cada par de elementos adjacentes, o primeiro elemento não for maior que o último;

- decrescente (ou mais precisamente - não crescente) - se, em cada par de elementos adjacentes, o primeiro elemento não for menor que o último.

Nas seções a seguir, classificaremos a lista em ordem crescente, para que os números sejam ordenados do menor para o maior. Aqui está a lista:

8, 10, 6, 2, 4.

Vamos tentar usar a seguinte abordagem: vamos pegar o primeiro e o segundo elementos e compará-los; se determinarmos que eles estão na ordem errada (ou seja, o primeiro é maior que o segundo), vamos trocá-los; se o pedido for válido, não faremos nada. Uma rápida olhada em nossa lista confirma a última; os elementos 01 e 02 estão na ordem correta, como em 8<10.

>8, 10, 6, 2, 4. 

Agora, observe o segundo e o terceiro elementos. Eles estão nas posições erradas. Temos que trocá-los:

>8, 10,  6, 2, 4
>
>8,  6, 10, 2, 4

Vamos mais além e olhamos para o terceiro e o quarto elementos. Novamente, isso não é o que deveria ser. Temos que trocá-los:

>8, 6, 10,  2, 4
>
>8, 6,  2, 10, 4

Agora vamos verificar o quarto e o quinto elementos. Sim, eles também estão nas posições erradas. Outra troca ocorre:

>8, 6, 2, 10,  4
>
>8, 6, 2,  4, 10

A primeira passagem pela lista já está concluída. Ainda estamos longe de terminar nosso trabalho, mas algo curioso aconteceu enquanto isso. O maior elemento, 10, já foi ao fim da lista. Observe que este é o local desejado. Todos os elementos restantes formam uma confusão pitoresca, mas este já está em vigor.

Agora vamos começar com a segunda passagem pela lista. Analisamos o primeiro e o segundo elementos - uma troca é necessária:

>8, 6, 2,  4, 10
>
>6, 8, 2,  4, 10

Tempo para o segundo e terceiro elementos: temos que trocá-los também:

>6, 8, 2, 4, 10
>
>6, 2, 8, 4, 10

Agora, o terceiro e o quarto elementos e a segunda passagem estão concluídos, pois 8 já está em vigor:

Começamos o próximo passe imediatamente. Observe o primeiro e o segundo elementos com cuidado; outra trocar é necessária:

>6, 2, 8, 4, 10
>
>2, 6, 4, 8, 10

Agora 6 precisa ser implementado. Trocamos o segundo e o terceiro elementos:

>2, 6, 4, 8, 10
>
>2, 4, 6, 8, 10

A lista já está classificada. Não temos mais nada a fazer. Isso é exatamente o que queremos.

>2, 4, 6, 8, 10

Agora, vamos tentar resumir o que fizemos. Nós:

- percorremos a lista, comparando cada par de elementos adjacentes e trocando-os se necessário;
- repetimos o processo até que uma passagem completa pela lista não exija nenhuma troca.

### Ordenando uma lista

Quantos passos precisamos para classificar a lista inteira?

Resolvemos esse problema da seguinte maneira: introduzimos outra variável ; sua tarefa é observar se alguma troca foi feita durante a passagem ou não; se não houver troca, a lista já está classificada e nada mais precisa ser feito. Criamos uma variável chamada swapped e atribuímos um valor de False a ela para indicar que não há swaps. Caso contrário, ele será atribuído como True.


In [4]:
lista = [8, 10, 6, 2, 4]  # Lista para ordenar

trocar = True # A variável que monitora se houve trocas feitas na lista. Inicialmente, definido como True para entrar no loop while.
trocas = 0 # Contador de trocas feitas na lista.

while trocar: # Enquanto uma troca for feita, continue o loop.

    trocar = False  # Não há trocas até agora. Se passarmos por todo o loop e não houver trocas, o valor permanecerá False e saberemos que a lista está classificada.

    for i in range(len(lista) - 1): # Loop através da lista. len(lista) - 1 é usado porque o último elemento não precisa ser verificado.
        if lista[i] > lista[i + 1]: # Se o elemento atual for maior que o próximo elemento, então:
            trocar = True # Continue o loop enquanto houver trocas.
            lista[i], lista[i + 1] = lista[i + 1], lista[i] # Troque os dois elementos.
            trocas += 1 # Adicione 1 ao contador de trocas.
print(lista)
print(f'Trocas feitas: {trocas}')

[2, 4, 6, 8, 10]
Trocas feitas: 8


### A ordenação por bolhas - versão interativa

Esse método de classificação é chamado de ordenação por bolhas, porque os elementos "flutuam" para a superfície, como bolhas em um tanque de água. É um método muito simples, mas não muito eficiente. A complexidade do algoritmo é O(n2), o que significa que o número de operações necessárias cresce quadraticamente com o número de elementos na lista. Isso é muito ruim, especialmente quando você tem uma lista grande.

In [5]:

while trocar: # Enquanto uma troca for feita, continue o loop.
    
    trocar = False # Não há trocas até agora. Se passarmos por todo o loop e não houver trocas, o valor permanecerá False e saberemos que a lista está classificada.
    
    for i in range(len(lista) - 1): # Loop através da lista. len(my_list) - 1 é usado porque o último elemento não precisa ser verificado.
        
        if lista[i] > lista[i + 1]: # Se o elemento atual for maior que o próximo elemento, então:
            
            swapped = True
            lista[i], lista[i + 1] = lista[i + 1], lista[i] # Troque os dois elementos.

print(lista)

[2, 4, 6, 8, 10]


Python, no entanto, tem seus próprios mecanismos de classificação. Ninguém precisa escrever seus próprios tipos, pois há um número suficiente de ferramentas prontas para o uso.

Se você quiser que o Python classifique sua lista, é possível fazer o seguinte:

In [6]:
my_list = [8, 10, 6, 2, 4]
my_list.sort()
print(my_list)

[2, 4, 6, 8, 10]


Como você pode ver, todas as listas têm um método chamado sort(), que as classifica o mais rápido possível. Você já aprendeu sobre alguns dos métodos de lista antes e em breve aprenderá mais sobre outros.

NOTA: sort() é um método que não retorna nenhum valor. Ele apenas classifica a lista. Se você tentar atribuir o resultado a uma nova variável, a nova variável será None.

Após usar sort() a lista original é alterada. Se você não quiser alterar a lista original, você pode usar a função sorted() que retorna uma lista classificada e não altera a original.

In [6]:
# Com sort() - a lista original é alterada.

lista = [8, 10, 6, 2, 4] # Lista original.

lista.sort() # A lista original é alterada.

print(lista) # [2, 4, 6, 8, 10]

lista2 = lista.sort() # sort() não retorna nenhum valor. Esse é um bom exemplo de sintaxe correta, mas semantica incorreta. Não será mostrado um erro, mas a variável lista2 será None, oque pode não ser o que você queria.

print(lista2) # None

[2, 4, 6, 8, 10]
None


Ao usar sort() numa lista de números, os números são classificados em ordem crescente, sejam eles inteiros ou de ponto flutuante, negativos ou positivos.

Ao usar sort() em uma lista de com strings, os valores são ordenados em ordem alfabética

In [7]:
# Com sorted() - uma nova lista é criada.

lista = [8, 10, 6, 2, 4] # Lista original.

lista2 = sorted(lista) # Uma nova lista é criada.

print(lista) # [8, 10, 6, 2, 4]
print(lista2) # [2, 4, 6, 8, 10]

[8, 10, 6, 2, 4]
[2, 4, 6, 8, 10]


Podemos gerar uma lista na ordem decrescente usando o parâmetro reverse=True no método sort() ou na função sorted(). 

Porém também existe um método chamado reverse() que inverte a ordem dos elementos da lista. Esse método não retorna nenhum valor, ele apenas inverte a lista, assim como o método sort().


### Encontrando dados extremos

Para explorar os dados que armazenamos em listas, muitas vezes é útil encontrar os valores extremos: O mínimo e o máximo.

In [8]:
pontos = [3, 5, 4, 6, 7, 2, 1]
print(pontos)

[3, 5, 4, 6, 7, 2, 1]


Para encontrar o maior número em uma lista de dados, codificamos max(), com o nome da lista entre os parênteses.

In [9]:
print(max(pontos))

7


Para encontrar o menor, codificamos min()

In [10]:
print(min(pontos))

1


#### Somando dados

Saber a soma dos números nas listas é útil ao comparar diferentes conjuntos de dados, como a diferença nas inscrições semanais em dois meses.


In [11]:
junho = [30, 6, 20, 12]
julho = [20, 5, 100, 40]

Para calcular o total de uma lista, usamos sum() com o nome da lista entre os parênteses.

Para reutilizar a soma da lista, podemos salvar o resultado em uma variável.

In [12]:
print(sum(junho))
print(sum(julho))

68
165


#### Unindo listas de dados

Frequentemente encontraremos diferentes conjuntos de dados que devemos combinar em um só, como o valor das vendas no fim de semana.

In [13]:
sabado = [50, 3, 20, 22, 5]
print(sabado)
domingo = [60, 10, 9, 11, 40]
print(domingo)

[50, 3, 20, 22, 5]
[60, 10, 9, 11, 40]


Para combinar dois conjuntos de dados, criamos uma expressão usando o operador +. A segunda lista é anexada no final da primeira. Portanto, a ordem das listas é importante.

Podemos salvar alista combinada em uma variável para reutilizá-la

In [14]:
vendas_fds = sabado + domingo
print(vendas_fds)

# A união também funciona com diferentes tipos de valores.

[50, 3, 20, 22, 5, 60, 10, 9, 11, 40]


 A ordem dos elementos na lista combinada é importante. Se quisermos que os elementos sejam classificados, podemos usar o método sort()

#### Contando elementos

Ao explorar conjuntos de dados, é bom saber quantas vezes um dado está presente, como a resposta mais frequente a uma pesquisa.

In [15]:
respostas = ['sim', 'não', 'as vezes', 'sim', 'sim', 'não', 'não', 'não', 'sim', 'as vezes', 'não', 'sim']

Para contar a frequência que um valor aparece em uma lista como, começamos com o nome da lista, um ponto e em seguida o método count(), com o valor desejado entre os parênteses

Podemos salvar o resultado da consulta em uma variável para reutilizá-la depois.

In [16]:
frequencia = respostas.count('sim')
print(frequencia)

5


Se quisessemos exibir cada resposta e sua frequência, poderíamos usar um loop for

In [17]:
questionario = []

for resposta in respostas:
  # Se a resposta já estiver no questionário, não precisamos contá-la novamente.
  
  if resposta not in questionario:
    # Se a resposta não estiver no questionário, contamos quantas vezes ela aparece na lista de respostas.
    
    frequencia = respostas.count(resposta)
    
    # Exibimos a resposta e sua frequência.
    print(f'{resposta}: {frequencia}')
    
    # Adicionamos a resposta ao questionário.
    questionario.append(resposta)

sim: 5
não: 5
as vezes: 2


Se não quisermos saber o número exato, mas apenas se existe um elemento específico, usamos a palavra-chave in

 O resultado será um boolean, True se houver o item na lista, caso contrário, False
print('não' in respostas)

In [19]:
print('não' in respostas)

True
