# Aula 10 - *Selection Sort*

## Objetivos:
- Implementar o *Selection Sort* em Python
- Comparar o tempo puro do *Selection Sort* com o *Bubble Sort* e o método `sort` da classe `list`
- Resolver um problema com dois algoritmos descritos pela mesmo notação Big O e determinar qual o mais eficiente

## Algoritmos de ordenação
Nesta aula continuamos o estudo de algoritmos de ordenação. Na semana passada implementados no *bubble sort*. Hoje implementaremos o *selection sort* e compararemos sua eficiência com aquela do *bubble sort*.

## Ordenação com o *Selection Sort*

Vimos na aula anterior que o *selection sort* compreende essencialmente três etapas com início no índice 0:

1. Verificar cada célula do *array* da esquerda para a direita a partir da última célula já ordenada e determinar o índice da célula com menor valor;
2. Trocar o valor do índice com o menor valor e o valor do índice de início da passagem;
3. Repetir os passos 1 e 2 até que o *array* esteja ordenado.

Após cada passagem, um elemento na parte inicial do *array* fica na ordem correta, do início para o final. A figura a seguir mostra a aplicação do *bubble sort* para o *array* `[4, 2, 7, 1, 3]`.

![alt text](https://docs.google.com/uc?export=download&id=1LqhlLqQ9O06S-KhKMFC1ddC5eJQwqLU9)

Vemos ao todo quatro passagens. Nos passos 1, 3, 9 e 10 o índice do menor valor é atualizado após a comparação. Nos passos 2, 4, 6, 7, 8 e 12 a atualização não é necessária. Nos passos 5 e 11 há a troca de valores no encerramento das passagens, enquanto no passo 8 essa troca não foi necessária. No passo 12 o *array* está ordenado.

**Exercício:** Implemente uma função em Python chamada `selection_sort` para ordenação de um *array* regular que recebe como argumento uma lista com elementos em qualquer ordem e que devolve uma lista com os elementos ordenados. Teste para diferentes listas de entrada.

In [0]:
def selection_sort(array):
  index_ini = 0
  n_ordenado = True
  while n_ordenado:
    menor_valor = array[index_ini]
    #comparação de cada elemento
    for i in range(index_ini,len(array)):
      #print(menor_valor, array[i])
      if menor_valor > array[i]:
        menor_valor = array[i]
    #troca
    index_menor = array.index(menor_valor)
    array[index_menor],array[index_ini] = array[index_ini],array[index_menor]
    #print(f'Troca efetuada {array[index_menor]}-{index_menor},{array[index_ini]}-{index_ini}')
    #percorre todo array ordenando
    if (index_ini == len(array)-2):
      n_ordenado = False
      #print(array)
    index_ini += 1
    
    
def selection_sort2(array):
  for i in range(len(array)):
    indice_menor_valor = i
    for j in range(i, len(array)):
      if array[j] < array[indice_menor_valor]:
        indice_menor_valor = j
    if i != indice_menor_valor:
      array[indice_menor_valor],array[i] = array[i],array[indice_menor_valor]
      
       
        
    

In [0]:
array = [4, 2, 7, 1, 3]
#selection_sort(array)
selection_sort2(array)
array

[1, 2, 3, 4, 7]

**Exercício:** Use as células abaixo (ou crie mais células, se necessário) para escrever códigos de teste do tempo de execução para a ordenação com *selection sort* em listas de tamanhos variados com, por exemplo, 100, 1000 e 10000 elementos, várias vezes. Use a função `range` com um passo negativo para criar a lista em ordem descendente, o que configura o pior caso. Os tempos de execução observados são compatíveis com a complexidade $O(n^2)$ como visto na aula anterior?

In [0]:
time = []
for i in range(100):
    l = list(range(100,0,-1))
    t = %timeit -o -r 1 -n 1 -q selection_sort2(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0003342996499941364


In [0]:
time = []
for i in range(100):
    l = list(range(100,0,-1))
    t = %timeit -o -r 1 -n 1 -q selection_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0004272561600055269


In [0]:
time = []
for i in range(100):
    l = list(range(10000,0,-1))
    t = %timeit -o -r 1 -n 1 -q selection_sort2(l)
    time.append(t.best)
print(sum(time)/len(time))

KeyboardInterrupt: ignored

**Exercício:** Repita nas células a seguir o teste realizado na aula da semana passada com o *bubble sort*. Os resultados são consistentes com a discussão realizada na aula anterior?

In [0]:
# Função para ordenação de listas pelo método bubble sort
def bubble_sort(list):
    unsorted_until_index = len(list) - 1
    sorted = False
    while not sorted:
        sorted = True
        for i in range(unsorted_until_index):
            if list[i] > list[i+1]:
                sorted = False
                list[i], list[i+1] = list[i+1], list[i]
        unsorted_until_index = unsorted_until_index - 1

In [0]:
time = []
for i in range(100):
    l = list(range(100,0,-1))
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0008689161100073761


In [0]:
time = []
for i in range(100):
    l = list(range(1000,0,-1))
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.09113445915998454


In [0]:
time = []
for i in range(100):
    l = list(range(10000,0,-1))
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

9.664371971339978


**Exercício** Repita o exercício da aula da semana passada usando o método `sort` da classe `list`. Compare os resultados obtidos com os resultados dos exercícios anteriores. É possível que o método `sort` use *selection sort* para ordenar listas?

In [0]:
time = []
for i in range(100):
    l = list(range(100,0,-1))
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

2.572210032667499e-06


In [0]:
time = []
for i in range(100):
    l = list(range(1000,0,-1))
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

1.40803800059075e-05


In [0]:
time = []
for i in range(100):
    l = list(range(10000,0,-1))
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

0.00012790130001121724


## Um exemplo prático

Considere o problema de copiar os elementos alternados de um *array* para criar um novo *array*. O código a seguir apresenta um possível solução.

In [0]:
# Função que copia os elementos alternados de um array para criar um novo array
def copia_um_sim_um_nao(array):
    novo_array = []
    for i, v in enumerate(array):
        if i % 2 == 0:
            novo_array.append(v)
    return novo_array

**Exercício:** Teste a função `copia_um_sim_um_nao` para alguns exemplos de *arrays* e certifique-se de que ela funciona.

In [0]:
array = [4, 2, 7, 1, 3]
print(copia_um_sim_um_nao(array))
array2 = [1, 2, 3, 4, 7]
print(copia_um_sim_um_nao(array2))
array3 = [6, 5, 8, 9, 1]
print(copia_um_sim_um_nao(array3))

[4, 7, 3]
[1, 3, 7]
[6, 8, 1]


**Exercício:** Analise o código e determine o que caracteriza um passo na solução desse problema. O que caracteriza um cenário de pior caso para este problema? Qual o número de passos necessários para resolver o problema no pior caso? Se necessário, faça uma função `copia_um_sim_um_nao_print` que mostra os passos. Qual a ordem de crescimento ou complexidade no tempo da função `copia_um_sim_um_nao` usando a notação Big O?

In [0]:
def copia_um_sim_um_nao_print(array):
    novo_array = []
    for i, v in enumerate(array):
        print(i,v,novo_array)
        if i % 2 == 0:
            novo_array.append(v)
            print(i,v,novo_array)
    return novo_array

In [0]:
array = [4, 2, 7]
print(copia_um_sim_um_nao_print(array))
print('----------------')
array2 = [1, 2, 3, 4]
print(copia_um_sim_um_nao_print(array2))
print('----------------')
array3 = [6, 5, 8, 9, 1]
print(copia_um_sim_um_nao_print(array3))

0 4 []
0 4 [4]
1 2 [4]
2 7 [4]
2 7 [4, 7]
[4, 7]
----------------
0 1 []
0 1 [1]
1 2 [1]
2 3 [1]
2 3 [1, 3]
3 4 [1, 3]
[1, 3]
----------------
0 6 []
0 6 [6]
1 5 [6]
2 8 [6]
2 8 [6, 8]
3 9 [6, 8]
4 1 [6, 8]
4 1 [6, 8, 1]
[6, 8, 1]


**Digite aqui sua resposta:** Acessar os indices pares e alocarem numa nova lista.
não tem pior caso,(n+n/2).O(n)

**Exercício:** Use as células abaixo (ou crie mais células, se necessário) para escrever códigos de teste do tempo de execução de `copia_um_sim_um_nao` em listas de tamanhos variados com, por exemplo, 100, 1000 e 10000 elementos, várias vezes. Os tempos de execução observados são compatíveis com a análise dos exercícios anteriores?

In [0]:
l = list(range(100,0,-1))
%timeit copia_um_sim_um_nao(l)

100000 loops, best of 3: 8.72 µs per loop


In [0]:
l = list(range(1000,0,-1))
%timeit copia_um_sim_um_nao(l)

10000 loops, best of 3: 94.7 µs per loop


In [0]:
l = list(range(1000,0,-1))
%timeit copia_um_sim_um_nao(l)

10000 loops, best of 3: 93.5 µs per loop


**Digite aqui sua resposta:** 

## Uma solução alternativa

Se você analisou corretamente a implementação anterior que resolve o problema de verificação de valores duplicados em um *array*, determinou a complexidade é $O(n)$. Será possível usar um algoritmo mais eficiente para copiar os valores alternados de um *array*?



**Exercício:** Implemente uma função em Python chamada `copia_um_sim_um_nao_rapida` para copiar os valores alternados de um *array* que seja mais eficiente do que a implementação original.

In [0]:
def copia_um_sim_um_nao_rapida(array):
  novo_array = []
  i = 0
  while i < len(array):
    novo_array.append(array[i])
    i += 2
  return novo_array
    
def copia_um_sim_um_nao_rapida2(array):
  novo_array = []
  for i in range(0,len(array),2):
    novo_array.append(array[i])
  return novo_array
    

**Exercício:** Teste a função `copia_um_sim_um_nao_rapida` para alguns exemplos com e sem valores duplicados e certifique-se de que ela funciona.


In [0]:
array = [4, 2, 7, 1, 3]
print(copia_um_sim_um_nao_rapida(array))
array2 = [1, 2, 3, 4, 7]
print(copia_um_sim_um_nao_rapida(array2))
array3 = [6, 5, 8, 9, 1]
print(copia_um_sim_um_nao_rapida(array3))

[4, 7, 3]
[1, 3, 7]
[6, 8, 1]


**Exercício:** Analise o código e determine o que caracteriza um passo na solução desse problema. O que caracteriza um cenário de pior caso para este problema? Qual o número de passos necessários para resolver o problema no pior caso? Se necessário, faça uma função `copia_um_sim_um_nao_rapida_print` que mostra os passos. Qual a ordem de crescimento ou complexidade no tempo da função `copia_um_sim_um_nao_rapida` usando a notação Big O?

In [0]:
# digite seu código aqui

In [0]:
# digite seu código aqui

**Digite aqui sua resposta:** 

**Exercício:** Use as células abaixo (ou crie mais células, se necessário) para escrever códigos de teste do tempo de execução de `copia_um_sim_um_nao_rapida` em listas de tamanhos variados com, por exemplo, 100, 1000 e 10000 elementos, várias vezes. Os tempos de execução observados são compatíveis com a análise dos exercícios anteriores? Foi possível obter um algoritmo mais eficiente? A notação Big O mudou?

In [0]:
l = list(range(100,0,-1))
%timeit copia_um_sim_um_nao_rapida(l)

100000 loops, best of 3: 6.54 µs per loop


In [0]:
l = list(range(1000,0,-1))
%timeit copia_um_sim_um_nao_rapida(l)

10000 loops, best of 3: 72.4 µs per loop


In [0]:
l = list(range(10000,0,-1))
%timeit copia_um_sim_um_nao_rapida(l)

1000 loops, best of 3: 723 µs per loop


**Digite aqui sua resposta:**