# Aula 20 - *Quicksort*

## Objetivos:
- Implementar o *Quicksort* em Python
- Avaliar o tempo puro de execução do *Quicksort* para o pior caso
- Comparar o tempo puro de execução do *Quicksort* com o *Insertion Sort*, com o *Selection Sort*, com o *Bubble Sort* e o método `sort` da classe `list` para o caso médio

## Algoritmos de ordenação
Nesta aula continuamos o estudo de algoritmos de ordenação. Em aulas passadas implementamos o *bubble sort*, o *selection sort*, e o *insertion sort*. Hoje implementaremos o *quicksort* e compararemos sua eficiência com aquela do *bubble sort*, do *selection sort*, e do *insertion sort*.

## Ordenação com o *Quicksort*

Vimos na aula anterior que o *quicksort* depende inteiramente do método de partição estudado na semana passada. Conhecido o método de partição, o *quicksort* consiste de:

1. Particionar o *array*. Ao final da partição o pivô está na posição correta;
2. Trata os *subarrays* à esquerda e à direita como novos *arrays* e aplica 1 e 2 recursivamente;
3. Quando um *subarray* tiver 0 ou 1 elemento, nada é feito. Este é o caso base.

A figura a seguir mostra a aplicação do *quicksort* para o *array* `[0, 5, 2, 1, 6, 3]`. A figura inicia do passo #8 que é o passo final da primeira partição, já realizada na semana passada, que teve o número 3 como pivô e que agora já está na posição correta.

![alt text](https://docs.google.com/uc?export=download&id=1JySVY6mI_n-VIseK6MKHV_x-U2Xg3mYx)


Após o passo #8 vemos a preparação para que ocorra a partição do *subarray* à esquerda do pivô 3. O número 2 é tomado como pivô e os ponteiros esquerdo (pe) e direito (pd) são posicionados. No passo #9 os valores 0 e 2 são comparados. Como 0 é menor, no passo #10 o pe é deslocado para a direita e novamente comparado com o pivô. Como 1 é menor do que 2, no passo #11 o pe é mais uma vez deslcaod para a direita. Como o pe ultrapassou o pd, encerra-se com o pe. No passoo #12 o pd é comparado com o pivô. Como 1 é menor do que 2 e o pd ultrapassou o pe, no passo #13 o pe é trocado com o pivô. Como o pe e pivô são o mesmo, nada é feito e os valores 2 e 3 passam a estar na posição correta. Há um *subarray* à esquerda do pivô 2 que deve ser particionado. Após a preparação, no passo #14 o pe é comparado com o pivô. Como 0 é menor do que 1, o pe é deslocado para a direita e comparado com o pivô no passo #15. O pe é o próprio pivô. Encerra-se com o pe e no passo #16, o pd é comparado com o pivô. Como zero é menor que o pivô e o pd ultrapassou o pe, o pe é trocado pelo pivô no passo #17. Mais uma vez o pe e o pivô são o mesmo. Os valores 2, 3 e 6 estão na posição correta. Além disso, como o subarray à esquerda o pivô 1 tem tamanho 1, trata-se de um caso base e o valor 0 também está na posição correta. É feita uma nova preparação para tratar do *subarray* que ficou pendente à direita do pivô 3 (o inicial). No passo #18 o pe é comparado com o pivô. Como 6 é maior do que 5, o pe pára. No passo #19 o pd é comparado com o pivô. Como 6 é maior do que 5 e estamos no extremo esquerdo do *subarray*, uma troca é necessária. No passo #20 o pe é trocado com o pivô. Assim, os valores 0, 1, 2, 3 e agora também o 5, estão na posiçcão correta. Como o *subarray* remanescente à direita do pivô 5 tem tamanho 1, trata-se de um caso base e o valor 6 também está na posição correta. Ao final do passo 20, o *array* está ordenado.

**Exercício:** Implemente uma função em Python chamada `quicksort` para ordenação de um *array* regular que recebe como argumento uma lista com elementos em qualquer ordem e que devolve uma lista com os elementos ordenados. Reaproveite a função `particao` criada na semana passada e fornecida a seguir (alguns ajustes podem ser necessários).Teste para diferentes listas de entrada.

In [0]:
import sys
sys.setrecursionlimit(1000000) #aumentar limite de recursão

In [0]:
def particao(array):
  pv_pos = len(array)-1 # pivô
  pv = array[pv_pos]    # pivô
  pe = 0                # ponteiro esquerdo
  pd = pv_pos - 1       # ponteiro direito
  while True:
    while array[pe] < pv:
      pe = pe + 1
    while array[pd] > pv:
      pd = pd - 1
    if pe >= pd:
      break
    else:
      array[pe], array[pd] = array[pd], array[pe]
  array[pe], array[pv_pos] = array[pv_pos], array[pe]
  return pe

In [0]:
def particao(array, pe, pd): #alterado
  pv_pos = pd # pivô
  pv = array[pv_pos]    # pivô
  #pe = 0                # ponteiro esquerdo
  pd = pv_pos - 1       # ponteiro direito
  while True:
    while array[pe] < pv:
      pe = pe + 1
    while array[pd] > pv:
      pd = pd - 1
    if pe >= pd:
      break
    else:
      array[pe], array[pd] = array[pd], array[pe]
  array[pe], array[pv_pos] = array[pv_pos], array[pe]
  return pe

In [0]:
def quicksort(array):
  def quick_sort(array, left_index, right_index):
    #Caso base: o subarray tem 0 ou 1 elementos
    if right_index - left_index <= 0:
      return
    # Particiona o array e pega a posição do pivô
    pivo_position = particao(array, left_index, right_index)
    quick_sort(array, left_index, pivo_position -1) #subarray a esquerda
    quick_sort(array, pivo_position+1, right_index) #subarray a direita
  return quick_sort(array, 0, len(array)-1)


In [23]:
array = [0, 5, 2, 1, 6, 3]
quicksort(array)
print(array)


[0, 1, 2, 3, 5, 6]


**Exercício:** Use as células abaixo (ou crie mais células, se necessário) para escrever códigos de teste do tempo de execução para a ordenação com *quicksort* em listas de tamanhos variados com, por exemplo, 100, 1000 e 10000 elementos, várias vezes. Use a função `range` para criar a lista em ordem ascendente, o que configura um exemplo de pior caso. Os tempos de execução observados são compatíveis com a complexidade $O(n^2)$ como visto na aula anterior?

In [0]:
# digite seu código aqui
time = []
for i in range(100):
    l = list(range(100))
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
time = []
for i in range(100):
    l = list(range(1000))
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
time = []
for i in range(100):
    l = list(range(10000))
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

**Digite aqui a sua resposta:** Sim, a complexidade observada é O(n²)


**Exercício:** Repita o exercício anterior para o "caso médio". Ou seja, crie listas com valores aleatórios. Use a função `randint` do módulo [`random`](https://docs.python.org/3.7/library/random.html) e abrangência de listas. Os resultados são consistentes com a discussão realizada na aula anterior?

In [25]:
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(100)]
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.00011268186999814133


In [26]:
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.001614657959989927


In [27]:
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q quicksort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0015123183799914842


**Digite aqui a sua resposta:** não observa exatamente o tempo logaritmo pelas bases usadas n*log n

**Exercício:** Repita nas células a seguir o exercício anterior usando o *bubble sort*. Os resultados são consistentes com a discussão realizada na aula anterior?

In [0]:
# Função para ordenação de listas pelo método bubble sort
def bubble_sort(list):
    unsorted_until_index = len(list) - 1
    sorted = False
    while not sorted:
        sorted = True
        for i in range(unsorted_until_index):
            if list[i] > list[i+1]:
                sorted = False
                list[i], list[i+1] = list[i+1], list[i]
        unsorted_until_index = unsorted_until_index - 1

In [29]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(100)]
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0006259045800015884


In [30]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

0.0673837666899999


In [0]:
# digite seu código aqui
import random
time = []
for i in range(1000):
    l = [random.randint(0,100000) for _ in range(10000)]
    t = %timeit -o -r 1 -n 1 -q bubble_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

**Digite aqui a sua resposta:**

**Exercício** Repita nas células a seguir o exercício anterior usando o *selection sort*. Os resultados são consistentes com a discussão realizada na aula anterior?

In [0]:
# Função para ordenação de listas pelo método selection sort
def selection_sort(array):
    for i in range(len(array)):
        lowestNumberIndex = i
        for j in range(i+1, len(array)):
            if array[j] < array[lowestNumberIndex]:
                lowestNumberIndex = j
        if lowestNumberIndex != i:
            array[i], array[lowestNumberIndex] = array[lowestNumberIndex], array[i]

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(100)]
    t = %timeit -o -r 1 -n 1 -q selection_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q selection_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(10000)]
    t = %timeit -o -r 1 -n 1 -q selection_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

**Digite aqui a sua resposta:**

**Exercício** Repita nas células a seguir o exercício anterior usando o *insertion sort*. Os resultados são consistentes com a discussão realizada na aula anterior?

In [0]:
def insertion_sort(array):
    for index in range(1, len(array)):
        
        position = index
        temp_value = array[index]
        
        while position > 0 and array[position - 1] > temp_value:
            array[position] = array[position - 1]
            position = position - 1
            
        array[position] = temp_value

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(100)]
    t = %timeit -o -r 1 -n 1 -q insertion_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q insertion_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
# digite seu código aqui
import random
time = []
for i in range(100):
    l = [random.randint(0,1000) for _ in range(10000)]
    t = %timeit -o -r 1 -n 1 -q insertion_sort(l)
    time.append(t.best)
print(sum(time)/len(time))

**Digite aqui a sua resposta:**

**Exercício** Repita nas células a seguir o exercício anterior usando o método `sort` da classe `list`. É possível que o método 

In [0]:
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(100)]
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(1000)]
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

In [0]:
time = []
for i in range(100):
    l = [random.randint(0,100000) for _ in range(10000)]
    t = %timeit -o -r 1 -n 1 -q l.sort()
    time.append(t.best)
print(sum(time)/len(time))

**Digite aqui a sua resposta:** o sort do python não é o quick sort, usa o burd sort