In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [2]:
from time import perf_counter
from random import shuffle

# Algoritmos de Ordenação
Nesta classe de problemas, desejamos rearranjar uma dada coleção de objetos, de modo que estes fiquem numa determinada ordem.

Este é um dos problemas mais recorrentes em computação e, por conta disso, sempre mereceu extenso estudo.

Há diversos algoritmos desenvolvidos com esse propósito, com sensíveis diferenças de abordagem e desempenho.

Hoje nós vamos estudar quatro deles:

-   Ordenação por seleção
-   Bubble sort
-   Ordenação por inserção
-   Quicksort

Um quinto algoritmo, *merge sort*, será visto quando estudarmos o tratamento de arquivos.

Embora esses algoritmos sejam aplicáveis a qualquer coleção de objetos entre os quais exista uma relação de ordem, por conveniência, nós iremos usar *listas de inteiros* em quase todos os exemplos.

## Selection sort
Para cada posição de uma lista dada, este modelo *seleciona* o item que deve ser colocado ali.

Por exemplo, dada uma lista
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & 26 & 93 & 17 & 77 & 31 & 44 & 55 \\
    \hline
\end{array}

*P:* Qual o item que deverá ir para a posição 0?    

*R:* O menor item da lista.

Assim, localizamos o menor item da lista e o trocamos com o item que está na posição 0.

Depois dessa operação, nossa lista estará assim
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    17 & 26 & 93 & 54 & 77 & 31 & 44 & 55 \\
    \hline
\end{array}

*P:* O que fazer agora?   

*R:* Localizar o menor item do trecho $[1:]$ e colocá-lo na posição $1$.

Dessa forma, é como se nossa lista se “dividisse” em duas:

-   uma ordenada, à esquerda, e
-   uma desordenada, à direita.

Em cada passo, a lista ordenada ganha mais um item e a lista desordenada perde um, até acabar.

Passo a passo, na lista do exemplo:
\begin{array}{ l | c | c | c | c | c | c | c | c | } 
    \hline
    i  & 54 & 26 & 93 & 17 & 77 & 31 & 44 & 55 \\
    \hline
    0 & \textit{17} & 26 & 93 & \textit{54} & 77 & 31 & 44 & 55 \\
    \hline
    1 & 17 & \textit{26} & 93 & 54 & 77 & 31 & 44 & 55 \\
    \hline
    2 & 17 & 26 & \textit{31} & 54 & 77 & \textit{93} & 44 & 55 \\
    \hline
    3 & 17 & 26 & 31 & \textit{44} & 77 & 93 & \textit{54} & 55 \\
    \hline
    4 & 17 & 26 & 31 & 44 & \textit{54} & 93 & \textit{77} & 55 \\
    \hline
    5 & 17 & 26 & 31 & 44 & 54 & \textit{55} & 77 & \textit{93} \\
    \hline
    6 & 17 & 26 & 31 & 44 & 54 & 55 & \textit{77} & 93 \\
    \hline
      & 17 & 26 & 31 & 44 & 54 & 55 & 77 & 93 \\
    \hline
\end{array}



Vamos esboçar nosso algoritmo, lembrando que, para uma lista com $n$ itens, serão necessários apenas $n - 1$ passos, uma vez que o último item já estará na posição certa por construção.
```python
def selectionSort(lst):
    for i in range(len(lst) - 1):
        # fazer m = índice do menor item em lst[i:]
        # permutar os itens i e m
```

In [3]:
def selectionSort(lst):
    for i in range(len(lst) - 1):
        # fazer m = índice do menor item em lst[i:]
        m = i
        for j in range(i + 1, len(lst)):
            if lst[j] < lst[m]:
                m = j
        # permutar os itens i e m
        lst[i], lst[m] = lst[m], lst[i]

In [4]:
for i in range(1, 5):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    selectionSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [5, 4, 0, 3, 7]
l[-5:] = [8, 6, 1, 9, 2]
n:     10  ts:   0.000013
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [29, 87, 94, 51, 6]
l[-5:] = [60, 39, 93, 3, 17]
n:    100  ts:   0.000448
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [108, 421, 868, 297, 668]
l[-5:] = [205, 610, 184, 459, 236]
n:   1000  ts:   0.049383
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [739, 2792, 5579, 859, 8656]
l[-5:] = [8283, 1065, 3122, 2988, 5987]
n:  10000  ts:   3.810873
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]


O algoritmo abaixo está publicado na página [Sorting a list using selection sort in Python](https://www.codesdope.com/blog/article/sorting-a-list-using-selection-sort-in-python/).    
O que você acha dele?

In [5]:
a = [16, 19, 11, 15, 10, 12, 14]

i = 0
while i < len(a):
    #smallest element in the sublist
    smallest = min(a[i:])
    #index of smallest element
    index_of_smallest = a.index(smallest)
    #swapping
    a[i], a[index_of_smallest] = a[index_of_smallest], a[i]
    i = i + 1
print(a)

[10, 11, 12, 14, 15, 16, 19]


*R:* Ele não funciona se houver itens repetidos em $a$.   
Por exemplo,...

In [6]:
a = [15, 19, 11, 15, 10, 12, 15]

i = 0
while i < len(a):
    #smallest element in the sublist
    smallest = min(a[i:])
    #index of smallest element
    index_of_smallest = a.index(smallest)
    #swapping
    a[i], a[index_of_smallest] = a[index_of_smallest], a[i]
    print(a)
    i = i + 1
print(a)

[10, 19, 11, 15, 15, 12, 15]
[10, 11, 19, 15, 15, 12, 15]
[10, 11, 12, 15, 15, 19, 15]
[10, 11, 12, 15, 15, 19, 15]
[10, 11, 12, 15, 15, 19, 15]
[10, 11, 12, 19, 15, 15, 15]
[10, 11, 12, 19, 15, 15, 15]
[10, 11, 12, 19, 15, 15, 15]


*P:* Onde está o *bug*?

*R:* Execute o algoritmo sobre a lista dada. Depois da seleção do primeiro $15,$ sua lista deverá estar assim...    
\begin{array}{ l | c | c | c | c | c | c | c | } 
    \hline
      & 15 & 19 & 11 & 15 & 10 & 12 & 15 \\
    \hline
    0 & \textit{10} & 19 & 11 & \textit{15} & 15 & 12 & 15 \\
    \hline
    1 & 10 & \textit{11} & \textit{19} & 15 & 15 & 12 & 15 \\
    \hline
    2 & 10 & 11 & \textit{12} & 15 & 15 & \textit{19} & 15 \\
    \hline
    3 & 10 & 11 & 12 & \textit{15} & 15 & 19 & 15 \\
    \hline
\end{array}

Vamos nos concentrar nesta última linha, que será a “entrada” para o próximo ciclo do `while`.
\begin{array}{ l | c | c | c | c | c | c | c | } 
      &    &    &    &    & i &    &    \\
    \hline
    3 & 10 & 11 & 12 & \textit{15} & 15 & 19 & 15 \\
    \hline
\end{array}
`smallest` vai ser procurado no trecho $a[i:]$ e será encontrado o $15$ (que está no índice $0$ desse trecho!).    
Em seguida vai ser calculado `index_of_smallest` como o índice de `smallest` em $a$ (isso é o que está na expressão!).   
O resultado será $3$, que é o índice do primeiro $15$ em $a$ (este é o bug!).    
Assim temos $i = 4$ e $index\_of\_smallest = 3$ e, na troca, os dois $15$ trocam (erradamente) de posição.

Portanto, entramos para o próximo ciclo do `while` com a lista no seguinte estado:
\begin{array}{ l | c | c | c | c | c | c | c | } 
      &    &    &    &    &   &  i &    \\
    \hline
    3 & 10 & 11 & 12 & \textit{15} & \textit{15} & 19 & 15 \\
    \hline
\end{array}
`smallest` vai ser procurado no trecho $a[i:]$ e será encontrado o último $15$ da lista.    
Em seguida `index_of_smallest` vai ser calculado como o índice de `smallest` em $a$ e o resultado novamente será $3$ — o índice do primeiro $15$.    
Agora temos $i = 5$ e $index\_of\_smallest = 3$ e, com isso, o $15$ (índice $3$) e o $19$ (índice $5$) trocam (erroneamente) de posição.

Há mais uma última troca entre dois $15$ e o algoritmo termina com a lista no seguinte estado, em que o $19$ aparece erroneamente no meio da lista.
\begin{array}{ l | c | c | c | c | c | c | c | } 
    \\
    \hline
      & 10 & 11 & 12 & 19 & 15 & 15 & 15 \\
    \hline
\end{array}

O *bug* está em procurarmos `smallest` a partir do início de $a[i:]$ e `index_of_smallest` a partir do início de $a$.   
Assim, quando `smallest` já estiver presente em $a[:i]$ (que é o que acontece quando há itens repetidos) calcula-se um índice incorreto.   

Para corrigi-lo, é preciso calcular `index_of_smallest`, na linha 8, a partir do início de $a[i:]$ e depois adicionar um `offset` igual a $i$, antes que se possa usá-lo para indexar $a$.

Depois dessa alteração, o algoritmo funciona perfeitamente.

In [7]:
a = [15, 19, 11, 15, 10, 12, 15]
print(a)

i = 0
while i < len(a) - 1:
    #smallest element in the sublist
    smallest = min(a[i:])
    #index of smallest element
    index_of_smallest = a[i:].index(smallest) + i
    #swapping
    print(i, index_of_smallest)
    a[i], a[index_of_smallest] = a[index_of_smallest], a[i]
    print(a)
    i = i + 1
print(a)

[15, 19, 11, 15, 10, 12, 15]
0 4
[10, 19, 11, 15, 15, 12, 15]
1 2
[10, 11, 19, 15, 15, 12, 15]
2 5
[10, 11, 12, 15, 15, 19, 15]
3 3
[10, 11, 12, 15, 15, 19, 15]
4 4
[10, 11, 12, 15, 15, 19, 15]
5 6
[10, 11, 12, 15, 15, 15, 19]
[10, 11, 12, 15, 15, 15, 19]


A versão abaixo implementa essa mesma proposta, de uma forma um pouco mais concisa...

In [8]:
def selectionSort(lst):
    for i in range(len(lst) - 1):
        # fazer m = índice do menor item em lst[i:]
        m = lst[i:].index(min(lst[i:]))
        # permutar os itens i e m
        lst[i], lst[i + m] = lst[i + m], lst[i]

In [9]:
for i in range(1, 5):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    selectionSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [3, 1, 0, 6, 2]
l[-5:] = [5, 9, 7, 8, 4]
n:     10  ts:   0.000014
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [16, 99, 67, 46, 22]
l[-5:] = [15, 48, 20, 57, 61]
n:    100  ts:   0.000235
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [487, 806, 754, 392, 126]
l[-5:] = [884, 398, 288, 473, 865]
n:   1000  ts:   0.016097
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [4087, 8977, 9177, 8202, 2884]
l[-5:] = [9429, 994, 895, 796, 4799]
n:  10000  ts:   1.514011
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]


Uma outra possibilidade é usar uma *tuple comprehension* para obter o menor item em $lst[i:]$ e o respectivo índice, como na versão abaixo:

In [10]:
def selectionSort(lst):
    n = len(lst)
    for i in range(n - 1):
        # fazer m = índice do menor item em lst[i:]
        vm, im = min((lst[k], k) for k in range(i, n))
        # permutar os itens i e m
        lst[i], lst[im] = lst[im], lst[i]

In [11]:
for i in range(1, 5):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    selectionSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [3, 4, 7, 9, 0]
l[-5:] = [5, 6, 1, 2, 8]
n:     10  ts:   0.000021
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [41, 92, 50, 64, 88]
l[-5:] = [91, 34, 14, 36, 72]
n:    100  ts:   0.000686
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [402, 182, 439, 303, 127]
l[-5:] = [745, 278, 210, 833, 159]
n:   1000  ts:   0.073098
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [6661, 992, 5434, 1079, 3189]
l[-5:] = [9097, 7309, 6070, 7898, 2131]
n:  10000  ts:   6.220957
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]


O importante aqui é notar que, apesar da variedade de implementações, o desempenho do algoritmo não se altera substancialmente e sua complexidade continua sendo $\mathcal{O}(n^2).$

## Bubble sort
Este modelo ordena os dois últimos itens de uma lista dada, depois os dois penúltimos, e assim por diante até chegar ao início da lista.

Por exemplo, dada a lista abaixo
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & 26 & 93 & 17 & 77 & 31 & 44 & 55 \\
    \hline
\end{array}
comparamos $44$ e $55$ e eles estão em ordem,    
comparamos $31$ e $44$ e eles também estão em ordem,    
comparamos $77$ e $31$ e invertemos suas posições, chegando a 
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & 26 & 93 & 17 & \textit{31} & \textit{77} & 44 & 55 \\
    \hline
\end{array}
Continuamos o processo, comparamos $17$ e $31$ e eles estão em ordem,   
comparamos $93$ e $17$, invertemos suas posições e chegamos a
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & 26 & \textit{17} & \textit{93} & 31 & 77 & 44 & 55 \\
    \hline
\end{array}
Continuamos, comparando $26$ e $17$, que também trocam de posição
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & \textit{17} & \textit{26} & 93 & 31 & 77 & 44 & 55 \\
    \hline
\end{array}
e, finalmente, $54$ e $17$, o que nos deixa com
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    \textit{17} & \textit{54} & 26 & 93 & 31 & 77 & 44 & 55 \\
    \hline
\end{array}

*P:* O que aconteceu?    

*R:* O $17$, por ser mais “leve”, “borbulhou” até o começo da lista.

Se repetirmos esse processo sobre os trechos $[1:]$, $[2:]$, $\dots$, criaremos as mesmas listas esquerda e direita do modelo de seleção anterior.

In [12]:
def bubbleSort(alist):
    n = len(alist)
    for i in range(n - 1):
        for j in range(n - 1, i, -1):
            if alist[j] < alist[j - 1]:
                alist[j], alist[j - 1] =  \
                    alist[j - 1], alist[j]

In [13]:
for i in range(1, 5):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    bubbleSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [2, 9, 7, 5, 8]
l[-5:] = [1, 4, 0, 6, 3]
n:     10  ts:   0.000023
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [89, 43, 94, 70, 27]
l[-5:] = [81, 74, 78, 13, 2]
n:    100  ts:   0.000754
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [148, 285, 999, 81, 136]
l[-5:] = [694, 751, 690, 11, 482]
n:   1000  ts:   0.097446
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [6915, 9707, 2100, 7251, 6891]
l[-5:] = [1623, 1972, 6120, 5254, 5018]
n:  10000  ts:   7.997947
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]


*Bubble sort*, apesar de sua abordagem interessante, é reconhecido como um dos métodos de ordenação mais lentos, dentre os métodos com complexidade $\mathcal{O}(n^2).$

## Insertion sort
Este modelo também cria as listas esquerda e direita dos modelos anteriores.

Em cada passo, o primeiro item da lista direita é removido e *inserido* na posição adequada na lista esquerda.

Dessa forma, a cada passo, a lista ordenada (esquerda) ganha mais um item enquanto a lista desordenada (direita) perde um, até acabar.

### Desenvolvimento
Suponha que a lista ordenada esteja no trecho $[:i]$ e a lista desordenada em $[i:]$.

O primeiro item da lista naturalmente já faz parte da lista esquerda, portanto o valor inicial de $i$ é $1$.

Vamos começar a esboçar nosso algoritmo...
```python
def insertionSort(alist):
    n = len(alist)
    for i in range(1, n):
        # encontrar a posição p onde alist[i] deve ser colocado
        # colocar alist[i] na posição p
```

Vamos usar novamente a lista dos exemplos anteriores
\begin{array}{ | c | c | c | c | c | c | c | c | }
    \hline
    54 & 26 & 93 & 17 & 77 & 31 & 44 & 55 \\
    \hline
\end{array}

e supor que já tenhamos avançado até o ponto em que $i = 5$ e, portanto, com a lista no seguinte estado
\begin{array}{ | c | c | c | c | c | c | c | c | }
    & & & & & i \\
    \hline
    17 & 26 & 54 & 77 & 93 & 31 & 44 & 55 \\
    \hline
\end{array}

Vamos nos concentrar na lista ordenada (esquerda) e supor que tenhamos salvo o item $i$ numa variável $si$.
\begin{array}{ | c | c | c | c | c | c | }
    & & & & & i \\
    \hline
    17 & 26 & 54 & 77 & 93 & \;\;\,   \\
    \hline
\end{array}

Vamos percorrer esse trecho da lista, do fim para o começo, movendo os itens maiores do que $si$ uma posição para a direita e parando quando encontrarmos um item menor ou igual a $si$ ou chegarmos ao começo da lista.

Neste caso chegamos ao seguinte estado
\begin{array}{ | c | c | c | c | c | c | }
    & & p & & & i \\
    \hline
    17 & 26 & \;\;\, & 54 & 77 & 93    \\
    \hline
\end{array}

Agora podemos simplesmente colocar $si$ na posição $p$ da lista e avançar $i$ mais uma posição.

Com isso podemos concluir o desenvolvimento do nosso algoritmo.

In [14]:
def insertionSort(alist):
    n = len(alist)
    for i in range(1, n):
        # salvar alist[i]
        si = alist[i]
        # encontrar a posição p onde si deve ser colocado
        p = i
        while p > 0 and alist[p - 1] > si:
            alist[p] = alist[p - 1]
            p -= 1
        # colocar si na posição p
        alist[p] = si

In [15]:
for i in range(1, 5):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    insertionSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [2, 5, 8, 1, 4]
l[-5:] = [9, 0, 3, 6, 7]
n:     10  ts:   0.000011
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [47, 9, 99, 70, 33]
l[-5:] = [16, 93, 3, 72, 60]
n:    100  ts:   0.000417
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [928, 958, 585, 81, 833]
l[-5:] = [394, 73, 953, 713, 209]
n:   1000  ts:   0.043895
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [3934, 4766, 8636, 7035, 6713]
l[-5:] = [5915, 9428, 6434, 9574, 6031]
n:  10000  ts:   4.671575
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]


Embora o desempenho de *insertion sort* tenha se mostrado um pouco superior ao dos anteriores, ele também constrói sua solução item a item e, em cada passo, faz uma passagem “completa” sobre a lista, o que coloca sua complexidade na classe $\mathcal{O}(n^2)$.

Para alterar esse quadro, será necessária uma intervenção mais radical.

## Quicksort
O modelo conhecido como *quicksort* foi desenvolvido em 1959 por Tony Hoare, um dos nomes mais influentes na história da computação e é reconhecido até hoje como um sinônimo de ordenação eficiente.

Quicksort usa um pivô para dividir a lista original em duas sub-listas, uma delas com itens menores ou iguais ao pivô e a outra com itens maiores ou iguais ao pivô.

Como não há qualquer interseção entre essas duas sub-listas, elas podem ser ordenadas separadamente.   

Se o pivô for “eficiente”, cada uma delas terá aproximadamente metade dos itens da lista original. Nesse caso, o número de passos necessários para atingirmos sub-listas de comprimento unitário, que estarão ordenadas por construção, será da ordem de $\log_2{n}$.

Como em cada passo, faremos ao todo uma passagem completa pela lista, a complexidade do algoritmo será $\mathcal{O}(n \log_2 n)$, o que lhe confere um desempenho superior.

### Desenvolvimento
Implementaremos diretamente a definição, apenas aproveitando para criar uma terceira lista com itens iguais ao pivô, o que poderá ser útil caso existam muitas repetições.

In [16]:
def quickSort(alist):
    if len(alist) <= 1: 
        return alist
    else:    
        pivô = alist[0]
        menores = [x for x in alist if x < pivô]
        iguais  = [x for x in alist if x == pivô]
        maiores = [x for x in alist if x > pivô]
        return quickSort(menores) + iguais + quickSort(maiores)

In [17]:
for i in range(1, 7):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    l = quickSort(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [2, 7, 5, 0, 8]
l[-5:] = [3, 4, 9, 1, 6]
n:     10  ts:   0.000036
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [44, 62, 10, 22, 7]
l[-5:] = [79, 76, 83, 80, 67]
n:    100  ts:   0.000155
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [731, 146, 272, 454, 175]
l[-5:] = [260, 74, 29, 82, 698]
n:   1000  ts:   0.002076
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [4016, 8196, 9397, 761, 6692]
l[-5:] = [7825, 9658, 1509, 5891, 8741]
n:  10000  ts:   0.026237
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]

l[:5] = [70136, 37080, 53923, 39301, 73187]
l[-5:] = [30669, 80926, 48037, 98278, 89083]
n: 100000  ts:   0.317341
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [99995, 99996, 99997, 99998, 99999]

l[:5] = [804227, 274245, 716961, 404161, 730193]
l[-5:] = [504399, 837946, 271199, 865401, 457952]
n:1000000  ts:   4.927742
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [999995, 999996, 999997, 999998, 999999]


Essa implementação é simples e direta, mas cria três novas listas e faz três passagens pela lista original em cada passo.

Vamos desenvolver uma nova versão que opere somente sobre a lista original.

Suponha que esteja disponível uma função
$$\mathrm{partition}(lst, \,primeiro, \,\mathit{último})$$
a qual, dado um trecho de uma lista $lst$ definido por $lst[primeiro], \dots lst[\mathit{último}]$ e um $\mathit{pivô}$ com valor igual ao valor inicial de $lst[primeiro]$, retorna um índice $i$ tal que:
-   $lst[primeiro], \dots lst[i - 1] \le \mathit{pivô}$
-   $lst[i + 1], \dots lst[\mathit{último}] \ge \mathit{pivô}$ e
-   $lst[i] = \mathit{pivô}$

Como a interseção desses trechos é nula, podemos definir uma função recursiva
$$\mathrm{quicksort}(lst, \,primeiro, \,\mathit{último})$$
a qual, se    
-  $primeiro \ge \mathit{último}$, não faz nada e
-  $primeiro \lt \mathit{último}$, se desdobra em   
   - $\mathrm{quicksort}(lst, \,primeiro, \,ponto\_de\_corte - 1)$ e
   - $\mathrm{quicksort}(lst, \,ponto\_de\_corte + 1, \,\mathit{último})$    
   
onde $ponto\_de\_corte$ é o resultado de uma chamada de $\mathrm{partition}()$.

In [18]:
def quicksort(lst, primeiro=0, ultimo=None):
    if ultimo is None:
        ultimo = len(lst) - 1
    if primeiro < ultimo:
        ponto_de_corte = partition(lst, primeiro, ultimo)
        quicksort(lst, primeiro, ponto_de_corte - 1)
        quicksort(lst, ponto_de_corte + 1, ultimo)

O próximo passo será definir a função $\mathrm{partition}()$.

In [19]:
def partition(lst, primeiro, ultimo):
    valor_do_pivo = lst[primeiro]
    marcador_esq = primeiro + 1
    marcador_dir = ultimo
    done = False

    while not done:
        while marcador_esq <= marcador_dir and \
                  lst[marcador_esq] <= valor_do_pivo:
            marcador_esq = marcador_esq + 1

        while marcador_dir >= marcador_esq and \
                  lst[marcador_dir] >= valor_do_pivo:
            marcador_dir = marcador_dir -1

        if marcador_dir < marcador_esq:
            done = True
        else:
            lst[marcador_esq], lst[marcador_dir] = lst[marcador_dir], lst[marcador_esq]

    lst[primeiro], lst[marcador_dir] =  \
        lst[marcador_dir], lst[primeiro]

    return marcador_dir

In [20]:
from random import shuffle
from time import perf_counter

for i in range(1, 7):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')

    ini = perf_counter()
    quicksort(l)
    tqs = perf_counter() - ini

    print(f'n:{n:7}  tqs:{tqs:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [1, 0, 7, 4, 5]
l[-5:] = [2, 9, 6, 3, 8]
n:     10  tqs:   0.000016
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [3, 62, 45, 57, 91]
l[-5:] = [58, 96, 47, 5, 32]
n:    100  tqs:   0.000165
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [725, 146, 779, 254, 145]
l[-5:] = [877, 900, 326, 208, 36]
n:   1000  tqs:   0.002468
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [3495, 8660, 3382, 8736, 6229]
l[-5:] = [8561, 5011, 1410, 7399, 5727]
n:  10000  tqs:   0.031027
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]

l[:5] = [28886, 59162, 42833, 97773, 52053]
l[-5:] = [4744, 21942, 34602, 87271, 51791]
n: 100000  tqs:   0.338022
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [99995, 99996, 99997, 99998, 99999]

l[:5] = [753247, 220393, 376071, 271291, 876175]
l[-5:] = [672283, 159163, 98206, 263863, 328684]
n:1000000  tqs:   4.475980
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [999995, 999996, 999997, 999998, 999999]


## Python’s “sort()” and “sorted()”
Essas implementações tiveram o propósito de apresentar e discutir diversos algoritmos desenvolvidos para resolver esse importante problema e permitir que você use raciocínio semelhante quando apropriado ou necessário.

No entanto, nenhuma delas é capaz de rivalizar com as implementações nativas e otimizadas de Python, como mostram os resultados abaixo.

In [21]:
for i in range(1, 7):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    l.sort()
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [2, 6, 9, 1, 4]
l[-5:] = [5, 0, 8, 3, 7]
n:     10  ts:   0.000002
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [42, 33, 22, 94, 38]
l[-5:] = [15, 26, 12, 84, 30]
n:    100  ts:   0.000010
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [649, 774, 160, 104, 736]
l[-5:] = [976, 482, 605, 707, 713]
n:   1000  ts:   0.000145
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [8502, 4699, 609, 4430, 9563]
l[-5:] = [2180, 2052, 7363, 7794, 9375]
n:  10000  ts:   0.002334
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]

l[:5] = [35581, 10667, 37219, 46958, 22947]
l[-5:] = [2254, 52691, 57010, 55054, 18127]
n: 100000  ts:   0.026047
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [99995, 99996, 99997, 99998, 99999]

l[:5] = [544938, 176365, 731291, 203863, 873545]
l[-5:] = [761010, 844314, 212929, 256401, 503922]
n:1000000  ts:   0.572410
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [999995, 999996, 999997, 999998, 999999]


In [22]:
for i in range(1, 7):
    n = 10 ** i
    l = [x for x in range(n)]
    shuffle(l)
    print()
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')
    
    ini = perf_counter()
    l = sorted(l)
    ts = perf_counter() - ini

    print(f'n:{n:7}  ts:{ts:11.6f}')
    print(f'l[:5] = {l[:5]}')
    print(f'l[-5:] = {l[-5:]}')


l[:5] = [7, 2, 3, 1, 5]
l[-5:] = [6, 8, 4, 0, 9]
n:     10  ts:   0.000005
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [5, 6, 7, 8, 9]

l[:5] = [41, 66, 93, 23, 69]
l[-5:] = [62, 99, 76, 3, 71]
n:    100  ts:   0.000016
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [95, 96, 97, 98, 99]

l[:5] = [687, 46, 37, 819, 781]
l[-5:] = [778, 411, 110, 250, 947]
n:   1000  ts:   0.000214
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [995, 996, 997, 998, 999]

l[:5] = [3416, 3875, 4701, 1014, 2571]
l[-5:] = [9735, 8721, 8939, 1032, 9505]
n:  10000  ts:   0.003583
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [9995, 9996, 9997, 9998, 9999]

l[:5] = [83415, 51253, 98496, 74943, 48459]
l[-5:] = [23938, 70022, 37327, 81757, 57105]
n: 100000  ts:   0.032405
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [99995, 99996, 99997, 99998, 99999]

l[:5] = [469161, 547798, 678030, 964631, 379854]
l[-5:] = [213666, 359890, 981340, 898784, 556599]
n:1000000  ts:   0.633211
l[:5] = [0, 1, 2, 3, 4]
l[-5:] = [999995, 999996, 999997, 999998, 999999]


### Noções básicas
O método `sort()` está disponível apenas para listas.   
Ele atua sobre a lista à qual é aplicado e retorna None.

In [23]:
lista = [54, 26, 93, 17, 77, 31, 44, 55]
print(lista.sort())
print(lista)

None
[17, 26, 31, 44, 54, 55, 77, 93]


In [24]:
tupla = (54, 26, 93, 17, 77, 31, 44, 55)
print(tupla.sort())
print(tupla)

AttributeError: 'tuple' object has no attribute 'sort'

A função `sorted()`, por sua vez, está disponível para qualquer obbjeto iterável.   
Ela não modifica o argumento que recebe e seu resultado é sempre uma lista. 

In [25]:
lista = [54, 26, 93, 17, 77, 31, 44, 55]
print(sorted(lista))
print(lista)

[17, 26, 31, 44, 54, 55, 77, 93]
[54, 26, 93, 17, 77, 31, 44, 55]


In [26]:
tupla = (54, 26, 93, 17, 77, 31, 44, 55)
print(sorted(tupla))
print(tupla)

[17, 26, 31, 44, 54, 55, 77, 93]
(54, 26, 93, 17, 77, 31, 44, 55)


In [27]:
cadeia = 'Olá pessoal!'
print(sorted(cadeia))
print(cadeia)

[' ', '!', 'O', 'a', 'e', 'l', 'l', 'o', 'p', 's', 's', 'á']
Olá pessoal!


### Parâmetros adicionais de *sort()* e *sorted()*
#### *key*
O valor de `key` deve ser uma função com **um** parâmetro que retorna uma *chave* a ser usada para ordenar o objeto. 

In [28]:
cadeia = 'Olá pessoal!'
print(sorted(cadeia, key=str.lower))

[' ', '!', 'a', 'e', 'l', 'l', 'O', 'o', 'p', 's', 's', 'á']


In [29]:
frase = '''De onde menos se espera 
           É de onde não vem nada mesmo'''
print(sorted(frase.split(), key=str.lower))

['De', 'de', 'espera', 'menos', 'mesmo', 'nada', 'não', 'onde', 'onde', 'se', 'vem', 'É']


In [30]:
frase = '''De onde menos se espera 
           É de onde não vem nada mesmo'''
print(sorted(frase.split(), key=len))

['É', 'De', 'se', 'de', 'não', 'vem', 'onde', 'onde', 'nada', 'menos', 'mesmo', 'espera']


No exemplo a seguir, alunos são representados por tuplas contendo *nome, ra, matéria, ano, nota*.   
Um *grupo* é representado como uma lista de alunos.

In [31]:
alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 1357, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)

grupo = [alunoA, alunoB, alunoC, alunoD]
sorted(grupo, key=lambda x: x[1])

[('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0)]

In [32]:
alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 1357, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)

grupo = [alunoA, alunoB, alunoC, alunoD]
sorted(grupo, key=lambda x: (x[3], len(x[0])))

[('Maria', 1234, 'mc102', 2015, 8.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0)]

In [33]:
from operator import itemgetter

alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 1357, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)

grupo = [alunoA, alunoB, alunoC, alunoD]
sorted(grupo, key=itemgetter(4, 0))

[('Chico', 1357, 'mc102', 2016, 4.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0)]

##### Funções do módulo *operator*
O módulo `operator` disponibiliza as funções `itemgetter()`,  `attrgetter()` e `methodcaller()`, que podem simplificar e agilizar essas chamadas.

Por exemplo, a chamada abaixo ordena a lista dos exemplos anteriores por *nota* e, no caso de empate, pelo *nome*.

### Ordenação ascendente e descendente
Tanto `sort()` quanto `sorted()` admitem um parâmetro booleano `reverse` (valor *default* = `False`) para indicar se a ordenação deverá ser em ordem ascendente (`False`) ou descendente (`True`).

In [34]:
from operator import itemgetter

alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 1357, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)

grupo = [alunoA, alunoB, alunoC, alunoD]
sorted(grupo, key=itemgetter(4), reverse=True)

[('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0)]

### Estabilidade da ordenação
E se quiséssemos colcoar o grupo de alunos na ordem inversa das *notas* e, no caso de empate, na ordem crescente dos *nomes* e, no caso de empate, na ordem crescente dos *ras*?    

Uma condição complexa como essa é geralmente atacada de uma entre duas maneiras:

-   Criando-se uma função específica para gerar a chave complexa desejada.
-   Quebrando a ordenação em uma sequência de passos, cada um deles aproveitando o resultado do passo anterior.    
    Para que isso seja possível, é preciso que o processo de ordenação seja **estável**, isto é, que cada passo da ordenação não destrua a ordem provisória estabelecida nos passos anteriores.    
    Em Python, `sort()` e `sorted()` têm essa propriedade.

Vamos começar criando a função específica

In [35]:
def chave(aluno):
    return (-aluno[4], aluno[0], aluno[1])

alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 7531, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)
alunoE = ('Chico', 1357, 'mc102', 2016, 4.0)

grupo = [alunoA, alunoB, alunoC, alunoD, alunoE]
sorted(grupo, key=chave)

[('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Chico', 7531, 'mc102', 2016, 4.0)]

Agora vamos fazer a mesma coisa como uma sequência de ordenações parciais...

In [36]:
alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 7531, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)
alunoE = ('Chico', 1357, 'mc102', 2016, 4.0)

grupo = [alunoA, alunoB, alunoC, alunoD, alunoE]

Nesta abordagem, a ordenação prossegue das chaves de menor para as de maior prioridade. Portanto, começamos pelo *ra* (posição $1$ na tupla).

In [37]:
from operator import itemgetter

grupo_ord = sorted(grupo, key=itemgetter(1))
grupo_ord

[('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Chico', 7531, 'mc102', 2016, 4.0)]

Agora os *nomes* (poisção $0$ na tupla)...

In [38]:
grupo_ord = sorted(grupo_ord, key=itemgetter(0))
grupo_ord

[('Chico', 1357, 'mc102', 2016, 4.0),
 ('Chico', 7531, 'mc102', 2016, 4.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0)]

E, finalmente, as *notas* (posição $4$ na tupla, na ordem inversa)...

In [39]:
grupo_ord = sorted(grupo_ord, key=itemgetter(4), 
                   reverse=True)
grupo_ord

[('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Chico', 7531, 'mc102', 2016, 4.0)]

Note que o que impede que a ordenação seja realizada de uma única vez é o `reverse` nas *notas*.    
Assim, é possível reunir os dois primeiros passos e depois realizar o último separadamente.

In [40]:
alunoA = ('Joaquim', 4321, 'mc102', 2016, 8.0)
alunoB = ('Maria', 1234, 'mc102', 2015, 8.0)
alunoC = ('Chico', 7531, 'mc102', 2016, 4.0)
alunoD = ('Rosa', 2468, 'mc102', 2016, 9.0)
alunoE = ('Chico', 1357, 'mc102', 2016, 4.0)

grupo = [alunoA, alunoB, alunoC, alunoD, alunoE]

In [41]:
from operator import itemgetter

grupo_ord = sorted(grupo, key=itemgetter(0, 1))
grupo_ord

[('Chico', 1357, 'mc102', 2016, 4.0),
 ('Chico', 7531, 'mc102', 2016, 4.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Rosa', 2468, 'mc102', 2016, 9.0)]

In [42]:
grupo_ord = sorted(grupo_ord, key=itemgetter(4), 
                   reverse=True)
grupo_ord

[('Rosa', 2468, 'mc102', 2016, 9.0),
 ('Joaquim', 4321, 'mc102', 2016, 8.0),
 ('Maria', 1234, 'mc102', 2015, 8.0),
 ('Chico', 1357, 'mc102', 2016, 4.0),
 ('Chico', 7531, 'mc102', 2016, 4.0)]