Efici√™ncia e Ordenadores
========================

**Autor:** Daniel R. Cassar



<font color=&ldquo;blue&rdquo;>Para os exerc√≠cios, preencha as c√©lulas de c√≥digo vazias abaixo. A instru√ß√£o `import` √© apenas permitida para importar os m√≥dulos `math`, `random` e `time` nestes exerc√≠cios. Utilize apenas vari√°veis num√©ricas ou listas com n√∫meros. Veja as fun√ß√µes e m√©todos de lista permitidos abaixo.</font>

-   **Fun√ß√µes de Python permitidas**: `sum`, `abs`, `all`, `any`, `complex`, `len`, `print`, `range`, `int`, `float`, `zip`, `enumerate`, `bool`, `dir`, `help`, `isinstance`, `list`, `round` e `type`.

-   **M√©todos de lista permitidos**: `append`, `copy`, `extend`, `insert`, `pop` e `remove`.

<font color=&ldquo;blue&rdquo;>Exerc√≠cios b√¥nus contam como pontos extra.</font>



## Efici√™ncia



Dado um certo problema, existem <u>diversas</u> formas de escrever um algoritmo de computador que resolva esse problema de maneira correta.

N√≥s vivemos em um momento bastante peculiar, onde o poder de processamento dos nossos computadores pessoais √© razoavelmente grande. Isso quer dizer que muitas vezes podemos nos dar o luxo de <u>n√£o se preocupar</u> sobre a *efici√™ncia* dos algoritmos que escrevemos, uma vez que far√° pouca diferen√ßa para n√≥s se nosso c√≥digo rodar em poucos segundos ou alguns minutos&#x2026; o que importa para n√≥s √© apenas o resultado e pronto.

Em certas situa√ß√µes, no entanto, n√£o queremos esperar! Imagina se seu GPS demorasse 5 minutos para recalcular uma rota caso voc√™ tenha entrado na rua errada&#x2026; isso √© considerado inaceit√°vel nos dias de hoje. Imagina se o seu resultado de busca no Google demorasse 5 minutos para ser exibido&#x2026; aposto que usar√≠amos o Google de uma forma totalmente diferente se esse fosse o caso.

Em outras situa√ß√µes, n√£o *podemos* esperar! O algoritmo que cuida dos voos de avi√µes em aeroportos deve ser r√°pido o suficiente para evitar acidentes. O algoritmo que os bancos usam deve ser r√°pido o suficiente para evitar que transa√ß√µes financeiras fraudulentas sejam realizadas.



## Estimando a efici√™ncia de um algoritmo com um contador



A fun√ß√£o abaixo n√≥s j√° vimos na aula anterior, ela encontra o valor m√°ximo em uma lista de valores.

**Problema**: encontrar o valor m√°ximo em uma lista de n√∫meros

**Entrada**: uma lista de n√∫meros

**Sa√≠da**: um n√∫mero representando o valor m√°ximo da lista de entrada

**Algoritmo**:



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor m√°ximo de uma lista de valores num√©ricos.'''
    valor = lista[0]
    for n in lista:
        if n > valor:
            valor = n
    return valor

Uma pergunta relevante √© &ldquo;quantas vezes precisamos realizar a tarefa mais custosa deste algoritmo&rdquo;? Para este algoritmo em espec√≠fico, a tarefa mais custosa √© o `if` da linha 5. Vamos ent√£o contar quantas vezes n√≥s executamos ele usando a vari√°vel `contador`! (Podemos fazer essa contagem na nossa mente tamb√©m, aqui eu fiz na fun√ß√£o para ficar mais visual).



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor m√°ximo de uma lista de valores num√©ricos.'''
    contador = 0
    valor = lista[0]
    for n in lista:
        contador = contador + 1
        if n > valor:
            valor = n
    return valor, contador

No c√≥digo acima, porque colocamos a linha `contador = contador + 1` acima do `if` e n√£o *dentro* do `if`? Fizemos isso pois se tiv√©ssemos colocado dentro do `if` n√≥s s√≥ estar√≠amos contando as vezes que a condi√ß√£o do `if` foi *verdadeira*, n√£o quantas vezes o `if` foi *executado*, voc√™ v√™ a diferen√ßa?

Agora vamos testar!



In [None]:
lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 100
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000000
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

H√°! Percebeu o padr√£o? Uma lista de tamanho $n$ executa a instru√ß√£o mais custosa $n$ vezes neste algoritmo!! Dizemos que este algoritmo executa sua tarefa em *tempo linear* (leia como &ldquo;linear em rela√ß√£o ao tamanho do objeto que recebe&rdquo;).

Mas nem sempre este √© o caso, veja no exemplo abaixo. <u>Nota</u>: a fun√ß√£o abaixo j√° contempla a vari√°vel `contador` pois esse √© nosso interesse aqui, contar as tarefas mais custosas de um algoritmo. A vari√°vel `contador` n√£o √© necess√°ria se seu interesse √© apenas resolver o problema em quest√£o!

**Problema**: encontrar os √≠ndices dos n√∫meros duplicados em uma lista

**Entrada**: uma lista de n√∫meros

**Sa√≠da**: uma lista com tuplas indicando os √≠ndices dos elementos duplicados

**Algoritmo**:



In [None]:
def indice_duplicados(lista):
    """Retorna os √≠ndices dos itens duplicados em uma lista"""
    indice_dos_duplicados = []
    contador = 0

    for i in range(len(lista)):
        for j in range(len(lista)):
            contador = contador + 1

            # Se os √≠ndices s√£o diferentes, por√©m os valores s√£o iguais,
            # ent√£o s√£o itens duplicados!
            if i != j and lista[i] == lista[j]:
                indice_dos_duplicados.append((i, j))

    return indice_dos_duplicados, contador

Vamos testar!



In [None]:
lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 100
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

UAU! Uma lista com $n$ elementos executa o `if` (tarefa mais custosa deste algoritmo) $n^2$ vezes!! Isso n√£o √© mais um *tempo linear*&#x2026; agora dizemos que nosso c√≥digo executa sua tarefa em *tempo polinomial*.



O conceito por tr√°s do que discutimos nesta se√ß√£o √© a an√°lise da *complexidade de algoritmos*. Para esta disciplina √© necess√°rio que voc√™ saiba o que significa a nota√ß√£o $O$, tamb√©m conhecida como nota√ß√£o big $O$ ou nota√ß√£o $O$ grande. Uma vis√£o matem√°tica pode ser encontrada no cap√≠tulo 3 do livro Algoritmos de Thomas H. Cormen (tem na biblioteca). Este livro vai al√©m do que precisamos para esta disciplina, recomendo a leitura para quem quiser realmente se aprofundar neste assunto. Uma introdu√ß√£o mais amig√°vel sobre este tema pode ser vista [neste v√≠deo](https://www.youtube.com/watch?v=X_6LTVkymVM) do canal C√≥digoEscola no YouTube.



## Medindo quanto tempo um algoritmo gasta para rodar



Vamos retornar para nossa fun√ß√£o que encontra o valor m√°ximo.

**Problema**: encontrar o valor m√°ximo em uma lista de n√∫meros

**Entrada**: uma lista de n√∫meros

**Sa√≠da**: um n√∫mero representando o valor m√°ximo da lista de entrada

**Algoritmo**:



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor m√°ximo de uma lista de valores num√©ricos.'''
    valor = lista[0]
    for n in lista:
        if n > valor:
            valor = n
    return valor

Podemos medir o tempo que essa fun√ß√£o demora para executar usando o m√≥dulo `time`. Veja o exemplo abaixo e observe como o tempo aumenta quando aumentamos o tamanho da lista.



In [None]:
import time


lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 100
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 1000
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 1000000
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

Esta √© uma maneira mais direta de se medir a efici√™ncia de um algoritmo. A estrat√©gia anterior (usando contadores) √© uma maneira mais matem√°tica de se medir a efici√™ncia.



## Comparando a efici√™ncia de dois algoritmos



**Problema**: contar quantos n√∫meros primos existem entre 1 e $n$

**Entrada**: n√∫mero $n$

**Sa√≠da**: um n√∫mero representando a quantidade de n√∫meros primos entre 1 e $n$

<font color=&ldquo;blue&rdquo;>‚Äã**Exerc√≠cio**: compare a execu√ß√£o dos algoritmos da solu√ß√£o 1 e 2 abaixo escolhendo a metodologia que preferir (contador ou m√≥dulo `time`). Escreva brevemente sobre o que observou.

<font color=&ldquo;blue&rdquo;>‚Äã**Ponto b√¥nus**: invente ou busque na internet um c√≥digo que resolva este problema de uma outra maneira diferente das solu√ß√µes 1 e 2 abaixo. Compare a velocidade do seu c√≥digo usando a mesma m√©trica que voc√™ usou para testar as solu√ß√µes 1 e 2 (contador ou m√≥dulo `time`). Se buscar na internet n√£o se esque√ßa de colocar a refer√™ncia!! Lembre-se de seguir as restri√ß√µes que foram combinadas no in√≠cio deste caderno de notas.



### Solu√ß√£o 1



N√≥s j√° temos um algoritmo que checa se um n√∫mero √© primo ou n√£o, vimos ele na aula anterior. No melhor esp√≠rito de uma economia verde, vamos reutilizar nosso algoritmo üôÇ

Veja na solu√ß√£o abaixo que temos duas fun√ß√µes. Isso √© perfeitamente v√°lido. Alias, n√£o apenas √© perfeitamente v√°lido, mas <u>√© recomendado dividir tarefas complexas em tarefas menores</u>. √â o princ√≠pio &ldquo;cada fun√ß√£o deve fazer uma a√ß√£o e apenas uma&rdquo;.

**Algoritmo**:



In [None]:
def checa_primo(n):
    """Checa se um n√∫mero √© primo."""

    # tudo menor ou igual a 1 n√£o √© primo
    if n <= 1:
        return False

    for i in range(2, n):
        if n % i == 0:
            return False

    return True


def conta_n_primeiros_primos(n):
    """Conta quantos n√∫meros primos existem entre 0 e n."""
    numero_de_primos = 0

    for i in range(1, n + 1):
        if checa_primo(i):
            numero_de_primos = numero_de_primos + 1

    return numero_de_primos

Como podemos tentar otimizar esse algoritmo? Isto √©, como podemos fazer ele executar mais rapidamente? Pense um pouco antes de ler a se√ß√£o seguinte.



### Solu√ß√£o 2



Uma forma de otimizar esse algoritmo √© evitando fazer contas que n√£o s√£o necess√°rias! Sabemos que para testar se um n√∫mero $n$ √© primo precisamos apenas checar se $n$ √© divis√≠vel pelos n√∫meros inteiros menores que $\sqrt{n}$. N√£o precisamos checar todos os n√∫meros entre 2 e $n-1$! Vamos reescrever o algoritmo usando esse conhecimento.

**Algoritmo**:



In [None]:
def checa_primo_2(n):
    """Checa se um n√∫mero √© primo."""

    # tudo menor ou igual a 1 n√£o √© primo
    if n <= 1:
        return False

    raiz_quadrada = round(n ** (1 / 2)) # arredondamos para n√£o ter problemas
    for i in range(2, raiz_quadrada + 1): # aqui est√° o segredo!
        if n % i == 0:
            return False

    return True


def conta_n_primeiros_primos_2(n):
    """Conta quantos n√∫meros primos existem entre 0 e n."""
    numero_de_primos = 0

    for i in range(1, n + 1):
        if checa_primo_2(i):
            numero_de_primos = numero_de_primos + 1

    return numero_de_primos

### Resposta do exerc√≠cio



In [None]:
# escreva seu c√≥digo aqui

<font color=&ldquo;blue&rdquo;>[Aqui nesta c√©lula, delete este texto e escreva brevemente a sua an√°lise.]



## Ordenadores



Veja as duas listas abaixo e reflita sobre qual delas √© mais f√°cil identificar qual √© o valor m√≠nimo e o valor m√°ximo que elas armazenam.



In [None]:
lista_1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

lista_2 = [16, 12, 6, 5, 13, 1, 15, 0, 9, 11, 10, 7, 17, 14, 2, 19, 3, 8, 18, 4]

As duas listas cont√©m os mesmos valores, por√©m a primeira est√° ordenada e a segunda n√£o. Listas ordenadas nos permitem obter facilmente o valor m√≠nimo e m√°ximo, basta olhar nos extremos da lista. Tamb√©m podemos obter facilmente a mediana, basta usar o √≠ndice apropriado. Em outras palavras, n√£o precisamos *navegar* pela lista para obter essas informa√ß√µes! Isso significa que podemos escrever certos algoritmos muito mais eficientes se soubermos que nossa lista est√° ordenada. Por esse motivo, existem diversos algoritmos conhecidos para ordenar listas! Idealmente, queremos ordenar listas com algoritmos eficientes!



In [None]:
minimo = lista_1[0]
maximo = lista_1[-1]

if len(lista_1) % 2 == 0:
    # mediana de uma lista com um n√∫mero par de itens
    indice_1 = int(len(lista_1) / 2) - 1
    indice_2 = int(len(lista_1) / 2)
    mediana = (lista_1[indice_1] + lista_1[indice_2]) / 2
else:
    # mediana de uma lista com um n√∫mero √≠mpar de itens
    indice_mediana = int((len(lista_1)) / 2)
    mediana = lista_1[indice_mediana]

print(minimo)
print(maximo)
print(mediana)

Abaixo veremos algoritmos que resolvem o seguinte problema:

**Problema**: ordenar uma lista num√©rica de tamanho arbitr√°rio

**Entrada**: lista num√©rica

**Sa√≠da**: lista num√©rica com os n√∫meros em ordem crescente



### Ordenador por sele√ß√£o (selection sort)



Este √© um dos algoritmos mais simples de ordenar uma lista. Ele funciona da seguinte maneira:

1.  Crie uma lista nova chamada `lista_ordenada`
2.  Encontre o valor m√≠nimo da sua lista de entrada
3.  Insira o valor encontrado no passo 2 no final da sua lista `lista_ordenada`
4.  Remova o valor encontrado no passo 2 da sua lista de entrada
5.  Se sua lista de entrada ainda cont√©m itens, retorne ao passo 2. Do contr√°rio, siga para o passo 6
6.  Fim, retorne sua lista `lista_ordenada` para o usu√°rio

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por sele√ß√£o abaixo e teste ele.

<u>Dica</u>: pode escrever mais de uma fun√ß√£o na sua resposta. Por exemplo: voc√™ pode escrever uma fun√ß√£o que encontra o m√≠nimo de uma lista e usar essa fun√ß√£o dentro da sua fun√ß√£o ordenadora.



**Teste**:



### Ordenador por flutua√ß√£o (bubble sort)



Outro algoritmo ordenador considerado simples. O ordenador por flutua√ß√£o funciona da seguinte maneira:

1.  Fa√ßa uma passada em *todos* os elementos $i$ da lista (menos o √∫ltimo), comparando o elemento da posi√ß√£o $i$ com o elemento da posi√ß√£o $i + 1$. Caso o elemento $i$ seja maior que o elemento $i + 1$ voc√™ deve trocar os valores destes elementos (isto √©, a posi√ß√£o $i$ agora deve armazenar o valor que estava na posi√ß√£o $i + 1$ e a posi√ß√£o $i + 1$ agora deve armazenar o valor que estava na posi√ß√£o $i$).
2.  Caso voc√™ tenha feito pelo menos uma altera√ß√£o de valores no passo 1, ent√£o retorne ao passo 1. Do contr√°rio v√° ao passo 3.
3.  Fim, sua lista est√° ordenada. Retorne ela para o usu√°rio.

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por flutua√ß√£o abaixo e teste ele.



**Teste**:



### Ordenador por insers√£o (insertion sort)



Este √© um algoritmo de ordena√ß√£o que costuma ser bastante eficiente para listas pequenas, mas n√£o para listas grandes.

1.  Considere um valor $p=2$
2.  Considere apenas os primeiros $p$ valores da sua lista. Para estes valores, cheque todos eles da *direita para a esquerda*. Se identificar valores fora da ordem crescente (isto √©, se o valor da posi√ß√£o $i$ √© maior que o valor da posi√ß√£o $i+1$), ent√£o troque estes valores de lugar entre si (a posi√ß√£o $i$ agora deve armazenar o valor que estava na posi√ß√£o $i+1$ e vice-versa).
3.  Se seu valor de $p$ √© igual ao tamanho da lista, ent√£o v√° ao passo 4. Do contr√°rio, acrescente 1 ao valor de $p$ e retorne ao passo 2.
4.  Fim, sua lista est√° ordenada. Retorne ela para o usu√°rio.

Se n√£o estiver claro os passos acima, busque na internet ou em livros outras formula√ß√µes do problema. A da [Wikip√©dia](https://pt.wikipedia.org/wiki/Insertion_sort) √© bastante boa.

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por inser√ß√£o abaixo e teste ele.



**Teste**:



### Ordenador estou com sort (bogosort)



Voc√™ √© uma pessoa sortuda? Se sim, este algoritmo √© para voc√™! Ele funciona basicamente embaralhando os elementos da lista de forma aleat√≥ria e checando se o produto final √© uma lista ordenada. Absurdamente ineficiente. Praticamente ofensivo. Objetivamente tragic√¥mico. Jamais use ele. Como cortesia, segue uma implementa√ß√£o poss√≠vel abaixo.



In [None]:
import random


def checa_se_lista_esta_ordenada(lista):
    """Checa se uma lista est√° ordenada."""
    for i in range(len(lista) - 1):
        if lista[i] > lista[i + 1]:
            return False
    return True


def ordenador_por_sorte(lista):
    """Ordena os valores de uma lista em ordem crescente."""
    while True:
        random.shuffle(lista)
        if checa_se_lista_esta_ordenada(lista):
            break
    return lista

**Teste**:



In [None]:
lista = [1, 10, 4, 19, -23, 55, 0, 2]

print("Entrada: ", lista)
print("Sa√≠da: ", ordenador_por_sorte(lista))
print()

### Exerc√≠cio b√¥nus



<font color=&ldquo;blue&rdquo;>Compare a efici√™ncia dos algoritmos de ordena√ß√£o apresentados neste caderno de notas. Escolha a metodologia que voc√™ preferir (contador ou m√≥dulo `time`). Comente brevemente sobre o que observou.

