Eficiência e Ordenadores
========================

**Autor:** Daniel R. Cassar



<font color=&ldquo;blue&rdquo;>Para os exercícios, preencha as células de código vazias abaixo. A instrução `import` é apenas permitida para importar os módulos `math`, `random` e `time` nestes exercícios. Utilize apenas variáveis numéricas ou listas com números. Veja as funções e métodos de lista permitidos abaixo.</font>

-   **Funções de Python permitidas**: `sum`, `abs`, `all`, `any`, `complex`, `len`, `print`, `range`, `int`, `float`, `zip`, `enumerate`, `bool`, `dir`, `help`, `isinstance`, `list`, `round` e `type`.

-   **Métodos de lista permitidos**: `append`, `copy`, `extend`, `insert`, `pop` e `remove`.

<font color=&ldquo;blue&rdquo;>Exercícios bônus contam como pontos extra.</font>



## Eficiência



Dado um certo problema, existem <u>diversas</u> formas de escrever um algoritmo de computador que resolva esse problema de maneira correta.

Nós vivemos em um momento bastante peculiar, onde o poder de processamento dos nossos computadores pessoais é razoavelmente grande. Isso quer dizer que muitas vezes podemos nos dar o luxo de <u>não se preocupar</u> sobre a *eficiência* dos algoritmos que escrevemos, uma vez que fará pouca diferença para nós se nosso código rodar em poucos segundos ou alguns minutos&#x2026; o que importa para nós é apenas o resultado e pronto.

Em certas situações, no entanto, não queremos esperar! Imagina se seu GPS demorasse 5 minutos para recalcular uma rota caso você tenha entrado na rua errada&#x2026; isso é considerado inaceitável nos dias de hoje. Imagina se o seu resultado de busca no Google demorasse 5 minutos para ser exibido&#x2026; aposto que usaríamos o Google de uma forma totalmente diferente se esse fosse o caso.

Em outras situações, não *podemos* esperar! O algoritmo que cuida dos voos de aviões em aeroportos deve ser rápido o suficiente para evitar acidentes. O algoritmo que os bancos usam deve ser rápido o suficiente para evitar que transações financeiras fraudulentas sejam realizadas.



## Estimando a eficiência de um algoritmo com um contador



A função abaixo nós já vimos na aula anterior, ela encontra o valor máximo em uma lista de valores.

**Problema**: encontrar o valor máximo em uma lista de números

**Entrada**: uma lista de números

**Saída**: um número representando o valor máximo da lista de entrada

**Algoritmo**:



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor máximo de uma lista de valores numéricos.'''
    valor = lista[0]
    for n in lista:
        if n > valor:
            valor = n
    return valor

Uma pergunta relevante é &ldquo;quantas vezes precisamos realizar a tarefa mais custosa deste algoritmo&rdquo;? Para este algoritmo em específico, a tarefa mais custosa é o `if` da linha 5. Vamos então contar quantas vezes nós executamos ele usando a variável `contador`! (Podemos fazer essa contagem na nossa mente também, aqui eu fiz na função para ficar mais visual).



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor máximo de uma lista de valores numéricos.'''
    contador = 0
    valor = lista[0]
    for n in lista:
        contador = contador + 1
        if n > valor:
            valor = n
    return valor, contador

No código acima, porque colocamos a linha `contador = contador + 1` acima do `if` e não *dentro* do `if`? Fizemos isso pois se tivéssemos colocado dentro do `if` nós só estaríamos contando as vezes que a condição do `if` foi *verdadeira*, não quantas vezes o `if` foi *executado*, você vê a diferença?

Agora vamos testar!



In [None]:
lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 100
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000000
maximo, contador = encontra_maximo(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

Há! Percebeu o padrão? Uma lista de tamanho $n$ executa a instrução mais custosa $n$ vezes neste algoritmo!! Dizemos que este algoritmo executa sua tarefa em *tempo linear* (leia como &ldquo;linear em relação ao tamanho do objeto que recebe&rdquo;).

Mas nem sempre este é o caso, veja no exemplo abaixo. <u>Nota</u>: a função abaixo já contempla a variável `contador` pois esse é nosso interesse aqui, contar as tarefas mais custosas de um algoritmo. A variável `contador` não é necessária se seu interesse é apenas resolver o problema em questão!

**Problema**: encontrar os índices dos números duplicados em uma lista

**Entrada**: uma lista de números

**Saída**: uma lista com tuplas indicando os índices dos elementos duplicados

**Algoritmo**:



In [None]:
def indice_duplicados(lista):
    """Retorna os índices dos itens duplicados em uma lista"""
    indice_dos_duplicados = []
    contador = 0

    for i in range(len(lista)):
        for j in range(len(lista)):
            contador = contador + 1

            # Se os índices são diferentes, porém os valores são iguais,
            # então são itens duplicados!
            if i != j and lista[i] == lista[j]:
                indice_dos_duplicados.append((i, j))

    return indice_dos_duplicados, contador

Vamos testar!



In [None]:
lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 100
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

lista = [0] * 1000
maximo, contador = indice_duplicados(lista)
print("Uma lista de tamanho", len(lista), "executou o if", contador, "vezes")

UAU! Uma lista com $n$ elementos executa o `if` (tarefa mais custosa deste algoritmo) $n^2$ vezes!! Isso não é mais um *tempo linear*&#x2026; agora dizemos que nosso código executa sua tarefa em *tempo polinomial*.



O conceito por trás do que discutimos nesta seção é a análise da *complexidade de algoritmos*. Para esta disciplina é necessário que você saiba o que significa a notação $O$, também conhecida como notação big $O$ ou notação $O$ grande. Uma visão matemática pode ser encontrada no capítulo 3 do livro Algoritmos de Thomas H. Cormen (tem na biblioteca). Este livro vai além do que precisamos para esta disciplina, recomendo a leitura para quem quiser realmente se aprofundar neste assunto. Uma introdução mais amigável sobre este tema pode ser vista [neste vídeo](https://www.youtube.com/watch?v=X_6LTVkymVM) do canal CódigoEscola no YouTube.



## Medindo quanto tempo um algoritmo gasta para rodar



Vamos retornar para nossa função que encontra o valor máximo.

**Problema**: encontrar o valor máximo em uma lista de números

**Entrada**: uma lista de números

**Saída**: um número representando o valor máximo da lista de entrada

**Algoritmo**:



In [None]:
def encontra_maximo(lista):
    '''Retorna o valor máximo de uma lista de valores numéricos.'''
    valor = lista[0]
    for n in lista:
        if n > valor:
            valor = n
    return valor

Podemos medir o tempo que essa função demora para executar usando o módulo `time`. Veja o exemplo abaixo e observe como o tempo aumenta quando aumentamos o tamanho da lista.



In [None]:
import time


lista = [0] * 10  # cria uma lista com 10 itens, todos eles com o valor zero
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 100
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 1000
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

lista = [0] * 1000000
inicio = time.perf_counter()
maximo = encontra_maximo(lista)
fim = time.perf_counter()
print("Uma lista de tamanho", len(lista), "itens demorou", fim - inicio, "segundos")

Esta é uma maneira mais direta de se medir a eficiência de um algoritmo. A estratégia anterior (usando contadores) é uma maneira mais matemática de se medir a eficiência.



## Comparando a eficiência de dois algoritmos



**Problema**: contar quantos números primos existem entre 1 e $n$

**Entrada**: número $n$

**Saída**: um número representando a quantidade de números primos entre 1 e $n$

<font color=&ldquo;blue&rdquo;>​**Exercício**: compare a execução dos algoritmos da solução 1 e 2 abaixo escolhendo a metodologia que preferir (contador ou módulo `time`). Escreva brevemente sobre o que observou.

<font color=&ldquo;blue&rdquo;>​**Ponto bônus**: invente ou busque na internet um código que resolva este problema de uma outra maneira diferente das soluções 1 e 2 abaixo. Compare a velocidade do seu código usando a mesma métrica que você usou para testar as soluções 1 e 2 (contador ou módulo `time`). Se buscar na internet não se esqueça de colocar a referência!! Lembre-se de seguir as restrições que foram combinadas no início deste caderno de notas.



### Solução 1



Nós já temos um algoritmo que checa se um número é primo ou não, vimos ele na aula anterior. No melhor espírito de uma economia verde, vamos reutilizar nosso algoritmo 🙂

Veja na solução abaixo que temos duas funções. Isso é perfeitamente válido. Alias, não apenas é perfeitamente válido, mas <u>é recomendado dividir tarefas complexas em tarefas menores</u>. É o princípio &ldquo;cada função deve fazer uma ação e apenas uma&rdquo;.

**Algoritmo**:



In [None]:
def checa_primo(n):
    """Checa se um número é primo."""

    # tudo menor ou igual a 1 não é primo
    if n <= 1:
        return False

    for i in range(2, n):
        if n % i == 0:
            return False

    return True


def conta_n_primeiros_primos(n):
    """Conta quantos números primos existem entre 0 e n."""
    numero_de_primos = 0

    for i in range(1, n + 1):
        if checa_primo(i):
            numero_de_primos = numero_de_primos + 1

    return numero_de_primos

Como podemos tentar otimizar esse algoritmo? Isto é, como podemos fazer ele executar mais rapidamente? Pense um pouco antes de ler a seção seguinte.



### Solução 2



Uma forma de otimizar esse algoritmo é evitando fazer contas que não são necessárias! Sabemos que para testar se um número $n$ é primo precisamos apenas checar se $n$ é divisível pelos números inteiros menores que $\sqrt{n}$. Não precisamos checar todos os números entre 2 e $n-1$! Vamos reescrever o algoritmo usando esse conhecimento.

**Algoritmo**:



In [None]:
def checa_primo_2(n):
    """Checa se um número é primo."""

    # tudo menor ou igual a 1 não é primo
    if n <= 1:
        return False

    raiz_quadrada = round(n ** (1 / 2)) # arredondamos para não ter problemas
    for i in range(2, raiz_quadrada + 1): # aqui está o segredo!
        if n % i == 0:
            return False

    return True


def conta_n_primeiros_primos_2(n):
    """Conta quantos números primos existem entre 0 e n."""
    numero_de_primos = 0

    for i in range(1, n + 1):
        if checa_primo_2(i):
            numero_de_primos = numero_de_primos + 1

    return numero_de_primos

### Resposta do exercício



In [None]:
# escreva seu código aqui

<font color=&ldquo;blue&rdquo;>[Aqui nesta célula, delete este texto e escreva brevemente a sua análise.]



## Ordenadores



Veja as duas listas abaixo e reflita sobre qual delas é mais fácil identificar qual é o valor mínimo e o valor máximo que elas armazenam.



In [None]:
lista_1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

lista_2 = [16, 12, 6, 5, 13, 1, 15, 0, 9, 11, 10, 7, 17, 14, 2, 19, 3, 8, 18, 4]

As duas listas contém os mesmos valores, porém a primeira está ordenada e a segunda não. Listas ordenadas nos permitem obter facilmente o valor mínimo e máximo, basta olhar nos extremos da lista. Também podemos obter facilmente a mediana, basta usar o índice apropriado. Em outras palavras, não precisamos *navegar* pela lista para obter essas informações! Isso significa que podemos escrever certos algoritmos muito mais eficientes se soubermos que nossa lista está ordenada. Por esse motivo, existem diversos algoritmos conhecidos para ordenar listas! Idealmente, queremos ordenar listas com algoritmos eficientes!



In [None]:
minimo = lista_1[0]
maximo = lista_1[-1]

if len(lista_1) % 2 == 0:
    # mediana de uma lista com um número par de itens
    indice_1 = int(len(lista_1) / 2) - 1
    indice_2 = int(len(lista_1) / 2)
    mediana = (lista_1[indice_1] + lista_1[indice_2]) / 2
else:
    # mediana de uma lista com um número ímpar de itens
    indice_mediana = int((len(lista_1)) / 2)
    mediana = lista_1[indice_mediana]

print(minimo)
print(maximo)
print(mediana)

Abaixo veremos algoritmos que resolvem o seguinte problema:

**Problema**: ordenar uma lista numérica de tamanho arbitrário

**Entrada**: lista numérica

**Saída**: lista numérica com os números em ordem crescente



### Ordenador por seleção (selection sort)



Este é um dos algoritmos mais simples de ordenar uma lista. Ele funciona da seguinte maneira:

1.  Crie uma lista nova chamada `lista_ordenada`
2.  Encontre o valor mínimo da sua lista de entrada
3.  Insira o valor encontrado no passo 2 no final da sua lista `lista_ordenada`
4.  Remova o valor encontrado no passo 2 da sua lista de entrada
5.  Se sua lista de entrada ainda contém itens, retorne ao passo 2. Do contrário, siga para o passo 6
6.  Fim, retorne sua lista `lista_ordenada` para o usuário

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por seleção abaixo e teste ele.

<u>Dica</u>: pode escrever mais de uma função na sua resposta. Por exemplo: você pode escrever uma função que encontra o mínimo de uma lista e usar essa função dentro da sua função ordenadora.



**Teste**:



### Ordenador por flutuação (bubble sort)



Outro algoritmo ordenador considerado simples. O ordenador por flutuação funciona da seguinte maneira:

1.  Faça uma passada em *todos* os elementos $i$ da lista (menos o último), comparando o elemento da posição $i$ com o elemento da posição $i + 1$. Caso o elemento $i$ seja maior que o elemento $i + 1$ você deve trocar os valores destes elementos (isto é, a posição $i$ agora deve armazenar o valor que estava na posição $i + 1$ e a posição $i + 1$ agora deve armazenar o valor que estava na posição $i$).
2.  Caso você tenha feito pelo menos uma alteração de valores no passo 1, então retorne ao passo 1. Do contrário vá ao passo 3.
3.  Fim, sua lista está ordenada. Retorne ela para o usuário.

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por flutuação abaixo e teste ele.



**Teste**:



### Ordenador por insersão (insertion sort)



Este é um algoritmo de ordenação que costuma ser bastante eficiente para listas pequenas, mas não para listas grandes.

1.  Considere um valor $p=2$
2.  Considere apenas os primeiros $p$ valores da sua lista. Para estes valores, cheque todos eles da *direita para a esquerda*. Se identificar valores fora da ordem crescente (isto é, se o valor da posição $i$ é maior que o valor da posição $i+1$), então troque estes valores de lugar entre si (a posição $i$ agora deve armazenar o valor que estava na posição $i+1$ e vice-versa).
3.  Se seu valor de $p$ é igual ao tamanho da lista, então vá ao passo 4. Do contrário, acrescente 1 ao valor de $p$ e retorne ao passo 2.
4.  Fim, sua lista está ordenada. Retorne ela para o usuário.

Se não estiver claro os passos acima, busque na internet ou em livros outras formulações do problema. A da [Wikipédia](https://pt.wikipedia.org/wiki/Insertion_sort) é bastante boa.

<font color=&ldquo;blue&rdquo;>Implemente um ordenador por inserção abaixo e teste ele.



**Teste**:



### Ordenador estou com sort (bogosort)



Você é uma pessoa sortuda? Se sim, este algoritmo é para você! Ele funciona basicamente embaralhando os elementos da lista de forma aleatória e checando se o produto final é uma lista ordenada. Absurdamente ineficiente. Praticamente ofensivo. Objetivamente tragicômico. Jamais use ele. Como cortesia, segue uma implementação possível abaixo.



In [None]:
import random


def checa_se_lista_esta_ordenada(lista):
    """Checa se uma lista está ordenada."""
    for i in range(len(lista) - 1):
        if lista[i] > lista[i + 1]:
            return False
    return True


def ordenador_por_sorte(lista):
    """Ordena os valores de uma lista em ordem crescente."""
    while True:
        random.shuffle(lista)
        if checa_se_lista_esta_ordenada(lista):
            break
    return lista

**Teste**:



In [None]:
lista = [1, 10, 4, 19, -23, 55, 0, 2]

print("Entrada: ", lista)
print("Saída: ", ordenador_por_sorte(lista))
print()

### Exercício bônus



<font color=&ldquo;blue&rdquo;>Compare a eficiência dos algoritmos de ordenação apresentados neste caderno de notas. Escolha a metodologia que você preferir (contador ou módulo `time`). Comente brevemente sobre o que observou.

