## Conteúdo da aula de hoje

Percurso em árvore (Infixo, prefixo e posfixo)

Árvores de decisão

Complexidade de algoritmos

Discussões sobre o DF

___________________________

### Percurso em árvore (Infixo, prefixo e posfixo)

Ver aula 6, antes de árvore de decisão

___________________________

### Árvores de decisão

Ver aula 6, árvore de decisão

___________________________

### Exemplo para colorir nós de cores diferentes

Ver arquivo `ds-py-estruturas-dados-II-desafio-final/ds_py_estruturas_dados_menu_navegacao_desafio_final.ipynb`

___________________________

# Complexidade de Algoritmos

Quanto tempo leva para o computador ordenar uma lista de 10.000, usando o bubble sort?


In [1]:
from random import randint

def gera_lista(qtde: int):
    lista = []
    for i in range(qtde):
        lista.append(randint(0, 1000000))
    return lista


def bubble_sort(lista):
    for i in range(len(lista)-1,0,-1): # começa no len, para no 0, diminui 1 em 1
        for j in range(i):
            if lista[j] > lista[j+1]:
                lista[j], lista[j+1] = lista[j+1], lista[j]
    return lista

# def bubble_sort_otimizado(lista):
#     for i in range(len(lista)-1,0,-1):
#         houve_troca = False
#         for j in range(i):
#             if lista[j] > lista[j+1]:
#                 lista[j], lista[j+1] = lista[j+1], lista[j]
#                 houve_troca = True
#         if not houve_troca:
#             break
#     return lista

In [2]:
from time import monotonic
lista = gera_lista(10000)

print(lista[0: 10])
start = monotonic()
bubble_sort(lista.copy())
print(monotonic() - start, '\n', lista[0: 10], '\n')

# print(lista[0: 10])
# start = monotonic()
# bubble_sort_otimizado(lista.copy())
# print(monotonic() - start, '\n', lista[0: 10], '\n')

[37749, 470757, 794968, 651846, 449482, 322043, 794499, 211425, 54728, 307662]
19.65700000000652 
 [37749, 470757, 794968, 651846, 449482, 322043, 794499, 211425, 54728, 307662] 



E 100.000? E 1.000.000? e 1 bilhão de números?

Acho que nunca saberemos....

Sabemos que o **Bubble Sort** é lento. Mas como sabemos que ele é lento? Aliás, ele é sempre lento? Existe algum caso em que valha a pena usar o **Bubble Sort** no lugar de algum outro? Como podemos responder a esses questionamentos? É aí que entra a noção de análise de algoritmos.

## Análise de algoritmos

Método empírico -> Determinar com precisão, caso a massa de dados não seja tão grande, mas ainda assim significativa, o tempo de processamento e a quantidade de memória que um determinado algoritmo ocupa ao ser executado

Método analítico -> Entendemos seu comportamento à medida que a massa de dados aumenta, através de expressões matemáticas.

Com o método analítico, podemos prever como o algoritmo deve se comportar ao longo do tempo independentemente do computador, da linguagem, do compilador e das condições de processamento.

&nbsp;

> Análise de algoritmos é a medição da complexidade de um algoritmo, e a complexidade do algoritmo pode ser definida como a quantidade de trabalho necessária para sua execução, expressa em função de suas operações fundamentais, as quais variam de acordo com o algoritmo e em função do volume de dados.

&nbsp;

Elementos considerados na análise de algoritmos:

- Complexidade de tempo (tempo para executar o algoritmo)
- Complexidade de espaço (espaço ocupado pelo algoritmo)
- Corretude (obtenção do resultado correto)
- Robustez (como se comporta com entradas inválidas ou não previstas)

**Não** vamos ver a com a complexidade de espaço, vamos focar na **complexidade de tempo**.

### Complexidade de tempo

Tempo necessário para um algoritmo realizar todo seu processamento até o final. 

É a soma de dois fatores: o tempo que o programa leva para compilar e o tempo de processamento dele.

Como Python não é uma linguagem compilada, é interpretada, vamos considerar somente o tempo de processamento dele.

Em uma linguagem compilada o tempo de compilação pode ser descartado, pois ele não depende das características da instância do algoritmo.

Vamos chamar o tempo de processamento de `T`<sub>`(p)`</sub> para um determinado programa P.

Podemos não conseguir definir exatamente o tempo de execução, pois muitos fatores podem ser desconhecidos durante o desenvolvimento do algoritmo. Ex: o tamanho da lista em um problema de ordenação ou busca.

Nesse caso, é aceitável **estimar** `T`<sub>`(p)`</sub>.

Essa estimativa é obtida determinando o número de adições, subtrações, multiplicações, divisões, comparações, atribuições, carregamentos etc., feitos pelo algoritmo.  Matematicamente, podemos expressar a estimativa através da fórmula abaixo:

> `Tp(n) = c`<sub>`a`</sub>`ADD(n) + c`<sub>`s`</sub>`SUB(n) + c`<sub>`m`</sub>`MUL(n) + ...`

onde `n` são as características da instância, enquanto c<sub>a</sub>, c<sub>s</sub>, c<sub>m</sub> são o tempo para realizar as operações de adição, subtração etc. e ADD, SUB, MUL são a quantidade de operações de adição, subtração etc., realizadas pelo algoritmo em uma instância com caraterística `n`.
&nbsp;


Observem o método `abc` abaixo:

In [None]:
def abc(a: int, b: int, c: int):
    # Realiza um cálculo qualquer
    return a - (b * c) + a - (c + a - b) / (b + a) + 3

Ele é independente das características da instância do algoritmo, pois recebe três parâmetros e não vai aumentar ou diminuir essa entrada.

Esse programa todo pode ser executado no que chamamos de `passo`

> Passo é um segmento do programa que possui tempo de execução independente das características da instância.

O número de passos de um algoritmo depende do tipo de instrução que compõe o algoritmo. 

- atribuições contam como um passo, 
- leituras contam como um passo, 
- em laços (`for`, `while`) contamos somente a parte de controle, descartando as operações internas do laço que não sejam atribuições, leituras etc. 
  
Para poder contar quantos passos um algoritmo executa, vamos tomar como exemplo o método de somatório abaixo, adicionando duas variáveis `cont_c` e `cont_n` para constar operações constantes e da instância.

In [3]:
from typing import List

def somatorio(lista: List[int]):
    #  Soma os valores dentro de uma lista pelo método interativo
    soma = 0
    for i in lista:
        soma += i
    return soma


In [4]:
lista = []
soma = somatorio(lista)
print(soma, "\n")

lista = [6]
soma = somatorio(lista)
print(soma, "\n")

lista = [6,9]
soma = somatorio(lista)
print(soma, "\n")

0 

6 

15 



In [5]:
# Somatório contando operações
from typing import List

def somatorio(lista: List[int]):
    cont_c = 0 # contador de constantes
    cont_n = 0 # contador de dados relativos à instancia do algoritmo
    
    # Inicialização da soma, executada uma vez
    soma = 0
    cont_c += 1

    # Inicialização da variável i, executada 1 vez
    cont_c += 1
    for i in lista: 
        # internamente, o python usa iteradores, mas podemos ler o for da seguinte forma:
        # for i = 0; i < len(lista); i++
        #   soma += lista[i]

        # Comparação de i com o tamanho da lista, executada n vezes
        cont_n += 1

        # i++ é a mesma coisa que i = i + 1, portanto
        # Leitura de i, executada n vezes
        # Atribuição de i, executada n vezes
        cont_n += 1
        cont_n += 1

        # Leitura de soma, executada n vezes
        # Atribuição de soma, executada n vezes
        cont_n += 1
        cont_n += 1
        soma += i
    
    # Retorno, executado 1 vez
    cont_c += 1
    print(f'T(som) = {cont_n}n + {cont_c}')
    return soma

In [9]:
lista = [6]
soma = somatorio(lista)
print(soma, "\n")

T(som) = 5n + 3
6 



Para uma lista de 1 posição, o tempo de execução é dado pela função de crescimento:
 
> `T`<sub>`(som)`</sub>` = 5n + 3`
 
São ralizadas 3 operações independentes da instância e 5 operações que aumentam à medida que o tamanho da entrada aumenta.

&nbsp;

E se fizéssemos um somatório recursivo?

In [10]:
from typing import List

def somatorio_recursivo(lista: List[int]):

    # Soma os valores dentro de uma lista pelo método recursivo
    if len(lista) <= 0:
        return 0
    
    return somatorio_recursivo(lista[1:]) + lista[0]

In [11]:
lista = []
soma = somatorio_recursivo(lista)
print(soma, "\n")

lista = [6]
soma = somatorio_recursivo(lista)
print(soma, "\n")

lista = [6,9]
soma = somatorio_recursivo(lista)
print(soma, "\n")

0 

6 

15 



Para o algoritmo `somatorio_recursivo` vamos passar a referência de um contador, de forma que as novas chamadas não inicializem nosso contador com 0 e possamos assim contabilizar exatamente quantas chamadas são realizadas;

In [12]:
from typing import List

def somatorio_recursivo(lista: List[int], contador: int = 0):

    # Comparação do tamanho com 0, executada n vezes
    contador += 1
    if len(lista) <= 0:
        # Retorno, executado 1 vez
        contador += 1
        print(f'T(som_rec) = {contador}')
        return 0
    
    # Para a atribuição, retorno e soma, executada n vezes
    contador += 1
    return somatorio_recursivo(lista[1:], contador) + lista[0]
    [1,2,3]
    # return ((([]+1)+2)+3)

In [13]:
lista = []
soma = somatorio_recursivo(lista)
print(soma, "\n")

lista = [6]
soma = somatorio_recursivo(lista)
print(soma, "\n")

lista = [6,9]
soma = somatorio_recursivo(lista)
print(soma, "\n")

T(som_rec) = 2
0 

T(som_rec) = 4
6 

T(som_rec) = 6
15 



A partir da execução obtemos a seguinte fórmula, chamada de **relação de recorrência** para denotar `T`<sub>`(som_rec)`</sub>
 
> `T`<sub>`(som_rec)`</sub>` = 2`, quando tamanho = 0
>
> `T`<sub>`(som_rec)`</sub>` = 2 + T`<sub>`(som_rec)`</sub>`(n-1)`, quando tamanho > 0
 
e podemos resolvê-la através de repetidas substituições para cada ocorrência da função
 
```
T(som_rec) = 2 + T(som_rec)(n-1)
           = 2 + 2 + T(som_rec)(n-2)
           = 2(2) + T(som_rec)(n-2)
           .
           .
           .
           = n(2) + T(som_rec)(0)
           = 2n + 2                         quando n >= 0
```
 
Sendo assim, podemos a função de crescimento do somatório recursivo como:
 
> `T`<sub>`(som_rec)`</sub>` = 2n + 2`
&nbsp;

Considerando o tempo de processamento, para estes exemplos de somatório, sugere-se que seja utilizado o método recursivo ao invés do interativo. Contudo, é necessário avaliar se não vai ocorrer estouro de pilha (_Stack Overflow_) durante a execução do programa por conta da recursão.

## Análise Assintótica e Notação Assintótica

> Análise assintótica é a análise da ordem de crescimento do tempo de execução *no limite* à medida que aumenta o tamanho da entrada de dados sem limitação.

Nosso somatório possuia função de crescimento `T`<sub>`(som)`</sub>` = 5n + 3`. Matematicamente falando, cresce de forma linear.


<img height="" src="https://www.section.io/engineering-education/big-o-notation/o-n.png" width="300">

&nbsp;

Uma função genérica qualquer com função de crescimento `T`<sub>`(p)`</sub>` = 3n`<sup>`2`</sup>` + 2n + 3` possui um comportamento quadrático, ou seja, cresce de forma quadrática matematicamente falando.

<img height="" src="https://www.section.io/engineering-education/big-o-notation/n-square.png" width="300">

&nbsp;

> Notação assintótica é a forma que usamos para descrever o tempo de execução dos algoritmos, considerando somente os termos mais relevantes da função e ignorando constantes e termos menos significativos.

&nbsp;

Considerando `T`<sub>`(som)`</sub>` = 5n + 3`, para uma entrada suficientemente grande (`n=100.000` por exemplo):
- A constante `+ 3` faz alguma diferença, pensando na matemática? Não.

E na função genérica `T`<sub>`(p)`</sub>` = 3n`<sup>`2`</sup>` + 2n + 3`, para um `n=100.000`?
- `T`<sub>`(p)`</sub>` = 30.000.000.000 + 200.000 + 3`. 
- Para este caso, `2n + 3` são pouco significativos, dado o valor de `3n`<sup>`2`</sup>.
 
Por isso, daqui pra frente, vamos indicar `somente o termo mais relevante` da função (nesse caso o `5n` e o `3n`<sup>`2`</sup> respectivamente).

&nbsp;

Estamos falando de tempo de execução, mas qual tempo de execução? É o tempo no `melhor caso` do algoritmo? Ou seria o `pior caso`? Ou é o `caso médio`?

&nbsp;

Notação assintótica define limites **superiores**, **inferiores** ou **médio**, para o tempo de execução dos algoritmos.

São conhecidos como Big- <img src="https://i.upmath.me/svg/O" alt="O" style="background:white" /> (Big Oh), Big - <img src="https://i.upmath.me/svg/%5COmega" alt="\Omega" style="background:white"/> <strong>(Big Ômega)</strong> e Big - <img src="https://i.upmath.me/svg/%20%5CTheta%20" alt=" \Theta " style="background:white"/> <strong>(Big Theta)</strong>, respectivamente.

### Big-O
 
Notação assintótica mais utilizada

Define o limite superior do tempo de processamento de uma função `f`<sub>`(n)`</sub> de um algoritmo para entradas suficientemente grandes, ou seja, o `pior caso`.

Dizemos que o tempo de execução é `Big-O de f`<sub>`(n)`</sub> ou apenas `O de f`<sub>`(n)`</sub>.
 
Limite superior significa que, dada uma entrada de tamanho significativo, o algoritmo deve ter um tempo de processamento menor ou igual ao `O(f`<sub>`(n)`</sub>`)`, nunca superior a este. Para entradas pequenas ele pode ser maior ou menor que `O(f`<sub>`(n)`</sub>`)`.
 
Observem o gráfico abaixo:
 
![Big-O](https://s3-sa-east-1.amazonaws.com/lcpi/b24992cb-45de-4516-ad16-178f8e28f2fc.png)
 
A linha azul demonstra o comportamento do nosso algoritmo `T`<sub>`(som)`</sub>` = 5n + 3` à medida que `n` tende ao infinito, enquanto a linha púrpura é o limite superior `O(n)`.

&nbsp;

### Big-Ômega<img src="https://i.upmath.me/svg/%5COmega" alt="\Omega" style="background:white"/>

Define o limite inferior do tempo de processamento de uma função f<sub>(n)</sub> de um algoritmo para entradas suficientemente grandes, ou seja, o `melhor caso`.

Dizemos que o tempo de execução é `Big-`<img src="https://i.upmath.me/svg/%20%5COmega%20" alt=" \Omega " style="background:white"/>` de f`<sub>`(n)`</sub> ou apenas <img src="https://i.upmath.me/svg/%20%5COmega%20" alt=" \Omega " style="background:white"/>` de f`<sub>`(n)`</sub>.

Observem o gráfico abaixo:
 
![Big-Ômega](https://s3-sa-east-1.amazonaws.com/lcpi/843a7373-fdb3-48a0-bcb8-87ba8cd9ff21.png)
 
A linha azul demonstra o comportamento do nosso algoritmo `T`<sub>`(som)`</sub>` = 5n + 3` à medida que `n` tende ao infinito, enquanto a linha laranja é o limite inferior Ômega<img src="https://i.upmath.me/svg/%20%5COmega%20" alt=" \Omega " style="background:white"/>(n)

### Big-Theta <img src="https://i.upmath.me/svg/%20%5CTheta%20" alt="\Theta" style="background:white"/>
 
 
Define os limites superior e inferior do tempo de processamento de uma função `f`<sub>`(n)`</sub> de um algoritmo para entradas suficientemente grandes, ou seja, o `caso médio`.

Dizemos que o tempo de execução é `Big-`<img src="https://i.upmath.me/svg/%20%5CTheta%20" alt=" \Theta " style="background:white"/>` de f`<sub>`(n)`</sub> ou apenas <img src="https://i.upmath.me/svg/%20%5CTheta%20" alt=" \Theta " style="background:white"/>` de f`<sub>`(n)`</sub>.
 
 
No caso do Big-<img src="https://i.upmath.me/svg/%20%5CTheta%20" alt=" \Theta " style="background:white"/>, dada uma entrada de tamanho significativo, o algoritmo deve ter um tempo de processamento menor ou igual ao limite superior e maior ou igual ao limite inferior. Novamente, para entradas pequenas ele pode ficar fora dos limites superior e inferior.
 
 
Observem o gráfico abaixo:
 
![Big-Theta](https://s3-sa-east-1.amazonaws.com/lcpi/1dbd3101-dffc-4961-943f-83c9c86d499f.png)
 
 
A linha azul demonstra o comportamento do nosso algoritmo `T`<sub>`(som)`</sub>` = 5n + 3` à medida que `n` tende ao infinito, enquanto a linha púrpura é o limite superior O(n) e a linha laranja é o limite inferior Ômega <img src="https://i.upmath.me/svg/%20%5COmega%20" alt=" \Omega " style="background:white"/>(n)

## Ordens de crescimento
 
Abaixo podemos ver a terminologia das classes mais comuns de funções, bem como uma tabela com a função, a designação e o Big-O de outras ordens que costumam aparecer com frequência e um gráfico comparativo entre algumas ordens de crescimento.
 
- Logarítmica - O(log n)
- Linear - O(n)
- Quadrática - O(n<sup>2</sup>)
- Polinomial - O(n<sup>k</sup>), onde k >= 1
- Exponencial - O(a<sup>n</sup>), onde a >= 1

&nbsp;
 
Função              | Designação        | Big-O
---------           | ------            | ------
c                   | Constante         | O(1)
log N               | Logaritmo         | O(log n)
log<sup>2</sup> N   | Logaritmo Quadrado | O(log<sup>2</sup> n)
N                   | Linear            | O(n)
N log N             | N logN            | O(n log n)
N<sup>2</sup>       | Quadrática        | O(n<sup>2</sup>)
N<sup>3</sup>       | Cúbica            | O(n<sup>3</sup>)
2<sup>n</sup>       | Exponencial       | O(2<sup>n</sup>)

&nbsp;

![Comparativo entre as ordens de crescimento](https://s3-sa-east-1.amazonaws.com/lcpi/44c9236f-0c7f-486e-9c73-24a08b582051.png)