# big o notation

denota desempenho de algoritmos, não necessariamente performance — avalia como um algoritmo escala conforme o tamanho do input.  
não necessariamente você pode dizer que um algoritmo O(n) é mais rápido que um algoritmo O(n^2).

quem define a velocidade é a análise assintótica, o papel do big é dizer o quão bem ou mal o algoritmo vai escalar com o tamanho do input.

big o avalia duas coisas:

1. complexidade temporal: **runtime**, quantidade de operações necessárias por ciclo
2. complexidade espacial: **memória**, quanto da memória é utilizada

notas:

-   big o sempre leva em conta o caso pessimista, o pior caso possível de um algoritmo.


# escalas de big o

<img src="./static/big-o-notation.png" width="600" />

> falta factorial — O (n!) — no gif, mas sempre lembre que é a pior.


In [1]:
"""
o(1): escala constante

independente do tamanho do input, a complexidade é igual.
"""


# essa função sempre retorna o primeiro item da lista;
# logo a complexidade temporal dela é o(1), já que a complexidade temporal é sempre igual;
# sempre vai ser só uma variável em memória.
def o_1_temporal(li: list[int]):
    return li[0]


# o objetivo dessa função é encontrar o maior elemento de um input.
# sabendo disso independente do input, vamos sempre alocar *uma* única variável em memória.
def o_1_espacial_1(li: list[int]):
    n = max(li)

    return n


# o mesmo vale se por exemplo você quiser encontrar os 3 maiores items do array.
# a complexidade espacial continua sendo constante, já que o input pode crescer infinitamente, mas a complexidade espacial sempre vai ser o(3) que pode ser matematicamente resumida a o(1), já que ambos são constantes.
def o_1_espacial_2(li: list[int]) -> tuple[int, int, int]:
    li = sorted(li, reverse=True)

    return (li[0], li[1], li[2])


In [2]:
import math

"""
o(log n): escala logarítmica

conforme você aumenta o input exponencialmente (dobra), a complexidade aumenta linearmente.

por exemplo:
- log2(10) -> 3.32
- log2(20) -> 4.32
- log2(40) -> 5.32

binary search é um exemplo dessa escala.
isso quer dizer que cada ciclo de iteração de binary search o tamanho do input vai diminuindo pela metade.

o motivo pelo qual binary search é o(log n), é que toda vez que você dobrar o tamanho do input, o algoritmo só vai precisar realizar um passo a mais.
"""


print(math.log2(10))
print(math.log2(20))
print(math.log2(40))


3.321928094887362
4.321928094887363
5.321928094887363


<img src="./static/binary-search.gif" width="500" />


In [3]:
"""
o(n): escala linear

complexidade cresce conforme o tamanho do input.
lembrando que big o sempre leva em conta o casso pessimista.

imagine que você precise iterar um array com 20 elementos. e pra iterar ele você leve 20s, se você dobrar o input pra 40 elementos, o tempo para iterar esse array seria de 40s. e por aí vai:

- 20 els. -> 20s
- 40 els. -> 40s
- 80 els. -> 80s
- 160 els. -> 160s

para complexidade espacial a lógica é a mesma, um exemplo é se você quiser calcular o dobro de cada elemento em um array de números, você precisa colocar em memória um array do mesmo tamanho
"""


# itera cada um dos elementos, escala temporal é linear.
def o_n_temporal(li: list[int]):
    for i in li:
        print(i)


# retorna um array com o tamanho igual ao do input, escala espacial é linear.
def o_n_espacial(li: list[int]) -> list[int]:
    return [i * 2 for i in li]


li_input = [1, 2, 3, 4, 5]
li_output = o_n_espacial(li_input)

assert len(li_input) == len(li_output)


<img src="./static/sequential-search.gif" width="500" />


In [4]:
import math

"""
o(n log n): escala quase linear ou linearítmica

combina o comportamento linear com o logarítmico.
é mais lento que o(n) mas muito mais rápido que o(n^2).

o padrão dessa escala é dividir o problema em partes menores (log n) e processar cada parte (n).
é a escala típica de algoritmos "divide and conquer" (dividir para conquistar).

exemplos clássicos:
- merge sort
- quick sort (caso médio)
- heap sort

por exemplo, se você tem 8 elementos:
- n = 8
- log2(8) = 3
- n * log2(n) = 8 * 3 = 24 operações

se você dobrar o input pra 16 elementos:
- n = 16
- log2(16) = 4
- n * log2(n) = 16 * 4 = 64 operações

perceba que dobrar o input não dobra as operações, mas também não é tão eficiente quanto o(log n).
"""


# merge sort é o exemplo clássico de o(n log n)
# ele divide o array pela metade recursivamente (log n divisões)
# e depois junta tudo ordenado (n operações por nível)
def merge_sort(li: list[int]) -> list[int]:
    # caso base: array com 0 ou 1 elemento já está ordenado
    if len(li) <= 1:
        return li

    # divide o array pela metade
    mid = len(li) // 2
    left = merge_sort(li[:mid])
    right = merge_sort(li[mid:])

    # junta as duas metades ordenadas
    return merge(left, right)


def merge(left: list[int], right: list[int]) -> list[int]:
    result: list[int] = []
    i = j = 0

    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1

    result.extend(left[i:])
    result.extend(right[j:])

    return result


# demonstração
li = [38, 27, 43, 3, 9, 82, 10]

print(f"original: {li}")
print(f"ordenado: {merge_sort(li)}")

print()

# comparação de escalas
print(f"n=8:  n*log2(n) = {8 * math.log2(8):.0f}")
print(f"n=16: n*log2(n) = {16 * math.log2(16):.0f}")
print(f"n=32: n*log2(n) = {32 * math.log2(32):.0f}")


original: [38, 27, 43, 3, 9, 82, 10]
ordenado: [3, 9, 10, 27, 38, 43, 82]

n=8:  n*log2(n) = 24
n=16: n*log2(n) = 64
n=32: n*log2(n) = 160


In [5]:
"""
o(n^2): escala quadrática

a complexidade cresce proporcionalmente ao quadrado do tamanho do input.
é aqui que as coisas começam a ficar lentas.

o padrão clássico dessa escala é loop aninhado: pra cada elemento, você itera todos os outros.

por exemplo:
- n=10 -> 100 operações
- n=20 -> 400 operações
- n=40 -> 1600 operações

perceba que ao dobrar o input, as operações quadruplicam.

exemplos clássicos:
- bubble sort
- selection sort
- insertion sort
- comparar todos os pares de um array
"""


# bubble sort é o exemplo clássico de o(n^2)
# pra cada elemento, ele compara com todos os outros elementos
def bubble_sort(li: list[int]) -> list[int]:
    li = li.copy()  # não modificar o original
    n = len(li)

    # loop externo: passa por todos os elementos
    for i in range(n):
        # loop interno: compara elemento atual com todos os seguintes
        for j in range(0, n - i - 1):
            if li[j] > li[j + 1]:
                li[j], li[j + 1] = li[j + 1], li[j]

    return li


# outro exemplo: encontrar todos os pares de um array
# se você tem [1, 2, 3], os pares são: (1,2), (1,3), (2,3)
def encontrar_pares(li: list[int]) -> list[tuple[int, int]]:
    pares: list[tuple[int, int]] = []

    for i in range(len(li)):
        for j in range(i + 1, len(li)):
            pares.append((li[i], li[j]))

    return pares


# demonstração
li = [64, 34, 25, 12, 22, 11, 90]


print(f"original: {li}")
print(f"ordenado: {bubble_sort(li)}")
print()
print(f"pares de [1, 2, 3, 4]: {encontrar_pares([1, 2, 3, 4])}")
print()


# comparação de escalas
print(f"n=10: n^2 = {10**2}")
print(f"n=20: n^2 = {20**2}")
print(f"n=40: n^2 = {40**2}")

original: [64, 34, 25, 12, 22, 11, 90]
ordenado: [11, 12, 22, 25, 34, 64, 90]

pares de [1, 2, 3, 4]: [(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]

n=10: n^2 = 100
n=20: n^2 = 400
n=40: n^2 = 1600


In [6]:
"""
o(2^n): escala exponencial

a complexidade dobra a cada elemento adicionado ao input.
é extremamente lenta e rapidamente se torna impraticável.

a lógica é: pra cada novo elemento, você duplica o trabalho anterior.

por exemplo:
- n=1 -> 2 operações
- n=5 -> 32 operações
- n=10 -> 1024 operações
- n=20 -> 1.048.576 operações (mais de 1 milhão!)
- n=30 -> 1.073.741.824 operações (mais de 1 bilhão!)

exemplos clássicos:
- fibonacci recursivo (sem memoization)
- encontrar todos os subconjuntos de um conjunto
- torre de hanói
"""


# fibonacci recursivo é o exemplo clássico de o(2^n)
# cada chamada gera duas novas chamadas, criando uma árvore exponencial
def fibonacci_exponencial(n: int) -> int:
    if n <= 1:
        return n
    return fibonacci_exponencial(n - 1) + fibonacci_exponencial(n - 2)


# encontrar todos os subconjuntos (power set) também é o(2^n)
# pra cada elemento, você tem 2 escolhas: incluir ou não incluir
# então pra n elementos, você tem 2^n subconjuntos possíveis
def subconjuntos(li: list[int]) -> list[list[int]]:
    if len(li) == 0:
        return [[]]

    primeiro = li[0]
    resto = subconjuntos(li[1:])

    # pra cada subconjunto do resto, criar uma versão com e sem o primeiro elemento
    com_primeiro = [[primeiro] + sub for sub in resto]

    return resto + com_primeiro


# demonstração
print(f"fibonacci(10) = {fibonacci_exponencial(10)}")
print(f"fibonacci(15) = {fibonacci_exponencial(15)}")
# não tente fibonacci(40) - vai demorar muito!

print("\nsubconjuntos de [1, 2, 3]:")
for sub in subconjuntos([1, 2, 3]):
    print(f"  {sub}")

print(f"\nquantidade de subconjuntos de [1,2,3]: {len(subconjuntos([1, 2, 3]))}")
print(f"2^3 = {2**3}")

# comparação de escalas
print(f"\nn=5:  2^n = {2**5}")
print(f"n=10: 2^n = {2**10}")
print(f"n=20: 2^n = {2**20}")

fibonacci(10) = 55
fibonacci(15) = 610

subconjuntos de [1, 2, 3]:
  []
  [3]
  [2]
  [2, 3]
  [1]
  [1, 3]
  [1, 2]
  [1, 2, 3]

quantidade de subconjuntos de [1,2,3]: 8
2^3 = 8

n=5:  2^n = 32
n=10: 2^n = 1024
n=20: 2^n = 1048576


In [7]:
import math

"""
o(n!): escala fatorial

a pior escala possível na prática. cresce absurdamente rápido.
n! significa n * (n-1) * (n-2) * ... * 1

por exemplo:
- 3! = 3 * 2 * 1 = 6
- 5! = 5 * 4 * 3 * 2 * 1 = 120
- 10! = 3.628.800 (mais de 3 milhões!)
- 15! = 1.307.674.368.000 (mais de 1 trilhão!)
- 20! = 2.432.902.008.176.640.000 (impossível de computar em tempo razoável)

o padrão dessa escala é: pra cada posição, você precisa testar todas as possibilidades restantes.
é o que acontece quando você quer encontrar todas as permutações de um conjunto.

exemplos clássicos:
- gerar todas as permutações
- problema do caixeiro viajante (todas as rotas possíveis)
- resolver puzzles por força bruta
"""


# gerar todas as permutações de um array é o(n!)
# pra cada posição, você tem (n-k) escolhas onde k é a posição atual
def permutacoes(li: list[int]) -> list[list[int]]:
    if len(li) <= 1:
        return [li]

    resultado: list[list[int]] = []

    for i, elemento in enumerate(li):
        # remove o elemento atual e gera permutações do resto
        resto = li[:i] + li[i + 1 :]

        for perm in permutacoes(resto):
            resultado.append([elemento] + perm)

    return resultado


# demonstração
perm_input = [1, 2, 3]
perm = permutacoes(perm_input)

print(f"permutações de {perm_input}:")
for perm in perm:
    print(f"  {perm}")

print(f"\nquantidade de permutações de {perm_input}: {len(perm)}")
print(f"3! = {math.factorial(3)}")


# comparação de escalas - veja como cresce absurdamente
print(f"\nn=3:  n! = {math.factorial(3)}")
print(f"n=5:  n! = {math.factorial(5)}")
print(f"n=10: n! = {math.factorial(10)}")
print(f"n=15: n! = {math.factorial(15)}")

permutações de [1, 2, 3]:
  [1, 2, 3]
  [1, 3, 2]
  [2, 1, 3]
  [2, 3, 1]
  [3, 1, 2]
  [3, 2, 1]

quantidade de permutações de [1, 2, 3]: 3
3! = 6

n=3:  n! = 6
n=5:  n! = 120
n=10: n! = 3628800
n=15: n! = 1307674368000


# resumo das escalas

| escala     | nome         | exemplo             | n=10      | n=20      | n=100      |
| ---------- | ------------ | ------------------- | --------- | --------- | ---------- |
| O(1)       | constante    | acesso por índice   | 1         | 1         | 1          |
| O(log n)   | logarítmica  | binary search       | 3         | 4         | 7          |
| O(n)       | linear       | busca sequencial    | 10        | 20        | 100        |
| O(n log n) | linearítmica | merge sort          | 33        | 86        | 664        |
| O(n^2)     | quadrática   | bubble sort         | 100       | 400       | 10.000     |
| O(2^n)     | exponencial  | fibonacci recursivo | 1.024     | 1.048.576 | impossível |
| O(n!)      | fatorial     | permutações         | 3.628.800 | 2.4×10¹⁸  | impossível |

## dicas práticas

-   **O(1) a O(n log n)**: escalas aceitáveis pra maioria dos casos
-   **O(n^2)**: funciona pra inputs pequenos (~1000 elementos), mas começa a ficar lento
-   **O(2^n) e O(n!)**: só viável pra inputs muito pequenos (~20 elementos no máximo)

## como identificar a escala

1. **sem loops ou recursão**: provavelmente O(1)
2. **um loop simples**: provavelmente O(n)
3. **loop que divide o problema pela metade**: provavelmente O(log n)
4. **dois loops aninhados**: provavelmente O(n^2)
5. **recursão que divide E processa**: provavelmente O(n log n)
6. **recursão que gera 2 chamadas pra cada elemento**: provavelmente O(2^n)
7. **gerar todas as permutações**: provavelmente O(n!)


| **Data Structure** | **Time Complexity** |           |           |           |           |           |           |           | **Space Complexity** |
| ------------------ | ------------------- | --------- | --------- | --------- | --------- | --------- | --------- | --------- | -------------------- |
|                    | **Average**         |           |           |           | **Worst** |           |           |           | **Worst**            |
|                    | Access              | Search    | Insertion | Deletion  | Access    | Search    | Insertion | Deletion  |                      |
| Array              | O(1)                | O(n)      | O(n)      | O(n)      | O(1)      | O(n)      | O(n)      | O(n)      | O(n)                 |
| Stack              | O(n)                | O(n)      | O(1)      | O(1)      | O(n)      | O(n)      | O(1)      | O(1)      | O(n)                 |
| Queue              | O(n)                | O(n)      | O(1)      | O(1)      | O(n)      | O(n)      | O(1)      | O(1)      | O(n)                 |
| Singly-Linked List | O(n)                | O(n)      | O(1)      | O(1)      | O(n)      | O(n)      | O(1)      | O(1)      | O(n)                 |
| Doubly-Linked List | O(n)                | O(n)      | O(1)      | O(1)      | O(n)      | O(n)      | O(1)      | O(1)      | O(n)                 |
| Skip List          | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(n)      | O(n)      | O(n)      | O(n)      | O(n log(n))          |
| Hash Table         | N/A                 | O(1)      | O(1)      | O(1)      | N/A       | O(n)      | O(n)      | O(n)      | O(n)                 |
| Binary Search Tree | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(n)      | O(n)      | O(n)      | O(n)      | O(n)                 |
| Cartesian Tree     | N/A                 | O(log(n)) | O(log(n)) | O(log(n)) | N/A       | O(n)      | O(n)      | O(n)      | O(n)                 |
| B-Tree             | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(n)                 |
| Red-Black Tree     | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(n)                 |
| Splay Tree         | N/A                 | O(log(n)) | O(log(n)) | O(log(n)) | N/A       | O(log(n)) | O(log(n)) | O(log(n)) | O(n)                 |
| AVL Tree           | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(log(n)) | O(n)                 |
| KD Tree            | O(log(n))           | O(log(n)) | O(log(n)) | O(log(n)) | O(n)      | O(n)      | O(n)      | O(n)      | O(n)                 |
