# **Análise de Complexidade**

fonte: https://algoritmosempython.com.br/cursos/algoritmos-python/analise-complexidade/intro-analise-complexidade/

**Algoritmo**: sequência de passos para se completar uma tarefa, descritos de forma precisa o bastante para que um computador seja capaz de executá-los.

**Objetivos de um algoritmo**:

* Corretude: produzir uma solução correta para o problema.

* Eficiência: utilizar os recursos computacionais de forma eficiente.

Objetivo da análise de algoritmos: predizer o comportamento de um dado algoritmo.

Análise de complexidade (ou análise de complexidade assintótica de algoritmos):

* Ferramenta utilizada para medir a eficiência de algoritmos.

* Visa predizer o tempo de execução do algoritmo ou seu consumo de memória, sem ter que implementá-lo e executá-lo em um computador específico.

* Ferramenta poderosa quando há dois algoritmos e há a necessidade de decidir qual dos 2 é aquele que executa mais rápido. A análse de complexidade assintótica de um algoritmo permite decidir, de grosso modo, quão rápido ele é.



**Comparação de 2 algoritmos que calculam a soma $s$ dos $n$ primeiros números inteiros**

$$
s = 1 + 2 + 3 + \dots + (n-1) + n
$$

In [1]:
# 1º algoritmo
def algoritmo_a(n):
    s = 0
    for i in range(1, n + 1):
        for j in range(i, n + 1):
            s = s + 1
    return s

resultado_a = algoritmo_a(10)
print("A soma dos 10 primeiros números inteiros é", resultado_a)

A soma dos 10 primeiros números inteiros é 55


In [2]:
# 2º algoritmo
def algoritmo_b(n):
    s = 0
    for i in range(1, n + 1):
        s = s + i    
    return s

resultado_b = algoritmo_b(10)
print("A soma dos 10 primeiros números inteiros é", resultado_b)

A soma dos 10 primeiros números inteiros é 55


Para avaliar qual é o algoritmo mais rápido é preciso analisar o custo computacional de cada um.

Operações primitivas: possuem custo computacional desprezível.

* Operações matemáticas: possuem custo computacional constante  (é possível considerá-las como tendo custo computacional igual a 1).

* Funções que lidam com entrada/entrada de dados: possuem custo computacional constante.

Obs.: uma operção primitiva é um comando ou sentença que realiza uma tarefa simples (adição, multiplicação, comparação, etc.) em variáveis simples (números ou caracteres, por exemplo).

Uma linha de código que soma todos os elementos de um arranjo não é uma operação primitiva, não verdade possui uma complexidade linear no tamanho do arranjo, ou seja, complexidade = O(n).

Com isso, é possível analisar `algoritmo_a` e `algoritmo_b`:

* `algoritmo_a`: executa $~n^2$ operações, considerando que executa cerca de $n$ operações para cada valor de $i$ e cerca de $n$ operações para cada valor de $j$.

* `algoritmo_b`: executa cerca de $n$ operações (uma operação para cada elemento $i$ no intervalo $[1,n]$ gerado pela função `range()`), ou seja, executa $~n$ operações.

Obs.: na análise de complexidade de um algoritmo não são considerados as constantes ou termos menores no cálculo do número de operações. Isso é possível porque, ao analisar a complexidade assintótica de um algoritmo, a preocupação reside no tempo de execução do algoritmo para entradas muito grandes (quando o tamanho da entrada tende ao infinito). Quando isso acontece, o termo de maior ordem na função de complexidade do algoritmo domina, enquanto que os valores dos termos de menor ordem e das constantes serão insignificantes se comparados ao valor do termo de maior ordem.

Ex.: se um algoritmo executa $2n^2 + 50n$, então, ignorando as constantes e os termos de menor ordem, ele executa $~n^2$ operações.

Ex.: se um algoritmo realiza $100n$ operações, então ele executa $~n$ operações.

Assim, retornando à comparação entre `algoritmo_a`e `algoritmo_b`, o `algoritmo_b` é mais rápido e mais eficiente.

É possível escrever um algoritmo ainda mais eficiente e mesma complexidade (`algoritmo_c`).

In [3]:
def algoritmo_c(n):
    return n * (n - 1) // 2

resultado_c = algoritmo_c(11)
print("A soma dos 10 primeiros números inteiros é", resultado_c)

# esta fórmula começa a contar os números a partir de zero (totalizando 11 números)

A soma dos 10 primeiros números inteiros é 55


Em resumo, na análise de complexidade assintótica recomenda-se descartar fatores constantes e termos de menor ordem.

**Tipos de Análise de Complexidade**

* **Melhor Caso**: o algoritmo retorna a resposta certa realizando a menor quantidade de trabalho possível. Ex.: se o elemento procurando em uma estrutura de dados é o primeiro que foi localizado, então a pesquisa caiu no melhor caso.

* **Caso Médio**: informa o desempenho do algoritmo na média, ou seja, informa o desempenho do algoritmo para uma entrada típica do algoritmo. Em muitas situações, a complexidade no caso médio é a mesma do pior caso, logo os esforços serão concentrados nas análises de pior caso.

* **Pior Caso**: informa o desempenho do algoritmo na pior entrada possível, ou seja, na entrada que faz com que o algoritmo demore a maior quantidade de tempo para retornar a resposta correta. Fornece uma visão pessimista sobre o desempenho do algoritmo. Neste caso, a função de complexidade informa que o algoritmo terá um desempenho pelo menos tão bom quanto o indicado pela sua função de complexidade.

# **Notação Big *O***

**Notaçaõ big-oh (notação *O*)**:

* Principal ferramenta utilizada para analisar a complexidade assintótica.

* Fornece um limite superior para o tempo de execução do algoritmo.

Retornando ao exemplo anterior, o `algoritmo_a` possui complexidade $O(n^2)$ e o `algoritmo_b` possui complexidade $O(n)$.

Algoritmo $O(n)$: há uma constante positiva $c$ pela qual é possível multiplicar $n$ e esta nova função, $g(n) = c \times n$ é um limite superior para o tempo de execução do algoritmo em questão.

<img src="img/img01.png">

**Definição**: Dizer que $f(n) = O(g(n))$ significa que existe constante positiva $c$ tal que $f(n) \leq c \times g(n)$, para algum $n$ maior que $n_0$. O ponto $n_0$ é o ponto no gráfico acima em que a curva da função $f(n)$ intercepta a curva da função $g(n)$.

No exemplo anterior, é possível dizer que o `algoritmo_a` é $O(n)$ porque, dado que ele executa cerca de $n$ operações, é possível escolher uma constante positiva $c=2$, de modo que $g(n) = c \times n$ sempre será maior que $f(n) = n$. Raciocínio semelhante pode ser aplicado ao `algoritmo_b`, para concluir que ele possui complexidade $O(n^2)$.

Pelo gráfico acima é possível observar que a função $g(n)$ cresce mais rapidamente que $f(n)$, pois a curva de $g(n)$ está acima de $f(n)$, a partir de um dado valor de $n$. Nesse caso, $g(n)$ domina assintoticamente $f(n)$ (em outras palavras, $g(n)$ é assintoticamente superior a $f(n)$). Matematicamente,

$$
\lim_{n \rightarrow \infty} \frac{g(n)}{f(n)} = \infty
$$

Em termos de comparação, se uma função $f(n)$ é $O(g(n))$, então $f(n) \leq g(n)$.

Operações matemáticas entre 2 funções de complexidade:

* Soma: $O(f(n)) + O(g(n)) = O(\max(f(n),g(n)))$

* Multiplicação: $O(f(n)) * O(g(n)) = O(f(n)*g(n))$

Obs.: apesar da função $O$ ser utilizada para localizar o limite superior do tempo de execução de um algoritmo, há situações em que é necessário dizer qual é o limite inferior do tempo de execução de um algoritmo. Para este caso, utiliza-se a função $\Omega$.

**Definição**: Dizer que $f(n) = \Omega(g(n))$ significa que há uma constante positiva $c$ tal que $g(n) \leq c \times f(n)$.

Se uma função $f(n)$ satisfaz tanto $f(n) = O(g(n))$ quanto $f(n) = \Omega (g(n))$, então $f(n) = \Theta(g(n))$. Neste caso, a função $\Theta$ fornece um limite inferior e superior (um limite mais firme e preciso) para o tempo de execução de um algoritmo. As funções $O$, $\Theta$ e $\Omega$ correspondem, respectivamente, $\leq$, $=$, $\geq$.

# **Regras para Análise de Complexidade**

De modo geral, é possível pensar na complexidade de um algoritmo como o somatório das complexidades de todos os fragmentos de código que o compõem.

* Sentenças simples: possuem complexidade constante, ou seja, $O(1)$

* Laços simples: possuem complexidade linear no tamanho da entrada, ou seja, $O(n)$, em que $n$ é o tamanho da entrada.

* Laços aninhados: possuem complexidade quadrática no tamanho da entrada, ou seja, $O(n^2)$, em que $n$ é o tamanho da entrada.

In [4]:
# Exemplo de complexidade constante (sentença simples)
s = 'Brasil'
i = 42
i += 1

In [None]:
# Exemplo de complexidade linear (laço simples)
for i in range(n):
    # Sentenças simples

In [None]:
# Exemplo de laços aninhados
for i in range(n):
    for j in range(n):
        # Sentenças simples

In [None]:
# Exemplo de complexidade O(n^2)
def f(n, condicao):
    a = "Ordem e Progresso"
    if condicao:
        for i in range(n):
            # Sentenças simples
    else:
        for i in range(n):
            for j in range(n):
                # Sentenças simples

"""
    Pensando no pior caso (quando o else é executado), a complexidade é O(n^2).
    São desconsiderados os trechos com complexidade constante (atribução de variável e condicionais) e termos
    de menor ordem (laço simples)
"""

In [None]:
# Exemplo de termos aninhados - complexidade O(n^2)
a = 0
for i in range(n):
    for j in range(i + 1, n):
        a = a + i + j
print(a)

In [None]:
# Exemplo de termos aninhados - complexidade O(n^3)
a = 0
for i in range(n):
    for j in range(n):
        for k in range(n):
            a = a + i + j + k
print(a)

"""
    Nem todo laço aninhado possui complexidade polinomial
"""