# 11 - Introdução a Paralelismo

## Comparação de implementações diferentes para o mesmo algoritmo

Nossa aula se inicia examinando o efeito de uma implementação cuidadosa de um algoritmo no tempo de execução final. 

In [None]:
import subprocess
import time

with open('entradas-busca-local/in-10.txt') as f:
    start = time.perf_counter()
    proc = subprocess.run(['./busca-local'], input=f.read(), text=True, capture_output=True)
    end = time.perf_counter()

    print('Saída:', proc.stdout)
    print('Stderr:', proc.stderr)
    print('Tempo total(s):', end - start)

Vamos agora praticar usar este snippet para executar nossos testes automaticamente. 

!!! example

    Crie uma função `roda_com_entrada(executavel, arquivo_in)` que roda o primeiro argumento usando como entrada o conteúdo do segundo argumento. Teste seu código com o executável `busca-local` e com o arquivo de entrada `entrada-pequena.txt` presente na pasta da aula.

    Sua função deverá devolver uma tupla `(stdout,time)` com `stdout` sendo a saída do programa e `time` seu tempo de execução em segundos. 

Com esse código, vamos criar um relatório interativo que roda nossos testes automaticamente e já plota informações prontas para nossas análises. Vamos começar examinando o desempenho do executável `busca-local`.

!!! example

    Rode o `busca-local` com os arquivos de entrada na pasta `entradas-busca-local`. Guarde os tempos em uma lista.

!!! example

    Leia o tamanho das entradas dos arquivos  na pasta `entradas-busca-local` e guarde em uma segunda lista.

!!! example 

    Plote o tempo de execução pelo tamanho da entrada usando `matplotlib`

In [None]:
# sua resposta aqui

O arquivo `busca-local` contém uma implementação cuidadosa da busca local do projeto. Ele não contém nenhuma técnica diferente das apresentadas em aula, mas evita ao máximo operações desnecessárias. Vamos agora comparar os resultados obtidos por ele com sua implementação.

!!! example

    Rode seu a busca local de seu projeto com as mesmas entradas acima e plote os tempos de ambos no mesmo gráfico. Não se esqueça de colocar legendas e título!

In [None]:
# seu código aqui

!!! question medium

    Interprete o gráfico que você gerou na linha de cima. Existe diferença entre o tempo gasto pelas duas implementações?

Até agora só testamos eficiência, mas poderia ser interessante testar também a qualidade da solução produzida. 

!!! question short
    Em qual situação você entende que comparar a qualidade da solução produzida é válido? Como você faria essa comparação? Responda levando em conta

    * tamanho das entradas usadas
    * quantidade de execuções para cada arquivo de entrada
    * quantidade de arquivos para cada tamanho de entrada.


## Expectativas de ganhos com paralelismo


Agora que já conseguimos comparar implementações de um mesmo algoritmo básico, vamos relembrar os tipos de paralelismo vistos em aula:

!!! tip "Tipos de paralelismo"

    **Dados**: operação (lenta) é feita em paralelo para cada elemento de um conjunto de dados.

    **Tarefas**: tarefas não dependentes entre si são executadas em paralelo.
    
Já vimos em aula que a busca exaustiva é um problema que deveria ser facilmente paralelizável, já que não possui dependência entre as escolhas de um nível da recursão. 

!!! example

    Meça o tempo da busca exaustiva do seu projeto para as entradas da pasta `entradas-busca-exaustiva`. Salve em uma lista. 

!!! example

    Supondo que sua máquina de testes tenha **8 cores**, qual seria o tempo gasto para cada uma das entradas acima? Salve estes valores em uma nova lista.

!!! example

    Plote abaixo o tempo real do algoritmo sequencial e o tempo esperado do seu projeto se ele fosse paralelizado.     


In [None]:
# seu código aqui

Vamos agora verificar se essa intuição se mantém para uma implementação cuidadosa do algoritmo de busca exaustiva e para uma paralelização bem feita. Os arquivos `busca-exaustiva` e `busca-exaustiva-par` contém essas implementações. 

!!! example

    Execute ambos para as entradas da pasta `entradas-busca-exaustiva` e plote os tempos abaixo. 

!!! question short
    As expectativas que você escreveu na pergunta anterior foram confirmadas? Como você avaliou isso?

Houve grandes ganhos de desempenho, mas eles não são exatamente proporcionais ao número de processadores. Isso é normal, já que existe um custo em levantar o ambiente paralelizado. Vamos agora complicar um pouco.

!!! example

    O arquivo `busca-branch-and-bound` possui uma implementação sequencial de um bound razoável para o caixeiro viajante. Compare-o com `busca-exaustiva-par`. 

!!! question short
    
    Quais foram os resultados da comparação? 

### Número de cores importa?

Vamos agora finalizar nosso estudo verificando se o número de *cores* afeta linearmente o desempenho. 

!!! tip 
    
    Para configurar o número de cores usados em `busca-exaustiva-par` usamos a *variável de ambiente* `OMP_NUM_THREADS`

!!! example

    Rode no terminal `OMP_NUM_THREADS=2 ./busca-exaustiva-paralela < in-6.txt` e verifique o consumo de CPU com `htop`.

    Varia o número de CPUS usadas e verifique com `htop` que  a preferência foi respeitada.

!!! question short
    Como você usaria o parâmetro `env` de `subprocess.run` para configurar o número de CPUs?

!!! example

    Faça um experimento com `in-6.txt` variando o número de CPUs de `1` até `8` e plote os resultados. 

!!! question short 

    Mais cores sempre ajudam? Como você avalia isto? E se o tamanho do problema for maior? Relacione número de cores, tamanho da entrada e desempenho.