# Insper

## Supercomputação - Avaliação Intermediária - 2º semestre de 2024

#### SEU NOME: Pedro Gomes de Sá Drumond

**Regras da prova**:

SOBRE HORÁRIOS:
- A prova estará liberada no Blackboard das 07h30 às 23h59 de 01/outubro/2024 (horário de Brasília);
- A prova tem duração aproximada de 03 horas (180 minutos);
- O aluno poderá realizar a prova ao longo do dia, no(s) horário(s) e espaço(s) de tempo que melhor lhe convier. Ao iniciar a prova você não precisará ficar 3 horas seguidas na sua realização;

SOBRE DÚVIDAS:
- O professor NÃO estará disponível fisicamente no Insper. O aluno que quiser tirar dúvidas, poderá fazê-lo via grupo de WhatsApp da prova. O link é: https://chat.whatsapp.com/IcnoFr2LkON1iYltj9SgDY

SOBRE SUBMISSÕES DA PROVA E DO PROJETO:
- A submissão da prova deve ser feita impreterivelmente até às 23h59 de 01/outubro/2024 (horário de Brasília). NÃO serão aceitas submissões após este horário;
- O aluno poderá fazer múltiplas submissões da prova. O sistema considerará a última submissão como oficial;
- A submissão da prova pode ser a resolução no jupyter notebook exportado no Colab ou ZIP com arquivos “.cpp” devidamente sinalizados (a qual questão se referenciam);

SOBRE A RESOLUÇÃO DA PROVA:
- A interpretação do enunciado faz parte da avaliação;
- É permitida a consulta ao material da disciplina (tudo o que estiver no repositório do Github da disciplina e no site https://liciascl.github.io/supercomp/. Isso também inclui suas próprias soluções aos exercícios de sala de aula, mas não inclui materiais não digitais, tampouco outros materiais além dos citados;
- É permitido consultar a documentação de C++ nos sites oficiais e links extras dos próprios enunciados;
- Seu pseudocódigo deve ser feito em Português, incluindo nomes de variáveis e comentários;


SOBRE QUESTÕES DE ÉTICA E PLÁGIO:
- A prova é individual. Qualquer consulta a outras pessoas durante a prova constitui violação do código de ética do Insper;
- Qualquer tentativa de fraude, como trechos idênticos ou muito similares, implicará em NOTA ZERO na prova a todos os envolvidos, sem prejuízo de outras sanções;
- Uso de Copilot ou ChatGPT ou correlatos para resolução pode implicar trechos similares entre alunos, caindo no item acima. Cuidado!

**_Boa prova!_**


# [2,0 pontos] Questão 01 - Problema do Subconjunto de Soma

**Contexto:**

O Problema do Subconjunto de Soma é um desafio clássico em ciência da computação e matemática, que se enquadra na categoria de problemas NP-Completo. Ele questiona se, dado um conjunto de números inteiros e um valor alvo, existe um subconjunto desses números cuja soma é igual ao valor alvo. Apesar de sua simplicidade conceitual, resolver este problema pode se tornar computacionalmente intensivo à medida que o tamanho do conjunto aumenta, tornando abordagens exaustivas impraticáveis para grandes conjuntos. Portanto, heurísticas e métodos aproximados se tornam ferramentas valiosas para encontrar soluções em tempo razoável.

**Questão:**

Considere um conjunto \( S = \{s_1, s_2, ..., s_n\} \) de números inteiros positivos e um valor alvo \( T \). Seu objetivo é desenvolver uma heurística para determinar se existe um subconjunto de \( S \) cuja soma é igual a \( T \). Sua solução não precisa ser ótima, mas deve ser capaz de encontrar uma resposta em um tempo razoável, mesmo para grandes valores de \( n \).

Para atingir este objetivo, você deve implementar o seguinte algoritmo heurístico em C++:

1. **Pré-processamento:** Ordene os números em \( S \) em ordem decrescente. Este passo visa a maximizar a eficiência da sua heurística, permitindo que grandes somas sejam alcançadas rapidamente, potencialmente aproximando-se de \( T \) mais rapidamente.

2. **Heurística de Aproximação:** Implemente uma função que percorra os números em \( S \) na ordem definida. Para cada número \( s_i \), decida se deve ou não incluí-lo no subconjunto candidato com base em uma regra heurística simples.

3. **Verificação e Saída:** Se, ao final do processo, a soma dos números no subconjunto candidato for igual a \( T \), sua função deve retornar `true`, indicando que uma solução foi encontrada. Caso contrário, retorne `false`.

**Pede-se**:
1. Implemente o algoritmo heurístico descrito acima em C++. (entregue o código)
2. Faça cenários de teste e comprove a corretude da sua solução.  
3. Discuta a eficácia da sua heurística. Em que cenários ela pode falhar em encontrar um subconjunto existente que some \( T \)? (entregue sua resposta justificada)


**DICA**:

Uma possível assinatura da sua função é:
```cpp
bool subsetSum(const vector<int>& set, int sum);
```





### 1.

```cpp
#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;

bool subconjuntoSoma(const vector<int>& conjunto, int alvo, vector<int>& subconjunto) {

    int soma_atual = 0;
    
    // cópia do conjunto 
    vector<int> conjunto_ordenado = conjunto;
    sort(conjunto_ordenado.rbegin(), conjunto_ordenado.rend()); // ordem decrescente

    for (int numero : conjunto_ordenado) { // percorre

        if (soma_atual + numero <= alvo) { // compara

            soma_atual += numero; // se não exceder o alvo, inclui
            subconjunto.push_back(numero);
        }
    
        if (soma_atual == alvo) {

            return true;
        }
    }

    return false;
}

int main() {

    vector<int> conjunto = {10, 20, 30, 40, 50, 60};
    int alvo = 100;

    vector<int> subconjunto;

    if (subconjuntoSoma(conjunto, alvo, subconjunto)) {

        cout << "Existe um subconjunto! (" << alvo << ")." << endl;
        cout << "Números usados na soma: ";

        for (int numero : subconjunto) {

            cout << numero << " ";
        }

        cout << endl;

    } else {
        
        cout << "Não existe um subconjunto!" << endl;
    }

    return 0;
}


```

### 2.

Cenário 1 - Conjunto: {5, 10, 12, 13, 15, 18} Alvo: 30
Subconjunto possível: {18, 12}
Saída esperada: Existe um subconjunto cuja soma é igual ao alvo


Cenário 2 - Conjunto: {10, 20, 30, 40, 50, 60} Alvo: 100
Subconjunto possível: {60, 40}
Saída esperada: Existe um subconjunto cuja soma é igual ao alvo


Cenário 3 - Conjunto: {1, 3, 6, 7, 11, 18} Alvo: 5
Subconjunto possível: nenhum
Saída esperada: Não existe um subconjunto cuja soma seja igual ao alvo.

### 3.

A heuristica resolve o problema de maneira rápida mas pode não ser perfeita. Ela funciona ordenadno os numeros em ordem decrescente, tentando incluir o maiores primeiro.

Ela funcionou para os exemplos e não foi possível encontrar uma solução quando realmente não tinha uma solução possível no conjunto. Porém, pode ter faltado imaginação para pensar em outras possibilidades de conjuntos para que não acertasse o valor.

Um erro que eu tinha pensado é quando a heuristica vai adicionando os maiores números e acabasse não tendo mais espaço, como no conjunto {1, 2, 4, 10} e T= 15, e por adicionar os maiores primeiro, pensei que ela faria 10+4+2 = 16 e aí não teria batido, mas eu tinha me esquecido que ela precisa avaliar antes de adicionar haha, aí ela funcionaria corretamente para esse caso.


# [2,0 pontos] Questão 02 - Solução Ótima

A solução ótima do problema anterior é verificar todos os subconjuntos possíveis dos números de ( S ), calcular a soma de cada um deles e verificar se alguma destas soma é igual ao valor buscado. Essa solução, embora simples, pode não escalar bem para grandes entradas.


**Pede-se**:
1. Escreva o código da solução ótima em C++ (você pode usar recursão ou não)
;
2. Gere a solução para 10 entradas distintas em ordens de grandeza diferentes (algumas entradas pequenas, algumas médias, algumas grandes);
3. Compare o tempo de execução deste código nas 10 entradas. O comportamento está alinhado com o esperado? Justifique.


### 1.


```cpp
#include <iostream>
#include <vector>
#include <fstream>
#include <chrono> 

using namespace std;
using namespace std::chrono;

bool subconjuntoSomaOtima(const vector<int>& conjunto, int n, int soma) {
    
    
    if (soma == 0) {
        return true;
    }
    
    if (n == 0 || soma < 0) {
        return false;
    }
    
    // exclui o ultimo item e verifica se encontrou com ou sem ele
    return subconjuntoSomaOtima(conjunto, n - 1, soma) || subconjuntoSomaOtima(conjunto, n - 1, soma - conjunto[n - 1]);
}

int main(int argc, char* argv[]) {

    if (argc != 2) {

        cout << "Uso: " << argv[0] << " <arquivo de entrada>" << endl;
        return 1;
    }

    ifstream arquivo(argv[1]);

    if (!arquivo) {

        cout << "Erro ao abrir" << argv[1] << endl;
        return 1;
    }

    // lendo o arquivo
    int n, alvo;
    arquivo >> n >> alvo;
    vector<int> conjunto(n);
    
    for (int i = 0; i < n; ++i) {

        arquivo >> conjunto[i];
    }

    arquivo.close();

    // inicia medicao de tempo
    auto inicio = high_resolution_clock::now();

    // busca exaustiva 
    bool resultado = subconjuntoSomaOtima(conjunto, n, alvo);

    // termina medicao de tempo
    auto fim = high_resolution_clock::now();
    auto duracao = duration_cast<microseconds>(fim - inicio);

    if (resultado) {

        cout << "Existe um subconjunto cuja soma é " << alvo << endl;
    
    } else {
        
        cout << "Não existe um subconjunto cuja soma seja " << alvo << endl;
    }

    cout << "Tempo de execução: " << duracao.count() << " microssegundos" << endl;

    return 0;
}

```

### 2.

- Para entrada PEQUENA 1: Existe um subconjunto cuja soma é 10 |
Tempo de execução: 19 microssegundos (normal ser maior porque o pc ainda tá frio kk)

- Para entrada PEQUENA 2: Existe um subconjunto cuja soma é 9 |
Tempo de execução: 2 microssegundos

- Para entrada PEQUENA 3: Existe um subconjunto cuja soma é 9 |
Tempo de execução: 1 microssegundos

- Para entrada MEDIA 1: Existe um subconjunto cuja soma é 30 |
Tempo de execução: 1 microssegundos

- Para entrada MEDIA 2: Existe um subconjunto cuja soma é 60 |
Tempo de execução: 1 microssegundos

- Para entrada MEDIA 3: Existe um subconjunto cuja soma é 75 |
Tempo de execução: 2 microssegundos

- Para entrada GRANDE 1: Existe um subconjunto cuja soma é 150 |
Tempo de execução: 4089 microssegundos

- Para entrada GRANDE 2: Existe um subconjunto cuja soma é 250 |
Tempo de execução: 32 microssegundos

- Para entrada GRANDE 3: Existe um subconjunto cuja soma é 400 |
Tempo de execução: 26522 microssegundos

- Para entrada GIGANTE: Existe um subconjunto cuja soma é 1000 |
Tempo de execução: 28721 microssegundos



### 3.

Os tempos de execução estão alinhados com o algoritmo de solução exaustiva, principalmente por conta da complexidade exponencial associada ao problema. 

Para as entradas pequenas e médias o tempo foi bem rápido porque o espaço de busca é bem curto. No entando, conforme o tamanho do conjunto cresce para as entradas grandes e gigante, o número de subconjuntos potenciais cresce exponencialmente, e o tempo de execução aumenta bastante.

# [1,5 ponto] Questão 03 - Aleatorização

Em sala de aula, nós implementamos diversas estratégias para a mochila
binária. Explique a importância de buscar um balanço entre _exploration_ e _exploitation_. Dê um exemplo de como buscamos atingir _exploration_ e outro de como buscamos atingir _exploitation_ no Problema do Subconjunto de Soma. Elabore um pseudocódigo que combine tais estratégias e avalie criticamente sua efetividade.

Exploration e exploitation são duas abordagens importantes em algoritmos de otimização, como no Problema do Subconjunto de Soma. Exploration, é a parte que tenta explorar diferentes caminhos e opções no espaço de busca. Isso é útil para evitar que o algoritmo fique preso em uma solução local subótima, sem perceber que há uma solução melhor em outra parte do espaço de busca. Já o exploitation foca em refinar as soluções que já parecem boas, aproveitando o que o algoritmo já descobriu de positivo até o momento.

- Exploration: 

Um exemplo de exploration seria testar embaralhar o conjunto de entrada antes de tentar formar os subconjuntos. Assim, mesmo que o algoritmo não tenha sucesso em uma tentativa, ele ainda tem a chance de explorar outros caminhos e combinações que podem ser melhores.

- Exploitation:

Um exemplo para exploitation seira o algoritmo incluir primeiro os maiores números que cabem no alvo ou aqueles que estão mais próximos de atingir a soma. Isso aproveita o conhecimento adquirido durante a execução e tenta melhorar incrementalmente a soma total, se aproximando cada vez mais do valor alvo.

```cpp
Função subconjuntoSomaHeuristica(conjunto, T, max_tentativas):

    melhor_subconjunto = []
    melhor_soma = 0
    
    Para i de 1 até max_tentativas:
        subconjunto_i = []
        soma_atual = 0
        
        conjunto_aleatorio = embaralhar(conjunto)

        Para cada numero em conjunto_aleatorio:

            Se soma_atual + numero <= T:

                subconjunto_i.incluir(numero)
                soma_atual = soma_atual + numero
            
            Se soma_atual == T:

                retornar subconjunto_i // Encontrou a solução ótima

        Se soma_atual > melhor_soma:
        
            melhor_soma = soma_atual
            melhor_subconjunto = subconjunto_i

    retornar melhor_subconjunto
```

# [2,0  pontos] Questão 04 - GPU e Thrust

1.	Acesse o link abaixo e faça uma cópia no seu Google Drive: https://colab.research.google.com/drive/14_EZNglXn2VXe3kpDW3XgEsRkB6R1jjp?usp=sharing
2.	Complete o código seguindo a especificação. ATENÇÃO: você provavelmente precisará complementar os imports para o código rodar!
3.	Baixe sua cópia do notebook preenchido e executado, e disponibilize junto com sua solução.

_OBSERVAÇÃO_: recomendo o uso do Colab na realização da questão de GPU. Use implementação e teste local por conta e risco. =)


# [1,5 pontos] Questão 05 - Busca global

Um algoritmo de busca global, em termos gerais, é um algoritmo de otimização que procura encontrar a melhor solução possível para um problema dentro de um espaço de busca, considerando todas as possíveis soluções. Em outras palavras, ele tenta encontrar o máximo ou mínimo global de uma função objetivo em um domínio especificado.

Em alguns problemas a "busca global" não se trata de uma otimização, mas de encontrar a única resposta correta possível. Por exemplo, o cálculo de Fibonacci é algoritmo que dado um número `N`, o `fib(N)` assume apenas um valor correto.

Observe o código abaixo para cálculo do Fibonacci. Altere o programa para receber `N` como uma entrada, e rode o programa para alguns valores de N, tanto pequenos (abaixo de 30) quanto grandes (acima de 30 --- só não exagere!), comparando os tempos de execução.  

Código-fonte:

```cpp
#include <iostream>

int fib(int n) {
    if (n <= 1) {
        return n;
    } else {
        return fib(n - 1) + fib(n - 2);
    }
}

int main() {
    int n = 30; // Valor de n para calcular Fibonacci
    int result = fib(n);
    std::cout << "Fibonacci de " << n << " é " << result << std::endl;
    return 0;
}
```

Note que tempo de execução para esta implementação aumenta consideravelmente quando `N` cresce.

**Pede-se**: Implemente  uma otimização para esse algoritmo de modo que sua implementação seja pela abordagem de memorização (*memoization*), ou seja, salvar cálculos já realizados para reaproveitá-los. Apresente código-fonte, resultados e compare os resultados de tempo de execução obtidos.

```cpp
#include <iostream>
#include <vector>
#include <chrono> 


int fib(int n, std::vector<int>& memo) {

    if (n <= 1) {

        return n; 
    }

    if (memo[n] != -1) {

        return memo[n];
    }

    // calcula e armazena p/ usar dps
    memo[n] = fib(n - 1, memo) + fib(n - 2, memo);
    return memo[n];
}

int main() {
    
    int n;

    std::cout << "Digite o valor de N: ";
    std::cin >> n;
    std::vector<int> memo(n + 1, -1);

    auto start = std::chrono::high_resolution_clock::now();

    int resultado = fib(n, memo);

    auto end = std::chrono::high_resolution_clock::now();
    
    std::chrono::duration<double> duration = end - start;

    std::cout << "Fibonacci de " << n << " é " << resultado << std::endl;
    std::cout << "Tempo de execução: " << duration.count() << " segundos" << std::endl;


    return 0;
}

```


- Fibonacci:

Fibonacci de 10 é 55
Tempo de execução: 0.003705 ms

Fibonacci de 15 é 610
Tempo de execução: 0.009092 ms

Fibonacci de 20 é 6765
Tempo de execução: 0.257108 ms

Fibonacci de 30 é 832040
Tempo de execução: 25.4481 ms

Fibonacci de 40 é 102334155
Tempo de execução: 788.879 ms



- Fibonacci_memorizacao:

Fibonacci de 10 é 55
Tempo de execução: 2.386e-06 segundos

Fibonacci de 15 é 610
Tempo de execução: 2.079e-06 segundos

Fibonacci de 20 é 6765
Tempo de execução: 3.88e-06 segundos

Fibonacci de 30 é 832040
Tempo de execução: 2.808e-06 segundos

Fibonacci de 40 é 102334155
Tempo de execução: 3.621e-06 segundos

- Fibonacci:
    - O tempo de execução cresce exponencialmente conforme o valor de N aumenta

- Fibonacci com mem:
    - Com memorização, o tempo de execução fica bem baixo, porque ao memorizar os resultados, o algoritmo evita cálculos repetidos, melhorando muito a efiiência do código

# [1.0 ponto] Questão 06 - Uso de Cluster em Supercomputação

Esta disciplina estuda estratégias para resolver problemas complexos em tempo computacionalmente razoável.

**Pede-se**:
1. Qual é a importância de aliar estratégias de implementação (Software) com recursos computacionais disponíveis (Hardware) para melhor endereçamento do problema?
2. Defina o que é Slurm e sua importância na programação paralela em larga escala.
3. Considerando o job configurado pelo ".slurm" abaixo, descreva quais recursos computacionais estão sendo solicitados ao Cluster, as limitações e condições de execução.

```
#!/bin/bash
#SBATCH --job-name=job_paralelo
#SBATCH --nodes=4
#SBATCH --ntasks-per-node=8
#SBATCH --time=02:00:00
#SBATCH --partition=compute
#SBATCH --output=resultado.out
#SBATCH --error=erro.err

# Carregar módulos necessários
module load mpi

# Executar o programa paralelo
mpirun -np 32 ./meu_programa_paralelo
```



### 1.

Combinar estratégias de software com recursos de hardware é importante para resolver problemas de forma mais eficiente. Isso porque o hardware, pode ajudar a processar grandes volumes de dados ou realizar cálculos mais complexos mais rápido. Por outro lado, se o software não for bem otimizado, ele pode desperdiçar os recursos disponíveis. Por exemplo, um algoritmo bem otimizado que aproveita o processamento em parelelo, vai usar o hardware de forma mais eficiente.

### 2.

Slurm é um sistema de gerenciamento de filas, usado em clusters. Ele ajuda a organizar e distribuir o uso dos recursos de hardware entre diferentes usuários. Basicamente, quando você quer rodar um programa em um supercomputador, você usa o Slurm para pedir uma "fila" de execução, dizendo quantos núcleos de processamento e quanto tempo você vai precisar. Assim, o Slurm cuida de distribuir o programa nos recursos disponíveis.

### 3.

O arquivo configura um job que irá usar 4 nós com 8 tarefas em cada (sendo 32 processos no total), por até 2 horas.