# Insper

## Supercomputação - Avaliação Intermediária - 2º semestre de 2024

#### SEU NOME: Luca Mizrahi

**Regras da prova**:

SOBRE HORÁRIOS:
- A prova estará liberada no Blackboard das 07h30 às 23h59 de 01/outubro/2024 (horário de Brasília);
- A prova tem duração aproximada de 03 horas (180 minutos);
- O aluno poderá realizar a prova ao longo do dia, no(s) horário(s) e espaço(s) de tempo que melhor lhe convier. Ao iniciar a prova você não precisará ficar 3 horas seguidas na sua realização;

SOBRE DÚVIDAS:
- O professor NÃO estará disponível fisicamente no Insper. O aluno que quiser tirar dúvidas, poderá fazê-lo via grupo de WhatsApp da prova. O link é: https://chat.whatsapp.com/IcnoFr2LkON1iYltj9SgDY

SOBRE SUBMISSÕES DA PROVA E DO PROJETO:
- A submissão da prova deve ser feita impreterivelmente até às 23h59 de 01/outubro/2024 (horário de Brasília). NÃO serão aceitas submissões após este horário;
- O aluno poderá fazer múltiplas submissões da prova. O sistema considerará a última submissão como oficial;
- A submissão da prova pode ser a resolução no jupyter notebook exportado no Colab ou ZIP com arquivos “.cpp” devidamente sinalizados (a qual questão se referenciam);

SOBRE A RESOLUÇÃO DA PROVA:
- A interpretação do enunciado faz parte da avaliação;
- É permitida a consulta ao material da disciplina (tudo o que estiver no repositório do Github da disciplina e no site https://liciascl.github.io/supercomp/. Isso também inclui suas próprias soluções aos exercícios de sala de aula, mas não inclui materiais não digitais, tampouco outros materiais além dos citados;
- É permitido consultar a documentação de C++ nos sites oficiais e links extras dos próprios enunciados;
- Seu pseudocódigo deve ser feito em Português, incluindo nomes de variáveis e comentários;


SOBRE QUESTÕES DE ÉTICA E PLÁGIO:
- A prova é individual. Qualquer consulta a outras pessoas durante a prova constitui violação do código de ética do Insper;
- Qualquer tentativa de fraude, como trechos idênticos ou muito similares, implicará em NOTA ZERO na prova a todos os envolvidos, sem prejuízo de outras sanções;
- Uso de Copilot ou ChatGPT ou correlatos para resolução pode implicar trechos similares entre alunos, caindo no item acima. Cuidado!

**_Boa prova!_**


# [2,0 pontos] Questão 01 - Problema do Subconjunto de Soma

**Contexto:**

O Problema do Subconjunto de Soma é um desafio clássico em ciência da computação e matemática, que se enquadra na categoria de problemas NP-Completo. Ele questiona se, dado um conjunto de números inteiros e um valor alvo, existe um subconjunto desses números cuja soma é igual ao valor alvo. Apesar de sua simplicidade conceitual, resolver este problema pode se tornar computacionalmente intensivo à medida que o tamanho do conjunto aumenta, tornando abordagens exaustivas impraticáveis para grandes conjuntos. Portanto, heurísticas e métodos aproximados se tornam ferramentas valiosas para encontrar soluções em tempo razoável.

**Questão:**

Considere um conjunto \( S = \{s_1, s_2, ..., s_n\} \) de números inteiros positivos e um valor alvo \( T \). Seu objetivo é desenvolver uma heurística para determinar se existe um subconjunto de \( S \) cuja soma é igual a \( T \). Sua solução não precisa ser ótima, mas deve ser capaz de encontrar uma resposta em um tempo razoável, mesmo para grandes valores de \( n \).

Para atingir este objetivo, você deve implementar o seguinte algoritmo heurístico em C++:

1. **Pré-processamento:** Ordene os números em \( S \) em ordem decrescente. Este passo visa a maximizar a eficiência da sua heurística, permitindo que grandes somas sejam alcançadas rapidamente, potencialmente aproximando-se de \( T \) mais rapidamente.

2. **Heurística de Aproximação:** Implemente uma função que percorra os números em \( S \) na ordem definida. Para cada número \( s_i \), decida se deve ou não incluí-lo no subconjunto candidato com base em uma regra heurística simples.

3. **Verificação e Saída:** Se, ao final do processo, a soma dos números no subconjunto candidato for igual a \( T \), sua função deve retornar `true`, indicando que uma solução foi encontrada. Caso contrário, retorne `false`.

**Pede-se**:
1. Implemente o algoritmo heurístico descrito acima em C++. (entregue o código)
2. Faça cenários de teste e comprove a corretude da sua solução.  
3. Discuta a eficácia da sua heurística. Em que cenários ela pode falhar em encontrar um subconjunto existente que some \( T \)? (entregue sua resposta justificada)


**DICA**:

Uma possível assinatura da sua função é:
```cpp
bool subsetSum(const vector<int>& set, int sum);
```





#### *Solução*:

```cpp
#include <iostream>
#include <vector>
#include <algorithm> // para sort
#include <chrono> // para contagem de tempo

// Função que implementa a heurística para o problema do subconjunto de soma
bool subsetSum(const std::vector<int>& set, int sum) {
    std::vector<int> sortedSet = set;

    // Passo 1: Ordenar o conjunto em ordem decrescente
    std::sort(sortedSet.begin(), sortedSet.end(), std::greater<int>());

    int currentSum = 0;
    
    // Passo 2: Iterar sobre os elementos e decidir se inclui no subconjunto
    for (int num : sortedSet) {
        if (currentSum + num <= sum) {
            currentSum += num;
        }

        // Passo 3: Verificar se a soma já atingiu o valor alvo
        if (currentSum == sum) {
            return true;
        }
    }

    // Se não for possível alcançar a soma alvo, retorne falso
    return false;
}

int main() {
    // Cenários de teste
    std::vector<int> set1 = {3, 34, 4, 12, 5, 2};
    int target1 = 9;

    std::vector<int> set2 = {1, 2, 3, 4, 5, 6};
    int target2 = 11;

    std::vector<int> set3 = {10, 20, 30};
    int target3 = 25;

    // Cenário 4: n = 1000
    std::vector<int> set4;
    int target4 = 5000;
    for (int i = 1; i <= 1000; ++i) {
        set4.push_back(i);
    }

    // Cenário 5: n = 10000
    std::vector<int> set5;
    int target5 = 200000;
    for (int i = 1; i <= 10000; ++i) {
        set5.push_back(i * 2);
    }

    // Cenário 6: n = 100000
    std::vector<int> set6;
    int target6 = 50000;
    for (int i = 1; i <= 100000; ++i) {
        set6.push_back(i);
    }

    // Testes com contagem de tempo
    auto start1 = std::chrono::high_resolution_clock::now();
    bool result1 = subsetSum(set1, target1);
    auto end1 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed1 = end1 - start1;
    std::cout << "Teste 1: " << (result1 ? "true" : "false") << " - Tempo: " << elapsed1.count() << " segundos" << std::endl;

    auto start2 = std::chrono::high_resolution_clock::now();
    bool result2 = subsetSum(set2, target2);
    auto end2 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed2 = end2 - start2;
    std::cout << "Teste 2: " << (result2 ? "true" : "false") << " - Tempo: " << elapsed2.count() << " segundos" << std::endl;

    auto start3 = std::chrono::high_resolution_clock::now();
    bool result3 = subsetSum(set3, target3);
    auto end3 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed3 = end3 - start3;
    std::cout << "Teste 3: " << (result3 ? "true" : "false") << " - Tempo: " << elapsed3.count() << " segundos" << std::endl;

    // Teste 4 com n = 5000
    auto start4 = std::chrono::high_resolution_clock::now();
    bool result4 = subsetSum(set4, target4);
    auto end4 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed4 = end4 - start4;
    std::cout << "Teste 4 (n = 1000): " << (result4 ? "true" : "false") << " - Tempo: " << elapsed4.count() << " segundos" << std::endl;

    // Teste 5 com n = 10000
    auto start5 = std::chrono::high_resolution_clock::now();
    bool result5 = subsetSum(set5, target5);
    auto end5 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed5 = end5 - start5;
    std::cout << "Teste 5 (n = 10000): " << (result5 ? "true" : "false") << " - Tempo: " << elapsed5.count() << " segundos" << std::endl;

    // Teste 6 com n = 100000
    auto start6 = std::chrono::high_resolution_clock::now();
    bool result6 = subsetSum(set6, target6);
    auto end6 = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed6 = end6 - start6;
    std::cout << "Teste 6 (n = 100000): " << (result6 ? "true" : "false") << " - Tempo: " << elapsed6.count() << " segundos" << std::endl;

    return 0;
}
```


O código está funcionando muito bem para as entradas testadas, e como esperado quanto maior o n mais tempo o código leva para rodar. Vale ressaltar que a maioria dos testes o conjunto já está ordenado, o que facilita a execução do código.

![Testes_ex1](ex1/ex1_AI_SuperComp.png)

#### *Discussão sobre a eficácia da heurística*

A heurística implementada utiliza uma abordagem onde o conjunto de números \( S \) é primeiro ordenado em ordem decrescente, e, em seguida, tenta-se somar os maiores elementos até que a soma atinja o valor alvo \( T \) ou o conjunto seja completamente percorrido. Essa estratégia busca maximizar a soma rapidamente, incluindo os maiores números disponíveis no subconjunto candidato, o que em muitos casos pode ser suficiente para encontrar uma solução, especialmente quando os maiores números têm grande impacto no valor da soma.

#### *Cenários em que a heurística pode falhar:*

Apesar de ser eficiente em muitos casos, a heurística não garante que sempre encontrará uma solução, mesmo quando um subconjunto com soma \( T \) existe. Existem cenários específicos em que essa abordagem pode falhar:

- **Distribuição Irregular dos Números (combinatória mais complexa):**
   - A heurística tende a ignorar combinações de números menores quando tenta primeiro somar os maiores. Isso pode ser problemático em casos onde a solução depende de várias combinações de números menores. Por exemplo, se \( T \) só pode ser alcançado somando uma combinação de vários números pequenos, a heurística pode falhar porque prioriza os números grandes, que ultrapassam ou não contribuem adequadamente para a soma.

- **Conjuntos com Grande Variabilidade de Valores:**
   - Quando o conjunto contém números com grande variabilidade de magnitude, a heurística pode acabar escolhendo grandes valores que se aproximam de \( T \), mas que acabam excluindo combinações de números menores que somam o valor exato. Nesses casos, a heurística perde eficiência ao tentar somar os maiores números, mesmo que eles não levem a uma solução.

- **Casos com Subconjuntos Densos:**
   - Em situações onde muitos números pequenos podem ser combinados de várias maneiras para atingir \( T \), a heurística pode ser ineficiente. Por exemplo, em problemas com muitos números menores, a soma ideal pode ser obtida por uma combinação precisa desses números, o que a abordagem gulosa dificilmente consegue identificar. 

- **Falsos Negativos:**
   - Outro ponto de falha é o fato de a heurística ser otimizada para encontrar uma solução rapidamente, mas não garantir a exaustividade. Ela pode retornar "false" para casos onde existe uma solução, simplesmente porque seguiu uma ordem específica que ignorou subconjuntos válidos. Como não há exploração de todas as possibilidades, a heurística pode deixar de encontrar uma solução mesmo quando ela existe.

#### *Conclusão sobre a heurística criada:*

A heurística apresentada é eficiente em termos de tempo e pode encontrar soluções rapidamente para muitos casos, especialmente quando os maiores números desempenham um papel importante na soma. No entanto, sua limitação principal reside na sua incapacidade de lidar com combinações complexas de números pequenos ou altamente variados. Nesses casos, algoritmos mais robustos, como programação dinâmica ou backtracking, seriam mais adequados, embora com um custo computacional mais elevado. Portanto, essa heurística é recomendada para problemas onde a simplicidade e a eficiência temporal são prioritárias, mas pode falhar em fornecer uma solução em casos mais complexos.

----

# [2,0 pontos] Questão 02 - Solução Ótima

A solução ótima do problema anterior é verificar todos os subconjuntos possíveis dos números de ( S ), calcular a soma de cada um deles e verificar se alguma destas soma é igual ao valor buscado. Essa solução, embora simples, pode não escalar bem para grandes entradas.


**Pede-se**:
1. Escreva o código da solução ótima em C++ (você pode usar recursão ou não)
;
2. Gere a solução para 10 entradas distintas em ordens de grandeza diferentes (algumas entradas pequenas, algumas médias, algumas grandes);
3. Compare o tempo de execução deste código nas 10 entradas. O comportamento está alinhado com o esperado? Justifique.


#### *Solução*:

```cpp
#include <iostream>
#include <vector>
#include <chrono> // para medir o tempo
#include <cstdlib> // para gerar números aleatórios
#include <ctime>   // para inicializar a seed do rand

// Função recursiva que verifica se existe um subconjunto cuja soma seja igual a 'sum'
bool subsetSumRecursive(const std::vector<int>& set, int n, int sum) {
    // Caso base: se a soma for 0, o subconjunto é encontrado
    if (sum == 0) return true;
    
    // Caso base: se não há mais elementos e a soma não foi encontrada
    if (n == 0 && sum != 0) return false;

    // Se o último elemento for maior que a soma, ignorá-lo
    if (set[n-1] > sum) return subsetSumRecursive(set, n-1, sum);

    // Verificar se a soma pode ser encontrada
    // (1) incluindo o último elemento ou
    // (2) não incluindo o último elemento
    return subsetSumRecursive(set, n-1, sum) || subsetSumRecursive(set, n-1, sum - set[n-1]);
}

int main() {
    // Inicializa a seed do gerador de números aleatórios
    std::srand(std::time(0));

    // Definindo 10 tamanhos para os conjuntos de teste, com tamanhos maiores para entradas médias e grandes
    std::vector<int> setSizes = {6, 6, 50, 100, 500, 1000, 5000, 10000, 20000, 30000};

    // Definindo os alvos para cada conjunto aleatório
    std::vector<int> targets = {9, 11, 500, 1000, 300, 500, 1000, 1000, 1000, 1000};

    // Gerar 10 conjuntos aleatórios e medir o tempo de execução da solução ótima
    for (int i = 0; i < setSizes.size(); ++i) {
        // Gerar um conjunto aleatório de tamanho setSizes[i]
        std::vector<int> testSet(setSizes[i]);
        for (int j = 0; j < setSizes[i]; ++j) {
            testSet[j] = std::rand() % 100 + 1; // Números aleatórios entre 1 e 100
        }

        // Exibir o conjunto gerado para referência (limitar a exibição para conjuntos menores)
        if (setSizes[i] <= 50) {
            std::cout << "Conjunto " << (i + 1) << ": ";
            for (int num : testSet) {
                std::cout << num << " ";
            }
            std::cout << " - Alvo: " << targets[i] << std::endl;
        } else {
            std::cout << "Conjunto " << (i + 1) << " (Tamanho: " << setSizes[i] << ") - Alvo: " << targets[i] << std::endl;
        }

        // Medir o tempo de execução da solução ótima
        auto start = std::chrono::high_resolution_clock::now();
        bool result = subsetSumRecursive(testSet, testSet.size(), targets[i]);
        auto end = std::chrono::high_resolution_clock::now();
        std::chrono::duration<double> elapsed = end - start;

        // Exibir o resultado e o tempo de execução
        std::cout << "Resultado: " << (result ? "true" : "false") 
                  << " - Tempo: " << elapsed.count() << " segundos" << std::endl;
        std::cout << "---------------------------------------------------------" << std::endl;
    }

    return 0;
}
```

#### *Resultado dos Testes*:

![Testes_ex2](ex2/ex2_AI_SuperComp.png)

#### *Resposta*:

O tempo de execução do código nas 10 entradas está alinhado com o esperado. Isso se deve ao fato de que a solução ótima, que verifica todos os subconjuntos possíveis, tem complexidade exponencial (**2^n**), o que significa que o tempo de execução aumenta exponencialmente com o tamanho do conjunto. Portanto, é esperado que o tempo de execução cresça significativamente à medida que o tamanho do conjunto aumenta. Além disso, algo que também influenciou consideravelmente o tempo de execução foi o target que foi escolhido para cada conjunto, pois quanto maior o target, mais subconjuntos precisam ser verificados. Sendo assim, o comportamento observado está alinhado com o esperado, e a solução ótima é eficaz para conjuntos pequenos, mas rapidamente se torna impraticável para conjuntos maiores devido à sua complexidade exponencial, especialmente quando o target é grande. Foi testado que para targets acima de 1000, o tempo de execução já é muito grande. 

Além disso, vale também ressaltar que as vezes o tempo de execução para entradas maiores pode ser menor que para entradas menores, dado que os conjuntos gerados são aleatórios e portanto, mesmo que o conjunto tenha mais números, o algoritmo pode encontrar uma solução mais rapidamente. No entanto, apesar desses casos, a tendência geral é que o tempo de execução aumente com o tamanho do conjunto e do target.

------

# [1,5 ponto] Questão 03 - Aleatorização

Em sala de aula, nós implementamos diversas estratégias para a mochila
binária. Explique a importância de buscar um balanço entre _exploration_ e _exploitation_. Dê um exemplo de como buscamos atingir _exploration_ e outro de como buscamos atingir _exploitation_ no Problema do Subconjunto de Soma. Elabore um pseudocódigo que combine tais estratégias e avalie criticamente sua efetividade.

#### *Resposta*:

No contexto de algoritmos de otimização, como no **Problema do Subconjunto de Soma**, encontrar um balanço entre _exploration_ e _exploitation_ é crucial. Se o algoritmo foca demais em **_exploration_**, ele pode gastar muito tempo explorando regiões menos promissoras, sem melhorar significativamente a solução. Por outro lado, se ele foca exclusivamente em **_exploitation_**, pode acabar preso em máximos ou mínimos locais, sem descobrir outras regiões do espaço de busca que poderiam conter soluções melhores.

Uma forma de aplicar _exploration_ no **Problema do Subconjunto de Soma** é introduzindo **aleatorização** na escolha dos subconjuntos a serem verificados. Em vez de sempre seguir um padrão determinístico para escolher os elementos a serem incluídos no subconjunto, podemos incluir uma escolha aleatória. Isso permite que o algoritmo explore diferentes regiões do espaço de soluções, aumentando as chances de encontrar subconjuntos que não seriam verificados por uma abordagem puramente determinística.

#### *Exemplos no Problema do Subconjunto de Soma*:

Uma forma de aplicar _exploration_ no **Problema do Subconjunto de Soma** é introduzindo **aleatorização** na escolha dos subconjuntos a serem verificados. Em vez de sempre seguir um padrão determinístico para escolher os elementos a serem incluídos no subconjunto, podemos incluir uma escolha aleatória. Isso permite que o algoritmo explore diferentes regiões do espaço de soluções, aumentando as chances de encontrar subconjuntos que não seriam verificados por uma abordagem puramente determinística.

Já Uma forma de aplicar _exploitation_ é priorizando subconjuntos que têm maior potencial de atingir a soma alvo, por exemplo, priorizando os elementos maiores que estão mais próximos de \( T \), ou seja, similar a heurística de ordenação decrescente implementada no exercício 1. O algoritmo explora intensivamente essas regiões do espaço de soluções, que são mais promissoras para encontrar a soma exata.



#### *Pseudocódigo Combinando Exploration e Exploitation*

A seguir está um pseudocódigo que combina estratégias de _exploration_ (escolhas aleatórias) e _exploitation_ (heurística decrescente) para resolver o **Problema do Subconjunto de Soma**:

```cpp
ProblemaDoSubconjuntoDeSoma(S, T):
    # S: Conjunto de elementos
    # T: Soma alvo
    Inicializar melhorSubconjunto = vazio
    Inicializar melhorSoma = 0

    Para i = 1 até MAX_ITER:
        # Passo 1: Exploration - Selecionar subconjuntos aleatórios
        subconjuntoAleatorio = escolherSubconjuntoAleatorio(S)
        somaAleatoria = calcularSoma(subconjuntoAleatorio)

        Se somaAleatoria == T:
            Retornar subconjuntoAleatorio

        Se somaAleatoria > melhorSoma e somaAleatoria <= T:
            melhorSoma = somaAleatoria
            melhorSubconjunto = subconjuntoAleatorio

        # Passo 2: Exploitation - Selecionar subconjuntos de maneira decrescente
        subconjuntoDecrescente = escolherSubconjuntoDecrescente(S, T)
        somaDecrescente = calcularSoma(subconjuntoDecrescente)

        Se somaDecrescente == T:
            Retornar subconjuntoDecrescente

        Se somaDecrescente > melhorSoma e somaDecrescente <= T:
            melhorSoma = somaDecrescente
            melhorSubconjunto = subconjuntoDecrescente

    Retornar melhorSubconjunto
```
#### *Avaliação Crítica da Efetividade:*

A fase de _exploration_ permite que o algoritmo explore diversas regiões do espaço de soluções, evitando que ele fique preso em uma região específica (como pode acontecer com uma abordagem puramente decrescente). No entanto, escolhas aleatórias podem ser ineficazes se muitas delas não estiverem próximas da solução ideal.

A fase de _exploitation_ garante que o algoritmo explore regiões promissoras mais profundamente, concentrando o esforço nas melhores opções identificadas. Essa abordagem pode rapidamente melhorar a qualidade das soluções, mas corre o risco de se prender a máximos locais se não houver _exploration_ suficiente.

O pseudocódigo tenta balancear as duas estratégias, alternando entre _exploration_ e _exploitation_ para maximizar as chances de encontrar uma solução ideal ou próxima da ideal. O sucesso dessa abordagem depende do número de iterações e do quão bem o algoritmo consegue equilibrar essas duas fases. O uso de aleatoriedade pode ser vantajoso no início da busca, mas à medida que o algoritmo convergir, _exploitation_ deve se tornar mais dominante. Sendo assim, essa nova abordagem seria mais eficaz do que apenas _exploration_ ou _exploitation_ isoladamente, mas ainda assim pode não ser suficiente para garantir a melhor solução em todos os casos, que é o caso da heurística implementada na questão 2.

----

# [2,0  pontos] Questão 04 - GPU e Thrust

1.	Acesse o link abaixo e faça uma cópia no seu Google Drive: https://colab.research.google.com/drive/14_EZNglXn2VXe3kpDW3XgEsRkB6R1jjp?usp=sharing
2.	Complete o código seguindo a especificação. ATENÇÃO: você provavelmente precisará complementar os imports para o código rodar!
3.	Baixe sua cópia do notebook preenchido e executado, e disponibilize junto com sua solução.

_OBSERVAÇÃO_: recomendo o uso do Colab na realização da questão de GPU. Use implementação e teste local por conta e risco. =)


#### *Solução*: 
O notebook com a resposta da questão está na pasta `ex4`

-----

# [1,5 pontos] Questão 05 - Busca global

Um algoritmo de busca global, em termos gerais, é um algoritmo de otimização que procura encontrar a melhor solução possível para um problema dentro de um espaço de busca, considerando todas as possíveis soluções. Em outras palavras, ele tenta encontrar o máximo ou mínimo global de uma função objetivo em um domínio especificado.

Em alguns problemas a "busca global" não se trata de uma otimização, mas de encontrar a única resposta correta possível. Por exemplo, o cálculo de Fibonacci é algoritmo que dado um número `N`, o `fib(N)` assume apenas um valor correto.

Observe o código abaixo para cálculo do Fibonacci. Altere o programa para receber `N` como uma entrada, e rode o programa para alguns valores de N, tanto pequenos (abaixo de 30) quanto grandes (acima de 30 --- só não exagere!), comparando os tempos de execução.  

Código-fonte:

```cpp
#include <iostream>

int fib(int n) {
    if (n <= 1) {
        return n;
    } else {
        return fib(n - 1) + fib(n - 2);
    }
}

int main() {
    int n = 30; // Valor de n para calcular Fibonacci
    int result = fib(n);
    std::cout << "Fibonacci de " << n << " é " << result << std::endl;
    return 0;
}
```

Note que tempo de execução para esta implementação aumenta consideravelmente quando `N` cresce.

**Pede-se**: Implemente  uma otimização para esse algoritmo de modo que sua implementação seja pela abordagem de memorização (*memoization*), ou seja, salvar cálculos já realizados para reaproveitá-los. Apresente código-fonte, resultados e compare os resultados de tempo de execução obtidos.

##### *Solução*:

```cpp
#include <iostream>
#include <vector>
#include <chrono> // Biblioteca para medir o tempo

// Função auxiliar que usa memorização para calcular Fibonacci
int fibMemo(int n, std::vector<int>& memo) {
    if (n <= 1) {
        return n;
    }
    // Se o valor já foi calculado antes, retorná-lo
    if (memo[n] != -1) {
        return memo[n];
    }
    // Caso contrário, calculamos e armazenamos o resultado
    memo[n] = fibMemo(n - 1, memo) + fibMemo(n - 2, memo);
    return memo[n];
}

int fib(int n) {
    std::vector<int> memo(n + 1, -1); // Inicializamos o vetor de memorização com -1
    return fibMemo(n, memo);
}

int main() {
    int n;
    std::cout << "Digite o valor de N para calcular Fibonacci: ";
    std::cin >> n;

    // Medir o tempo de execução da função otimizada (com memorização)
    auto start = std::chrono::high_resolution_clock::now();
    int result = fib(n);
    auto end = std::chrono::high_resolution_clock::now();

    // Exibir o resultado e o tempo de execução
    std::cout << "Fibonacci de " << n << " é " << result << std::endl;
    std::chrono::duration<double> elapsed = end - start;
    std::cout << "Tempo de execução (com memorização): " << elapsed.count() << " segundos" << std::endl;

    return 0;
}
```

#### Testes com *N = 40*:

*Teste - Código Original (sem memorização):*

![Testes_ex5](ex5/ex5_AI_SuperComp_original.png)

*Teste - Código Otimizado (com memorização):*

![Testes_ex5](ex5/ex5_AI_SuperComp_otimizado.png)


#### Comparação dos Resultados:

A implementação otimizada com memorização é significativamente mais rápida do que a implementação original, especialmente para valores grandes de \( N \). Isso ocorre porque a abordagem de memorização evita recalcular os mesmos valores várias vezes, armazenando os resultados intermediários em um vetor de memoização. Dessa forma, a complexidade de tempo da função otimizada é linear, \( O(N) \), em vez de exponencial, \( O(2^N) \), como na implementação original. Isso resulta em um tempo de execução muito mais rápido, como exemplificado nos testes realizados.

-----

# [1.0 ponto] Questão 06 - Uso de Cluster em Supercomputação

Esta disciplina estuda estratégias para resolver problemas complexos em tempo computacionalmente razoável.

**Pede-se**:
1. Qual é a importância de aliar estratégias de implementação (Software) com recursos computacionais disponíveis (Hardware) para melhor endereçamento do problema?
2. Defina o que é Slurm e sua importância na programação paralela em larga escala.
3. Considerando o job configurado pelo ".slurm" abaixo, descreva quais recursos computacionais estão sendo solicitados ao Cluster, as limitações e condições de execução.

```
#!/bin/bash
#SBATCH --job-name=job_paralelo
#SBATCH --nodes=4
#SBATCH --ntasks-per-node=8
#SBATCH --time=02:00:00
#SBATCH --partition=compute
#SBATCH --output=resultado.out
#SBATCH --error=erro.err

# Carregar módulos necessários
module load mpi

# Executar o programa paralelo
mpirun -np 32 ./meu_programa_paralelo
```



#### *Respostas*:

*1.* A combinação de estratégias de implementação de software com os recursos computacionais disponíveis é crucial para garantir a eficiência e o desempenho na solução de problemas complexos. Ao aproveitar o paralelismo oferecido por arquiteturas multicore ou clusters, o software pode dividir tarefas e executar em várias unidades de processamento ao mesmo tempo, o que acelera significativamente a resolução do problema. Programas que não utilizam adequadamente os recursos disponíveis tendem a subutilizar o hardware, resultando em maior tempo de execução. Além disso, softwares mal otimizados podem criar gargalos, como uso excessivo de I/O ou sincronizações desnecessárias, que diminuem a eficiência global. Por isso, uma implementação que maximiza o uso de hardware disponível melhora a escalabilidade e o desempenho geral, permitindo a resolução de problemas em tempo computacionalmente razoável.

*2.* SLURM (Simple Linux Utility for Resource Management) é um sistema de gerenciamento de filas e recursos amplamente utilizado em supercomputadores e clusters para alocar recursos computacionais e gerenciar a execução de tarefas. Ele desempenha um papel essencial na programação paralela em larga escala, pois distribui os jobs entre os nós disponíveis de forma eficiente, garantindo o uso ideal de CPUs, memória e outros recursos. SLURM também gerencia a fila de execução de múltiplos usuários, organizando os jobs de acordo com prioridades e recursos disponíveis. Em ambientes de computação de alto desempenho (HPC), SLURM é fundamental para a execução de programas paralelos, permitindo a coordenação de processos em diferentes nós e suportando escalabilidade em sistemas de larga escala. Ele garante que o sistema opere de maneira eficiente e justa, mesmo em clusters com milhares de nós.

*3.*

*O script `.slurm` está solicitando ao cluster os seguintes recursos computacionais:*

- **Número de nós (`--nodes=4`):** O job está requisitando o uso de **4 nós** do cluster. Um nó é uma máquina (servidor) individual dentro do cluster, que possui um número de processadores, memória e outros recursos. Usar múltiplos nós permite que o trabalho seja distribuído entre várias máquinas, que é algo fundamental para a execução de programas paralelos de larga escala.

- **Tarefas por nó (`--ntasks-per-node=8`):** Em cada nó, serão executadas **8 tarefas paralelas**. Ou seja, cada nó vai processar 8 unidades de trabalho simultaneamente, utilizando os núcleos de CPU disponíveis. Em conjunto com o número de nós, a tarefa será distribuído em 32 tarefas no total (4 nós x 8 tarefas por nó).

- **Tempo de execução (`--time=02:00:00`):** O job tem um limite de **2 horas** para sua execução. Se o programa não for concluído dentro desse período, ele será interrompido automaticamente pelo SLURM. Esse limite garante que a tarefa não consuma indefinidamente os recursos do cluster.

- **Partição (`--partition=compute`):** O job será executado na partição `compute`. Partições em um cluster geralmente representam diferentes conjuntos de recursos ou diferentes filas de prioridade. A partição `compute` é uma fila dedicada a tarefas computacionais intensivas, mas pode ter limitações em termos de disponibilidade de recursos dependendo da carga do cluster.

- **Execução paralela com MPI:** O módulo **MPI** (Message Passing Interface) é carregado para garantir a execução do programa paralelo. O comando `mpirun -np 32 ./meu_programa_paralelo` indica que **32 processos MPI** serão executados simultaneamente, distribuídos entre os 4 nós solicitados. Isso significa que cada nó estará processando 8 tarefas MPI em paralelo. A comunicação entre esses processos será gerenciada por MPI, permitindo que eles colaborem na execução de um único programa.

*As principais Limitações e condições de execução:*

O job está sujeito a algumas limitações e condições de execução. Primeiramente, existe o limite de tempo de 2 horas para a execução, o que significa que, caso o programa não termine dentro desse período, ele será interrompido automaticamente pelo sistema SLURM. Essa limitação pode ser um problema caso o código exija mais tempo para ser concluído, necessitando uma reavaliação dos requisitos de tempo de execução. Além disso, o job solicita 4 nós, com 8 tarefas por nó, totalizando 32 processos. A execução do job depende da disponibilidade de 4 nós no momento da submissão. Caso esses recursos não estejam disponíveis, o job ficará na fila até que os nós solicitados estejam livres para uso, o que pode gerar um tempo de espera antes do início da execução.

Outro ponto importante é que a execução está confinada à partição `compute`. Se a partição estiver ocupada ou houver restrições de uso, isso também pode aumentar o tempo de espera para a execução. Além disso, o desempenho do job pode ser afetado pela eficiência da comunicação entre os processos MPI distribuídos pelos 4 nós. Se houver latência de rede ou problemas de sincronização, isso pode reduzir a eficiência do paralelismo e aumentar o tempo total de execução do programa. Em termos de memória, o script não especifica explicitamente a quantidade de memória requerida, portanto, o SLURM alocará a quantidade padrão proporcional ao número de tarefas. Se o programa consumir mais memória do que o disponível, isso poderá causar falhas no job.