# Insper

## Supercomputação - Avaliação Intermediária - 2º semestre de 2024

#### SEU NOME: Gustavo Eliziario Stevenson de Oliveira

**Regras da prova**:

SOBRE HORÁRIOS:
- A prova estará liberada no Blackboard das 07h30 às 23h59 de 01/outubro/2024 (horário de Brasília);
- A prova tem duração aproximada de 03 horas (180 minutos);
- O aluno poderá realizar a prova ao longo do dia, no(s) horário(s) e espaço(s) de tempo que melhor lhe convier. Ao iniciar a prova você não precisará ficar 3 horas seguidas na sua realização;

SOBRE DÚVIDAS:
- O professor NÃO estará disponível fisicamente no Insper. O aluno que quiser tirar dúvidas, poderá fazê-lo via grupo de WhatsApp da prova. O link é: https://chat.whatsapp.com/IcnoFr2LkON1iYltj9SgDY

SOBRE SUBMISSÕES DA PROVA E DO PROJETO:
- A submissão da prova deve ser feita impreterivelmente até às 23h59 de 01/outubro/2024 (horário de Brasília). NÃO serão aceitas submissões após este horário;
- O aluno poderá fazer múltiplas submissões da prova. O sistema considerará a última submissão como oficial;
- A submissão da prova pode ser a resolução no jupyter notebook exportado no Colab ou ZIP com arquivos “.cpp” devidamente sinalizados (a qual questão se referenciam);

SOBRE A RESOLUÇÃO DA PROVA:
- A interpretação do enunciado faz parte da avaliação;
- É permitida a consulta ao material da disciplina (tudo o que estiver no repositório do Github da disciplina e no site https://liciascl.github.io/supercomp/. Isso também inclui suas próprias soluções aos exercícios de sala de aula, mas não inclui materiais não digitais, tampouco outros materiais além dos citados;
- É permitido consultar a documentação de C++ nos sites oficiais e links extras dos próprios enunciados;
- Seu pseudocódigo deve ser feito em Português, incluindo nomes de variáveis e comentários;


SOBRE QUESTÕES DE ÉTICA E PLÁGIO:
- A prova é individual. Qualquer consulta a outras pessoas durante a prova constitui violação do código de ética do Insper;
- Qualquer tentativa de fraude, como trechos idênticos ou muito similares, implicará em NOTA ZERO na prova a todos os envolvidos, sem prejuízo de outras sanções;
- Uso de Copilot ou ChatGPT ou correlatos para resolução pode implicar trechos similares entre alunos, caindo no item acima. Cuidado!

**_Boa prova!_**


# [2,0 pontos] Questão 01 - Problema do Subconjunto de Soma

**Contexto:**

O Problema do Subconjunto de Soma é um desafio clássico em ciência da computação e matemática, que se enquadra na categoria de problemas NP-Completo. Ele questiona se, dado um conjunto de números inteiros e um valor alvo, existe um subconjunto desses números cuja soma é igual ao valor alvo. Apesar de sua simplicidade conceitual, resolver este problema pode se tornar computacionalmente intensivo à medida que o tamanho do conjunto aumenta, tornando abordagens exaustivas impraticáveis para grandes conjuntos. Portanto, heurísticas e métodos aproximados se tornam ferramentas valiosas para encontrar soluções em tempo razoável.

**Questão:**

Considere um conjunto \( S = \{s_1, s_2, ..., s_n\} \) de números inteiros positivos e um valor alvo \( T \). Seu objetivo é desenvolver uma heurística para determinar se existe um subconjunto de \( S \) cuja soma é igual a \( T \). Sua solução não precisa ser ótima, mas deve ser capaz de encontrar uma resposta em um tempo razoável, mesmo para grandes valores de \( n \).

Para atingir este objetivo, você deve implementar o seguinte algoritmo heurístico em C++:

1. **Pré-processamento:** Ordene os números em \( S \) em ordem decrescente. Este passo visa a maximizar a eficiência da sua heurística, permitindo que grandes somas sejam alcançadas rapidamente, potencialmente aproximando-se de \( T \) mais rapidamente.

2. **Heurística de Aproximação:** Implemente uma função que percorra os números em \( S \) na ordem definida. Para cada número \( s_i \), decida se deve ou não incluí-lo no subconjunto candidato com base em uma regra heurística simples.

3. **Verificação e Saída:** Se, ao final do processo, a soma dos números no subconjunto candidato for igual a \( T \), sua função deve retornar `true`, indicando que uma solução foi encontrada. Caso contrário, retorne `false`.

**Pede-se**:
1. Implemente o algoritmo heurístico descrito acima em C++. (entregue o código)
2. Faça cenários de teste e comprove a corretude da sua solução.  
3. Discuta a eficácia da sua heurística. Em que cenários ela pode falhar em encontrar um subconjunto existente que some \( T \)? (entregue sua resposta justificada)


**DICA**:

Uma possível assinatura da sua função é:
```cpp
bool subsetSum(const vector<int>& set, int sum);
```





### Resposta:

```cpp
#include <iostream>
#include <vector>
#include <algorithm>  // Para sort
#include <fstream>    // Para ler arquivos
#include <chrono>     // Para medir o tempo de execução
using namespace std;

// Função para resolver o problema do subconjunto de soma usando heurística
bool subsetSum(const vector<int>& set, int target) {
    // Criar uma cópia do conjunto para não modificar o original
    vector<int> sortedSet = set;
    
    // Passo 1: Ordenar os números em ordem decrescente
    sort(sortedSet.begin(), sortedSet.end(), greater<int>());

    // Variável para armazenar a soma do subconjunto candidato
    int currentSum = 0;

    // Passo 2: Heurística de aproximação
    for (int num : sortedSet) {
        if (currentSum + num <= target) {
            currentSum += num;  // Incluir o número no subconjunto candidato
        }

        // Se atingimos o valor alvo, retornar true
        if (currentSum == target) {
            return true;
        }
    }

    // Se não conseguimos atingir a soma exata, retornar false
    return false;
}

int main(int argc, char* argv[]) {
    if (argc != 2) {
        cerr << "Uso: " << argv[0] << " <arquivo de entrada>" << endl;
        return 1;
    }

    // Abrir o arquivo de entrada
    ifstream inputFile(argv[1]);
    if (!inputFile) {
        cerr << "Erro ao abrir o arquivo de entrada!" << endl;
        return 1;
    }

    // Ler os números do arquivo
    vector<int> set;
    int num;
    while (inputFile >> num) {
        set.push_back(num);
    }

    // Fechar o arquivo após a leitura
    inputFile.close();

    // O último número do arquivo será o valor alvo
    int target = set.back();
    set.pop_back();  // Remover o valor alvo do conjunto

    // Medir o tempo de execução
    auto start = chrono::steady_clock::now();

    // Executar o algoritmo de subconjunto de soma
    bool result = subsetSum(set, target);

    auto end = chrono::steady_clock::now();
    chrono::duration<double> elapsed_seconds = end - start;

    // Exibir o resultado
    if (result) {
        cout << "Há um subconjunto cuja soma é igual a " << target << "." << endl;
    } else {
        cout << "Não há subconjunto cuja soma seja igual a " << target << "." << endl;
    }

    // Exibir o tempo de execução
    cout << "Tempo de execução: " << elapsed_seconds.count() << " segundos." << endl;

    return 0;
}

```

### Codigo para criar uma base de testes:

In [1]:
def gerar_base_teste(n, valor_alvo, nome_arquivo="entrada_teste.txt"):
    with open(nome_arquivo, "w") as arquivo:
        # Escreve os números de 1 até n-1
        for i in range(1, n):
            arquivo.write(f"{i} ")
        # Escreve o valor alvo no final
        arquivo.write(f"{valor_alvo}\n")
    print(f"Arquivo {nome_arquivo} gerado com sucesso!")

# Exemplo de uso: Gerar um arquivo de teste com números de 1 a 1.000.000 e valor alvo 450.000
gerar_base_teste(1000000, 450000, "entrada_grande_tempo.txt")

Arquivo entrada_grande_tempo.txt gerado com sucesso!



---

### Eficácia da Heurística

A heurística implementada resolve o problema do **Subconjunto de Soma** de forma eficiente na maioria dos cenários. Ela ordena o conjunto de números em ordem decrescente e tenta somar os maiores números primeiro, a fim de se aproximar rapidamente do valor alvo \( T \). Se um subconjunto cuja soma seja igual a \( T \) for encontrado, a heurística retorna `true`; caso contrário, retorna `false`.

#### Como a Heurística Funciona

1. **Ordenação Decrescente**:
   O algoritmo começa ordenando os números em \( S \) em ordem decrescente, permitindo que os maiores números sejam somados primeiro, o que pode ajudar a alcançar o valor alvo \( T \) de maneira mais rápida.

2. **Soma Parcial**:
   Após a ordenação, o algoritmo percorre o conjunto e vai somando os números ao subconjunto candidato, desde que a soma não ultrapasse \( T \). Se a soma exata for atingida, o algoritmo retorna `true`.

3. **Verificação de Falha**:
   Se, após percorrer todos os números, o valor \( T \) não for atingido, a heurística retorna `false`, indicando que não há um subconjunto cuja soma seja igual ao alvo.

#### Cenários em que a Heurística Pode Falhar

Embora seja eficiente, a heurística não é exaustiva, o que significa que pode não encontrar todas as soluções. Abaixo estão os cenários em que pode falhar:

1. **Soma Total Menor que \( T \)**:
   Se a soma de todos os números do conjunto for menor que \( T \), a heurística retornará `false`, pois não é possível atingir o valor alvo. 
   - **Exemplo**: No arquivo `entrada_grande_nao_resolve.txt`, o conjunto \( S = \{1000, 800, 500, 400, 300, 200, 100, 50, 20, 10, 5, 1\} \) tem uma soma total de \( 3386 \), que é menor que \( T = 5000 \), levando o algoritmo a retornar `false`.

2. **Combinações Específicas Não Consideradas**:
   A heurística pode falhar se a solução exigir uma combinação complexa de números menores que não são somados devido à abordagem gananciosa.
   - **Exemplo**: Para \( S = \{1, 3, 5, 6, 7, 10\} \) e \( T = 11 \), a heurística pode falhar se começar somando \( 7 + 3 \), ignorando a solução correta \( 10 + 1 \).

3. **Casos com Muitos Números Pequenos**:
   Quando o conjunto contém muitos números pequenos e \( T \) é grande, a heurística pode falhar ao não considerar combinações corretas de números menores que poderiam atingir o valor alvo.

### Reflexão sobre a Eficácia da Heurística

A heurística é eficaz para a maioria dos casos, especialmente em situações que envolvem grandes números. Ela oferece tempos de execução extremamente rápidos, mesmo para conjuntos grandes, devido à sua abordagem gananciosa de tentar somar os maiores números primeiro. Contudo, em cenários que exigem combinações específicas de números menores, a heurística pode não encontrar a solução, retornando `false` incorretamente. Ainda assim, para a maioria dos cenários práticos, ela oferece uma solução rápida e eficiente.

### Testes e Resultados

Aqui estão os resultados obtidos para os diferentes testes:

1. **Arquivo `entrada_grande_nao_resolve.txt`**:
   - Conjunto: \( \{1000, 800, 500, 400, 300, 200, 100, 50, 20, 10, 5, 1\} \)
   - Valor alvo: \( T = 5000 \)
   - **Resultado**: "Não há subconjunto cuja soma seja igual a 5000."
   - **Tempo de execução**: 1.583e-06 segundos.

2. **Arquivo `entrada_grande_resolve.txt`**:
   - Conjunto: \( \{1000, 800, 500, 400, 300, 200, 100, 50, 20, 10, 5, 1\} \)
   - Valor alvo: \( T = 2156 \)
   - **Resultado**: "Há um subconjunto cuja soma é igual a 2156."
   - **Tempo de execução**: 1.604e-06 segundos.

3. **Arquivo `entrada_grande_tempo.txt`**:
   - Conjunto: Números de \( 1 \) a \( 1.000.000 \)
   - Valor alvo: \( T = 450000 \)
   - **Resultado**: "Há um subconjunto cuja soma é igual a 450000."
   - **Tempo de execução**: 0.0803478 segundos.

4. **Arquivo `entrada_pequeno_resolve.txt`**:
   - Conjunto: \( \{3, 34, 4, 12, 5, 2, 9\} \)
   - Valor alvo: \( T = 9 \)
   - **Resultado**: "Há um subconjunto cuja soma é igual a 9."
   - **Tempo de execução**: 1.266e-06 segundos.

### Complexidade do Problema do Subconjunto de Soma

O problema do **Subconjunto de Soma** é **NP-completo**, o que significa que sua solução exata tem complexidade **exponencial** com tempo de execução \( O(2^n) \), onde \( n \) é o número de elementos no conjunto.

### Complexidade da Heurística

A heurística implementada possui complexidade reduzida:
1. **Ordenação Decrescente**: Tem complexidade \( O(n \log n) \), onde \( n \) é o tamanho do conjunto.
2. **Percurso Linear**: Após a ordenação, o algoritmo percorre o conjunto uma vez, com complexidade \( O(n) \).

Portanto, a complexidade total da heurística é **\( O(n \log n) \)**, o que é muito mais eficiente que a abordagem exata.

### Conclusão

A heurística oferece uma solução rápida para a maioria dos casos, com complexidade \( O(n \log n) \), o que a torna adequada para conjuntos grandes. No entanto, ela pode falhar em encontrar soluções quando estas dependem de combinações complexas de números menores, ou quando a soma total do conjunto é insuficiente para alcançar o valor alvo \( T \).

---


# [2,0 pontos] Questão 02 - Solução Ótima

A solução ótima do problema anterior é verificar todos os subconjuntos possíveis dos números de ( S ), calcular a soma de cada um deles e verificar se alguma destas soma é igual ao valor buscado. Essa solução, embora simples, pode não escalar bem para grandes entradas.


**Pede-se**:
1. Escreva o código da solução ótima em C++ (você pode usar recursão ou não)
;
2. Gere a solução para 10 entradas distintas em ordens de grandeza diferentes (algumas entradas pequenas, algumas médias, algumas grandes);
3. Compare o tempo de execução deste código nas 10 entradas. O comportamento está alinhado com o esperado? Justifique.


### Resposta:
    
```cpp
#include <iostream>
#include <vector>
#include <fstream>
#include <chrono> // Para medir o tempo de execução

using namespace std;

// Função recursiva para verificar todos os subconjuntos possíveis
bool subsetSum(const vector<int>& set, int n, int sum) {
    // Caso base: Se a soma for 0, encontramos um subconjunto
    if (sum == 0) {
        return true;
    }

    // Se não houver mais elementos e a soma não for 0, retorne false
    if (n == 0) {
        return false;
    }

    // Se o último elemento é maior que a soma, ignorar este elemento
    if (set[n - 1] > sum) {
        return subsetSum(set, n - 1, sum);
    }

    // Verificar duas opções: incluir o último elemento ou não
    return subsetSum(set, n - 1, sum) || subsetSum(set, n - 1, sum - set[n - 1]);
}

int main(int argc, char* argv[]) {
    if (argc != 2) {
        cerr << "Uso: " << argv[0] << " <arquivo de entrada>" << endl;
        return 1;
    }

    // Abrir o arquivo de entrada
    ifstream inputFile(argv[1]);
    if (!inputFile) {
        cerr << "Erro ao abrir o arquivo de entrada!" << endl;
        return 1;
    }

    // Ler os números do arquivo
    vector<int> set;
    int num;
    while (inputFile >> num) {
        set.push_back(num);
    }

    // Fechar o arquivo após a leitura
    inputFile.close();

    // O último número do arquivo será o valor alvo
    int target = set.back();
    set.pop_back(); // Remover o valor alvo do conjunto

    // Medir o tempo de execução
    auto start = chrono::steady_clock::now();

    // Executar o algoritmo de subconjunto de soma
    bool result = subsetSum(set, set.size(), target);

    auto end = chrono::steady_clock::now();
    chrono::duration<double> elapsed_seconds = end - start;

    // Exibir o resultado
    if (result) {
        cout << "Há um subconjunto cuja soma é igual a " << target << "." << endl;
    } else {
        cout << "Não há subconjunto cuja soma seja igual a " << target << "." << endl;
    }

    // Exibir o tempo de execução
    cout << "Tempo de execução: " << elapsed_seconds.count() << " segundos." << endl;

    return 0;
}

```

### Código de gerar base de testes:

In [12]:
import random

# Função para gerar uma base de teste com valores randomizados de 1 a 100
def gerar_base_questao2_random_limited(n, valor_alvo, nome_arquivo="questao2.txt"):
    with open(nome_arquivo, "w") as arquivo:
        # Gerar uma lista de números aleatórios de 1 a 100 com tamanho n-1
        numeros = [random.randint(1, 100) for _ in range(n - 1)]
        
        for num in numeros:
            arquivo.write(f"{num} ")
        
        # Escreve o valor alvo no final
        arquivo.write(f"{valor_alvo}\n")
    print(f"Arquivo {nome_arquivo} gerado com sucesso!")

# Pequenas entradas
gerar_base_questao2_random_limited(5, 3, "pequena1.txt")     # Conjunto de 1 a 4 randomizados e valor alvo 3
gerar_base_questao2_random_limited(10, 15, "pequena2.txt")   # Conjunto de 1 a 9 randomizados e valor alvo 15
gerar_base_questao2_random_limited(15, 12, "pequena3.txt")   # Conjunto de 1 a 14 randomizados e valor alvo 12

# Médias entradas (limite até 100)
gerar_base_questao2_random_limited(100, 400, "media1.txt")    # Conjunto de 1 a 99 randomizados e valor alvo 250
gerar_base_questao2_random_limited(200, 400, "media2.txt")    # Conjunto de 1 a 199 randomizados e valor alvo 400
gerar_base_questao2_random_limited(300, 400, "media3.txt")    # Conjunto de 1 a 299 randomizados e valor alvo 550

# Grandes entradas (600 <= n <= 1000)
gerar_base_questao2_random_limited(2000, 1000, "grande1.txt")  # Conjunto de 1 a 599 randomizados e valor alvo 300
gerar_base_questao2_random_limited(2000, 1300, "grande2.txt")  # Conjunto de 1 a 699 randomizados e valor alvo 200
gerar_base_questao2_random_limited(2000, 1500, "grande3.txt")  # Conjunto de 1 a 799 randomizados e valor alvo 150
gerar_base_questao2_random_limited(2000, 1400, "grande4.txt")  # Conjunto de 1 a 899 randomizados e valor alvo 400


Arquivo grande4.txt gerado com sucesso!



---

### Comparação do Tempo de Execução nas 10 Entradas:

Os tempos de execução para as entradas foram os seguintes:

1. **pequena1.txt (n = 5, T = 3)**: 1.4e-07 segundos  
2. **pequena2.txt (n = 10, T = 15)**: 1.59e-07 segundos  
3. **pequena3.txt (n = 15, T = 12)**: 2.07e-07 segundos  

4. **media1.txt (n = 100, T = 400)**: 4.599e-06 segundos  
5. **media2.txt (n = 200, T = 400)**: 3.163e-06 segundos  
6. **media3.txt (n = 300, T = 400)**: 1.7397e-05 segundos  

7. **grande1.txt (n = 2000, T = 1000)**: 0.0066407 segundos  
8. **grande2.txt (n = 2000, T = 1300)**: 0.0811235 segundos  
9. **grande3.txt (n = 2000, T = 1500)**: 1.34634 segundos  
10. **grande4.txt (n = 2000, T = 1400)**: 8.43857 segundos  

### Análise dos Resultados:

O comportamento observado está **alinhado com o esperado** para uma solução ótima do **Problema do Subconjunto de Soma**, cuja complexidade é **exponencial**, ou seja, \( O(2^n) \). É importante destacar que, no gerador de base de testes, **os valores gerados foram limitados ao intervalo de 1 a 100**. Isso significa que, mesmo para grandes valores de \( n \), os números no conjunto de teste permanecem dentro desse intervalo, o que pode influenciar a dificuldade do problema em certos casos.

#### Entradas Pequenas (n ≤ 15):
- Os tempos de execução para as entradas pequenas foram extremamente rápidos, variando entre \( 10^{-7} \) e \( 10^{-6} \) segundos. Isso se deve ao fato de que, com poucos elementos, o número de subconjuntos possíveis ainda é pequeno, permitindo que o algoritmo ótimo verifique todas as combinações rapidamente.

#### Entradas Médias (n = 100 a 300):
- O tempo de execução começa a aumentar de maneira perceptível à medida que \( n \) cresce. Aqui, os tempos variam entre \( 10^{-6} \) e \( 10^{-5} \) segundos, refletindo o aumento exponencial do número de subconjuntos possíveis. A limitação dos valores entre 1 e 100 pode contribuir para a presença de mais combinações válidas, reduzindo ligeiramente o tempo de verificação em alguns casos.

#### Entradas Grandes (n = 2000):
- Para entradas grandes, os tempos de execução aumentam drasticamente. O tempo variou de 0.006 a 8.438 segundos, com o maior valor refletindo o custo exponencial de explorar todos os subconjuntos possíveis para um \( n \) elevado. A limitação dos valores de 1 a 100 pode tornar alguns casos mais fáceis de resolver, mas para \( n \) grande o crescimento exponencial do tempo é inevitável.

### Justificativa do Comportamento:

- **Comportamento Exponencial**: O tempo de execução da solução ótima aumenta exponencialmente à medida que \( n \) cresce. Cada novo elemento adicionado ao conjunto duplica o número de subconjuntos possíveis, resultando em um aumento drástico no tempo de execução.
  
- **Entradas Pequenas**: O número de subconjuntos a serem testados é pequeno, resultando em tempos de execução muito curtos.
  
- **Entradas Médias**: O tempo de execução cresce devido ao aumento no número de subconjuntos possíveis, mas a limitação dos valores entre 1 e 100 torna possível encontrar combinações válidas de maneira mais rápida.
  
- **Entradas Grandes**: O aumento exponencial no número de subconjuntos torna o problema computacionalmente pesado, independentemente da limitação dos valores, e o tempo de execução reflete isso claramente.

### Considerações Finais:

O gerador de base de testes limitando os valores ao intervalo de 1 a 100 influencia a distribuição dos números no conjunto, o que pode, em alguns casos, reduzir o tempo de execução ao permitir mais combinações válidas. No entanto, para grandes valores de \( n \), o comportamento exponencial do tempo de execução ainda prevalece, confirmando que, embora a solução ótima funcione corretamente, ela se torna impraticável para conjuntos muito grandes.

---

# [1,5 ponto] Questão 03 - Aleatorização

Em sala de aula, nós implementamos diversas estratégias para a mochila
binária. Explique a importância de buscar um balanço entre _exploration_ e _exploitation_. Dê um exemplo de como buscamos atingir _exploration_ e outro de como buscamos atingir _exploitation_ no Problema do Subconjunto de Soma. Elabore um pseudocódigo que combine tais estratégias e avalie criticamente sua efetividade.

A questão sobre **exploration** e **exploitation** é central em muitos problemas de otimização, incluindo o **Problema do Subconjunto de Soma** e a **mochila binária**. Esses dois conceitos representam diferentes abordagens para a solução de problemas complexos:

- **Exploration**: Refere-se à busca por novas soluções, mesmo que isso envolva testar combinações que podem não ser as melhores a princípio. A ideia é cobrir uma maior parte do espaço de soluções, explorando caminhos alternativos que podem levar a uma solução ótima.
  
- **Exploitation**: Refere-se a focar em soluções que parecem promissoras com base no que já foi descoberto. Isso significa continuar aprimorando e refinando uma solução conhecida para maximizar o desempenho.

### Importância do Balanço entre Exploration e Exploitation:
Manter um balanço entre essas duas estratégias é essencial para evitar ficar preso em soluções subótimas (ao focar demais na exploitation) ou gastar tempo explorando áreas do espaço de busca com poucas chances de sucesso (ao exagerar na exploration).

### Exemplos no Problema do Subconjunto de Soma:

1. **Exploration**:
   - No contexto do **Problema do Subconjunto de Soma**, uma estratégia de exploration pode ser gerar subconjuntos aleatórios e verificar se a soma atende ao valor alvo. Isso ajuda a cobrir várias combinações possíveis e descobrir novas regiões do espaço de soluções.
   
   **Exemplo de exploration**:
   - Usar uma abordagem de Monte Carlo: Gerar subconjuntos aleatórios e verificar sua soma repetidamente.

2. **Exploitation**:
   - No contexto de exploitation, poderíamos focar em subconjuntos que já estão próximos do valor alvo. Ou seja, após encontrar um subconjunto que quase atinge a soma alvo, tentamos modificá-lo levemente, adicionando ou removendo poucos elementos, para melhorar a solução.

   **Exemplo de exploitation**:
   - Refinar um subconjunto gerado, ajustando elementos para que a soma se aproxime do valor alvo sem mudar muitos elementos de uma solução já boa.



---

### Pseudocódigo que Combina Exploration e Exploitation:

```pseudo
function randomized_subset_sum(S, T):
    best_solution = None
    best_sum = 0

    while not termination_criteria_met():
        if random_choice(exploration_probability):
            # Exploration: gerar subconjunto aleatório
            current_solution = generate_random_subset(S)
        else:
            # Exploitation: melhorar subconjunto existente
            current_solution = improve_solution(best_solution, S)

        current_sum = calculate_sum(current_solution)

        if current_sum == T:
            return current_solution  # Solução exata encontrada

        if current_sum < T and current_sum > best_sum:
            best_solution = current_solution
            best_sum = current_sum

    return best_solution  # Melhor solução encontrada

function generate_random_subset(S):
    return [item for item in S if random_bool()]

function improve_solution(current_solution, S):
    # Tentar melhorar a solução alterando pequenos elementos
    modified_solution = current_solution.copy()
    for item in S:
        if should_flip_item():
            toggle_item_in_solution(modified_solution, item)
    return modified_solution
```



---

### Análise Crítica da Efetividade:

- **Vantagens**:
  - A combinação de exploration e exploitation evita que o algoritmo fique preso em soluções subótimas, já que a exploration permite a busca por novas áreas no espaço de soluções.
  - O exploitation ajuda a refinar soluções promissoras, otimizando o tempo gasto ao invés de continuar explorando soluções que não agregam valor.

- **Desvantagens**:
  - Se o algoritmo focar demais em exploration, ele pode desperdiçar tempo explorando soluções inviáveis.
  - Se a exploitation for excessiva, o algoritmo pode se prender a soluções boas localmente, mas subótimas globalmente, deixando de encontrar a solução ótima.

### Conclusão:

Encontrar o equilíbrio entre exploration e exploitation é crucial para resolver problemas complexos como o Problema do Subconjunto de Soma. O pseudocódigo fornecido tenta equilibrar essas duas estratégias, combinando a geração de novas soluções e o refinamento de soluções existentes.

---

# [2,0  pontos] Questão 04 - GPU e Thrust

1.	Acesse o link abaixo e faça uma cópia no seu Google Drive: https://colab.research.google.com/drive/14_EZNglXn2VXe3kpDW3XgEsRkB6R1jjp?usp=sharing
2.	Complete o código seguindo a especificação. ATENÇÃO: você provavelmente precisará complementar os imports para o código rodar!
3.	Baixe sua cópia do notebook preenchido e executado, e disponibilize junto com sua solução.

_OBSERVAÇÃO_: recomendo o uso do Colab na realização da questão de GPU. Use implementação e teste local por conta e risco. =)



### Resultados na pasta da questão 4 dentro do Jupyter do Google Colab.
---

# [1,5 pontos] Questão 05 - Busca global

Um algoritmo de busca global, em termos gerais, é um algoritmo de otimização que procura encontrar a melhor solução possível para um problema dentro de um espaço de busca, considerando todas as possíveis soluções. Em outras palavras, ele tenta encontrar o máximo ou mínimo global de uma função objetivo em um domínio especificado.

Em alguns problemas a "busca global" não se trata de uma otimização, mas de encontrar a única resposta correta possível. Por exemplo, o cálculo de Fibonacci é algoritmo que dado um número `N`, o `fib(N)` assume apenas um valor correto.

Observe o código abaixo para cálculo do Fibonacci. Altere o programa para receber `N` como uma entrada, e rode o programa para alguns valores de N, tanto pequenos (abaixo de 30) quanto grandes (acima de 30 --- só não exagere!), comparando os tempos de execução.  

Código-fonte:

```cpp
#include <iostream>

int fib(int n) {
    if (n <= 1) {
        return n;
    } else {
        return fib(n - 1) + fib(n - 2);
    }
}

int main() {
    int n = 30; // Valor de n para calcular Fibonacci
    int result = fib(n);
    std::cout << "Fibonacci de " << n << " é " << result << std::endl;
    return 0;
}
```

Note que tempo de execução para esta implementação aumenta consideravelmente quando `N` cresce.

**Pede-se**: Implemente  uma otimização para esse algoritmo de modo que sua implementação seja pela abordagem de memorização (*memoization*), ou seja, salvar cálculos já realizados para reaproveitá-los. Apresente código-fonte, resultados e compare os resultados de tempo de execução obtidos.

### Fibonacci otimizado:

```cpp
#include <iostream>
#include <vector>
#include <chrono>

// Função Fibonacci com memoization
long long int fib(int n, std::vector<long long int>& memo) {
    if (n <= 1) {
        return n;
    }
    if (memo[n] != -1) {
        return memo[n]; // Retorna o valor já calculado
    }
    memo[n] = fib(n - 1, memo) + fib(n - 2, memo); // Calcula e armazena o valor
    return memo[n];
}

int main() {
    int n;
    std::cout << "Digite o valor de N: ";
    std::cin >> n;

    // Inicializa o vetor de memoization com -1 para indicar valores não calculados
    std::vector<long long int> memo(n + 1, -1);

    // Medir o tempo de execução
    auto start = std::chrono::high_resolution_clock::now();

    long long int result = fib(n, memo);

    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = end - start;

    std::cout << "Fibonacci de " << n << " é " << result << std::endl;
    std::cout << "Tempo de execução: " << duration.count() << " segundos" << std::endl;

    return 0;
}
```


---

### Resultados da Versão Não Otimizada:

1. **\( N = 10 \)**:
   - Fibonacci de 10: **55**
   - Tempo de execução: **6.34e-07** segundos

2. **\( N = 20 \)**:
   - Fibonacci de 20: **6765**
   - Tempo de execução: **3.737e-05** segundos

3. **\( N = 30 \)**:
   - Fibonacci de 30: **832040**
   - Tempo de execução: **0.00443207** segundos

4. **\( N = 40 \)**:
   - Fibonacci de 40: **102334155**
   - Tempo de execução: **0.585951** segundos

5. **\( N = 50 \)**:
   - Fibonacci de 50: **12586269025**
   - Tempo de execução: **69.446** segundos

6. **\( N = 60 \)**:
   - Não rodou devido ao tempo excessivo de execução.

### Comparação com a Versão Otimizada (Memoization):

| \( N \)  | Não Otimizado (segundos) | Otimizado (Memoization) (segundos) |
|---------|---------------------------|-----------------------------------|
| 10      | 6.34e-07                  | 2.28e-07                         |
| 20      | 3.737e-05                 | 4.39e-07                         |
| 30      | 0.00443207                | 4.08e-07                         |
| 40      | 0.585951                  | 4.63e-07                         |
| 50      | 69.446                    | 5.17e-07                         |
| 60      | Não rodou                 | 7.18e-07                         |

### Reflexão sobre os Resultados:

1. **Crescimento Exponencial na Versão Não Otimizada**:
   - Na versão original, o algoritmo realiza muitas chamadas recursivas redundantes. Para cada chamada de `fib(n)`, ele calcula repetidamente os mesmos subproblemas, o que resulta em uma **explosão exponencial** do número de cálculos. Isso é refletido nos tempos de execução, que aumentam drasticamente conforme \( N \) cresce.
   - Para \( N = 50 \), o tempo de execução chegou a **69 segundos**, e para \( N = 60 \), a execução demoraria demais, o que torna o cálculo impraticável.

2. **Versão Otimizada com Memoization**:
   - A versão com memoization mantém os valores já calculados, eliminando a necessidade de recalcular subproblemas. Isso reduz a complexidade de tempo de execução de **exponencial \( O(2^n) \)** para **linear \( O(n) \)**.
   - Mesmo para \( N = 60 \), o tempo de execução foi de **7.18e-07** segundos, o que é insignificante comparado com a versão não otimizada.

3. **Impacto da Otimização**:
   - A diferença entre as duas abordagens se torna **drástica** para valores maiores de \( N \). A versão otimizada resolve problemas grandes de maneira eficiente, enquanto a versão original torna-se inviável muito rapidamente.
   - A otimização torna o cálculo de Fibonacci viável para valores grandes de \( N \), enquanto a versão original se limita a valores menores devido ao tempo de execução exponencial.

### Conclusão:

A versão otimizada com memoization é extremamente mais eficiente que a versão original recursiva para calcular Fibonacci. A otimização torna o algoritmo escalável para valores maiores de \( N \), enquanto a versão não otimizada rapidamente se torna impraticável. Essa comparação destaca a importância de técnicas como memoization para melhorar a eficiência de algoritmos recursivos em cenários onde muitos subproblemas são recalculados.

---

# [1.0 ponto] Questão 06 - Uso de Cluster em Supercomputação

Esta disciplina estuda estratégias para resolver problemas complexos em tempo computacionalmente razoável.

**Pede-se**:
1. Qual é a importância de aliar estratégias de implementação (Software) com recursos computacionais disponíveis (Hardware) para melhor endereçamento do problema?
2. Defina o que é Slurm e sua importância na programação paralela em larga escala.
3. Considerando o job configurado pelo ".slurm" abaixo, descreva quais recursos computacionais estão sendo solicitados ao Cluster, as limitações e condições de execução.

```
#!/bin/bash
#SBATCH --job-name=job_paralelo
#SBATCH --nodes=4
#SBATCH --ntasks-per-node=8
#SBATCH --time=02:00:00
#SBATCH --partition=compute
#SBATCH --output=resultado.out
#SBATCH --error=erro.err

# Carregar módulos necessários
module load mpi

# Executar o programa paralelo
mpirun -np 32 ./meu_programa_paralelo
```




---

### 1)
A combinação de estratégias de implementação com os recursos computacionais disponíveis é crucial, especialmente em problemas complexos que lidam com grandes volumes de dados, como previsões meteorológicas e simulações físicas. Embora programas simples possam não exigir uma integração tão rigorosa entre software e hardware, ao considerarmos algoritmos que processam grandes conjuntos de dados, como os exercícios desta prova, essa aliança se torna vital.

Utilizando múltiplos processos (cores) de um processador, podemos paralelizar a execução de tarefas, distribuindo o trabalho entre os núcleos e, consequentemente, reduzindo significativamente o tempo de execução do programa. Essa abordagem não apenas melhora a eficiência, mas também permite que os sistemas escalem conforme a complexidade e o tamanho dos dados aumentam. Por exemplo, em simulações de física, a paralelização permite que cálculos que antes levariam dias sejam realizados em questão de horas, otimizando o uso de recursos computacionais e aumentando a produtividade.

No entanto, é importante ressaltar que essa utilização intensiva de recursos também pode ter desvantagens. O uso excessivo de múltiplos núcleos pode levar a ineficiências, especialmente se não houver um balanceamento adequado entre a carga de trabalho e a capacidade de processamento. Além disso, o aumento do consumo energético associado à execução de tarefas paralelizadas pode se tornar um problema significativo, tanto do ponto de vista econômico quanto ambiental. Em um cenário onde a sustentabilidade se torna cada vez mais importante, a necessidade de otimizar não apenas o tempo de execução, mas também o consumo de energia é um desafio a ser considerado.


---

### 2)
O Slurm (Simple Linux Utility for Resource Management) é um sistema de gerenciamento de recursos de código aberto amplamente utilizado em ambientes de computação de alto desempenho (HPC). Sua principal função é alocar e gerenciar recursos computacionais, permitindo que os usuários executem jobs paralelizados em clusters de computação.

A importância do Slurm na programação paralela inclue:

1) Gerenciamento eficiente de Recursos:
    - O Slurm permite que usuários solicitem recursos específicos, como número de núcleos de CPU, memória, tempo de execução e tipo de partição. Isso garante que os jobs sejam executados de forma eficiente, utilizando apenas os recursos necessários e otimizando a utilização do cluster.
2) Escalonamento de Jobs:
    - O Slurm gerencia a fila de jobs, priorizando a execução com base em políticas de escalonamento configuráveis. Isso garante que os jobs sejam executados de forma justa e eficiente, evitando gargalos e maximizando a utilização do cluster.
3) Facilidade de Uso:
    - Slurm fornece uma interface simples e intuitiva para submissão e monitoramento de jobs. Com comandos como sbatch para enviar jobs e squeue para verificar o status, os usuários conseguem gerenciar suas tarefas sem a necessidade de conhecimento profundo sobre a infraestrutura do cluster.
4) Suporte a Programação Paralela:
    - Ele é compatível com várias bibliotecas de programação paralela, como MPI (Message Passing Interface), tornando mais fácil para os desenvolvedores implementar soluções que aproveitem a computação distribuída em larga escala.

#### Conclusão:
O Slurm é uma ferramenta essencial para a programação paralela em larga escala, permitindo que pesquisadores e profissionais de diversas áreas tirem proveito da capacidade computacional de clusters. Com seu gerenciamento eficiente de recursos, escalonamento inteligente de jobs e suporte a aplicações paralelas, o Slurm desempenha um papel fundamental em garantir que as tarefas sejam executadas de forma otimizada, aproveitando ao máximo os recursos disponíveis.



---

### 3) Análise do Job Configurado pelo Arquivo ".slurm"

No job configurado pelo arquivo ".slurm" fornecido, os seguintes recursos computacionais estão sendo solicitados ao Cluster:

1. **Nome do Job**:
   - `#SBATCH --job-name=job_paralelo`: O job recebe o nome de `job_paralelo`, facilitando a identificação do job na fila de execução.

2. **Número de Nós**:
   - `#SBATCH --nodes=4`: O job solicita um total de 4 nós do cluster, permitindo que o trabalho seja distribuído entre quatro máquinas distintas. Isso é fundamental para tarefas que requerem maior capacidade de processamento.

3. **Tarefas por Nó**:
   - `#SBATCH --ntasks-per-node=8`: Cada um dos 4 nós terá 8 tarefas executadas simultaneamente. Assim, o total de tarefas que estarão em execução ao mesmo tempo é de \( 4 \times 8 = 32 \). Essa distribuição otimiza o uso dos recursos do cluster.

4. **Tempo de Execução**:
   - `#SBATCH --time=02:00:00`: O job tem um tempo máximo de execução de 2 horas. Essa limitação é importante, pois garante que o job não consuma recursos do cluster indefinidamente, sendo encerrado automaticamente se ultrapassar esse tempo.

5. **Partição**:
   - `#SBATCH --partition=compute`: O job será executado na partição `compute`, que é normalmente designada para jobs que demandam computação intensiva. Essa escolha ajuda a alocar recursos adequados para a tarefa.

6. **Saída e Erro**:
   - `#SBATCH --output=resultado.out` e `#SBATCH --error=erro.err`: O output do programa será registrado em `resultado.out`, enquanto mensagens de erro serão redirecionadas para `erro.err`. Essa configuração é útil para monitorar e depurar o job após a execução.

### Limitações e Condições de Execução

- **Limitação de Recursos**: A solicitação de 4 nós com 8 tarefas por nó está sujeita à disponibilidade dos recursos no cluster. Caso haja uma alta demanda ou outros jobs em execução, o job pode ser colocado em espera na fila.

- **Prioridade de Execução**: O sistema de gerenciamento de filas pode ter diferentes políticas de prioridade que determinam a ordem em que os jobs são executados. Jobs com maior prioridade podem ser executados antes, mesmo que tenham sido submetidos depois.

- **Tempo Máximo**: O limite de 2 horas para a execução pode ser uma restrição significativa, especialmente se o job demandar mais tempo para ser concluído. Portanto, é essencial que o usuário se certifique de que sua tarefa se encaixa nesse intervalo.

- **Custo Associado**: Alguns clusters têm um modelo de custos para o uso de recursos, onde mais recursos consumidos podem resultar em maiores custos para os usuários. Isso é especialmente relevante em ambientes de nuvem.

### Conclusão

O uso de um script Slurm, como o apresentado, permite que os usuários solicitem recursos computacionais de maneira estruturada e eficiente, facilitando a execução de jobs paralelos em ambientes de computação de alto desempenho. Essa configuração é fundamental para otimizar o uso dos recursos do cluster, assegurando que as tarefas sejam geridas adequadamente e contribuindo para um processamento mais rápido e eficiente.

--- 
