# Projeto SuperComputação 2024.2

## Análise de Redes Sociais: encontrando a clique máxima em um grafo.

![Exemplo Clique](https://upload.wikimedia.org/wikipedia/commons/thumb/d/d0/VR_complex.svg/1200px-VR_complex.svg.png)


A análise de redes sociais (ARS) é uma abordagem oriunda de áreas tais como Sociologia, Psicologia Social e Antropologia. Tal abordagem estuda as ligações relacionais (*relational tie*) entre atores sociais. Os atores na ARS podem ser tanto pessoas e empresas, analisadas como unidades individuais, quanto unidades sociais coletivas como, por exemplo, departamentos dentro de uma organização, agências de serviço público em uma cidade, estados-nações de um continente, dentre outras. A ARS difere fundamentalmente de outros estudos pelo fato de que sua ênfase não é nos atributos (características) dos atores, mas nas ligações entre eles.


A idéia de uma clique em um grafo é relativamente simples. No nível mais geral, uma clique é um subconjunto de uma rede no qual os atores são mais próximos entre si do que com outros membros da rede. Em termo de laços de amizade, por exemplo, não é incomum encontrar grupos humanos que formam cliques baseando-se em idade, gênero, raça, etnia, religião, ideologia, e muitas coisas coisas. Uma clique é, portanto, um conjunto de vértices em um grafo em que cada par de vértices está diretamente conectado por uma aresta.

Encontrar a clique máxima em um grafo é uma tarefa computacionalmente desafiadora devido à natureza combinatória do problema.  A dificuldade computacional surge da necessidade de explorar todas as combinações possíveis de vértices para identificar a maior clique, o que se torna exponencial em relação ao número de vértices. Isso resulta em uma complexidade computacional alta, mesmo para grafos moderadamente grandes.

A importância de estudar cliques está notavelmente presente na análise de redes sociais, onde as cliques representam grupos coesos de indivíduos que compartilham interesses, amizades ou conexões em comum. A identificação de cliques ajuda a entender a estrutura de uma rede social, identificar influenciadores e grupos de afinidade, além de auxiliar na detecção de comunidades e na análise de dinâmicas sociais.

As cliques são importantes, pois além de desenvolver em seus membros comportamentos homogêneos, elas têm, por definição, grande proximidade, aumentando a velocidade das trocas. Assim, informações dirigidas a uma clique são rapidamente absorvidas pelos seus membros, que tendem a percebê-las de forma semelhante. Isso é importante, por exemplo, em estratégias de segmentação.


Portanto, a resolução eficiente do problema da clique máxima tem aplicações valiosas em áreas que vão desde a ciência da computação até a análise de dados em redes sociais.

## SUA TAREFA: Encontrar a clique máxima em um grafo.

Seu programa deve receber um grafo a partir de um input de texto (abaixo você vai encontrar o código gerador do input). A partir da leitura do arquivo, você deve armazenar o grafo computacionalmente (matriz de adjacência, por exemplo). E com isso, você deverá executar três implementações:


### Código gerador de grafo em Python:

```py
# O que faz: Gera um grafo aleatório e o salva no arquivo grafo.txt.
# Resultado: Um arquivo de texto com os vértices e arestas do grafo.

import networkx as nx
import random

# Parâmetros
num_vertices = 150  # Número de vértices no grafo
probabilidade_conexao = 0.7  # Probabilidade de haver uma aresta entre dois vértices

# Crie um grafo aleatório densamente conectado
grafo = nx.fast_gnp_random_graph(num_vertices, probabilidade_conexao)

# Nome do arquivo de saída
nome_arquivo = "grafo.txt"

# Abra o arquivo para escrita
with open(nome_arquivo, 'w') as arquivo:
    # Escreva a quantidade de vértices e número de arestas na primeira linha
    arquivo.write(f"{num_vertices} {grafo.number_of_edges()}\n")

    # Escreva as arestas no formato de lista de adjacência
    for aresta in grafo.edges():
        arquivo.write(f"{aresta[0]+1} {aresta[1]+1}\n")  # +1 para ajustar os índices (começando em 1)

print(f"Grafo gerado e salvo em '{nome_arquivo}'.")

```

### Código para leitura do grafo e armazenamento como matriz de adjacência (em C++):

```cpp
// O que faz: Lê o grafo do arquivo grafo.txt e armazena como uma matriz de adjacência.
// Resultado: O grafo estará representado como uma matriz de adjacência.

#include <iostream>
#include <vector>
#include <fstream>

// Função para ler o grafo a partir do arquivo de entrada
std::vector<std::vector<int>> LerGrafo(const std::string& nomeArquivo, int& numVertices) {
    std::ifstream arquivo(nomeArquivo);
    int numArestas;
    arquivo >> numVertices >> numArestas;

    // Cria uma matriz de adjacência de tamanho numVertices x numVertices
    std::vector<std::vector<int>> grafo(numVertices, std::vector<int>(numVertices, 0));

    // Preenche a matriz com as arestas do grafo
    for (int i = 0; i < numArestas; ++i) {
        int u, v;
        arquivo >> u >> v;
        grafo[u - 1][v - 1] = 1;
        grafo[v - 1][u - 1] = 1;  // O grafo é não direcionado
    }

    arquivo.close();
    return grafo;
}

```

### Código para verificar (em Python) se seu programa encontrou a clique correta.

```py
# O que faz: Lê o grafo gerado, encontra todas as cliques e exibe a maior clique.
# Resultado: Exibe a maior clique do grafo.

import networkx as nx

# Nome do arquivo de entrada
nome_arquivo = "grafo.txt"

# Abrir o arquivo e pular a primeira linha
with open(nome_arquivo, 'r') as arquivo:
    next(arquivo)  # Pula a primeira linha

    # Lê o grafo a partir das linhas restantes
    G = nx.parse_adjlist(arquivo)

# Encontrar todas as cliques maximais
cliques_maximais = list(nx.find_cliques(G))

# Encontrar a clique máxima (a maior)
clique_maxima = max(cliques_maximais, key=len)

print("Clique máxima encontrada:", clique_maxima)

```

## Foram criados 5 grafos:
- 15 nós
- 20 nós
- 25 nós
- 30 nós
- 35 nós


# 1. **Abordagem Exaustiva**

A busca exaustiva explora todas as combinações possíveis de vértices para identificar a maior clique. Embora seja direta, essa abordagem se torna ineficiente para grafos maiores devido ao crescimento exponencial do número de combinações de vértices, levando a tempos de execução extremamente altos.

É referente ao arquivo BuscaExaustiva.cpp e o exercicio1.slurm

Compilei com o comando g++ -std=c++11 -o busca_exaustiva BuscaExaustiva.cpp

- Para 15 nós teve um tempo de execução de 0.003 segundos.
- Para 20 nós teve um tempo de execução de 0.039 segundos.
- Para 25 nós teve um tempo de execução de 0.976 segundos.
- Para 30 nós teve um tempo de execução de 27.33 segundos.
- Para 35 não consegui chegar a ter tempo de execução que cabia no cluster.



![Texto alternativo](Graficos/BuscaExaustiva.png)

### Heurística de Poda: Branch and Bound

A heurística de Branch and Bound (Ramificação e Poda) é uma técnica para reduzir o número de combinações a testar em problemas de otimização, como o problema da clique máxima. Ela se baseia em duas ideias principais:

Ramificação (Branch): Dividimos o problema em caminhos diferentes, explorando cada possibilidade de forma organizada. Aqui, cada caminho representa a escolha de incluir ou não um vértice na clique.

Poda (Bound): Interrompemos a exploração de caminhos que não podem gerar uma solução melhor do que a atual. Isso permite ignorar combinações sem precisar verificá-las todas.

No problema da clique máxima, o Branch and Bound evita testar todas as combinações de vértices, descartando aquelas que não têm chance de formar uma clique maior do que a já encontrada, o que torna a solução mais eficiente para grafos grandes.

```cpp
Função BuscaExaustivaClique(Grafo, numVertices, MelhorClique, CliqueAtual, VerticeAtual)
    Se tamanho de CliqueAtual > tamanho de MelhorClique E CliqueAtual é uma clique Então
        MelhorClique = CliqueAtual

    Se tamanho de CliqueAtual + (numVertices - VerticeAtual) <= tamanho de MelhorClique Então
        Retornar  // Poda: não há vértices suficientes restantes para formar uma clique maior

    Para cada vértice i de VerticeAtual até numVertices - 1 Faça
        Se vértice i é adjacente a todos os vértices de CliqueAtual Então
            Adicionar i a CliqueAtual
            Chamar BuscaExaustivaClique(Grafo, numVertices, MelhorClique, CliqueAtual, i + 1)
            Remover i de CliqueAtual
        Fim Se
    Fim Para
Fim Função

```

# 2. **Abordagem OpenMP**

Utilizamos OpenMP para paralelizar o processamento de busca em um único nó de computação. Através do uso de múltiplos threads, a carga de trabalho é distribuída, reduzindo o tempo de execução ao processar várias partes do grafo simultaneamente.

O desempenho é melhorado em comparação à busca exaustiva, especialmente em grafos maiores, onde OpenMP reduz o tempo significativamente. No entanto, para tamanhos maiores, o aumento do tempo de execução também encontra limitações ao tentar explorar todas as combinações de forma exaustiva com apenas paralelização local.

É referente ao código BuscaExaustivaOMP.cpp e ao exercicio2.slurm

Compilei com o comando: g++ -fopenmp -o exercicio2 BuscaExaustivaOMP.cpp

- Para 15 nós teve um tempo de execução de 0.002 segundos.
- Para 20 nós teve um tempo de execução de 0.026 segundos.
- Para 25 nós teve um tempo de execução de 0.885 segundos.
- Para 30 nós teve um tempo de execução de 14.440 segundos.
- Para 35 nós teve um tempo de execução de 534.126 segundos.



![Texto alternativo](Graficos/OpenMP.png)

# 3. **Abordagem MPI**

O MPI foi implementado para distribuir a carga de trabalho entre diferentes nós do cluster, permitindo o processamento paralelo distribuído. Cada processador analisa uma parte do grafo de forma independente, o que é útil para problemas combinatórios.

Com MPI, o tempo de execução é reduzido em comparação ao OpenMP para grafos de até 25 nós. Entretanto, para grafos maiores (30 e 35 nós), o custo de comunicação entre nós começou a impactar o tempo de execução, embora a abordagem continue perto do OpenMP.

É referente ao código BuscaExaustivaMPI.cpp e ao exercicio3.slurm

Compilei com o comando: mpic++ -o exercicio3 BuscaExaustivaMPI.cpp

- Para 15 nós teve um tempo de execução de 0.003 segundos.
- Para 20 nós teve um tempo de execução de 0.026 segundos.
- Para 25 nós teve um tempo de execução de 0.485 segundos.
- Para 30 nós teve um tempo de execução de 16.515 segundos.
- Para 35 nós teve um tempo de execução de 563.729 segundos.

![Texto alternativo](Graficos/MPI.png)

![Texto alternativo](Graficos/Comparacao.png)

| Algoritmo       | Nós | Tempo de Execução (segundos)                        |
|-----------------|-----|-----------------------------------------------------|
| **BuscaExaustiva** | 15  | 0.003                                            |
|                 | 20  | 0.039                                               |
|                 | 25  | 0.976                                               |
|                 | 30  | 27.33                                               |
|                 | 35  | Não executou                                        |
|                 |     |                                                     |
| **OpenMP**      | 15  | 0.002                                               |
|                 | 20  | 0.026                                               |
|                 | 25  | 0.885                                               |
|                 | 30  | 14.440                                              |
|                 | 35  | 534.126                                             |
|                 |     |                                                     |
| **MPI**         | 15  | 0.003                                               |
|                 | 20  | 0.026                                               |
|                 | 25  | 0.485                                               |
|                 | 30  | 16.515                                              |
|                 | 35  | 563.729                                             |
