# Projeto SuperComputação 2024.2

## Análise de Redes Sociais: encontrando a clique máxima em um grafo.

![Exemplo Clique](https://upload.wikimedia.org/wikipedia/commons/thumb/d/d0/VR_complex.svg/1200px-VR_complex.svg.png)


A análise de redes sociais (ARS) é uma abordagem oriunda de áreas tais como Sociologia, Psicologia Social e Antropologia. Tal abordagem estuda as ligações relacionais (*relational tie*) entre atores sociais. Os atores na ARS podem ser tanto pessoas e empresas, analisadas como unidades individuais, quanto unidades sociais coletivas como, por exemplo, departamentos dentro de uma organização, agências de serviço público em uma cidade, estados-nações de um continente, dentre outras. A ARS difere fundamentalmente de outros estudos pelo fato de que sua ênfase não é nos atributos (características) dos atores, mas nas ligações entre eles.


A idéia de uma clique em um grafo é relativamente simples. No nível mais geral, uma clique é um subconjunto de uma rede no qual os atores são mais próximos entre si do que com outros membros da rede. Em termo de laços de amizade, por exemplo, não é incomum encontrar grupos humanos que formam cliques baseando-se em idade, gênero, raça, etnia, religião, ideologia, e muitas coisas coisas. Uma clique é, portanto, um conjunto de vértices em um grafo em que cada par de vértices está diretamente conectado por uma aresta.

Encontrar a clique máxima em um grafo é uma tarefa computacionalmente desafiadora devido à natureza combinatória do problema.  A dificuldade computacional surge da necessidade de explorar todas as combinações possíveis de vértices para identificar a maior clique, o que se torna exponencial em relação ao número de vértices. Isso resulta em uma complexidade computacional alta, mesmo para grafos moderadamente grandes.

A importância de estudar cliques está notavelmente presente na análise de redes sociais, onde as cliques representam grupos coesos de indivíduos que compartilham interesses, amizades ou conexões em comum. A identificação de cliques ajuda a entender a estrutura de uma rede social, identificar influenciadores e grupos de afinidade, além de auxiliar na detecção de comunidades e na análise de dinâmicas sociais.

As cliques são importantes, pois além de desenvolver em seus membros comportamentos homogêneos, elas têm, por definição, grande proximidade, aumentando a velocidade das trocas. Assim, informações dirigidas a uma clique são rapidamente absorvidas pelos seus membros, que tendem a percebê-las de forma semelhante. Isso é importante, por exemplo, em estratégias de segmentação.


Portanto, a resolução eficiente do problema da clique máxima tem aplicações valiosas em áreas que vão desde a ciência da computação até a análise de dados em redes sociais.

## SUA TAREFA: Encontrar a clique máxima em um grafo.

Seu programa deve receber um grafo a partir de um input de texto (abaixo você vai encontrar o código gerador do input). A partir da leitura do arquivo, você deve armazenar o grafo computacionalmente (matriz de adjacência, por exemplo). E com isso, você deverá executar três implementações:


### Código gerador de grafo em Python:

```py
# O que faz: Gera um grafo aleatório e o salva no arquivo grafo.txt.
# Resultado: Um arquivo de texto com os vértices e arestas do grafo.

import networkx as nx
import random

# Parâmetros
num_vertices = 150  # Número de vértices no grafo
probabilidade_conexao = 0.7  # Probabilidade de haver uma aresta entre dois vértices

# Crie um grafo aleatório densamente conectado
grafo = nx.fast_gnp_random_graph(num_vertices, probabilidade_conexao)

# Nome do arquivo de saída
nome_arquivo = "grafo.txt"

# Abra o arquivo para escrita
with open(nome_arquivo, 'w') as arquivo:
    # Escreva a quantidade de vértices e número de arestas na primeira linha
    arquivo.write(f"{num_vertices} {grafo.number_of_edges()}\n")

    # Escreva as arestas no formato de lista de adjacência
    for aresta in grafo.edges():
        arquivo.write(f"{aresta[0]+1} {aresta[1]+1}\n")  # +1 para ajustar os índices (começando em 1)

print(f"Grafo gerado e salvo em '{nome_arquivo}'.")

```

### Código para leitura do grafo e armazenamento como matriz de adjacência (em C++):

```cpp
// O que faz: Lê o grafo do arquivo grafo.txt e armazena como uma matriz de adjacência.
// Resultado: O grafo estará representado como uma matriz de adjacência.

#include <iostream>
#include <vector>
#include <fstream>

// Função para ler o grafo a partir do arquivo de entrada
std::vector<std::vector<int>> LerGrafo(const std::string& nomeArquivo, int& numVertices) {
    std::ifstream arquivo(nomeArquivo);
    int numArestas;
    arquivo >> numVertices >> numArestas;

    // Cria uma matriz de adjacência de tamanho numVertices x numVertices
    std::vector<std::vector<int>> grafo(numVertices, std::vector<int>(numVertices, 0));

    // Preenche a matriz com as arestas do grafo
    for (int i = 0; i < numArestas; ++i) {
        int u, v;
        arquivo >> u >> v;
        grafo[u - 1][v - 1] = 1;
        grafo[v - 1][u - 1] = 1;  // O grafo é não direcionado
    }

    arquivo.close();
    return grafo;
}

```

### Código para verificar (em Python) se seu programa encontrou a clique correta.

```py
# O que faz: Lê o grafo gerado, encontra todas as cliques e exibe a maior clique.
# Resultado: Exibe a maior clique do grafo.

import networkx as nx

# Nome do arquivo de entrada
nome_arquivo = "grafo.txt"

# Abrir o arquivo e pular a primeira linha
with open(nome_arquivo, 'r') as arquivo:
    next(arquivo)  # Pula a primeira linha

    # Lê o grafo a partir das linhas restantes
    G = nx.parse_adjlist(arquivo)

# Encontrar todas as cliques maximais
cliques_maximais = list(nx.find_cliques(G))

# Encontrar a clique máxima (a maior)
clique_maxima = max(cliques_maximais, key=len)

print("Clique máxima encontrada:", clique_maxima)

```

Foram criados 5 grafos:
- 15 nós
- 20 nós
- 50 nós
- 100 nós
- 150 nós

# 1. **Abordagem Exaustiva**

A exaustão é uma abordagem que seleciona iterativamente os vértices para formar um clique, geralmente começando com um vértice e adicionando outros que tenham o maior número de vizinhos já na clique.

É referente ao arquivo BuscaExaustiva.cpp e o exercicio1.slurm

Compilei com o comando g++ -std=c++11 -o busca_exaustiva BuscaExaustiva.cpp

- Para 15 nós bateu e teve um tempo de execução de 0.00285535 segundos.
- Para 20 nós bateu e teve um tempo de execução de 0.0396523 segundos.
- Para 25 nós bateu e teve um tempo de execução de 0.976111 segundos.
- Para 30 nós bateu e teve um tempo de execução de 27.33 segundos.
- Para 35 não consegui chegar a ter tempo de execução que cabia no cluster.



### Heurística de Poda: Branch and Bound

A heurística de Branch and Bound (Ramificação e Poda) é uma técnica para reduzir a quantidade de combinações que precisamos testar ao resolver problemas de otimização, como o problema da clique máxima. Ela funciona usando duas ideias principais:

Ramificação (Branch): Exploramos cada possibilidade de maneira organizada, dividindo o problema em "ramos" ou caminhos diferentes. No nosso caso, cada caminho representa a escolha de incluir ou não incluir um vértice na clique.

Poda (Bound): Interrompemos a exploração de certos caminhos que sabemos que não podem gerar uma solução melhor do que a que já temos. Isso é feito por meio de uma "limitação" ou "poda", que permite descartar combinações sem ter que realmente verificar todas elas.

Como Branch and Bound é Aplicada no Problema da Clique Máxima
Ao tentar encontrar a maior clique em um grafo, queremos evitar testar todas as combinações possíveis de vértices, pois isso seria extremamente lento em grafos grandes. O Branch and Bound nos ajuda a ignorar combinações de vértices que não têm chance de formar uma clique maior do que a já encontrada.

```cpp
Função BuscaExaustivaClique(Grafo, numVertices, MelhorClique, CliqueAtual, VerticeAtual)
    Se tamanho de CliqueAtual > tamanho de MelhorClique E CliqueAtual é uma clique Então
        MelhorClique = CliqueAtual

    Se tamanho de CliqueAtual + (numVertices - VerticeAtual) <= tamanho de MelhorClique Então
        Retornar  // Poda: não há vértices suficientes restantes para formar uma clique maior

    Para cada vértice i de VerticeAtual até numVertices - 1 Faça
        Se vértice i é adjacente a todos os vértices de CliqueAtual Então
            Adicionar i a CliqueAtual
            Chamar BuscaExaustivaClique(Grafo, numVertices, MelhorClique, CliqueAtual, i + 1)
            Remover i de CliqueAtual
        Fim Se
    Fim Para
Fim Função

```

# 2. **Abordagem OpenMP**

É referente ao código BuscaExaustivaOMP.cpp e ao exercicio2.slurm

Para compilar: g++ -fopenmp -o exercicio2 BuscaExaustivaOMP.cpp


É referente ao arquivo BuscaExaustivaOMP.cpp e o exercicio2.slurm

- Para 15 nós teve um tempo de execução de 0.00231709 segundos.
- Para 20 nós teve um tempo de execução de 0.0258463 segundos.
- Para 25 nós teve um tempo de execução de 0.884734 segundos.
- Para 30 nós teve um tempo de execução de 14.4404 segundos.
- Para 35 nós teve um tempo de execução de 534.126 segundos.



Para 15:
Tempo de execução: 0.00231709 segundos.
Clique máxima encontrada: 4 5 6 11 12 14 
Tamanho da clique máxima: 6

Para 20:
Tempo de execução: 0.0258463 segundos.
Clique máxima encontrada: 3 4 6 10 12 15 17 18 
Tamanho da clique máxima: 8

Para 25:
Tempo de execução: 0.884734 segundos.
Clique máxima encontrada: 6 7 9 10 13 15 16 20 24 
Tamanho da clique máxima: 9

Para 30:
Tempo de execução: 14.4404 segundos.
Clique máxima encontrada: 2 3 5 11 12 21 24 25 26 30 
Tamanho da clique máxima: 10

Para 35:
Tempo de execução: 534.126 segundos.
Clique máxima encontrada: 6 7 10 13 21 26 28 30 32 34 
Tamanho da clique máxima: 10

# 3. **Abordagem MPI**

É referente ao código BuscaExaustivaMPI.cpp e ao exercicio3.slurm

Para compilar: g++ -fopenmp -o exercicio2 BuscaExaustivaOMP.cpp


É referente ao arquivo BuscaExaustivaOMP.cpp e o exercicio2.slurm

- Para 15 nós teve um tempo de execução de  segundos.
- Para 20 nós teve um tempo de execução de  segundos.
- Para 25 nós teve um tempo de execução de  segundos.
- Para 30 nós teve um tempo de execução de  segundos.
- Para 35 nós teve um tempo de execução de  segundos.

