# Projeto SuperComputação 2023.2

## Análise de Redes Sociais: encontrando a clique máxima em um grafo.

![Exemplo Clique](https://upload.wikimedia.org/wikipedia/commons/thumb/d/d0/VR_complex.svg/1200px-VR_complex.svg.png)


A análise de redes sociais (ARS) é uma abordagem oriunda de áreas tais como Sociologia, Psicologia Social e Antropologia. Tal abordagem estuda as ligações relacionais (*relational tie*) entre atores sociais. Os atores na ARS podem ser tanto pessoas e empresas, analisadas como unidades individuais, quanto unidades sociais coletivas como, por exemplo, departamentos dentro de uma organização, agências de serviço público em uma cidade, estados-nações de um continente, dentre outras. A ARS difere fundamentalmente de outros estudos pelo fato de que sua ênfase não é nos atributos (características) dos atores, mas nas ligações entre eles.


A idéia de uma clique em um grafo é relativamente simples. No nível mais geral, uma clique é um subconjunto de uma rede no qual os atores são mais próximos entre si do que com outros membros da rede. Em termo de laços de amizade, por exemplo, não é incomum encontrar grupos humanos que formam cliques baseando-se em idade, gênero, raça, etnia, religião, ideologia, e muitas coisas coisas. Uma clique é, portanto, um conjunto de vértices em um grafo em que cada par de vértices está diretamente conectado por uma aresta.

Encontrar a clique máxima em um grafo é uma tarefa computacionalmente desafiadora devido à natureza combinatória do problema.  A dificuldade computacional surge da necessidade de explorar todas as combinações possíveis de vértices para identificar a maior clique, o que se torna exponencial em relação ao número de vértices. Isso resulta em uma complexidade computacional alta, mesmo para grafos moderadamente grandes.

A importância de estudar cliques está notavelmente presente na análise de redes sociais, onde as cliques representam grupos coesos de indivíduos que compartilham interesses, amizades ou conexões em comum. A identificação de cliques ajuda a entender a estrutura de uma rede social, identificar influenciadores e grupos de afinidade, além de auxiliar na detecção de comunidades e na análise de dinâmicas sociais.

As cliques são importantes, pois além de desenvolver em seus membros comportamentos homogêneos, elas têm, por definição, grande proximidade, aumentando a velocidade das trocas. Assim, informações dirigidas a uma clique são rapidamente absorvidas pelos seus membros, que tendem a percebê-las de forma semelhante. Isso é importante, por exemplo, em estratégias de segmentação.


Portanto, a resolução eficiente do problema da clique máxima tem aplicações valiosas em áreas que vão desde a ciência da computação até a análise de dados em redes sociais.

## SUA TAREFA: Encontrar a clique máxima em um grafo.

Seu programa deve receber um grafo a partir de um input de texto (abaixo você vai encontrar o código gerador do input). A partir da leitura do arquivo, você deve armazenar o grafo computacionalmente (matriz de adjacência, por exemplo). E com isso, você deverá executar três implementações:

1. **Abordagem Exaustiva**

A exaustão é uma abordagem que seleciona iterativamente os vértices para formar um clique, geralmente começando com um vértice e adicionando outros que tenham o maior número de vizinhos já na clique. Aqui está um pseudo-código simplificado para detectar cliques em um grafo usando essa abordagem. ATENÇÃO: esse pseudo-codigo **não** é a solução completa dessa abordagem. Você pode se inspirar nele para compreender como resolver o problema, mas é parte de sua tarefa desenvolver a solução.

```
Função EncontrarCliqueMaxima(grafo, numVertices)
    cliqueMaxima = ListaVazia()
    candidatos = ListaDeNós()  # Inicialmente, todos os nós são candidatos

    Para cada i de 0 até numVertices - 1 Faça
        Adicione i à lista de candidatos

    Enquanto candidatos não estiver vazia Faça
        v = Último elemento de candidatos
        Remova o último elemento de candidatos

        podeAdicionar = Verdadeiro

        Para cada u em cliqueMaxima Faça
            Se grafo[u][v] == 0 Então
                podeAdicionar = Falso
                Pare o loop
            Fim Se
        Fim Para

        Se podeAdicionar for Verdadeiro Então
            Adicione v a cliqueMaxima
            novosCandidatos = ListaDeNós()

            Para cada u em candidatos Faça
                adjacenteATodos = Verdadeiro

                Para cada c em cliqueMaxima Faça
                    Se grafo[u][c] == 0 Então
                        adjacenteATodos = Falso
                        Pare o loop
                    Fim Se
                Fim Para

                Se adjacenteATodos for Verdadeiro Então
                    Adicione u a novosCandidatos
                Fim Se
            Fim Para

            candidatos = novosCandidatos
        Fim Se
    Fim Enquanto

    Retorne cliqueMaxima
Fim Função


```

Implemente o código em C++.

Aproveite para pensar se é possível adotar alguma heurística. Por exemplo, ordenar os nós em função do grau de adjacência, ajuda?


**Sua segunda tarefa**: Até qual tamanho de problema você conseguiu obter um resultado em tempo hábil (aprox. 15 min)? Você deve apresentar um pseudo-codigo de uma heurística para otimizar essa tarefa exaustiva. É possível implementar alguma poda? Algum critério que evite calcular um nó, dado que você já descobriu uma clique maior?



Para implementacao em c++, tentei de duas formas. 

A primeira implementacao (findclickpermu.cpp) utiliza permutacao para fazer busca exaustiva em todos os nos. Essa implementacao no entanto 'e extremamente demorada,leva tempo exponencial para ser realizada e ao tentar rodar com um node com muitos vertices o programa da exit.

A segunda implementacao (findclick.cpp) faz uma busca exaustiva.Essa implementacao conseguiu obter um resultado em tempo habil com grafos de ate 40 vertices.

A funcao findClick
A funcao findMaxClickGlobal

In [5]:
%%writefile findclickpermutacao.cpp
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <fstream>
using namespace std;

// Função para ler o grafo a partir do arquivo de entrada
vector<vector<int>> LerGrafo(const string &nomeArquivo, int &numVertices)
{
    ifstream ifs(nomeArquivo, ifstream::in);
    int numArestas;
    ifs >> numVertices >> numArestas;

    vector<vector<int>> grafo(numVertices, vector<int>(numVertices, 0));

    for (int i = 0; i < numArestas; ++i)
    {
        int u, v;
        ifs >> u >> v;
        grafo[u - 1][v - 1] = 1;
        grafo[v - 1][u - 1] = 1; // O grafo é não direcionado
    }

    ifs.close();

    return grafo;
}

vector<int> EncontrarCliqueMaxima(vector<vector<int>> grafo, int numVertices,vector<int> candidatos)
{
    vector<int> cliqueMaxima; // Comeca vazia
    vector<int> listaNos;     // Comeca vazia

    bool podeAdicionar = true;
    bool adjacenteATodos = false;

    while (candidatos.size() > 0)
    {
        int v = candidatos.back();
        candidatos.pop_back();
        podeAdicionar = true;
        int sizeCliqueMaxima = cliqueMaxima.size();

        for (int index_u = 0; index_u < sizeCliqueMaxima; index_u++)
        {
            int u = cliqueMaxima[index_u];
            if (grafo[u][v] == 0)
            {
                podeAdicionar = false;
                break;
            }
        }

        if (podeAdicionar)
        {
            cliqueMaxima.push_back(v);
            vector<int> novosCandidatos;
            int sizeCandidatos = candidatos.size();
            for (int index_u = 0; index_u < sizeCandidatos; index_u++)
            {
                int u = candidatos[index_u];
                adjacenteATodos = true;
                int sizeCliqueMaxima2 = cliqueMaxima.size();
                for (int index_c = 0; index_c < sizeCliqueMaxima2; index_c++)
                {
                    int c = cliqueMaxima[index_c];
                    if (grafo[u][c] == 0)
                    {
                        adjacenteATodos = false;
                        break;
                    }
                }

                if (adjacenteATodos)
                {
                    novosCandidatos.push_back(u);
                }
            }

            candidatos = novosCandidatos;
        }
    }

    return cliqueMaxima;
}

vector<vector<int>> generateCombinations(vector<int> candidatos, int numVertices) {
    vector<vector<int>> result;

    do {
        result.push_back(candidatos);
    } while (next_permutation(candidatos.begin(), candidatos.end()));

    return result;
}

bool cliqueExiste(const vector<int>& clique, const vector<vector<int>>& allcliques) {
    for (const auto& existingClique : allcliques) {
        if (existingClique == clique) {
            return true; // O clique já existe
        }
    }
    return false; // O clique não existe
}

int main()
{
    int numVertices;
    vector<vector<int>> grafo;

    string nomeArquivo = "grafo.txt";

    grafo = LerGrafo(nomeArquivo, numVertices);

    vector<int> candidatos(numVertices);
    for (int i = 0; i < numVertices; ++i)
    {
        candidatos[i] = i;
    }

    vector<vector<int>> combinations = generateCombinations(candidatos, numVertices);

    vector<vector<int>> allcliques;
    // Verificar cada combinação
    for (const auto& combination : combinations)
    {
        vector<int> cliqueMaxima = EncontrarCliqueMaxima(grafo, numVertices, combination);
        sort(cliqueMaxima.begin(),cliqueMaxima.end());
        if (!cliqueExiste(cliqueMaxima, allcliques)) {
            allcliques.push_back(cliqueMaxima);
        }
    }

    for (const auto& clique : allcliques) {
        for (int vertex : clique) {
            cout << vertex+1 << " ";
        }
        cout << endl;
    }

    return 0;
}

Writing findclickpermutacao.cpp


In [6]:
%%writefile findclick.cpp
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <fstream>
#include <tuple>
#include <omp.h>


// Função para read o graph a partir do arquivo de entrada
std::vector<std::vector<int>> readgraph(const std::string &fileName, int &numVertices)
{
    std::ifstream ifs(fileName, std::ifstream::in);
    int numArestas;
    ifs >> numVertices >> numArestas;

    std::vector<std::vector<int>> graph(numVertices, std::vector<int>(numVertices, 0));

    for (int i = 0; i < numArestas; ++i)
    {
        int u, v;
        ifs >> u >> v;
        graph[u - 1][v - 1] = 1;
        graph[v - 1][u - 1] = 1; // O graph é não direcionado
    }

    ifs.close();

    return graph;
}

std::vector<int> findClick(const std::vector<std::vector<int>>& graph, int& numVertices, std::vector<int> candidates, std::vector<int> clique, int c, std::vector<int>& newCandidates)
{
    candidates.erase(remove(candidates.begin(), candidates.end(), c), candidates.end());

    bool adjacenteATodos = false;
    
    clique.push_back(c);

    for (int u : candidates)
    {
        adjacenteATodos = all_of(clique.begin(), clique.end(), [&](int v) {
            return graph[u][v] != 0;
        });

        if (adjacenteATodos)
        {
            newCandidates.push_back(u);
            numVertices++;
        }
    }

    return clique;
}

void findMaxClickGlobal(std::vector<std::vector<int>> graph, int numVertices,std::vector<int> candidates,std::vector<int> clique,std::vector<int>& maxClick){
    // Pega um candidato na lista de candidatos
    for(auto& c:candidates){
        std::vector<int> newCandidates;
        int verticesnewCandidates=0;
        std::vector<int> nowClick;

        //Retorna o clique de agora e novos candidatos
        nowClick = findClick(graph,verticesnewCandidates,candidates,clique,c,newCandidates);
        
        int nowClickSize = nowClick.size();
        int maxclickSize = maxClick.size();

        // printf("verticesnewCandidates %d ",verticesnewCandidates);
        // printf("nowClick Size %d ",nowClickSize);
        // printf("MaxClique size %d ",maxclickSize);
        // printf("Diff %d",maxclickSize-nowClickSize);

        // for(auto& a:nowClick){
        //     std::cout<<a<<" ";
        // }

        // std::cout<<std::endl;

        if(verticesnewCandidates>0){
            if(maxclickSize==0){
                findMaxClickGlobal(graph,numVertices,newCandidates,nowClick,maxClick);
            }else if(nowClickSize+verticesnewCandidates>maxclickSize){
                findMaxClickGlobal(graph,numVertices,newCandidates,nowClick,maxClick);
            }
        }else if(nowClick.size()>=maxClick.size()){
            maxClick = nowClick;
        }
        
    }

}

int main()
{
    double start; 
    double end; 
    start = omp_get_wtime(); 
    int numVertices;
    std::vector<std::vector<int>> graph;

    std::string fileName = "grafo.txt";

    graph = readgraph(fileName, numVertices);

    std::vector<int> candidates(numVertices);
    for (int i = 0; i < numVertices; ++i)
    {
        candidates[i] = i;
    }

    std::vector<int> maxClick;
    std::vector<int> initClick;
    findMaxClickGlobal(graph,numVertices,candidates,initClick,maxClick);
    std::cout<<"Res"<<std::endl;

    for (auto& v : maxClick) {
        std::cout<<v+1<<" ";
    }

    std::cout << std::endl;
    end = omp_get_wtime(); 
    printf("Work took %f seconds for numvertices=%d\n", end - start,numVertices);
    std::cout << "Codigo Serial " << std::endl;

    return 0;
}


Writing findclick.cpp


In [1]:
!g++ -g -Wall -o -fopenmp findclick findclick.cpp

2. **Implementação com Threads OpenMP**

A implementação de uma solução com OpenMP para encontrar cliques em um grafo usando a heurística gulosa envolve a paralelização das iterações do algoritmo em diferentes threads. O OpenMP simplifica a criação de threads e a coordenação entre elas.


Nessa implementação você deve apresentar o código-fonte modificado, justificar a alteração feita, e mostrar também o speed up obtido. Faça uso de gráficos e tabelas para mostrar que sua implementação em openMP valeu a pena. Observe que mesmo assim você não vai conseguir resolver exaustivamente o problema, mas o tamanho do grafo será maior, e o tempo de processamento para um mesmo tamanho deve ser preferencialmente menor.

Para a implementacao com threads OPENMP, nao foi necessario modificar o codigo base, apenas foi necessario adicionar as flags que fazem o paralelismo.

Na funcao findClick 

In [None]:
%%writefile findclickOPENMP.cpp
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <fstream>
#include <tuple>
#include <omp.h>


// Função para read o graph a partir do arquivo de entrada
std::vector<std::vector<int>> readgraph(const std::string &fileName, int &numVertices)
{
    std::ifstream ifs(fileName, std::ifstream::in);
    int numArestas;
    ifs >> numVertices >> numArestas;

    std::vector<std::vector<int>> graph(numVertices, std::vector<int>(numVertices, 0));

    for (int i = 0; i < numArestas; ++i)
    {
        int u, v;
        ifs >> u >> v;
        graph[u - 1][v - 1] = 1;
        graph[v - 1][u - 1] = 1; // O graph é não direcionado
    }

    ifs.close();

    return graph;
}

std::vector<int> findClick(const std::vector<std::vector<int>>& graph, int& numVertices, std::vector<int> candidates, std::vector<int> clique, int c, std::vector<int>& newCandidates)
{
    candidates.erase(remove(candidates.begin(), candidates.end(), c), candidates.end());

    bool adjacenteATodos = false;
    
    clique.push_back(c);

    #pragma omp parallel for private(adjacenteATodos)
    for (int i = 0; i < candidates.size(); ++i)
    {
        int u = candidates[i];
        adjacenteATodos = true;

        #pragma omp parallel for reduction(&&:adjacenteATodos)
        for (int j = 0; j < clique.size(); ++j)
        {
            int v = clique[j];
            if (graph[u][v] == 0)
            {
                adjacenteATodos = false;
            }
        }

        if (adjacenteATodos)
        {
            #pragma omp critical
            {
                newCandidates.push_back(u);
                numVertices++;
            }
        }
    }

    return clique;
}

void findMaxClickGlobal(std::vector<std::vector<int>> graph, int numVertices,std::vector<int> candidates,std::vector<int> clique,std::vector<int>& maxClick){
    // Pega um candidato na lista de candidatos
    #pragma omp parallel for
    for(auto& c:candidates){
        std::vector<int> newCandidates;
        int verticesnewCandidates=0;
        std::vector<int> nowClick;

        //Retorna o clique de agora e novos candidatos
        nowClick = findClick(graph,verticesnewCandidates,candidates,clique,c,newCandidates);
        
        int nowClickSize = nowClick.size();
        int maxclickSize = maxClick.size();

        if(verticesnewCandidates>0){
            if(maxclickSize==0){
                findMaxClickGlobal(graph,numVertices,newCandidates,nowClick,maxClick);
            }else if(nowClickSize+verticesnewCandidates>maxclickSize){
                findMaxClickGlobal(graph,numVertices,newCandidates,nowClick,maxClick);
            }
        }else if(nowClick.size()>=maxClick.size()){
            #pragma omp critical
            {
                maxClick = nowClick;
            }
        }
        
    }

}

int main(int argc, char *argv[])
{
    double start; 
    double end; 
    start = omp_get_wtime(); 
    int numVertices;
    std::vector<std::vector<int>> graph;

    std::string fileName = argv[1];

    graph = readgraph(fileName, numVertices);

    std::vector<int> candidates(numVertices);
    for (int i = 0; i < numVertices; ++i)
    {
        candidates[i] = i;
    }

    std::vector<int> maxClick;
    std::vector<int> initClick;
    findMaxClickGlobal(graph,numVertices,candidates,initClick,maxClick);

    for (auto& v : maxClick) {
        std::cout<<v+1<<" ";
    }

    std::cout << std::endl;
    end = omp_get_wtime(); 
    printf("Work took %f seconds for numvertices=%d\n", end - start,numVertices);
    std::cout << "Codigo OPENMP " << std::endl;

    return 0;
}

In [None]:
!g++ -g -Wall -o -fopenmp findclickOPENMP findclickOPENMP.cpp

3. **Paralelização e Distribuição do Processamento com MPI**

Nesta implementação, você deve dividir o problema em várias partes e distribuí-las para diferentes processadores usando a biblioteca MPI (*Message Passing Interface*). Cada processador será responsável por encontrar cliques em uma parte do grafo, e os resultados serão combinados no final para encontrar todas as cliques no grafo.

Para a paralelizacao e distribuicao do Processamento com MPI, foi condigurado para o job rodar com 2 nodes e 3 tasks per node, tendo um total de 6 processos. Cada processo recebe uma parte do vetor contendo todos os candidatos iniciais (0 a numVertices), e com essa parte ira realizar a recursiva findMaxClickGlobal. Na hora de rodar o comando findClick, ira levar em conta todos os candidatos e nao somente os candidator da parte total do vetor. O rank 0 sera um processo somente para controle, quem realmentee ira realizar a recursiva serao os outros 5 processos. Para que nao tenha problema com segmentation fault, 'e obrigatorio que o codigo rode com somente grafos com numero multiplo de 5 de vetores. As funcoes de readgraph e findclick nao foram alteradas. 

Na main sera feito a inicializacao do MPI:
```c++
    int size, rank;
    double startTime, endTime; 

    //Inicializacao do MPI
    MPI_Init(&argc, &argv);

    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);
```

Em seguida a funcao readgraph 'e chamada para que todos os processos tenham acesso ao grafo, numVertices e o tamanho de cada slice dos vetores que serao utilizados pelos 5 processos:

```c++
    int numVertices;
    std::vector<std::vector<int>> graph;
    std::string fileName = "grafo.txt";
    std::vector<int> maxClick;
    std::vector<int> initClick;

    //Criacao do grafo
    graph = readgraph(fileName, numVertices);

    int sizeVec = numVertices/(size-1); //Tamanho de cada slice de vector
    // Variaveis para encontrar rank com maior clique maximo
    int atualsizeofMaxfromRank;
    int sizeofMaxfromRank;
    int rankMax;
    
    
    std::vector<int> recv_full_array(numVertices);
    std::vector<int> recv_array(sizeVec);
```

Inicialmente o processo 0 vai fazer o vetor de todos os candidatos e enviar para cada um com o comando `MPI_Send(fullcandidates.data(),numVertices,MPI_INT,i,0,MPI_COMM_WORLD);` send `i` o rank dos outros processos. Em seguida envia os vetores menores para cada processo individualmente,`MPI_Send(fullcandidates.data() + (i-1)*sizeVec,sizeVec,MPI_INT,i,0,MPI_COMM_WORLD);` e inicializa a contagem do tempo total do algoritmo. Depois disso, cada processo ira rodar a funcao `findMaxClickGlobal` e o rank 0 fica aguardando o tamanho da resposta dessa funcao em cada um dos processos. Em seguida ira verificar qual processo enviou o clique maximo de maior tamanho e enviara para ele um sinal para printar o resultado da funcao.Ao final disso o rank 0 ira printar o tempo de execucao do algoritmo.
Esse 'e o codigo que o rank 0 executa:

```c++
    if(rank==0){
        std::vector<int> fullcandidates(numVertices);

        for (int i = 0; i < numVertices; i++)
        {
            fullcandidates[i] = i;
            // printf("%d",fullcandidates[i]);
        }

        // std::cout<<std::endl;

        //Enviando array total para todos
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(fullcandidates.data(),numVertices,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        //Enviando array pequeno para cada um
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(fullcandidates.data() + (i-1)*sizeVec,sizeVec,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        startTime = MPI_Wtime();
        //Recebe o tamanho de cada processo e coloca o rank do maior na variavel rankMax
        for(int i=1;i<size;i++){
            MPI_Recv(&sizeofMaxfromRank,1,MPI_INT,i,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
            if (sizeofMaxfromRank>=atualsizeofMaxfromRank){
                atualsizeofMaxfromRank=sizeofMaxfromRank;
                rankMax = i;
            }
        }

        //Enviando o rank do processo que teve o maior clique max
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(&rankMax,1,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        // std::cout<<"FOI MASTER"<<std::endl;
    }

    endTime = MPI_Wtime();

    if (rank == 0) {
        std::cout << "Tempo de execução: " << endTime - startTime << " segundos." << std::endl;
        std::cout << "Tamanho do grafo: " << numVertices << std::endl;
        std::cout << "Codigo MPI " << std::endl;
    }
```

Os outros processos irao realizar o seguinte codigo:
```c++
    else{
        MPI_Recv(recv_full_array.data(),numVertices,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);        
        MPI_Recv(recv_array.data(),sizeVec,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
        
        std::vector<int> maxClick;
        std::vector<int> initClick;
        findMaxClickGlobal(graph, numVertices, recv_full_array, initClick, maxClick,recv_array);

        int sizeMaxClick = maxClick.size();
        
        MPI_Send(&sizeMaxClick,1,MPI_INT,0,0,MPI_COMM_WORLD);

        MPI_Recv(&rankMax,1,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
        if(rank==rankMax){
            printf("Resposta:  \n",rank);
            for (auto &v : maxClick)
            {
                std::cout << v + 1 << " ";
            }
        }
    }

    endTime = MPI_Wtime();
```


In [2]:
%%writefile findclickMPI.cpp
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <fstream>
#include <tuple>
#include <omp.h>
#include <mpi.h>

// Função para read o graph a partir do arquivo de entrada
std::vector<std::vector<int>> readgraph(const std::string &fileName, int &numVertices)
{
    std::ifstream ifs(fileName, std::ifstream::in);
    int numArestas;
    ifs >> numVertices >> numArestas;

    std::vector<std::vector<int>> graph(numVertices, std::vector<int>(numVertices, 0));

    for (int i = 0; i < numArestas; ++i)
    {
        int u, v;
        ifs >> u >> v;
        graph[u - 1][v - 1] = 1;
        graph[v - 1][u - 1] = 1; // O graph é não direcionado
    }

    ifs.close();

    return graph;
}

std::vector<int> findClick(const std::vector<std::vector<int>> &graph, int &numVertices, std::vector<int> candidates, std::vector<int> clique, int c, std::vector<int> &newCandidates)
{
    candidates.erase(remove(candidates.begin(), candidates.end(), c), candidates.end());

    bool adjacenteATodos = false;

    clique.push_back(c);

    for (int u : candidates)
    {
        adjacenteATodos = all_of(clique.begin(), clique.end(), [&](int v)
                                 { return graph[u][v] != 0; });

        if (adjacenteATodos)
        {
            newCandidates.push_back(u);
            numVertices++;
        }
    }

    return clique;
}

void findMaxClickGlobal(std::vector<std::vector<int>> graph, int numVertices, std::vector<int> candidates, std::vector<int> clique, std::vector<int> &maxClick,std::vector<int> smallcandidates)
{
    // Pega um candidato na lista de candidatos
    for (auto &c : smallcandidates)
    {
        std::vector<int> newCandidates;
        int verticesnewCandidates = 0;
        std::vector<int> nowClick;

        // Retorna o clique de agora e novos candidatos
        nowClick = findClick(graph, verticesnewCandidates, candidates, clique, c, newCandidates);

        int nowClickSize = nowClick.size();
        int maxclickSize = maxClick.size();

        if (verticesnewCandidates > 0)
        {
            if (maxclickSize == 0)
            {
                findMaxClickGlobal(graph, numVertices, newCandidates, nowClick, maxClick,newCandidates);
            }
            else if (nowClickSize + verticesnewCandidates > maxclickSize)
            {
                findMaxClickGlobal(graph, numVertices, newCandidates, nowClick, maxClick,newCandidates);
            }
        }
        else if (nowClick.size() >= maxClick.size())
        {
            maxClick = nowClick;
        }
    }
}

int main(int argc, char *argv[])
{
    int size, rank;
    double startTime, endTime; 

    //Inicializacao do MPI
    MPI_Init(&argc, &argv);

    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    int numVertices;
    std::vector<std::vector<int>> graph;
    std::string fileName = "grafo.txt";
    std::vector<int> maxClick;
    std::vector<int> initClick;

    //Criacao do grafo
    graph = readgraph(fileName, numVertices);

    int sizeVec = numVertices/(size-1); //Tamanho de cada slice de vector
    // Variaveis para encontrar rank com maior clique maximo
    int atualsizeofMaxfromRank;
    int sizeofMaxfromRank;
    int rankMax;
    
    
    std::vector<int> recv_full_array(numVertices);
    std::vector<int> recv_array(sizeVec);

    if(rank==0){
        std::vector<int> fullcandidates(numVertices);

        for (int i = 0; i < numVertices; i++)
        {
            fullcandidates[i] = i;
            // printf("%d",fullcandidates[i]);
        }

        // std::cout<<std::endl;

        //Enviando array total para todos
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(fullcandidates.data(),numVertices,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        //Enviando array pequeno para cada um
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(fullcandidates.data() + (i-1)*sizeVec,sizeVec,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        startTime = MPI_Wtime();
        //Recebe o tamanho de cada processo e coloca o rank do maior na variavel rankMax
        for(int i=1;i<size;i++){
            MPI_Recv(&sizeofMaxfromRank,1,MPI_INT,i,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
            if (sizeofMaxfromRank>=atualsizeofMaxfromRank){
                atualsizeofMaxfromRank=sizeofMaxfromRank;
                rankMax = i;
            }
        }

        //Enviando o rank do processo que teve o maior clique max
        for(int i=1;i<size;i++){
            // std::cout<<"Mandou "<<i<<std::endl;
            MPI_Send(&rankMax,1,MPI_INT,i,0,MPI_COMM_WORLD);
        }

        // std::cout<<"FOI MASTER"<<std::endl;
    }else{
        MPI_Recv(recv_full_array.data(),numVertices,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);        
        MPI_Recv(recv_array.data(),sizeVec,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
        
        std::vector<int> maxClick;
        std::vector<int> initClick;
        findMaxClickGlobal(graph, numVertices, recv_full_array, initClick, maxClick,recv_array);

        // std::cout << "Res do processo:" <<rank<< std::endl;
        
        // std::cout<<std::endl;
        int sizeMaxClick = maxClick.size();
        //Envia o tamanho para o rank0
        MPI_Send(&sizeMaxClick,1,MPI_INT,0,0,MPI_COMM_WORLD);

        MPI_Recv(&rankMax,1,MPI_INT,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
        if(rank==rankMax){
            printf("Resposta:  \n",rank);
            for (auto &v : maxClick)
            {
                std::cout << v + 1 << " ";
            }
        }
    }

    endTime = MPI_Wtime();  // Registra o tempo de término

    if (rank == 0) {
        // Apenas o processo de rank 0 exibirá o tempo total
        std::cout << "Tempo de execução: " << endTime - startTime << " segundos." << std::endl;
        std::cout << "Tamanho do grafo: " << numVertices << std::endl;
        std::cout << "Codigo MPI " << std::endl;
    }

    MPI_Finalize();
    return 0;
}


Overwriting findclickMPI.cpp


A celula a seguir 'e o codigo slurm criando as 6 tasks e realizando o MPI.
Para executar esse .slurm foi usado o comando `sbatch findclickMPI.slurm`

In [None]:
%%writefile findclickMPI.slurm
#!/bin/bash
#SBATCH --job-name=job
#SBATCH --nodes=2
#SBATCH --ntasks-per-node=3
#SBATCH --partition=normal
#SBATCH --mem=1G

echo Output do job $SLURM_JOB_ID
mpirun -np 6 --allow-run-as-root ./executavel

# Conclusoes

## Criacao e leitura de Grafo e validacao da saida

1. Código-fonte de geração do grafo (em Python)


```python

    import networkx as nx
    import random

    # Parâmetros
    num_vertices = 1000  # Número de vértices no grafo
    probabilidade_conexao = 0.7  # Probabilidade de haver uma aresta entre dois vértices (ajuste conforme necessário)

    # Crie um grafo aleatório densamente conectado
    grafo = nx.fast_gnp_random_graph(num_vertices, probabilidade_conexao)

    # Nome do arquivo de saída
    nome_arquivo = "grafo.txt"

    # Abra o arquivo para escrita
    with open(nome_arquivo, 'w') as arquivo:
        # Escreva a quantidade de vértices e número de arestas na primeira linha
        arquivo.write(f"{num_vertices} {grafo.number_of_edges()}\n")

        # Escreva as arestas no formato de lista de adjacência
        for aresta in grafo.edges():
            arquivo.write(f"{aresta[0]+1} {aresta[1]+1}\n")  # +1 para ajustar os índices (começando em 1)

    print(f"Grafo densamente conectado gerado e salvo em '{nome_arquivo}'.")

```


2. Trecho de código-fonte para leitura do grafo e armazenamento como matriz de adjacência

```cpp
    // Função para ler o grafo a partir do arquivo de entrada
    std::vector<std::vector<int>> LerGrafo(const std::string& nomeArquivo, int& numVertices) {
        std::ifstream arquivo(nomeArquivo);
        int numArestas;
        arquivo >> numVertices >> numArestas;

        std::vector<std::vector<int>> grafo(numVertices, std::vector<int>(numVertices, 0));

        for (int i = 0; i < numArestas; ++i) {
            int u, v;
            arquivo >> u >> v;
            grafo[u - 1][v - 1] = 1;
            grafo[v - 1][u - 1] = 1;  // O grafo é não direcionado
        }

        arquivo.close();

        return grafo;
    }
```

3. Verificar (em Python) se seu programa encontrou a clique correta. Para isso, use a implementação abaixo, ela já está adaptada para ler nosso arquivo de input, ignorando a primeira linha.


```python
    import networkx as nx

    # Nome do arquivo de entrada
    nome_arquivo = "seu_arquivo.txt"

    # Abrir o arquivo e pular a primeira linha
    with open(nome_arquivo, 'r') as arquivo:
        next(arquivo)  # Pula a primeira linha

        # Lê o grafo a partir das linhas restantes
        G = nx.parse_adjlist(arquivo)

    # Encontrar todas as cliques maximais
    cliques_maximais = list(nx.find_cliques(G))

    # Encontrar a clique máxima (a maior)
    clique_maxima = max(cliques_maximais, key=len)

    print("Cliques maximais encontradas:")
    for clique in cliques_maximais:
        print(clique)

    print("Clique máxima encontrada:", clique_maxima)


```


Para validar os tempos de MPI, OPENMP, serial e validacao, foi rodado os comandos para grafos de tamanho 10,15,20,25,30,35,40 e seus tempos e resultados estao na pasta ClusterScripts/outputs/. Para MPI e Serial foi rodado manualmente um a um com cada tamanho de grafo. Para o OPENMP, foi utilizado o script runOPENMP.sh.

Com esses dados, 'e possivel plotar grafico de tempo por tamanho do grafo em python.
Nesta primeira celula 'e feita a validacao para ver se esta tudo correto.

In [3]:
# Pegando tempo e resultados para o OPENMP
import os
# Lista para armazenar os cliques maximos com os variados tamanhos
OPENMP_results = []
OPENMP_times = []

# Caminho para a pasta com os grafos
caminho_da_pasta = os.getcwd()+"/ClusterScripts/outputs/OPENMP"

for numero in range(2, 8 + 1):  # Sao 7 grafos
    nome_do_arquivo = f"{caminho_da_pasta}/OPENMPout{numero*5}.txt"
    try:
        with open(nome_do_arquivo, 'r') as arquivo:
            # Fazendo lista Python do output
            primeira_linha = arquivo.readline().strip().split()
            lista_de_numeros = [int(numero) for numero in primeira_linha]
            lista_de_numeros = sorted(lista_de_numeros)
            # Pegando tempo
            segunda_linha = arquivo.readline().strip().split()
            tempo = float(segunda_linha[2])  
            
            OPENMP_results.append(lista_de_numeros)
            OPENMP_times.append(tempo)
    except FileNotFoundError:
        print(f"Arquivo {nome_do_arquivo} não encontrado.")

print("OPENMP resultados")
print(OPENMP_results)
print(OPENMP_times)

# Pegando tempo e resultados para o SERIAL

# Lista para armazenar os cliques maximos com os variados tamanhos
SERIAL_results = []
SERIAL_times = []

# Caminho para a pasta com os grafos
caminho_da_pasta = os.getcwd()+"/ClusterScripts/outputs/SERIAL"

# Itera sobre os arquivos na pasta
for numero in range(2, 8 + 1):  # Sao 7 grafos
    nome_do_arquivo = f"{caminho_da_pasta}/Serial{numero*5}.out"
    
    try:
        with open(nome_do_arquivo, 'r') as arquivo:
            arquivo.readline()
            arquivo.readline()
            
            # Fazendo lista Python do output
            terceira_linha = arquivo.readline().strip().split()
            lista_de_numeros = [int(numero) for numero in terceira_linha]
            lista_de_numeros = sorted(lista_de_numeros)
            
            # Pegando tempo
            quarta_linha = arquivo.readline().strip().split()
            tempo = float(quarta_linha[2])
            
            SERIAL_results.append(lista_de_numeros)
            SERIAL_times.append(tempo)
    except FileNotFoundError:
        print(f"Arquivo {nome_do_arquivo} não encontrado.")

# Exibe a lista de listas
print("Serial resultados")
print(SERIAL_results)
print(SERIAL_times)

# Pegando tempo e resultados para o MPI

# Lista para armazenar os cliques maximos com os variados tamanhos
MPI_results = []
MPI_times = []

# Caminho para a pasta com os grafos
caminho_da_pasta = os.getcwd()+"/ClusterScripts/outputs/MPI"

for numero in range(2, 8 + 1):  # Sao 7 grafos
    nome_do_arquivo = f"{caminho_da_pasta}/MPI{numero*5}.out"
    
    # Tenta abrir o arquivo
    try:
        with open(nome_do_arquivo, 'r') as arquivo:
            # Tratando output
            while True:
                linha = arquivo.readline().strip()
                if "Tempo de execução" in linha:
                    break
            
            # Extrai o tempo de execução
            tempo = float(linha.split(":")[1].strip().split()[0])
            
            # Pula linhas até encontrar "Tamanho do grafo"
            while True:
                linha = arquivo.readline().strip()
                if "Tamanho do grafo" in linha:
                    break
            
            # Extrai o tamanho do grafo
            tamanho_do_grafo = int(linha.split(":")[1].strip())
            
            arquivo.readline()
            arquivo.readline()
            
            linha_de_numeros = arquivo.readline().strip().split()
            lista_de_numeros = [int(numero) for numero in linha_de_numeros]
            lista_de_numeros = sorted(lista_de_numeros)
            
            MPI_results.append(lista_de_numeros)
            MPI_times.append(tempo)
    except FileNotFoundError:
        print(f"Arquivo {nome_do_arquivo} não encontrado.")

# Exibe a lista de listas
print("MPI resultados")
print(MPI_results)
print(MPI_times)


OPENMP resultados
[[1, 2, 3, 4, 5, 7], [2, 13, 12, 9, 7, 3, 11], [17, 1, 2, 3, 5, 12, 13, 16, 20], [5, 20, 10, 8, 4, 3, 2, 17], [16, 3, 4, 6, 8, 9, 10, 22, 24, 29, 25], [30, 35, 31, 29, 25, 22, 10, 8, 7, 19], [16, 40, 37, 26, 22, 14, 13, 10, 25]]
[0.005157, 0.174574, 1.750416, 0.782328, 149.580515, 84.248817, 364.018446]
Serial resultados
[[1, 2, 3, 4, 5, 7], [13, 12, 9, 7, 3, 2, 11], [1, 2, 3, 5, 12, 13, 16, 17, 20], [20, 10, 8, 5, 4, 3, 2, 17], [3, 4, 6, 8, 9, 10, 16, 22, 24, 25, 29], [35, 31, 30, 29, 25, 22, 10, 8, 7, 19], [40, 38, 31, 28, 24, 8, 3, 2, 35]]
[0.02146, 0.126583, 1.937819, 0.996288, 168.116089, 116.729906, 579.658018]
MPI resultados
[[1, 2, 3, 4, 5, 7], [2, 3, 7, 9, 11, 12, 13], [1, 2, 3, 5, 12, 13, 16, 17, 20], [7, 9, 10, 16, 17, 19, 21, 25], [3, 4, 6, 8, 9, 10, 16, 22, 24, 25, 29], [7, 8, 10, 19, 22, 25, 29, 30, 31, 35], [2, 3, 8, 24, 28, 31, 35, 38, 40]]
[0.0108412, 0.0914473, 1.46783, 0.734537, 124.7, 81.3089, 395.785]


## Critérios de avaliação

A correção do projeto levará em conta:

+ [Até 2 pontos] **Organização geral**
  - Organização do código fonte e/ou do notebook que centraliza seus códigos. Se a entrega for via jupyter notebook, ele deve conter células markdown que guiem a apreciação do trabalho. Caso seu código esteja organizado em arquivos ".cpp", ".py", etc, submeta também um relatório em PDF descrevendo seu trabalho;

+ [Até 5 pontos] **Implementações**
  - Sua entrega deve conter ao menos 3 implementações (uma para cada solução: exaustiva, OpenMP e MPI). Soluções extras nestas vertentes são encorajadas e serão valorizadas;
  - A parte de MPI deve ser obrigatoriamente executada no cluster montado em sala de aula. Portanto, submeta também os arquivos de configuração dos executáveis em batch;
  - Esperamos códigos seguindo as boas práticas de implementação e devidamente comentados;

+ [Até 3 pontos] **Avaliação de resultados**
  - Comparações das abordagens com tamanhos diferentes de grafos;
  - Clareza na comunicação dos resultados. Ex: gráficos e/ou pequenos textos que descrevem os resultados obtidos;
  - Justificativas: é esperado que a execução paralela seja mais rápida que a sequencial, assim como uma heurística seja mais rápida que a abordagem exaustiva. Caso seus resultados diferem do esperado, argumente potenciais causas;

+ [Até 1 ponto] **Extras**
  - A rubrica não cita implementação em GPU. Caso você opte por fazer, daremos até 1 ponto extra na nota do trabalho pelo esforço;


