# Sobre o projeto

Este projeto tem como objetivo a implementa√ß√£o de diversas solu√ß√µes para o problema VRP.

Para execut√°-lo:
1. V√° para a sess√£o de gera√ß√£o de instancias do problema para gerar arquivos de grafos com o tamanho e probabilidade que desejar

2. O projeto est√° dividido em diferentes sess√µes com o nome de cada implamenta√ß√£o, √©recomentado seguir a ordem do notebook, as instru√ß√µes de execu√ß√£o se encontram na primeira iplementa√ß√£o (a global) e s√£o as mesmas para todas a implementa√ß√µes, aten√ß√£o somente aos nomes dos arquivos.

# Projeto SuperComputa√ß√£o 2024.1 (Enunciado)

## Otimiza√ß√£o de Rotas de Ve√≠culos (_Vehicle Routing Problem_ - VRP)

**Objetivo:**

Desenvolver uma aplica√ß√£o em C++ que otimize as rotas de uma frota de ve√≠culos destinados √† entrega de produtos a diversos clientes, buscando minimizar o custo total das rotas.


**Descri√ß√£o:**

Voc√™ est√° encarregado de criar uma solu√ß√£o computacional para o problema de Otimiza√ß√£o de Rotas de Ve√≠culos (VRP) para uma empresa de log√≠stica. A empresa possui uma frota de ve√≠culos que s√£o usados para entregar produtos a uma s√©rie de clientes. Cada ve√≠culo tem uma capacidade de carga m√°xima, e cada cliente tem uma demanda espec√≠fica que deve ser atendida. O objetivo √© determinar as rotas √≥timas para os ve√≠culos, de forma que todos os clientes sejam atendidos, respeitando as restri√ß√µes de capacidade dos ve√≠culos, e minimizando o custo total das entregas.


**Restri√ß√µes e Requisitos:**
1. **Capacidade dos Ve√≠culos:** Cada ve√≠culo tem uma capacidade m√°xima de carga que n√£o pode ser excedida.
2. **Demanda dos Clientes:** Cada cliente tem uma demanda espec√≠fica que deve ser completamente atendida por um √∫nico ve√≠culo.
3. **Custo da Rota:** Cada rota possui um custo, que simboliza o c√¥mputo agregado da dist√¢ncia percorrida, do tempo de entrega, e do consumo de combust√≠vel. O objetivo √© minimizar o custo total.
4. **N√∫mero m√°ximo de visitas por rota:** Cada rota pode visitar um n√∫mero m√°ximo de cidades.
5. **Ponto de Partida e Chegada:** Todos os ve√≠culos come√ßam e terminam suas rotas no dep√≥sito da empresa.


**Desafios Computacionais:**

- O VRP √© um problema NP-dif√≠cil, o que significa que sua complexidade computacional cresce exponencialmente com o aumento do n√∫mero de clientes e ve√≠culos.
- A busca exaustiva por todas as poss√≠veis combina√ß√µes de rotas torna-se impratic√°vel para inst√¢ncias maiores do problema.


**Composi√ß√£o da Solu√ß√£o:**
1. Implementa√ß√£o de um algoritmo de _busca global_ para o problema (for√ßa bruta);
2. Implementa√ß√£o de alguma solu√ß√£o aproximada (_heur√≠stica_ ou _busca local_);
3. Implementa√ß√£o de 2 solu√ß√µes paralelizadas, sendo:

  a. _Paraleliza√ß√£o com Threads OpenMP_: Utilizar threads e a biblioteca OpenMP para paralelizar o algoritmo desenvolvido, com o objetivo de reduzir o tempo de execu√ß√£o. Analisar e implementar a paraleliza√ß√£o de componentes do algoritmo que possam se beneficiar da execu√ß√£o concorrente, como a gera√ß√£o de solu√ß√µes iniciais ou a busca local.

  b. _Paraleliza√ß√£o e Distribui√ß√£o do Processamento com MPI_: Implementar uma vers√£o do algoritmo que utilize a interface de passagem de mensagens MPI para distribuir o processo de busca de solu√ß√µes em m√∫ltiplos processos, possivelmente executando em diferentes n√≥s de um cluster. A estrat√©gia deve permitir a explora√ß√£o paralela do espa√ßo de solu√ß√µes e a troca eficiente de informa√ß√µes entre os processos.



**Entreg√°veis:**

1. **C√≥digo Fonte:** C√≥digo fonte em C++ comentado e organizado.
2. **Relat√≥rio:** Um relat√≥rio descrevendo a abordagem utilizada, incluindo descri√ß√£o das heur√≠sticas e m√©todos de busca local, bem como as estrat√©gias de paraleliza√ß√£o adotadas.
3. **An√°lise de Desempenho:** Uma an√°lise de desempenho da solu√ß√£o proposta, incluindo tempos de execu√ß√£o e qualidade das solu√ß√µes encontradas, com base em inst√¢ncias de teste de diferentes tamanhos.
4. **Instru√ß√µes de Uso:** Breve documenta√ß√£o sobre como compilar e executar a aplica√ß√£o, incluindo exemplos de uso.


**DICA**:
N√£o deixe de estudar os exemplos deste link https://vrpy.readthedocs.io/en/master/examples.html, para entender como gerar a avaliar solu√ß√µes para o problema. Compare sua solu√ß√£o com a solu√ß√£o desta biblioteca!

# GERA√á√ÉO DE INST√ÇNCIAS DO PROBLEMA

Execute o c√≥digo abaixo algumas vezes gerando inst√¢ncias de tamanhos e complexidades distintas. Voc√™ deve experimentar altera√ß√µes de:
- **num_nos**: n√∫mero de cidades a serem visitados;
- **probabilidade**: a probabilidade de ser criada uma rota direta entre 2 cidades;


In [1]:
import random
# from networkx import set_node_attributes

def gerar_dicionario_demandas(N):
    """
    Gera um dicion√°rio onde a chave √© um int de 1 at√© N e o valor √© um inteiro aleat√≥rio de 1 at√© 10.

    :param N: N√∫mero m√°ximo para as chaves do dicion√°rio.
    :return: Dicion√°rio com chaves de 1 at√© N e valores inteiros aleat√≥rios de 1 at√© 10.
    """
    return {i: random.randint(1, 10) for i in range(1, N)}


def gerar_entradas_grafo(num_nos, max_peso=100, probabilidade=0.125):
    """
    Gera um grafo para o problema de otimiza√ß√£o de rotas de ve√≠culos.

    :param num_nos: N√∫mero de n√≥s no grafo, incluindo o dep√≥sito.
    :param max_peso: Peso m√°ximo para as arestas do grafo.
    :param probabilidade: Probabilidade de criar uma rota entre duas cidades.
    :return: Um dicion√°rio representando o grafo onde as chaves s√£o tuplas representando as arestas (n√≥1, n√≥2)
             e os valores s√£o os pesos dessas arestas.
    """
    grafo = {}
    # Gerar pesos para arestas entre o dep√≥sito e outros n√≥s
    for i in range(1, num_nos):
        grafo[(0, i)] = random.randint(1, max_peso)
        grafo[(i, 0)] = grafo[(0, i)]  # Assume que a dist√¢ncia de volta ao dep√≥sito √© a mesma

    # Gerar pesos para arestas entre todos os outros pares de n√≥s
    for i in range(1, num_nos):
        for j in range(i+1, num_nos):
            if random.random() > (1 - probabilidade):  # Verifica a probabilidade
                peso = random.randint(1, max_peso)
                grafo[(i, j)] = peso

    return grafo

############################################
#             Exemplo de uso
############################################
num_nos = 1000                                   # N√∫mero total de n√≥s incluindo o dep√≥sito
probabilidade = 0.125                           # Probabilidade de criar uma rota entre duas cidades
nome_arquivo = "grafo_"+str(num_nos)+"_"+str(probabilidade)+".txt"  # Nome do arquivo onde ser√° salvo o grafo

def generator(num_nos, probabilidade, nome_arquivo):

    demandas = gerar_dicionario_demandas(num_nos)  # Gera as demandas para cada n√≥
    grafo = gerar_entradas_grafo(num_nos, probabilidade=probabilidade)          # Gera o grafo que representa os locais e custos entre eles

    # Salva o grafo em um arquivo TXT
    with open(nome_arquivo, 'w') as arquivo:
        arquivo.write(str(num_nos) + "\n")    # N√∫mero de n√≥s, incluindo dep√≥sito
        for local, demanda in demandas.items():
            linha = f"{local} {demanda}\n"      # Par LOCAL DEMANDA
            arquivo.write(linha)

        arquivo.write(str(len(grafo)) + "\n") # N√∫mero de arestas
        for aresta, peso in grafo.items():
            linha = f"{aresta[0]} {aresta[1]} {peso}\n" # Trio: ORIGEM DESTINO CUSTO
            arquivo.write(linha)

        print(f"Grafo salvo em {nome_arquivo}")


In [6]:
num_nos = 10                                   # N√∫mero total de n√≥s incluindo o dep√≥sito
probabilidade = 0.125                           # Probabilidade de criar uma rota entre duas cidades
nome_arquivo = "grafo_"+str(num_nos)+"_"+str(probabilidade)+".txt"  # Nome do arquivo onde ser√° salvo o grafo

generator(num_nos, probabilidade, nome_arquivo)

Grafo salvo em grafo_10_0.125.txt


# GERA√á√ÉO DE SOLU√á√ïES (testes de valida√ß√£o com VRPy) (se desejar validar)

Instale a biblioteca [VRPy](https://vrpy.readthedocs.io/en/latest/getting_started.html) para resolver problemas de otimiza√ß√£o de rotas.

Para cada inst√¢ncia do problema gerada, execute este c√≥digo para gerar a solu√ß√£o esperada.

N√£o deixe de estudar a documenta√ß√£o da biblioteca! Especialmente este link: https://vrpy.readthedocs.io/en/latest/examples.html#a-simple-example

Aqui voc√™ pode gerar solu√ß√µes diferentes alterando:
- **load_capacity**: a quantidade e capacidade de ve√≠culos;
- **num_stops**: o n√∫mero m√°ximo de paradas numa rota;

In [None]:
!pip install vrpy

Collecting vrpy
  Downloading vrpy-0.5.1.tar.gz (139 kB)
[?25l     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/140.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m30.7/140.0 kB[0m [31m750.0 kB/s[0m eta [36m0:00:01[0m[2K     [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[90m‚ï∫[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m92.2/140.0 kB[0m [31m1.2 MB/s[0m eta [36m0:00:01[0m[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m140.0/140.0 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting cspy (from vrpy)
  Downloading cspy-

In [None]:
from networkx import DiGraph, set_node_attributes
from vrpy import VehicleRoutingProblem


def ler_arquivo_grafo(caminho_arquivo):
    with open(caminho_arquivo, 'r') as arquivo:
        # L√™ o n√∫mero de n√≥s
        N = int(arquivo.readline().strip())-1

        # L√™ as demandas dos n√≥s
        demandas = {}
        for _ in range(N):
            linha = arquivo.readline().strip().split()
            id_no, demanda = int(linha[0]), int(linha[1])
            demandas[id_no] = demanda

        # L√™ o n√∫mero de arestas
        K = int(arquivo.readline().strip())

        # L√™ as arestas
        arestas = []
        for _ in range(K):
            linha = arquivo.readline().strip().split()
            origem, destino, peso = int(linha[0]), int(linha[1]), int(linha[2])
            arestas.append((origem, destino, peso))

    return demandas, arestas

############################################
#             Usando a funcao
############################################
caminho_arquivo = 'grafo_500_0.125.txt'
demandas, arestas = ler_arquivo_grafo(caminho_arquivo)


G = DiGraph()
for inicio, fim, custo in arestas:
    if inicio==0: inicio="Source"
    if fim==0: fim="Sink"
    G.add_edge(inicio, fim, cost=custo)

set_node_attributes(G, values=demandas, name="demand")

prob = VehicleRoutingProblem(G, load_capacity=15)  # Pode alterar a capacidade
prob.num_stops = 5                                 # Pode alterar o n√∫mero m√°ximo de paradas
prob.solve()

In [None]:
prob.best_routes

{1: ['Source', 2, 9, 'Sink'],
 2: ['Source', 5, 'Sink'],
 3: ['Source', 7, 'Sink'],
 4: ['Source', 1, 8, 'Sink'],
 5: ['Source', 4, 6, 'Sink'],
 6: ['Source', 3, 'Sink']}

In [None]:
prob.best_value

741

In [None]:
prob.best_routes_cost

{1: 167, 2: 24, 3: 74, 4: 205, 5: 223, 6: 48}

In [None]:
prob.best_routes_load

{1: 11, 2: 4, 3: 7, 4: 11, 5: 15, 6: 3}

# Algoritmo de busca global (Pseudoc√≥digo) e Rubrica



```cpp
Fun√ß√£o ResolverVRPComDemanda(Locais, Demanda, C):
    // Locais: Lista de locais para entrega (excluindo o dep√≥sito)
    // Demanda: Dicion√°rio mapeando cada local √† sua demanda
    // C: Capacidade do ve√≠culo
    
    MelhorRota = NULL
    MenorCusto = INFINITO

    // Gera todas as combina√ß√µes poss√≠veis de rotas considerando a capacidade do ve√≠culo
    Combina√ß√µes = GerarTodasAsCombina√ß√µes(Locais)
    
    Para cada combina√ß√£o em Combina√ß√µes fa√ßa:
        Se VerificarCapacidade(combina√ß√£o, Demanda, C) ent√£o:
            CustoAtual = CalcularCusto(combina√ß√£o)
            Se CustoAtual < MenorCusto ent√£o:
                MenorCusto = CustoAtual
                MelhorRota = combina√ß√£o
                
    Retornar MelhorRota, MenorCusto

Fun√ß√£o GerarTodasAsCombina√ß√µes(Locais):
    // Gera todas as permuta√ß√µes poss√≠veis de locais e agrupa em rotas v√°lidas conforme a capacidade
    // Esta fun√ß√£o √© bastante complexa, pois precisa considerar todas as subdivis√µes poss√≠veis dos locais em rotas que atendam √† capacidade do ve√≠culo
    // Retorna uma lista de combina√ß√µes v√°lidas
    Retornar combina√ß√µes

Fun√ß√£o VerificarCapacidade(Rota, Demanda, C):
    // Verifica se a demanda total da rota n√£o excede a capacidade do ve√≠culo
    CargaTotal = 0
    Para cada local em Rota fa√ßa:
        CargaTotal += Demanda[local]
    Se CargaTotal > C ent√£o:
        Retornar Falso
    Sen√£o:
        Retornar Verdadeiro

Fun√ß√£o CalcularCusto(Rota):
    // Calcula o custo de uma rota com base na dist√¢ncia, tempo ou outro crit√©rio
    // O custo pode depender de fatores como a dist√¢ncia total percorrida, o n√∫mero de ve√≠culos necess√°rios, entre outros
    Retornar custo

// In√≠cio do programa
// Define os locais, suas demandas e a capacidade do ve√≠culo
Locais = [...]
Demanda = {...}
Capacidade = C

MelhorRota, MenorCusto = ResolverVRPComDemanda(Locais, Demanda, Capacidade)
Exibir "A melhor rota √©:", MelhorRota, "com custo total de:", MenorCusto
```

## Crit√©rios de avalia√ß√£o

A corre√ß√£o do projeto levar√° em conta:

+ [At√© 1 pontos] **Organiza√ß√£o geral**
  - Organiza√ß√£o do c√≥digo fonte e/ou do notebook que centraliza seus c√≥digos. Se a entrega for via jupyter notebook, ele deve conter c√©lulas markdown que guiem a aprecia√ß√£o do trabalho. Caso seu c√≥digo esteja organizado em arquivos ".cpp", ".py", etc, submeta tamb√©m um relat√≥rio em PDF descrevendo seu trabalho;

+ [At√© 4 pontos] **Implementa√ß√µes**
  - Sua entrega deve conter ao menos 3 implementa√ß√µes (uma para cada solu√ß√£o: exaustiva, OpenMP e MPI). Solu√ß√µes extras nestas vertentes s√£o encorajadas e ser√£o valorizadas;
  - A parte de MPI deve ser obrigatoriamente executada no cluster. Portanto, submeta tamb√©m os arquivos de configura√ß√£o dos execut√°veis em batch;
  - Esperamos c√≥digos seguindo as boas pr√°ticas de implementa√ß√£o e devidamente comentados;

+ [At√© 3 pontos] **Avalia√ß√£o de resultados**
  - Compara√ß√µes das abordagens com tamanhos diferentes de grafos;
  - Clareza na comunica√ß√£o dos resultados. Ex: gr√°ficos e/ou pequenos textos que descrevem os resultados obtidos;
  - Justificativas: √© esperado que a execu√ß√£o paralela seja mais r√°pida que a sequencial, assim como uma heur√≠stica seja mais r√°pida que a abordagem exaustiva. Caso seus resultados diferem do esperado, argumente potenciais causas;

+ [At√© 1 ponto] **Extras**
  - A rubrica n√£o cita o m√°ximo de implementa√ß√µes a ser feita. Caso voc√™ opte por fazer algo al√©m das 4 solicitadas, daremos at√© 1 ponto extra na nota do trabalho pelo esfor√ßo;




# GLOBAL

Como primeiro passo deste projeto buscamos realizar o metodo da busca global pela melhor solu√ß√£o, onde s√£o realizadas todas as cobina√ß√µes poss√≠veis de caminhos e atrav√©s desta busca exaustiva encontramos o melhor resultado poss√≠vel para o problema.

Esta solu√ß√£o √© invi√°vel na grande maioria dos casos, uma vez que o tempo de execu√ß√£o cresce exponencialmente com a entrada, sendo poss√≠vel execut√°-lo em tempo aceit√°vel apenas em situa√ß√µes com algumas dezenos de n√≥s para o vrp

Apesar da intratabilidade para grandes entradas, enta pode ainda ser uma solu√ß√£o vi√°vel se:

1. as entradas forem sempre pequenas
2. √© necess√°rio que sempre se obtenha a melhor solu√ß√£o poss√≠vel


In [5]:
%%file global.cpp

#include <iostream>  // For input and output
#include <vector>    // For using vectors
#include <algorithm> // For using algorithms like next_permutation
#include <fstream>   // For file handling
#include <set>       // For using sets
#include <limits>    // For numeric limits
#include <chrono>    // For measuring execution time
#include <numeric>   // For numeric operations like iota

using namespace std;
using namespace std::chrono;

// Function to read demands from a file and store them in a vector
vector<int> ReadDemands(const string& fileName, int& numVerts) {
    ifstream file(fileName); // Open the file
    if (!file.is_open()) {   // Check if the file is open
        cerr << "Error opening file " << fileName << endl;
        exit(1);
    }

    file >> numVerts; // Read the number of vertices

    vector<int> demands(numVerts, 0); // Initialize the demands vector
    int dest, demand;
    for (int i = 1; i < numVerts; i++) {
        file >> dest >> demand; // Read destination and demand
        demands[dest] = demand; // Store the demand in the vector
    }
    file.close(); // Close the file
    return demands;
}

// Function to read routes from a file and store them in a 2D vector
vector<vector<int>> ReadRoutes(const string& fileName, int& numVerts) {
    ifstream file(fileName); // Open the file
    if (!file.is_open()) {   // Check if the file is open
        cerr << "Error opening file " << fileName << endl;
        exit(1);
    }

    file >> numVerts; // Read the number of vertices

    // Skip the initial routes data as it's not used
    for (int i = 0; i < numVerts - 1; i++) {
        int x, y;
        file >> x >> y;
    }

    int numRoutes;
    file >> numRoutes; // Read the number of routes

    // Initialize the routes matrix with zeros
    vector<vector<int>> routes(numVerts, vector<int>(numVerts, 0));

    int src, dest, cost;
    while (file >> src >> dest >> cost) {
        routes[src][dest] = cost; // Store the cost in the matrix
    }
    file.close(); // Close the file
    return routes;
}

// Function to calculate the cost of a given route
int CalcCost(const vector<int>& route, const vector<vector<int>>& routes) {
    int cost = 0;
    for (size_t i = 0; i < route.size() - 1; ++i) {
        int src = route[i];
        int dest = route[i + 1];
        if (routes[src][dest] == 0) { // If there's no direct route
            return -1;
        }
        cost += routes[src][dest]; // Add the cost of the segment
    }
    return cost;
}

// Function to check if a route's total demand is within capacity
bool CheckCapacity(const vector<int>& route, const vector<int>& demands, int capacity) {
    int totalLoad = 0;
    for (int idx : route) {
        totalLoad += demands[idx]; // Sum the demands of all nodes in the route
    }
    return totalLoad <= capacity; // Check if within capacity
}

// Function to check if a route exists in a set of valid combinations
bool RouteExists(const vector<int>& sub, const vector<vector<int>>& validCombs) {
    return find(validCombs.begin(), validCombs.end(), sub) != validCombs.end();
}

// Function to generate all valid combinations of routes
void GenerateAllCombs(const vector<vector<int>>& routes, int routeSize, vector<vector<int>>& results,
                      const vector<int>& demands, int capacity) {
    int n = routes.size();
    vector<int> indices(n);
    iota(indices.begin(), indices.end(), 0); // Fill indices with 0, 1, ..., n-1

    // Generate all permutations of routes
    while (next_permutation(indices.begin() + 1, indices.end())) {
        for (int i = 0; i < n; i += routeSize) {
            int j = min(i + routeSize, n);
            vector<int> sub(indices.begin() + i, indices.begin() + j);
            sub.insert(sub.begin(), 0); // Add starting point
            sub.push_back(0);           // Add ending point
            // Check if the route is valid
            if (CalcCost(sub, routes) != -1 && !RouteExists(sub, results) && CheckCapacity(sub, demands, capacity)) {
                results.push_back(sub); // Add to results if valid
            }
        }
    }
}

// Function to check if there are no overlapping nodes in different routes
bool NoOverlap(const vector<vector<int>>& routes, int totalNodes) {
    set<int> visited;
    for (const auto& route : routes) {
        for (int node : route) {
            if (node == 0) continue; // Skip the depot
            if (visited.find(node) != visited.end()) { // If node already visited
                return false;
            }
            visited.insert(node); // Mark the node as visited
        }
    }
    return visited.size() == static_cast<size_t>(totalNodes) - 1;
}

// Recursive function to generate all combinations of routes
void GenerateCombsRec(const vector<vector<int>>& routes, vector<int>& currComb, vector<vector<int>>& allCombs,
                      int combSize, int numVerts, int start) {
    if (currComb.size() == combSize) {
        vector<vector<int>> realComb;
        for (size_t idx : currComb) {
            realComb.push_back(routes[idx]);
        }
        if (NoOverlap(realComb, numVerts)) {
            allCombs.push_back(currComb); // Add to allCombs if no overlap
        }
        return;
    }

    for (size_t i = start; i < routes.size(); i++) {
        currComb.push_back(i); // Add route index to current combination
        GenerateCombsRec(routes, currComb, allCombs, combSize, numVerts, i + 1);
        currComb.pop_back(); // Backtrack
    }
}

// Wrapper function to generate all route combinations
vector<vector<int>> GenerateAllCombs(const vector<vector<int>>& routes, int numVerts) {
    vector<vector<int>> allCombs;
    vector<int> currComb;

    for (size_t k = 1; k <= routes.size(); k++) {
        GenerateCombsRec(routes, currComb, allCombs, k, numVerts, 0);
    }

    return allCombs;
}

// Function to calculate the total cost of a combination of routes
int TotalCost(const vector<int>& comb, const vector<vector<int>>& possRoutes, const vector<vector<int>>& routes) {
    int totalCost = 0;
    for (const auto& routeIdx : comb) {
        int routeCost = CalcCost(possRoutes[routeIdx], routes);
        if (routeCost == -1) return -1; // If any route is invalid
        totalCost += routeCost; // Add route cost to total cost
    }
    return totalCost;
}

// Function to find the combination of routes with the minimum cost
int MinCost(const vector<vector<int>>& allCombs, const vector<vector<int>>& possRoutes, const vector<vector<int>>& routes) {
    int minCost = numeric_limits<int>::max();
    vector<int> minCostIndices;

    for (const auto& comb : allCombs) {
        int totalCost = TotalCost(comb, possRoutes, routes);
        if (totalCost != -1 && totalCost < minCost) {
            minCost = totalCost;
            minCostIndices = comb; // Update minimum cost and indices
        }
    }

    cout << "Minimum cost combination: ";
    cout << minCost << endl; // Print minimum cost

    return minCost;
}

// Function to solve the Vehicle Routing Problem (VRP)
int SolveVRP(const vector<vector<int>>& locations, const vector<int>& demands, int capacity, int numVerts, int routeSize, int maxStops) {
    vector<vector<int>> possRoutes;

    // Generate possible routes
    for (int i = 1; i < routeSize; i++) {
        GenerateAllCombs(locations, i, possRoutes, demands, capacity);
    }

    // Generate all combinations of possible routes
    vector<vector<int>> allCombs = GenerateAllCombs(possRoutes, numVerts);
    MinCost(allCombs, possRoutes, locations); // Find the minimum cost combination

    return 0;
}

// Main function to execute the program
int main(int argc, char* argv[]) {
    if (argc < 2) {
        cerr << "Usage: " << argv[0] << " <input file>" << endl;
        return 1;
    }
    string fileName = argv[1];
    int capacity = 15;
    int numVerts;
    int routeSize = 3;
    int maxStops = 5;

    // Read demands and locations from the input file
    vector<int> demands = ReadDemands(fileName, numVerts);
    vector<vector<int>> locations = ReadRoutes(fileName, numVerts);

    auto start = high_resolution_clock::now(); // Start measuring execution time

    SolveVRP(locations, demands, capacity, numVerts, routeSize, maxStops); // Solve the VRP

    auto end = high_resolution_clock::now(); // End measuring execution time
    auto duration = duration_cast<milliseconds>(end - start).count();
    cout << "Execution time: " << duration << " ms" << endl; // Print execution time

    return 0;
}

Writing global.cpp


## Execu√ß√£o

Nas c√©lulas abiaxo est√° constru√≠do um padr√£o que tamb√©m ser√° seguido para as pr√≥ximas implementa√ß√µes, definido pelos seguintes passos.

1. Defini√ß√£o do arquivo de entrada, n√£o se esque√ßa de gerar os qrquivos anteriormente na etapa de gera√ß√£o de entradas
2. compila√ß√£o e execu√ß√£o, caso deseje executar no colab ou notebook √© necess√°rio apenas rodas as c√©lulas abaixo, caso deseje fazer isso no cluster, o arquivo slurm est√° disponibilizado na se√ß√£o slurm abaixo e deve ser rodado com o comando sbatch.

In [7]:
arquivo = "grafo_10_0.125.txt"

In [8]:
!g++ -g -Wall -o global global.cpp

[01m[Kglobal.cpp:[m[K In function ‚Äò[01m[Kvoid GenerateCombsRec(const std::vector<std::vector<int> >&, std::vector<int>&, std::vector<std::vector<int> >&, int, int, int)[m[K‚Äô:
  132 |     if ([01;35m[KcurrComb.size() == combSize[m[K) {
      |         [01;35m[K~~~~~~~~~~~~~~~~^~~~~~~~~~~[m[K


In [9]:
!./global $arquivo

Minimum cost combination: 913
Execution time: 6652 ms


In [None]:
arquivo = "grafo_20_0.125.txt"
!./global $arquivo

### Slurm


In [None]:
%%file global.slurm

#!/bin/bash
#SBATCH --job-name=global
#SBATCH --nodes=1
#SBATCH --partition=express
#SBATCH --mem=500M

./global $arquivo

Writing global.slurm


## Resultados


Para a analize desta conclus√£o o arquivo foi executado no colab conforme descrito na se√ß√£o anterior.

Ao executar o problema com entradas de 10 ou 20 n√≥s ja √© poss√≠vel perceber o grau de complexidade do problema, sendo que ao rod√°-lo para 20 n√≥s j√° possuimos um tempo de execu√ß√£o dr√°sticamente maior (levam-se alguns v√°rios minutos) do para 10 n√≥s (leva um pouco mais de 7 segundos) e para entradas de 50 ou 100 ja se torna intrat√°vel.

Isso mostra que a solu√ß√£o implementada seria inutiliz√°vel em um problema real de tra√ßado de rotas, sendo necess√°ria a execu√ß√£o de outra abordagem para reduzir o tempo de processamento.

# Heuristica

Com o objetivo de se tentar alcan√ßar uma implementa√ß√£o vi√°vel para o mundo real, o pr√≥ximo passo ser√° o de se aplicar a heur√≠tica de de Clarke e Wright.

Essa heur√≠stica foi escolhida uma vez que ela √© simples de se entendere implementar comparada a outras heur√≠sticas do VRP e apresenta resultados bons e r√°pidos com frequ√™ncia.

Os passos desta heur√≠stica s√£o os seguintes:

1. Come√ßa-se com uma solu√ß√£o inicial onde cada cliente √© atendido individualmente por um ve√≠culo que vai do dep√≥sito at√© o cliente e retorna diretamente ao dep√≥sito. Ou seja, se houver n clientes, teremos n rotas inicialmente.

2. Para cada par de clientes ùëñ e ùëó, calcula-se a economia ùëÜùëñùëó
associada ao combinar os dois clientes em uma √∫nica rota, em vez de atender a cada um individualmente. esta opera√ß√£o √© representada pela f√≥rmula:
ùëÜùëñùëó = d0i+d0j‚àídij

3. As economias ùëÜùëñùëó s√£o ordenadas de forma decrescente.

4. Inicia-se a constru√ß√£o das rotas. Inicialmente, cada cliente est√° em uma rota separada. A heur√≠stica come√ßa a combinar rotas baseando-se nas economias calculadas, come√ßando pela maior economia.
Ao combinar duas rotas que incluem os clientes ùëñ e ùëó, verifica-se se √© poss√≠vel juntar essas rotas sem violar nenhuma restri√ß√£o do problema (por exemplo, capacidade dos ve√≠culos ou restri√ß√µes de tempo).
A combina√ß√£o √© feita unindo a rota que termina em ùëñ com a rota que come√ßa em ùëó.

5. Come√ßamos a iterar at√© que n√£o seja poss√≠vel mais combinar rotas de forma ben√©fica ou at√© que todas as economias poss√≠veis tenham sido avaliadas.



In [10]:
%%file heuristica.cpp


#include <iostream>  // For input and output operations
#include <vector>    // For using vectors
#include <algorithm> // For using algorithms like sort
#include <map>       // For using maps
#include <climits>   // For integer limits
#include <fstream>   // For file handling
#include <set>       // For using sets
#include <limits>    // For numeric limits
#include <chrono>    // For measuring execution time

using namespace std;
using namespace std::chrono;

// Function to read the input file and return a vector with demands
vector<int> LerDestinoDemanda(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo); // Open the file
    if (!arquivo.is_open()) {      // Check if the file is open
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }

    arquivo >> numVertices; // Read the number of vertices

    vector<int> grafo(numVertices, 0); // Initialize the graph with zero demands
    int destino, demanda;
    for (int i = 1; i < numVertices; i++) {
        arquivo >> destino >> demanda; // Read destination and demand
        grafo[destino] = demanda;      // Store the demand in the graph
    }
    arquivo.close(); // Close the file
    return grafo;
}

// Function to read the input file and return a vector with possible routes
vector<vector<int>> LerRotasPossiveis(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo); // Open the file
    if (!arquivo.is_open()) {      // Check if the file is open
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }
    // Read the first line of the file to get the number of vertices
    arquivo >> numVertices;

    // Skip the next numVertices-1 lines
    for (int i = 0; i < numVertices-1; i++) {
        int x, y;
        arquivo >> x >> y;
    }

    // Read the number of possible routes
    int numRotas;
    arquivo >> numRotas;

    // Create a graph with numVertices vertices and initialize with 0, then read the routes
    vector<vector<int>> grafo(numVertices, vector<int>(numVertices, 0));

    int origem, destino, custo;
    while (arquivo >> origem >> destino >> custo) {
        grafo[origem][destino] = custo; // Store the route cost (directed graph)
    }
    arquivo.close(); // Close the file
    return grafo;
}

// Struct to store the economy values for the Clarke-Wright algorithm
struct Economia {
    int i, j;     // Nodes
    double valor; // Economy value
    Economia(int i, int j, double valor) : i(i), j(j), valor(valor) {} // Constructor
};

// Function to compare economy values
bool compararEconomias(const Economia& a, const Economia& b) {
    return a.valor > b.valor;
}

// Function to find the route of a node
int encontrarRota(int node, const vector<vector<int>>& rotas, const vector<vector<int>>& distancias) {
    for (size_t i = 0; i < rotas.size(); ++i) {
        auto it = find(rotas[i].begin(), rotas[i].end(), node);
        if (it != rotas[i].end()) {
            // Check if the route has a cost of 0
            for (size_t j = 0; j < rotas[i].size() - 1; ++j) {
                if (distancias[rotas[i][j]][rotas[i][j + 1]] == 0) {
                    return -1; // Invalid route
                }
            }
            return i;
        }
    }
    return -1;
}

// Function to calculate the cost of a route
int calcularCustoRota(const vector<int>& rota, const vector<vector<int>>& distancias) {
    int custo = 0;
    for (size_t i = 0; i < rota.size() - 1; ++i) {
        custo += distancias[rota[i]][rota[i + 1]];
    }
    return custo;
}

// Function to combine routes based on economies
void CombinaRotas(vector<Economia>& economias, vector<vector<int>>& rotas, const vector<vector<int>>& distancias, const vector<int>& demandas, int maxParadas, int capacidade);

// Function to verify if a new route is valid
void VerificaValida(vector<int>& novaRota, const vector<vector<int>>& distancias, bool& rotaValida, vector<vector<int>>& rotas, int rotaI, int rotaJ);

// Function to calculate the total cost of all routes
void CalcCustoTotal(vector<vector<int>>& rotas, const vector<vector<int>>& distancias);

// Function to implement the Clarke-Wright heuristic
/**
 * Applies the Clarke-Wright heuristic algorithm to solve a vehicle routing problem.
 *
 * @param distancias A 2D vector representing the distances between each pair of nodes.
 * @param capacidade The maximum capacity of each vehicle.
 * @param demandas A vector representing the demand of each customer node.
 * @param maxParadas The maximum number of stops allowed in each route.
 */
void clarkeWright(const vector<vector<int>>& distancias, int capacidade, const vector<int>& demandas, int maxParadas) {
    int n = distancias.size() - 1; // Number of customers (excluding depot)

    // Initialize individual routes
    vector<vector<int>> rotas;
    for (int i = 1; i <= n; ++i) {
        rotas.push_back({0, i, 0});
    }

    // Calculate the economies
    vector<Economia> economias;
    for (int i = 1; i <= n; ++i) {
        for (int j = i + 1; j <= n; ++j) {
            int valor = distancias[0][i] + distancias[0][j] - distancias[i][j];
            economias.push_back(Economia(i, j, valor));
        }
    }

    // Sort the economies in descending order
    sort(economias.begin(), economias.end(), compararEconomias);

    // Combine routes based on economies
    CombinaRotas(economias, rotas, distancias, demandas, maxParadas, capacidade);

    // Calculate and print the total cost
    CalcCustoTotal(rotas, distancias);
}

// Function to calculate the total cost of all routes
void CalcCustoTotal(vector<vector<int>>& rotas, const vector<vector<int>>& distancias) {
    int custoTotal = 0;
    for (const auto& rota : rotas) {
        int custoRota = calcularCustoRota(rota, distancias);
        custoTotal += custoRota;
    }
    cout << "Custo total: " << custoTotal << endl; // Print total cost
}

// Function to combine routes based on economies
void CombinaRotas(vector<Economia>& economias, vector<vector<int>>& rotas, const vector<vector<int>>& distancias, const vector<int>& demandas, int maxParadas, int capacidade) {
    for (const auto& economia : economias) {
        int i = economia.i;
        int j = economia.j;

        int rotaI = encontrarRota(i, rotas, distancias);
        int rotaJ = encontrarRota(j, rotas, distancias);

        if (rotaI != -1 && rotaJ != -1 && rotaI != rotaJ) {
            int demandaTotal = 0;
            for (int cliente : rotas[rotaI]) {
                if (cliente != 0) {
                    demandaTotal += demandas[cliente];
                }
            }
            for (int cliente : rotas[rotaJ]) {
                if (cliente != 0) {
                    demandaTotal += demandas[cliente];
                }
            }

            // Check if the combination exceeds the maximum number of stops
            int numParadasRotaI = rotas[rotaI].size() - 2; // Excluding initial and final depot
            int numParadasRotaJ = rotas[rotaJ].size() - 2; // Excluding initial and final depot
            if (numParadasRotaI + numParadasRotaJ > maxParadas) {
                continue; // Skip this combination if it exceeds the stop limit
            }

            if (demandaTotal <= capacidade) {
                // Combine the routes
                vector<int> novaRota = rotas[rotaI];
                novaRota.pop_back();
                novaRota.insert(novaRota.end(), rotas[rotaJ].begin() + 1, rotas[rotaJ].end());

                // Verify if the new route is valid
                bool rotaValida = true;
                VerificaValida(novaRota, distancias, rotaValida, rotas, rotaI, rotaJ);
            }
        }
    }
}

// Function to verify if a new route is valid
void VerificaValida(vector<int>& novaRota, const vector<vector<int>>& distancias, bool& rotaValida, vector<vector<int>>& rotas, int rotaI, int rotaJ) {
    for (size_t k = 0; k < novaRota.size() - 1; ++k) {
        if (distancias[novaRota[k]][novaRota[k + 1]] == 0) {
            rotaValida = false;
            break;
        }
    }

    if (rotaValida) {
        rotas[rotaI] = novaRota;
        rotas.erase(rotas.begin() + rotaJ);
    }
}

// Main function
int main(int argc, char* argv[]) {
    char* nomeArquivo = argv[1]; // Get the input file name from command line arguments
    int numVertices;
    vector<int> demandas = LerDestinoDemanda(nomeArquivo, numVertices); // Read demands
    vector<vector<int>> distancias = LerRotasPossiveis(nomeArquivo, numVertices); // Read distances

    int capacidade = 15; // Vehicle capacity
    int maxParadas = 5;  // Maximum stops

    auto start = high_resolution_clock::now(); // Start measuring execution time
    clarkeWright(distancias, capacidade, demandas, maxParadas - 2); // Apply Clarke-Wright algorithm
    auto end = high_resolution_clock::now(); // End measuring execution time

    auto duration = duration_cast<milliseconds>(end - start).count(); // Calculate duration
    cout << "Tempo de execu√ß√£o: " << duration << " ms" << endl; // Print execution time

    return 0;
}

Writing heuristica.cpp


## Execu√ß√£o

In [11]:
arquivo = "grafo_100_0.125.txt"

In [12]:
!g++ -g -Wall -fopenmp -o heuristica heuristica.cpp
!./heuristica $arquivo

Custo total: 5411
Tempo de execu√ß√£o: 42 ms


In [13]:
arquivo = "grafo_500_0.125.txt"
!./heuristica $arquivo

Custo total: 25756
Tempo de execu√ß√£o: 5388 ms


In [14]:
arquivo = "grafo_1000_0.125.txt"
!./heuristica $arquivo

Custo total: 49987
Tempo de execu√ß√£o: 36090 ms


### Slurm

In [None]:
%%file heuristica.slurm

#!/bin/bash
#SBATCH --job-name=heuristica
#SBATCH --nodes=1
#SBATCH --partition=express
#SBATCH --mem=500M

./heuristica $arquivo

Writing heuristica.slurm


## Resultados

Pode-se dizer que a aplica√ß√£o da heur√≠stica foi um grande sucesso. Ao compararmos o desemprenho da vers√£o com heur√≠stica com a exaustiva, vemos que diferntemente da exaustiva a heur√≠stica √© capaz de tornar trat√°veis entradas de at√© mlihares de n√≥s e executar entradas pequenas em um tempo r√°pido e vi√°vel para aplica√ß√µes reais.

Apesar disso ao compararmos os tempos obtidos nas execu√ß√µes realizadas na se√ß√£o anterior, √© poss√≠vel ver que o crescimento da complexidade ainda continua exponencial o pr√≥ximo de exponecial, ao levar 5 segundo para uma entrada de tamanho 500 e 40 para uma entrada de tamanho 1000, logo, apesar do sucesso, a solu√ß√£o com heur√≠stica ainda √© invi√°vel para entradas grandes, possuindo sua aplica√ß√£o liitada a entradas pequenas ou m√©dias.



# Paraleliza√ß√£o Local

O pr√≥ximo passo passo a realizarmos em nossas implementa√ß√µes √© a tentativa de paraleliza√ß√£o, neste caso a local, utilizando-se de m√∫ltiplos processos de uma m√°quina com a ajuda do openMP.

A melhor implementa√ß√£o poss√≠vel √© capaz de tornar algoritimos de tempos expon√™nciais em polin√¥miais, atrav√©s da apluca√ß√£o de uma estrutura semelhante a uma m√°quina de turing n√£o determin√≠stica e assim, tornar grandes entradas trat√°veis.

Para realizar a implementa√ß√£o do paralelismo para o c√≥digo abaixo, optu-se por realizar apenas a pareliza√ß√£o de fors, utilizando diferentes schedulers do openMP, sendo eles os que foram julgados como mais adequados para cada situa√ß√£o.

Schedulers utilizados:

Static - O scheduler statico √© util para paralelizar fors com itera√ß√µes que possuem mais ou menos o mesmo tempo de execu√ß√£o, uma vez que a divis√£o dos dados entre as threads √© feita durante a complia√ß√£o

Guided - O scheduler guiado, inicia associando grandes grupos de dados aos processos no come√ßo da execu√ß√£o e menores no final, sendo √∫til para fors com itera√ß√µes que aumentam de complexidade.

In [49]:
%%file localParallel.cpp

#include <iostream>
#include <vector>
#include <algorithm>
#include <map>
#include <climits>
#include <fstream>
#include <set>
#include <limits>
#include <chrono>
#include <omp.h>

using namespace std;
using namespace std::chrono;

// Fun√ß√£o para ler o arquivo de entrada e retornar um vetor com as demandas
vector<int> LerDestinoDemanda(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo);
    if (!arquivo.is_open()) {
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }

    arquivo >> numVertices;

    vector<int> grafo(numVertices, 0);
    int destino, demanda;
    for (int i = 1; i < numVertices; i++) {
        arquivo >> destino >> demanda;
        grafo[destino] = demanda;
    }
    arquivo.close();
    return grafo;
}

// Fun√ß√£o para ler o arquivo de entrada e retornar um vetor com as rotas poss√≠veis
vector<vector<int>> LerRotasPossiveis(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo);
    if (!arquivo.is_open()) {
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }
    // le a primeira linha do arquivo e salva o numero de vertices
    arquivo >> numVertices;

    // ignora as proximas numVertices-1 linhas
    for (int i = 0; i < numVertices-1; i++) {
        int x, y;
        arquivo >> x >> y;
    }

    // le a quantidade de rotas possiveis
    int numRotas;
    arquivo >> numRotas;

    // cria um grafo com numVertices vertices e inicializa com 0 e le as rotas
    vector<vector<int>> grafo(numVertices, vector<int>(numVertices, 0));

    int origem, destino, custo;
    while (arquivo >> origem >> destino >> custo) {
        grafo[origem][destino] = custo;     // GRAFO DIRECIONADO!
    }
    arquivo.close();
    return grafo;
}

struct Economia {
    int i, j;
    double valor;
    Economia(int i, int j, double valor) : i(i), j(j), valor(valor) {} // Construtor
};

bool compararEconomias(const Economia& a, const Economia& b) {
    return a.valor > b.valor;
}

// Fun√ß√£o para encontrar a rota de um n√≥
int encontrarRota(int node, const vector<vector<int>>& rotas, const vector<vector<int>>& distancias) {
    for (size_t i = 0; i < rotas.size(); ++i) {
        auto it = find(rotas[i].begin(), rotas[i].end(), node);
        if (it != rotas[i].end()) {
            // Verificar se a rota tem custo 0
            for (size_t j = 0; j < rotas[i].size() - 1; ++j) {
                if (distancias[rotas[i][j]][rotas[i][j + 1]] == 0) {
                    return -1; // Rota inv√°lida
                }
            }
            return i;
        }
    }
    return -1;
}

// Fun√ß√£o para calcular o custo de uma rota
int calcularCustoRota(const vector<int>& rota, const vector<vector<int>>& distancias) {
    int custo = 0;

    #pragma omp parallel for reduction(+:custo) schedule(static)
    for (size_t i = 0; i < rota.size() - 1; ++i) {
        custo += distancias[rota[i]][rota[i + 1]];
    }
    return custo;
}

void CombinaRotas(std::vector<Economia> &economias, std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias, const std::vector<int> &demandas, int maxParadas, int capacidade);

void VerificaValida(std::vector<int> &novaRota, const std::vector<std::vector<int>> &distancias, bool &rotaValida, std::vector<std::vector<int>> &rotas, int rotaI, int rotaJ);

void CalcCustoTotal(std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias);


void clarkeWright(const vector<vector<int>>& distancias, int capacidade, const vector<int>& demandas, int maxParadas) {
    int n = distancias.size() - 1; // n√∫mero de clientes (n√£o inclui dep√≥sito)

    // Inicializa rotas individuais
    vector<vector<int>> rotas;
    for (int i = 1; i <= n; ++i) {
        rotas.push_back({0, i, 0});
    }

    // Calcula as economias
    vector<Economia> economias;
    int numPairs = (n * (n - 1)) / 2;

    #pragma omp parallel for schedule(guided)
    for (int index = 0; index < numPairs; ++index) {
        int i = 1 + index / (n - 1);
        int j = 2 + index % (n - 1);

        if (j > n) {
            i++;
            j = i + 1;
        }

        int valor = distancias[0][i] + distancias[0][j] - distancias[i][j];

        #pragma omp critical
        economias.push_back(Economia(i, j, valor));
    }

    // Ordena as economias em ordem decrescente
    sort(economias.begin(), economias.end(), compararEconomias);

    CombinaRotas(economias, rotas, distancias, demandas, maxParadas, capacidade);

    CalcCustoTotal(rotas, distancias);
}

void CalcCustoTotal(std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias)
{
    // Calcula e imprime o custo total
    int custoTotal = 0;

    #pragma omp parallel for reduction(+:custoTotal) schedule(static)
    for (size_t i = 0; i < rotas.size(); ++i)
    {
        int custoRota = calcularCustoRota(rotas[i], distancias);
        #pragma omp critical
        {
            custoTotal += custoRota;
        }
    }
    cout << "Custo total: " << custoTotal << endl;
}

void CombinaRotas(std::vector<Economia> &economias, std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias, const std::vector<int> &demandas, int maxParadas, int capacidade)
{
    // Combina rotas com base nas economias
    for (size_t k = 0; k < economias.size(); ++k)
    {
        int i = economias[k].i;
        int j = economias[k].j;

        int rotaI = encontrarRota(i, rotas, distancias);
        int rotaJ = encontrarRota(j, rotas, distancias);

        if (rotaI != -1 && rotaJ != -1 && rotaI != rotaJ)
        {
            int demandaTotal = 0;

            for (int cliente : rotas[rotaI])
                {
                    if (cliente != 0)
                    {
                        demandaTotal += demandas[cliente];
                    }
                }
            for (int cliente : rotas[rotaJ])
                {
                    if (cliente != 0)
                    {
                        demandaTotal += demandas[cliente];
                    }
                }
            // Verificar se a combina√ß√£o excede o n√∫mero m√°ximo de paradas
            int numParadasRotaI = rotas[rotaI].size() - 2; // Excluindo dep√≥sito inicial e final
            int numParadasRotaJ = rotas[rotaJ].size() - 2; // Excluindo dep√≥sito inicial e final
            if (numParadasRotaI + numParadasRotaJ > maxParadas)
            {
                continue; // Pular essa combina√ß√£o se exceder o limite de paradas
            }

            if (demandaTotal <= capacidade)
            {
                // Combina as rotas
                vector<int> novaRota = rotas[rotaI];
                novaRota.pop_back();
                novaRota.insert(novaRota.end(), rotas[rotaJ].begin() + 1, rotas[rotaJ].end());

                // Verifica se a nova rota √© v√°lida
                bool rotaValida = true;
                VerificaValida(novaRota, distancias, rotaValida, rotas, rotaI, rotaJ);
            }
        }
    }
    //cout << "Rotas combinadas" << endl;
}

void VerificaValida(std::vector<int> &novaRota, const std::vector<std::vector<int>> &distancias, bool &rotaValida, std::vector<std::vector<int>> &rotas, int rotaI, int rotaJ)
{
    for (size_t k = 0; k < novaRota.size() - 1; ++k)
    {
        if (distancias[novaRota[k]][novaRota[k + 1]] == 0)
        {
            rotaValida = false;
            break;
        }
    }

    if (rotaValida)
    {
        {
            rotas[rotaI] = novaRota;
            rotas.erase(rotas.begin() + rotaJ);
        }
    }
}

int main( int argc, char *argv[] ) {
    char *nomeArquivo = argv[1];
    int numVertices;
    vector<int> demandas = LerDestinoDemanda(nomeArquivo, numVertices);
    vector<vector<int>> distancias = LerRotasPossiveis(nomeArquivo, numVertices);

    int capacidade = 15; // Capacidade do ve√≠culo
    int maxParadas = 5;

    auto start = high_resolution_clock::now();
    clarkeWright(distancias, capacidade, demandas, maxParadas - 2); // -2 pra tirar a saida e entrada
    auto end = high_resolution_clock::now();


    auto duration = duration_cast<milliseconds>(end - start).count();
    cout << "Tempo de execu√ß√£o: " << duration << " ms" << endl;

    return 0;
}

Overwriting localParallel.cpp


## Execu√ß√£o

Observa√ß√µes sobre a execu√ß√£o.

Devido a algum detalhe do colab, as vezes o algoritimo n√£o imprime os resultados e da como completo, sem retornar erros ou qualquer sinal, caso isso ocorra, apenas execute novamente

In [50]:
arquivo = "grafo_100_0.125.txt"

In [51]:
!g++ -g -Wall -fopenmp -o localParallel localParallel.cpp

In [52]:
!./localParallel $arquivo

Custo total: 6029
Tempo de execu√ß√£o: 52 ms


In [53]:
arquivo = "grafo_500_0.125.txt"
!./localParallel $arquivo

Custo total: 26873
Tempo de execu√ß√£o: 4614 ms


In [54]:
arquivo = "grafo_1000_0.125.txt"
!./localParallel $arquivo

Custo total: 52077
Tempo de execu√ß√£o: 30338 ms


## Slurm

In [None]:
%%file localParallel.slurm

#!/bin/bash
#SBATCH --job-name=localParallel
#SBATCH --nodes=1
#SBATCH --ntasks=4
#SBATCH --cores=4
#SBATCH --mem=500M

export OMP_NUM_THREADS=4
./localParallel $arquivo

Writing localParallel.slurm


## Resultados

Com base nas execu√ß√µes realizadas na se√ß√£o anterior podemos detectar uma melhoria no tempo de execu√ß√£o, em rela√ß√£o a aplica√ß√£o apenas da heur√≠stica. √© poss√≠vel observar tamb√©m, que a melhoria nos tempos de execu√ß√£o se torna cada vez mais evidente conforme o aumento das entradas, evidenciando uma melhoria no valor da exponecial.
Por√©m como mencionado o algoritimo ainda continua a apresentar tempo exponencial, possuindo abertura para melhorias na pareliliza√ß√£o.

Outro ponto importante, este que deve ser melhorado em implementa√ß√µes futuras √© a detec√ß√£o de todas as "race conditions", uma vez que os resultados paralelizados foram um pouco diferentes dos resultados originais. Isto provavelmente ocorreu devido a em algum ponto da execu√ß√£o, dois ou mais processos acessaram a mesma vari√°vel simultanemante e por isso coletaram informa√ß√µes incorretas. Apesar de resultados variaveis serem um problema, √© necess√°rio notar tamb√©m que em diversos casos √© necess√°rio balancear a seguran√ßa do resultado e o tempo de execu√ß√£o. Caso desejassemos eliminar todas as poss√≠bilidades de conflito, poderiamos criar situa√ß√µes em que eliminariamos o prop√≥sito da paraleliza√ß√£o, ao bloquear processos em pontos espec√≠ficos, ou em situa√ß√µes piores, fazer com que o programa travesse nos pontos de concorrencia.


# Paraleliza√ß√£o em diversas m√°quinas

Para a sess√£o abaixo, tentaremos implementar outro tipo de paraleliza√ß√£o, ainda nos utilizando da heur√≠stca, para este caso por√©m, utilizaremos do MPI para realizar compua√ß√£o distribuida em diversas m√°quinas, ou caso deseje executar no colab ou localmente, em diversos cores da mesma m√°quina.

Entrando um pouco mais afundo na implementa√ß√£o, o MPI permite que uma m√°quina mestre realiza comunica√ß√£o com diversas outras m√°quinas, enviando e recebendo informa√ß√µes. A capacidade de transmitir informa√ß√µes foi utilizada neste caso para transmitir peda√ß√µes dos arrays manipulados ao longo do c√≥digo, com objetivo de distribuir o trabalho entre as m√°quinas.

In [None]:
%%file mpiV2.cpp

#include <iostream>
#include <vector>
#include <algorithm>
#include <map>
#include <climits>
#include <fstream>
#include <set>
#include <limits>
#include <chrono>
#include <mpi.h>

using namespace std;
using namespace std::chrono;

// Function declarations
vector<int> LerDestinoDemanda(const string& nomeArquivo, int& numVertices);
vector<vector<int>> LerRotasPossiveis(const string& nomeArquivo, int& numVertices);
struct Economia;
bool compararEconomias(const Economia& a, const Economia& b);
int encontrarRota(int node, const vector<vector<int>>& rotas, const vector<vector<int>>& distancias);
int calcularCustoRota(const vector<int>& rota, const vector<vector<int>>& distancias);
void CombinaRotas(std::vector<Economia> &economias, std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias, const std::vector<int> &demandas, int maxParadas, int capacidade, int rank, int size);
void VerificaValida(std::vector<int> &novaRota, const std::vector<std::vector<int>> &distancias, bool &rotaValida, std::vector<std::vector<int>> &rotas, int rotaI, int rotaJ);
void CalcCustoTotal(std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias);

struct Economia {
    int i, j;
    double valor;
    Economia() = default;
    Economia(int i, int j, double valor) : i(i), j(j), valor(valor) {}
};

bool compararEconomias(const Economia& a, const Economia& b) {
    return a.valor > b.valor;
}

int encontrarRota(int node, const vector<vector<int>>& rotas, const vector<vector<int>>& distancias) {
    for (size_t i = 0; i < rotas.size(); ++i) {
        auto it = find(rotas[i].begin(), rotas[i].end(), node);
        if (it != rotas[i].end()) {
            return i;
        }
    }
    return -1;
}

int calcularCustoRota(const vector<int>& rota, const vector<vector<int>>& distancias) {
    int custo = 0;
    for (size_t i = 0; i < rota.size() - 1; ++i) {
        custo += distancias[rota[i]][rota[i + 1]];
    }
    return custo;
}

void CombinaRotas(std::vector<Economia> &economias, std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias, const std::vector<int> &demandas, int maxParadas, int capacidade, int rank, int size) {
    vector<Economia> allEconomias;

    // Gather all local economias at rank 0
    if (rank == 0) {
        allEconomias.insert(allEconomias.end(), economias.begin(), economias.end());
        for (int i = 1; i < size; ++i) {
            int numLocalEconomias;
            MPI_Status status;
            MPI_Probe(i, 0, MPI_COMM_WORLD, &status);
            MPI_Get_count(&status, MPI_BYTE, &numLocalEconomias);
            vector<Economia> localEconomias(numLocalEconomias / sizeof(Economia));
            MPI_Recv(localEconomias.data(), numLocalEconomias, MPI_BYTE, i, 0, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
            allEconomias.insert(allEconomias.end(), localEconomias.begin(), localEconomias.end());
        }
        sort(allEconomias.begin(), allEconomias.end(), compararEconomias);
    } else {
        MPI_Send(economias.data(), economias.size() * sizeof(Economia), MPI_BYTE, 0, 0, MPI_COMM_WORLD);
    }

    // Only rank 0 performs the route combination
    if (rank == 0) {
        for (const auto &economia : allEconomias) {
            int i = economia.i;
            int j = economia.j;

            int rotaI = encontrarRota(i, rotas, distancias);
            int rotaJ = encontrarRota(j, rotas, distancias);

            if (rotaI != -1 && rotaJ != -1 && rotaI != rotaJ) {
                int demandaTotal = 0;
                for (int cliente : rotas[rotaI]) {
                    if (cliente != 0) {
                        demandaTotal += demandas[cliente];
                    }
                }
                for (int cliente : rotas[rotaJ]) {
                    if (cliente != 0) {
                        demandaTotal += demandas[cliente];
                    }
                }

                int numParadasRotaI = rotas[rotaI].size() - 2;
                int numParadasRotaJ = rotas[rotaJ].size() - 2;
                if (numParadasRotaI + numParadasRotaJ > maxParadas) {
                    continue;
                }

                if (demandaTotal <= capacidade) {
                    vector<int> novaRota = rotas[rotaI];
                    novaRota.pop_back();
                    novaRota.insert(novaRota.end(), rotas[rotaJ].begin() + 1, rotas[rotaJ].end());

                    bool rotaValida = true;
                    VerificaValida(novaRota, distancias, rotaValida, rotas, rotaI, rotaJ);
                }
            }
        }
    }

    // Broadcast the updated routes to all processes
    int numRotas = rotas.size();
    MPI_Bcast(&numRotas, 1, MPI_INT, 0, MPI_COMM_WORLD);

    if (rank != 0) {
        rotas.resize(numRotas);
    }

    for (int i = 0; i < numRotas; ++i) {
        int rotaSize = rotas[i].size();
        MPI_Bcast(&rotaSize, 1, MPI_INT, 0, MPI_COMM_WORLD);

        if (rank != 0) {
            rotas[i].resize(rotaSize);
        }

        MPI_Bcast(rotas[i].data(), rotaSize, MPI_INT, 0, MPI_COMM_WORLD);
    }
}

void VerificaValida(std::vector<int> &novaRota, const std::vector<std::vector<int>> &distancias, bool &rotaValida, std::vector<std::vector<int>> &rotas, int rotaI, int rotaJ) {
    for (size_t k = 0; k < novaRota.size() - 1; ++k) {
        if (distancias[novaRota[k]][novaRota[k + 1]] == 0) {
            rotaValida = false;
            break;
        }
    }

    if (rotaValida) {
        rotas[rotaI] = novaRota;
        rotas.erase(rotas.begin() + rotaJ);
    }
}

void CalcCustoTotal(std::vector<std::vector<int>> &rotas, const std::vector<std::vector<int>> &distancias) {
    int custoTotal = 0;
    for (const auto &rota : rotas) {
        int custoRota = calcularCustoRota(rota, distancias);
        custoTotal += custoRota;
    }
    cout << "Custo total: " << custoTotal << endl;
}

vector<int> LerDestinoDemanda(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo);
    if (!arquivo.is_open()) {
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }

    arquivo >> numVertices;

    vector<int> grafo(numVertices, 0);
    int destino, demanda;
    for (int i = 1; i < numVertices; i++) {
        arquivo >> destino >> demanda;
        grafo[destino] = demanda;
    }
    arquivo.close();
    return grafo;
}

vector<vector<int>> LerRotasPossiveis(const string& nomeArquivo, int& numVertices) {
    ifstream arquivo(nomeArquivo);
    if (!arquivo.is_open()) {
        cerr << "Erro ao abrir o arquivo " << nomeArquivo << endl;
        exit(1);
    }
    arquivo >> numVertices;

    for (int i = 0; i < numVertices-1; i++) {
        int x, y;
        arquivo >> x >> y;
    }

    int numRotas;
    arquivo >> numRotas;

    vector<vector<int>> grafo(numVertices, vector<int>(numVertices, 0));

    int origem, destino, custo;
    while (arquivo >> origem >> destino >> custo) {
        grafo[origem][destino] = custo;
    }
    arquivo.close();
    return grafo;
}

int main(int argc, char* argv[]) {
    MPI_Init(&argc, &argv);

    int rank, size;
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    int numVertices;
    vector<int> demandas;
    vector<vector<int>> distancias;

    if (rank == 0) {
        char* nomeArquivo = argv[1];
        demandas = LerDestinoDemanda(nomeArquivo, numVertices);
        distancias = LerRotasPossiveis(nomeArquivo, numVertices);
    }

    MPI_Bcast(&numVertices, 1, MPI_INT, 0, MPI_COMM_WORLD);

    if (rank != 0) {
        demandas.resize(numVertices);
        distancias.resize(numVertices, vector<int>(numVertices));
    }

    MPI_Bcast(demandas.data(), numVertices, MPI_INT, 0, MPI_COMM_WORLD);

    for (int i = 0; i < numVertices; ++i) {
        MPI_Bcast(distancias[i].data(), numVertices, MPI_INT, 0, MPI_COMM_WORLD);
    }

    int capacidade = 15;
    int maxParadas = 5;

    auto start = high_resolution_clock::now();

    vector<vector<int>> rotas;
    for (int i = 1; i < numVertices; ++i) {
        rotas.push_back({0, i, 0});
    }

    vector<Economia> economias;
    for (int i = 1; i < numVertices; ++i) {
        for (int j = i + 1; j < numVertices; ++j) {
            int valor = distancias[0][i] + distancias[0][j] - distancias[i][j];
            economias.push_back(Economia(i, j, valor));
        }
    }

    int economiasPerProcess = economias.size() / size;
    int remainder = economias.size() % size;
    vector<Economia> localEconomias;

    if (rank == 0) {
        for (int i = 0; i < size; ++i) {
            int startIdx = i * economiasPerProcess + min(i, remainder);
            int endIdx = startIdx + economiasPerProcess + (i < remainder ? 1 : 0);
            if (i == 0) {
                localEconomias.insert(localEconomias.end(), economias.begin() + startIdx, economias.begin() + endIdx);
            } else {
                MPI_Send(economias.data() + startIdx, (endIdx - startIdx) * sizeof(Economia), MPI_BYTE, i, 0, MPI_COMM_WORLD);
            }
        }
    } else {
        int numLocalEconomias;
        MPI_Status status;
        MPI_Probe(0, 0, MPI_COMM_WORLD, &status);
        MPI_Get_count(&status, MPI_BYTE, &numLocalEconomias);
        localEconomias.resize(numLocalEconomias / sizeof(Economia));
        MPI_Recv(localEconomias.data(), numLocalEconomias, MPI_BYTE, 0, 0, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
    }

    sort(localEconomias.begin(), localEconomias.end(), compararEconomias);

    CombinaRotas(localEconomias, rotas, distancias, demandas, maxParadas, capacidade, rank, size);

    if (rank == 0) {
        CalcCustoTotal(rotas, distancias);
    }

    auto end = high_resolution_clock::now();
    cout << "Rank " << rank << " finished" << endl;
    auto duration = duration_cast<milliseconds>(end - start).count();
    if (rank == 0) {
        cout << "Tempo de execu√ß√£o: " << duration << " ms" << endl;
    }

    MPI_Finalize();
    return 0;
}

Overwriting mpiV2.cpp


In [None]:
!mpic++ -g -Wall -o mpiV2 mpiV2.cpp

In [None]:
arquivo = "grafo_100_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 2 ./mpiV2 $arquivo

Custo total: 5796
Rank 1 finished
Rank 0 finished
Tempo de execu√ß√£o: 117 ms


In [None]:
arquivo = "grafo_500_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 2 ./mpiV2 $arquivo

Rank 1 finished
Custo total: 25517
Rank 0 finished
Tempo de execu√ß√£o: 6503 ms


In [None]:
arquivo = "grafo_1000_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 2 ./mpiV2 $arquivo

Rank 1 finished
Custo total: 48742
Rank 0 finished
Tempo de execu√ß√£o: 54629 ms


In [None]:
arquivo = "grafo_100_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 4 ./mpiV2 $arquivo

Rank 1 finished
Rank 2 finished
Rank 3 finished
Custo total: 5685
Rank 0 finished
Tempo de execu√ß√£o: 117 ms


In [None]:
arquivo = "grafo_500_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 4 ./mpiV2 $arquivo

Rank 2 finished
Rank 3 finished
Rank 1 finished
Custo total: 25824
Rank 0 finished
Tempo de execu√ß√£o: 13785 ms


In [None]:
arquivo = "grafo_1000_0.125.txt"
!mpirun --allow-run-as-root --oversubscribe -n 4 ./mpiV2 $arquivo

Rank 1 finished
Rank 2 finished
Rank 3 finished
Custo total: 49661
Rank 0 finished
Tempo de execu√ß√£o: 105807 ms


## Slurm

In [None]:
%%file global_parallel.slurm

#!/bin/bash
#SBATCH --job-name=global_parallel
#SBATCH --nodes=2
#SBATCH --mem=500M
#SBATCH --time=00:02:00
#SBATCH --partition=espec

mpirun ./global_parallel $arquivo

Writing global_parallel.slurm


## Resultados


### Analise com os dados do cluster

#### Dados (obtidos no cluster da disciplina durante a tarde de 03/06/24 e manh√£ de 05/06/24 utilizando o slurm acima)

- Heuristica:

100 n√≥s:
Custo total: 6431
Tempo de execu√ß√£o: 27 ms

500 n√≥s:
Custo total: 26444
Tempo de execu√ß√£o: 2625 ms

1000 n√≥s:
Custo total: 50208
Tempo de execu√ß√£o: 20230 ms

- MPI+Heur√≠stica:

100 n√≥s:
Custo total: 5953
Tempo de execu√ß√£o: 13 ms

500 n√≥s:
Custo total: 25249
Tempo de execu√ß√£o: 1257 ms

1000 n√≥s:
Custo total: 48030
Tempo de execu√ß√£o: 9719 ms


Como √© poss√≠vele visualizar atrav√©s dos dados obtidos, a implementa√ß√£o do MPI resultou em uma melhoria significativa no tempo de execu√ß√£o, sendo poss√≠vel observar uma redu√ß√£o de tempo de execu√ß√£o de at√©, aproximadamente, 50% em rela√ß√£o a execu√ß√£o da heur√≠stica pura.

Apesar disso, √© poss√≠vel observar uma pequena diferen√ßa entre os resultados obtidos, sendo que a execu√ß√£o do MPI resultou em um custo total um pouco menor que a execu√ß√£o da heur√≠stica pura, oque pode ser explicado pela natureza da paraleliza√ß√£o, uma vez que o conjunto de dados √© divido entre as m√°quinas e caso o vetor de dados n√£o seja um n√∫mero divis√≠vel pelo n√∫mero de m√°quinas, pode ocorrer que algumas m√°quinas recebam mais dados que outras, resultando em resultados levemente diferentes.

Al√©m disso, durante a execu√ß√£o do c√≥digo em MPI podem ocorrer pequenas varia√ß√µes nos resultados, devido a ordem de execu√ß√£o de opera√ß√µes matem√°ticas que poem variar de execu√ß√£o para execu√ß√£o, al√©m de problemas de precis√£o decimal, lat√™ncia e problemas durante transmiss√µes de dados, que acumuladas podem resultar em impactos mais significativos nos resultados.


### Analise com os dados do colab

Como √© poss√≠vel observar na se√ß√£o de execu√ß√£o acima, apesar dos melhores esfor√ßos n√£o foi poss√≠vel obter uma melhoria em rela√ß√µa ao tempo de execu√ß√£o ao compararmos a implementa√ß√£o da heur√≠stica pura, com a com adi√ß√£o de MPI, sendo poss√≠vel notar situa√ß√µes onde inclusive ocorreu piora do tempo.

Isso pode ser devido a que no colab a paraleliza√ß√£o esta sendo feita no local, ou seja, em diferentes cores da mesma m√°quina, oque pode resultar em um overhead de comunica√ß√£o maior que o benef√≠cio da paraleliza√ß√£o, uma vez que a comunica√ß√£o entre os processos √© feita de maneira mais lenta que a execu√ß√£o do c√≥digo em si.