# Trabalho prático 2

MST's: implementar os algoritmos de Kruskal e Prim para obtenção de MST's, testando em um grafo ponderado.

- Caio Ueda Sampaio 802215
- Vinícius Matheus Romualdo Santos 801258

## MST

Um dos problemas mais clássicos para algoritmos gulosos é o problema da obtenção da árvore geradora mínima de um grafo ponderado. 

Sabe-se que seja G um grafo não-dirigido com custos nas arestas.  O custo de cada aresta pode ser positivo ou negativo.  O custo de um sub­grafo não-dirigido T de G é a soma dos custos das arestas de T.

Logo, uma árvore geradora mínima de G é qualquer árvore geradora de G que tenha custo mínimo.  Em outras palavras, uma árvore geradora T de G é mínima se nenhuma outra árvore geradora tem custo menor que o de T.  Árvores geradoras mínimas também são conhecidas pela abreviatura MST de minimum spanning tree.

Uma MST tem **(V – 1) arestas**, onde V é o número de vértices no grafo dado. 

Problema da MST:  Dado um grafo não-dirigido com custos nas arestas, encontrar uma árvore geradora mínima do grafo.

É claro que o problema tem solução se e somente se o grafo é conexo.  Outra observação óbvia: se todos as arestas tiverem o mesmo custo então toda árvore geradora é uma MST.


## Caso de teste

Utilizaremos o seguinte grafo G para testar e comparar as MST's encontradas pelos algoritmos de Kruskal e de Prim:

<img src="./graph1.jpg" />

Com os seguintes dicionários para mapear as identificações dos vértices:

In [29]:
numero_vertice = {
  0: 'A',
  1: 'B',
  2: 'C',
  3: 'D',
  4: 'E',
  5: 'F',
  6: 'G',
  7: 'H',
  8: 'I',
}

vertice_numero = {
  'A': 0,
  'B': 1,
  'C': 2,
  'D': 3,
  'E': 4,
  'F': 5,
  'G': 6,
  'H': 7,
  'I': 8,
}

## Kruskal



O algoritmo de Kruskal para encontrar a árvore geradora mínima utiliza a abordagem gulosa. A escolha gulosa decorre em escolher o vértice (o qual não forma ciclo na MST) com menos custo a cada iteração.

Como encontrar a MST usando Kruskal?

Abaixo estão os passos utilizados pelo algoritmo para alcançar o objetivo:

1. Ordene todas as arestas em ordem crescente de peso. 
2. Selecione a aresta de menor peso. Verifique se com a nova aresta forma-se ciclo na MST contruída até o momento. Se não forma ciclo, adicione a aresta na MST. Senão, descarte-a. 
3. Repita o Passo 2 enquanto não houver (V - 1) arestas na MST.

Para alcançarmos a implementação do algoritmo em Python, primeiro utilizaremos a classe `Graph` para reprentar o nosso grafo, com as primitivas: 

- `addEdge` que adiciona uma nova aresta ao grafo;
- `find` que encontra o vértice raíz de um vértice `i`;
- `union` que faz a união de dois conjuntos de vértices com vértices raíz `x` e `y`, respectivamente.

A qual podemos analisar abaixo:

In [30]:
# Estrutura de dados para representar um grafo
class Graph:

  # Função para inicializar o grafo
	def __init__(self, vertices):
		self.V = vertices # número de vértices
		self.graph = []   # lista de arestas

	# função para adicionar uma aresta ao grafo
  # u e v são os vértices e w é o peso da aresta
	def addEdge(self, u, v, w):
		self.graph.append([u, v, w])

	# função para encontrar o nó raíz de um elemento i
  # parent é o vetor que armazena os nós pais
	def find(self, parent, i):
		# Encontra a raiz e faz a compressão de caminho
		if parent[i] != i:
		  # Reatribuição do nó pai ao nó raiz usando
      # compressão de caminho
			parent[i] = self.find(parent, parent[i])
			
		# Se o parent[i] == i, então o nó raiz é o nó pai
		return parent[i]

	# Função que faz a união de dois conjuntos x e y
	def union(self, parent, rank, x, y):

		# Anexa a árvore de classificação menor sob a raiz de
    # árvore de classificação alta (União por classificação)
		if rank[x] < rank[y]:
			parent[x] = y
		elif rank[x] > rank[y]:
			parent[y] = x

    # Se as classificações forem iguais, faremos uma como raiz
    # e incrementamos sua classificação em um
		else:
			parent[y] = x
			rank[x] += 1

Com isso, podemos implementar o algoritmo utilizando a função `KruskalMST` a seguir:

In [31]:
def KruskalMST(graph: Graph):
  print("KruskalMST")
  print("Arestas do grafo:")
  for u, v, weight in graph.graph:
    print("%s -- %s == %d" % (numero_vertice[u], numero_vertice[v], weight))
  print(" ")

  T = [] # Lista de arestas adicionadas na MST
  L = [] # Lista de arestas descartadas

  # Variável de índice, usada para selecionar a próxima aresta
  i = 0

  # Variável de índice, usada para o número de arestas selecionadas
  e = 0

  # Ordena as arestas em ordem crescente de peso
  graph.graph = sorted(graph.graph,
            key=lambda item: item[2])

  print("Arestas ordenadas:")
  for u, v, weight in graph.graph:
    print("%s -- %s == %d" % (numero_vertice[u], numero_vertice[v], weight))
  print(" ")

  parent = [] # Vetor para armazenar os nós pais
  rank = []  # Vetor para armazenar a classificação de cada nó

  # Inicializa os vetores de classificação e pais
  for node in range(graph.V):
    parent.append(node)
    rank.append(0)
  
  # O número de arestas para serem consideradas na MST 
  # é igual ao número de vértices - 1
  while e < graph.V - 1:
    print("--------------------------------------------------")
    print("Iteração %d" % (i+1))
    
    # Seleciona a menor aresta e incrementa o índice
    # para a próxima aresta
    u, v, w = graph.graph[i]
    print("Aresta selecionada: %s -- %s == %d" % (numero_vertice[u], numero_vertice[v], w))

    i = i + 1

    # Encontra os nós raízes dos vértices de
    # duas extremidades da aresta selecionada
    x = graph.find(parent, u)
    y = graph.find(parent, v)

    # Se a aresta selecionada não forma um ciclo
    # inclui a aresta na MST
    if x != y:
      print("Aresta adicionada: %s -- %s == %d" % (numero_vertice[u], numero_vertice[v], w))
      e = e + 1
      T.append([u, v, w])
      graph.union(parent, rank, x, y)
    else:
      # Senão, descarta a aresta
      print("Aresta descartada: %s -- %s == %d" % (numero_vertice[u], numero_vertice[v], w))
      L.append([u, v, w])

    print("------")
    print("Lista de arestas descartadas:")
    for u, v, weight in L:
      print("%s -- %s == %d" % (numero_vertice[u], numero_vertice[v], weight))
    print("Lista de arestas adicionadas na MST:")
    for u, v, weight in T:
      print("%s -- %s == %d" % (numero_vertice[u], numero_vertice[v], weight))

  print("--------------------------------------------------")

  # Imprime o resultado
  minimumCost = 0
  print("Arestas da MST:")
  for u, v, weight in T:
    minimumCost += weight
    print("%s -- %s == %d" % (numero_vertice[u], numero_vertice[v], weight))
    
  print("\nPeso ==", minimumCost)


#### **Executando no grafo G**

In [32]:
A = vertice_numero['A']
B = vertice_numero['B']
C = vertice_numero['C']
D = vertice_numero['D']
E = vertice_numero['E']
F = vertice_numero['F']
G = vertice_numero['G']
H = vertice_numero['H']

if __name__ == '__main__':
	g = Graph(8)
	g.addEdge(A, B, 35)
	g.addEdge(A, F, 36)
	g.addEdge(A, H, 34)
	g.addEdge(B, F, 42)
	g.addEdge(B, E, 65)
	g.addEdge(B, D, 4)
	g.addEdge(C, D, 30)
	g.addEdge(C, G, 21)
	g.addEdge(C, H, 19)
	g.addEdge(D, E, 33)
	g.addEdge(D, G, 16)
	g.addEdge(E, F, 18)
	g.addEdge(E, G, 23)
	g.addEdge(F, G, 22)
	g.addEdge(F, H, 20)
	g.addEdge(G, H, 25)

	KruskalMST(g)

KruskalMST
Arestas do grafo:
A -- B == 35
A -- F == 36
A -- H == 34
B -- F == 42
B -- E == 65
B -- D == 4
C -- D == 30
C -- G == 21
C -- H == 19
D -- E == 33
D -- G == 16
E -- F == 18
E -- G == 23
F -- G == 22
F -- H == 20
G -- H == 25
 
Arestas ordenadas:
B -- D == 4
D -- G == 16
E -- F == 18
C -- H == 19
F -- H == 20
C -- G == 21
F -- G == 22
E -- G == 23
G -- H == 25
C -- D == 30
D -- E == 33
A -- H == 34
A -- B == 35
A -- F == 36
B -- F == 42
B -- E == 65
 
--------------------------------------------------
Iteração 1
Aresta selecionada: B -- D == 4
Aresta adicionada: B -- D == 4
------
Lista de arestas descartadas:
Lista de arestas adicionadas na MST:
B -- D == 4
--------------------------------------------------
Iteração 2
Aresta selecionada: D -- G == 16
Aresta adicionada: D -- G == 16
------
Lista de arestas descartadas:
Lista de arestas adicionadas na MST:
B -- D == 4
D -- G == 16
--------------------------------------------------
Iteração 3
Aresta selecionada: E -- F == 18
Ar

Assim, na saída do algoritmo temos a MST:

<p align="center" >
  <img src="./mst.png" />
<p/>

Com peso 132.

## Prim

Como o algoritmo de Kruskal, Prim é um algoritmo guloso. Esse algoritmo sempre começa com um único nó e move-se percorrendo os diversos nós adjacentes, em ordem de custo para explorar todas as arestas conectadas no caminho.

O algoritmo começa com uma MST vazia. A ideia é manter dois conjuntos de vértices: os vértices já incluídos na MST e os não incluídos ainda. A cada iteração, são consideradas todas as arestas que conectam os dois conjuntos e é selecionada a aresta com menor peso. Depois de selecionar a aresta, move-se a outra extremidade da aresta para o conjunto da MST. 

Na teoria dos grafos, o conjunto de arestas que conectam dois conjuntos de vértices é chamado de corte. Então, a cada iteração do Prim, encontra-se o corte, selecionando a aresta de menor peso do corte, e incluindo-a ao conjunto da MST.

No algoritmo de Prim, nós precisamos de uma fila de prioridades e das operações abaixo para a fila: 

- ExtractMin : de todos os vértices, os quais ainda não foram adicionados no conjunto da MST, nós precisamos pegar o vértice com valor de chave menor.
- DecreaseKey : Depois de extrair o vértice nós precisamos atualizar as chaves dos vértices adjacentes, e se a nova chave for menor, então atualiza-se ela.

O passos principais são:

1. Inicialize as chaves de todos os vértices como infinito e o pai de todos os vértices como -1.

2. Crie uma fila de prioridade _priority_queue_ vazia.  Todo item na _priority_queue_ é um par (peso, vértice). O peso é usado como primeiro item do par pois é, por padrão, a comparação entre dois pares.

3. Inicialize todos os vértices como não participantes da MST.
   Nós usamos um array booleano `added` para indicar quais vértices estão, ou não, na MST. É necessário este vértice pois o valor da chave pode diminuir durante as iterações.

4. Insira o vértice inicial na _priority_queue_ e inicialize sua chave como 0.

5. Enquanto a _priority_queue_ não está vazia.

    a. Extraia o vértice com o menor valor de chave da fila. 
       Faça o vértice extraído ser `u`.

    b. Inclua `u` na MST usando `added[u] = True`.

    c. Itere sobre todos os vértices adjacentes de `u` e faça o seguinte para cada vértice.
      
      if added[adjnode] == False :
        priority_queue[Node(adjnode)] = adjcost
               
6. Imprima o resultado utilizando a lista de vértices na MST.

Para implementarmos este algoritmo, utilizamos duas classes:

- `Node`: classe que representa um vértice do grafo.
- `Graph`: classe que reprenta o grafo ponderado.

In [33]:
from typing import List, Dict # Para tipos

# Classe para representar um vértice
class Node :
  def __init__(self, arg_id) :
    self._id = arg_id

# Estrutura de dados para representar um grafo não direcionado 
# com pesos nas arestas utilizando lista de adjacência
class Graph :

  def __init__(self, source : int, adj_list : Dict[int, List[int]]):
    self.source = source
    self.adjlist = adj_list

Com isso, chegamos na função `PrimsMST`:

In [34]:
def PrimsMST (graph: Graph) -> int:

  # A fila de prioridade é um dicionário com a chave como um objeto da classe 'Node' e o valor como o custo de
  # alcançar o nó a partir da raiz.
  # Como a fila de prioridade pode ter várias entradas para o
  # mesmo nó adjacente (com diferentes pesos), temos que usar os objetos como
  # chaves para que eles possam ser armazenados em um dicionário.
  # [Como o dicionário não pode ter chaves duplicadas, então objectificamos a chave]

  # A distância do nó fonte de si mesmo é 0. Adicionamos o nó fonte como o primeiro nó
  # na fila de prioridade
  priority_queue = { Node(graph.source) : 0 } # Fila de prioridade
  added = [False] * len(graph.adjlist) # Vetor para armazenar os nós que foram adicionados à árvore geradora mínima
  min_span_tree_cost = 0 # Custo da árvore geradora mínima
  i = 0 # Contador de iterações
  T = [] # Lista de arestas da árvore geradora mínima
  lastNode = graph.source # Último nó adicionado à árvore geradora mínima

  # Enquanto a fila de prioridade não estiver vazia
  while priority_queue :
    print("------------------------------------")
    print("Iteração : " + str(i+1) + "\n")

    # Escolhe o nó com menor custo
    node = min(priority_queue, key=priority_queue.get)
    
    print("Nó selecionado: \"" + numero_vertice[node._id] + "\"")

    cost = priority_queue[node]

    # Remove o nó da fila de prioridade
    del priority_queue[node]

    # Se o nó não foi adicionado ainda, adicione-o à árvore geradora mínima
    if added[node._id] == False :
      print("Custo : " + str(cost) + "\n")
      T.append([node._id, lastNode, cost])
      lastNode = node._id
      min_span_tree_cost += cost
      added[node._id] = True
      print("Nó adicionado: \"" + numero_vertice[node._id] + "\", custo atual: "+str(min_span_tree_cost) + "\n")

      print("Adicionando nós adjacentes ao nó selecionado: \"" + numero_vertice[node._id] + "\" à fila de prioridade")
      for item in graph.adjlist[node._id] :
        adjnode = item[0]
        adjcost = item[1]
        if added[adjnode] == False :
          priority_queue[Node(adjnode)] = adjcost
          print(" Nó: \"" + numero_vertice[adjnode] + "\", custo: " + str(adjcost))
      
      print("\nFila de prioridade: ")
      for item in priority_queue :
        print(" Nó: \"" + numero_vertice[item._id] + "\", custo: " + str(priority_queue[item]))

    i += 1

  print("------------------------------------")
  print("\nÁrvore geradora mínima: ")
  for item in T :
    print(" Nó: \"" + numero_vertice[item[0]] + "\", custo: " + str(item[2]))
    
  return min_span_tree_cost

#### **Executando em G**

Começando pelo vértice C:

In [35]:
def main():
   
  A = vertice_numero['A']
  B = vertice_numero['B']
  C = vertice_numero['C']
  D = vertice_numero['D']
  E = vertice_numero['E']
  F = vertice_numero['F']
  G = vertice_numero['G']
  H = vertice_numero['H']

  arestas_do_vertice = {}

  # Lista de adjacência : [(vertice, peso), ...]
  arestas_do_vertice[A] = [ (B,35),(F,36),(H,34) ]
  arestas_do_vertice[B] = [ (A,35), (D,4),(F,42),(E,65) ]
  arestas_do_vertice[C] = [ (D,30),(G,21),(H,19) ]
  arestas_do_vertice[D] = [ (C,30),(G,16),(B,4),(E,33) ]
  arestas_do_vertice[E] = [ (D,33),(B,65),(F,18),(G,23) ]
  arestas_do_vertice[F] = [ (A,36),(B,42),(E,18),(H,20), (G,22) ]
  arestas_do_vertice[G] = [ (C,21),(D,16),(E,23),(F,22),(H,25) ]
  arestas_do_vertice[H] = [ (A,34),(C,19),(F,20),(G,25) ]

  g1 = Graph(C, arestas_do_vertice)
  cost = PrimsMST(g1)
  print("Peso: " + str(cost) +"\n")

if __name__ == "__main__" :
    main()

------------------------------------
Iteração : 1

Nó selecionado: "C"
Custo : 0

Nó adicionado: "C", custo atual: 0

Adicionando nós adjacentes ao nó selecionado: "C" à fila de prioridade
 Nó: "D", custo: 30
 Nó: "G", custo: 21
 Nó: "H", custo: 19

Fila de prioridade: 
 Nó: "D", custo: 30
 Nó: "G", custo: 21
 Nó: "H", custo: 19
------------------------------------
Iteração : 2

Nó selecionado: "H"
Custo : 19

Nó adicionado: "H", custo atual: 19

Adicionando nós adjacentes ao nó selecionado: "H" à fila de prioridade
 Nó: "A", custo: 34
 Nó: "F", custo: 20
 Nó: "G", custo: 25

Fila de prioridade: 
 Nó: "D", custo: 30
 Nó: "G", custo: 21
 Nó: "A", custo: 34
 Nó: "F", custo: 20
 Nó: "G", custo: 25
------------------------------------
Iteração : 3

Nó selecionado: "F"
Custo : 20

Nó adicionado: "F", custo atual: 39

Adicionando nós adjacentes ao nó selecionado: "F" à fila de prioridade
 Nó: "A", custo: 36
 Nó: "B", custo: 42
 Nó: "E", custo: 18
 Nó: "G", custo: 22

Fila de prioridade: 
 Nó

Assim, na saída do algoritmo temos a MST:

<p align="center" >
  <img src="./mst.png" />
<p/>

Com peso 132.