## 11. 가중치 그래프

### 가중치 그래프란?
- :간선에 비용이나 가중치가 할당된 그래프( G = (V, E, w))
 - 정점 사이의 연결 정보뿐만 아니라 필요한 비용을 함께 표현할 수 있음
- 비용 또는 길이: 간선 e의 강도(w(e))
- 경로의 길이(또는 강도): 경로상의 모든 간선의 길이 합

### 가중치 그래프의 표현
- 가중치 그래프도 인접행렬과 인접리스트를 이용해 표현할 수 있음
 - 인접 행렬은 파이썬에서 리스트를 요소로 갖는 리스트로 표현하면 됨
 - 정점 리스트와 인접 행렬을 튜플로 묶어 전체 그래프를 하나의 객체로 관리할 수도 있음
- 인접 행렬 표현에서 대각선 성분에 유의
 - 대각선 성분: 어떤 정점에서 자신을 돌아오는 자체 간선에 해당하는 요소
- 인접 행렬에서의 가중치의 합 계산
- 인접 행렬에서의 모든 간선 출력

#### 인접 리스트를 이용한 표현
- 각 정점의 인접 리스트에 정점만이 아니라 가중치를 추가로 저장해야 하기 때문에 가중치 그래프를 인접리스트로 표현하는 것은 약간 더 복잡함
- 정점과 가중치는 (정점, 가중치)의 형태로 튜플로 표현하는 것이 좋음
 - 딕셔너리 엔트리의 키(key)는 정점 데이터, 값(value)은 간선의 집합이 된다
 - 간선의 집합은 (인접 정점, 가중치)의 튜플을 원소로 갖는다
- 인접 리스트에서의 가중치의 합 계산과 간선 출력

In [1]:
vertex =   ['A',    'B',    'C',    'D',    'E',    'F',    'G' ]
weight = [ [None,	29,		None,	None,	None,   10,		None],
           [29,	None,	16,		None,	None,	None,	15  ],
           [None,	16,		None,	12,		None,	None,	None],
           [None,	None,   12,		None,	22,		None,	18  ],
           [None,	None,	None,   22,		None,	27,		25  ],
           [10,	None,	None,	None,   27,		None,	None],
           [None,  15,		None,   18,		25,		None,	None]]    
graph = (vertex, weight)

In [2]:
def weightSum( vlist, W ):
    sum = 0
    for i in range(len(vlist)) :
        for j in range(i+1, len(vlist)):
            if W[i][j] != None :
                sum += W[i][j]
    return sum

print('AM : weight sum = ', weightSum(vertex, weight))

AM : weight sum =  174


In [3]:
def printAllEdges(vlist, W ):        
    for i in range(len(vlist)) :
        for j in range(i+1, len(W[i])) :  
            if W[i][j] != None and W[i][j] != 0 :
                print("(%s,%s,%d)"%(vlist[i],vlist[j],W[i][j]), end=' ')
    print()

printAllEdges(vertex, weight)

(A,B,29) (A,F,10) (B,C,16) (B,G,15) (C,D,12) (D,E,22) (D,G,18) (E,F,27) (E,G,25) 


In [5]:
# 딕셔너리와 집합, 튜플, 리스트를 모두 이용한 그래프 표현
graphAL ={'A' : set([('B',29),('F',10)          ]),
        'B' : set([('A',29),('C',16), ('G',15)]),
        'C' : set([('B',16),('D',12)          ]),
        'D' : set([('C',12),('E',22), ('G',18)]),
        'E' : set([('D',22),('F',27), ('G',25)]),
        'F' : set([('A',10),('E',27)          ]),
        'G' : set([('B',15),('D',18), ('E',25)]) }

In [6]:
# 가중치의 총 합을 구하는 함수
def weightSum(graph):
    sum = 0
    for v in graph:             
        for e in graph[v]:      
            sum += e[1]
    return sum//2

In [7]:
# 모든 간선을 출력하는 함수
def printAllEdges(graph):
    for v in graph:             
        for e in graph[v]:      
            print("(%s,%s,%d)"%(v,e[0],e[1]), end=' ')

print('AL : weight sum = ', weightSum(graphAL))
printAllEdges(graphAL)

AL : weight sum =  174
(A,B,29) (A,F,10) (B,C,16) (B,A,29) (B,G,15) (C,B,16) (C,D,12) (D,G,18) (D,E,22) (D,C,12) (E,G,25) (E,D,22) (E,F,27) (F,A,10) (F,E,27) (G,E,25) (G,D,18) (G,B,15) 

### 최소 비용 신장 트리
- 통신망, 도로망, 유통망 등은 대개 길이, 구축비용, 전송 시간 등의 가중치를 산선에 할당한 가중치 그래프로 표현 가능
- 최소비용 신장 트리 MST: 그래프의 여러 가능한 신장 트리들 중에서 사용된 간선들의 가중치 합이 최소인 신장 트리
 - 그래프의 모든 정점들은 연결되어야 한다
 - 연결에 필요한 간선의 가중치 합(비용)이 최소가 되어야 한다
 - 사이클은 두 정점을 연결하는 두 가지 경로를 제공하므로 비용 측면에서 바람직하지 않다. 따라서 사이클 없이 (n - 1)개의 간선만을 사용해야 한다
- 최소비용 신장트리를 구하는 방법에는 Kruskal과 Prim의 알고리즘이 존재

#### Kruskal의 MST 알고리즘
- Kruskal의 알고리즘은 탐욕적인 방법이라는 알고리즘 설계에서 중요한 기법 중의 하나를 사용
 - 어떤 결정을 해야할 때마다 "그 순간에 최적"이라고 생각되는 것을 선택하는 방법
 - 순간에 최적이라고 판단했던 선택을 모아 최종적인 답을 만들었을 때 이것이 "궁극적으로 최적"이라는 보장이 없기 때문에 탐욕적인 방법은 항상 최적의 해답을 주는지를 반드시 검증해야 함
- Kruskal 알고리즘은 각 단계에서 사이클을 이루지 않는 최소 비용 간선을 선택하며 이러한 과정을 반복하여 그래프의 모든 정점을 최소비용으로 연결하는 최적 해답을 구함
- Union-Find
 - 서로소인 집합들을 표현할 때 사용하는 독특한 형태의 집합 자료구조
 - 추가하고자 하는 간선 (u,v)의 양끝 정점 u와 v가 같은 집합에 속해있는지를 검사하는데 사용
- union과 find 연산
 - union(x, y): 원소 x와 y가 속해있는 집합을 입력으로 받아 이들의 합집합을 만드는 연산
 - find(x): 여러 집합들 중에서 원소 x가 속해있는 집합을 반환하는 연산
- 집합을 구현하는 데는 비트 벡터, 배열, 연결 리스트 등 여러 가지 방법을 사용할 수 있지만, 가장 효율적인 방법은 트리
- Kruskal 알고리즘의 구현
 - kruskal 알고리즘의 시간 복잡도는 간선들을 정렬하는 시간에 좌우됨
 - 퀵 정렬이나 최소 힙과 같은 효율적인 정렬 알고리즘을 사용하다면 Kruskal의 알고리즘의 시간 복잡도는 (elog2e)(e: 간선의 개수)

#### Prim의 MST 알고리즘
- :하나의 정점에서부터 시작하여 트리를 단계적으로 확장해나가는 방법
 - 처음에는 시작 정점만이 트리에 포함되고, 다음으로 현재까지 만들어진 트리에 인접한 정점들 중에서 간선의 가중치가 가장 작은 정점을 선택하여 트리를 확장하며, 이 과정이 트리가 n - 1개의 간선을 가질 때까지 계속됨
- Kruskal의 알고리즘은 간선을 기반으로 하는데 비해 Prim의 알고리즘은 정점을 기반으로 함
- Prim 알고리즘의 구현
 - Prim의 알고리즘은 간단하지만 구현을 위해서는 현재의 MST에 인접한 정점들 중에서 가장 가까운(간선의 가중치가 작은) 정점을 찾는 과정을 처리해야 함(dist라는 배열 사용)
 - Prim의 알고리즘은 주 반복문이 정점의 수 n만큼 반복하고, 내부 반복문이 n번 반복하므로 O(n^2)의 시간 복잡도를 가짐
 - Kruskal의 알고림즘은 복잡도가 (elog2e)이므로 정점의 개수에 비해 간선의 개수가 매우 적은 희박한 그래프를 대상으로 할 경우에는 Kruskal 알고라즘이 적합하고, 반대로 완전 그래프와 같이 간선이 매우 많은 그래프의 경우에는 Prim의 알고리즘이 유리

In [9]:
parent = []     
set_size = 0    

#집합의 초기화 함수
def init_set(nSets) : 
    global set_size, parent 
    set_size = nSets;
    for i in range(nSets):
        parent.append(-1)

# 정점 id가 속한 집합의 대표번호 탐색
def find(id) :
    while (parent[id] >= 0) :
        id = parent[id]
    return id;

# 두 집합을 병합(s1을 s2에 병합시킴)
def union(s1, s2) :
    global set_size
    parent[s1] = s2
    set_size = set_size - 1

In [10]:
# kruskal의 최소 비용 신장 트리 프로그램
def MSTKruskal(vertex, adj):
    vsize = len(vertex)             
    init_set(vsize)                 
    eList = []                      

    for i in range(vsize-1) :       
        for j in range(i+1, vsize) :
            if adj[i][j] != None :
                eList.append( (i,j,adj[i][j]) )
    
    # 간선 리스트를 가중치의 내림차순으로 정렬: 람다 함수 사용
    eList.sort(key= lambda e : e[2], reverse=True)

    edgeAccepted = 0
    while (edgeAccepted < vsize - 1) :
        e = eList.pop(-1)       
        uset = find(e[0])      
        vset = find(e[1])

        if uset != vset :       
            print("간선 추가 : (%s, %s, %d)" %
                (vertex[e[0]], vertex[e[1]], e[2]))
            union(uset, vset)   
            edgeAccepted += 1   

In [11]:
vertex =   ['A',    'B',    'C',    'D',    'E',    'F',    'G' ]
weight = [ [None,	29,		None,	None,	None,   10,		None],
           [29,	None,	16,		None,	None,	None,	15  ],
           [None,	16,		None,	12,		None,	None,	None],
           [None,	None,   12,		None,	22,		None,	18  ],
           [None,	None,	None,   22,		None,	27,		25  ],
           [10,	None,	None,	None,   27,		None,	None],
           [None,  15,		None,   18,		25,		None,	None]]    

print("MST By Kruskal's Algorithm")
MSTKruskal(vertex, weight)

MST By Kruskal's Algorithm
간선 추가 : (A, F, 10)
간선 추가 : (C, D, 12)
간선 추가 : (B, G, 15)
간선 추가 : (B, C, 16)
간선 추가 : (D, E, 22)
간선 추가 : (E, F, 27)


In [12]:
INF = 9999

# 현재 트리에 인접한 정점들 중에서 가장 가까운 정점을 찾는 함수
def getMinVertex(dist, selected) :
    minv = 0
    mindist = INF
    for v in range(len(dist)) :
        if not selected[v] and dist[v]<mindist :
            mindist = dist[v]
            minv = v
    return minv

In [13]:
# Prim의 최소 비용 신장 트리 프로그램
def MSTPrim(vertex, adj) :
    vsize = len(vertex)
    dist = [INF] * vsize
    selected = [False] * vsize
    dist[0] = 0    

    for i in range(vsize) :
        u = getMinVertex(dist, selected)
        selected[u] = True
        print(vertex[u], end=' ')

        for v in range(vsize) :
            if (adj[u][v] != None):
                if selected[v]==False and adj[u][v]< dist[v] :
                    dist[v] = adj[u][v]
    print()

print("MST By Prim's Algorithm")
MSTPrim(vertex, weight)

MST By Prim's Algorithm
A F E D C B G 


### 최단 경로
- :가중치 그래프에서 두 정점을 연결하는 여러 경로들 중에서 간선들의 가중치 합이 최소가 되는 경로
- 최단 경로 문제는 어떤 정점 u에서 다른 정점 v로 가는 여러 경로들 중에서 전체 이동거리가 최소가 되는 경로를 찾는 것
- 가중치 그래프에서 정점들 사이의 최단 경로를 구하는 방법에는 Dijkstra와 Floyd의 알고리즘이 존재
 - Dijkstra 알고리즘은 하나의 시작 정점에서 다른 모든 정점까지의 최단 경로를 구함
 - Floyd 알고리즘은 모든 정점에서 다른 모든 정점까지의 최단 경로를 한꺼번에 구할 수 있음
- 간선의 가중치는 반드시 양수이며 음수는 허용하지 않는 것에 주의

#### Dijkstra의 최단 경로 알고리즘
- :하나의 시작 정점 v에서 다른 모든 정점까지의 최단 경로를 찾는 알고리즘
 - 시작 정점 v: 최단경로탐색의 시작 정점
 - 집합 S: 시작 정점 v로부터의 최단경로가 이미 발견된 정점들의 집합
 - dist 배열: S에 있는 정점만을 거쳐서 다른 정점으로 가는 최단거리를 기록하는 배열(Prim의 MST알고리즘에서와 유사. dist[v] = 0(시작 정점))
- 알고리즘 증명
- 알고리즘 진행 예
- Dijkstra 알고리즘의 구현
 - 알고리즘을 구현하기 위해서는 세 가지 배열(리스트)이 필요(dist[], found[], path[])4
 - Dijkstra 알고리즘은 시작정점에서부터 다른 모든 정점까지의 최단 경로의 거리 정보를 제공
 - 그래프에 n개의 정점이 있다면, 최단 경로 알고리즘은 주 반복문을 n번 반복하고 내부 반복문을 2n번 반복하므로 O(n^2)의 시간 복잡도를 가짐
 
#### Floyd의 최단 경로 알고리즘
- 그래프의 모든 정ㅈ머들 사이의 최단 경로를 구하려고 한다면 Dijkstra 알고리즘을 정점의 수만큼 반복하여 실행하면 되지만 더 간단한 방법도 존재
- Floyd 알고리즘은 행렬 A를 이용하여 3중 반복을 하는 루프로 구성됨
- Floyd 알고리즘의 구현
 - Dijkstra의 알고리즘의 경우 하나의 정점에서 출발하여 모든 정점까지의 최단 경로를 찾는데 O(n^2)의 시간이 걸리기 때문에, 모든 정점에서 출발한다면 알고리즘을 n번 반복해야 하므로 전체 시간복잡도는 O(n^3)
 - Floyd의 알고리즘은 한 번에 모든 정점의 최단 경로를 구하고, 3중 반복문을 사용하여 시간 복잡도는 O(n^3)가 됨
 - Dijkstra 알고리즘과의 차이는 없지만 Floyd의 알고리즘은 매우 간결한 반복 구문을 사용한다는 특징이 존재

In [5]:
INF = 9999

# 최소 dist 정점을 찾는 함수
def choose_vertex(dist, found) :
    min = INF
    minpos = -1
    for i in range(len(dist)) :
        if dist[i]<min and found[i]==False:
            min = dist[i]
            minpos = i
    return minpos;

In [6]:
def shortest_path_dijkstra(vtx, adj, start) :
    vsize = len(vtx)
    dist = list(adj[start])
    path = [start] * vsize
    found= [False] * vsize
    found[start] = True
    dist[start] = 0

    for i in range(vsize) :
        print("Step%2d: "%(i+1), dist)  
        u = choose_vertex(dist, found)
        found[u] = True

        for w in range(vsize) :
            if not found[w] :
                if dist[u] + adj[u][w] < dist[w] :
                    dist[w] = dist[u] + adj[u][w]
                    path[w] = u

    return path            

In [10]:
vertex =   ['A',    'B',    'C',    'D',    'E',    'S']
weight = [ [INF, INF, INF, INF, 9, 14 ],
           [INF, INF, 10, 15, INF, 7 ],
           [INF, 10, INF, 11, INF, 9],
           [INF, 15, 11, INF, 6, INF ],
           [9, INF, INF, 6, INF,INF ],
           [14, 7, 9, INF, INF, INF] ]    

print("Shortest Path By Dijkstra Algorithm")
start = 5
path = shortest_path_dijkstra(vertex, weight, start)

# 최종 경로를 출력하기 위한 코드
for end in range(len(vertex)) :
    if end != start :
        print("[최단경로: %s->%s] %s" %
                (vertex[start], vertex[end], vertex[end]), end='')
        while (path[end] != start) :
            print(" <- %s" % vertex[path[end]], end='')
            end = path[end]
        print(" <- %s" % vertex[path[end]])

Shortest Path By Dijkstra Algorithm
Step 1:  [14, 7, 9, 9999, 9999, 0]
Step 2:  [14, 7, 9, 22, 9999, 0]
Step 3:  [14, 7, 9, 20, 9999, 0]
Step 4:  [14, 7, 9, 20, 23, 0]
Step 5:  [14, 7, 9, 20, 23, 0]
Step 6:  [14, 7, 9, 20, 23, 0]
[최단경로: S->A] A <- S
[최단경로: S->B] B <- S
[최단경로: S->C] C <- S
[최단경로: S->D] D <- C <- S
[최단경로: S->E] E <- A <- S


In [17]:
INF = 9999

# 현재의 A 행렬을 화면에 출력하는 함수
def printA(A):
    vsize = len(A)
    print("====================================")
    for i in range(vsize) :
        for j in range(vsize) :
            if (A[i][j] == INF) : print(" INF ", end='')
            else : print("%4d "%A[i][j], end='')
        print("");

# Floyd의 최단경로탐색 함수
def shortest_path_floyd(vertex, adj) :
    vsize = len(vertex)       
    A = list(adj)
    for i in range(vsize) :   
        A[i] = list(adj[i])

    for k in range(vsize) :
        for i in range(vsize) :
            for j in range(vsize) :
                if (A[i][k] + A[k][j] < A[i][j]) :
                    A[i][j] = A[i][k] + A[k][j]
        printA(A)

print("Shortest Path By Floyd Algorithm")
start = 0
path = shortest_path_floyd(vertex, weight)

Shortest Path By Floyd Algorithm
   0    7  INF  INF    3   10  INF 
   7    0    4   10    2    6  INF 
 INF    4    0    2  INF  INF  INF 
 INF   10    2    0   11    9    4 
   3    2  INF   11    0   13    5 
  10    6  INF    9   13    0  INF 
 INF  INF  INF    4    5  INF    0 
   0    7   11   17    3   10  INF 
   7    0    4   10    2    6  INF 
  11    4    0    2    6   10  INF 
  17   10    2    0   11    9    4 
   3    2    6   11    0    8    5 
  10    6   10    9    8    0  INF 
 INF  INF  INF    4    5  INF    0 
   0    7   11   13    3   10  INF 
   7    0    4    6    2    6  INF 
  11    4    0    2    6   10  INF 
  13    6    2    0    8    9    4 
   3    2    6    8    0    8    5 
  10    6   10    9    8    0  INF 
 INF  INF  INF    4    5  INF    0 
   0    7   11   13    3   10   17 
   7    0    4    6    2    6   10 
  11    4    0    2    6   10    6 
  13    6    2    0    8    9    4 
   3    2    6    8    0    8    5 
  10    6   10    9    8    0  