# Graph(그래프)

* 그래프는 정점(Vertex)와 간선(Edge)의 집합이다.
* 그래프는 방향그래프와 무방향그래프가 있다
* 그래프에서 노드를 탐색하는 것은 그래프에 포함된 모든 노드를 구하거나 사이클이 존재하는 부분을 찾는 것이다.
* 그래프 자료구조
 * 인접행렬과 인접리스트로 저장할 수 있다.
 <center><img src="https://drive.google.com/uc?id=1RJEly9Y3q-2_zA5sv1J350Klxtuo9xZx" width="300" height="200" ></center>    

    <center><img src="https://drive.google.com/uc?id=1z5083BntshMqrc5UAgfN_SrXHY-JLlh4" width="600" height="200" ></center>

## DFS(Depth First Search : 깊이 우선 탐색)

* DFS는 출발선에서 출발하여 미로를 탐색하듯이 끝까지 가보고 막히면 왔던 곳을 되돌아 오면서 다른 방향을 모색하는 방법이다.
* Stack과 visit 리스트를 이용한다

In [1]:
class Stack:
    def __init__(self):
        self.s = []

    def push(self, item):
        self.s.append(item)

    def pop(self):
        if self.isEmpty() == False:
            return self.s.pop(-1)
        else:
            return None

    def peek(self):
        if self.isEmpty() == False:
            return self.s[-1]
        else:
            return None

    def isEmpty(self):
        if len(self.s) > 0:
            return False
        else:
            return True

    def size(self):
        return len(self.s)

    def print(self):
        print(self.s)

In [5]:
class Graph:
    def __init__(self, graph):
        self.graph = graph
        
    def dfs(self, start):
        keys = list(self.graph.keys())
        if start not in keys:
            print("key error!")
        else:
            s = Stack()
            visit = []
            s.push(start)
            while s.isEmpty() == False:
                curnode = s.pop()
                if curnode not in visit:
                    for item in set(self.graph[curnode]) - set(visit):
                        s.push(item)
                        print(curnode, end = " ")
                        s.print()
                    visit.append(curnode)
                else:
                    print(curnode, "에 cyle이 존재합니다.")
            return visit
g1 = {}
g1['A'] = ['B','C']
g1['B'] = ['A','D','E']
g1['C'] = ['A','E']
g1['D'] = ['B','G']
g1['E'] = ['B','C','G']
g1['F'] = ['G']
g1['G'] = ['D','E','F']

dfs = Graph(g1)
print(dfs.dfs('A'))       

A ['C']
A ['C', 'B']
B ['C', 'D']
B ['C', 'D', 'E']
E ['C', 'D', 'G']
E ['C', 'D', 'G', 'C']
G ['C', 'D', 'D']
G ['C', 'D', 'D', 'F']
D 에 cyle이 존재합니다.
C 에 cyle이 존재합니다.
['A', 'B', 'E', 'C', 'G', 'F', 'D']


In [6]:
g2 = {}
g2[0] = [1,2]
g2[1] = [0,3]
g2[2] = [0,4,5]
g2[3] = [1]
g2[4] = [2,5,6]
g2[5] = [2,4]
g2[6] = [4]

dfs = Graph(g2)
print(dfs.dfs(0))

0 [1]
0 [1, 2]
2 [1, 4]
2 [1, 4, 5]
5 [1, 4, 4]
4 [1, 4, 6]
4 에 cyle이 존재합니다.
1 [3]
[0, 2, 5, 4, 6, 1, 3]


## BFS(Breadth First Search : 너비 우선 탐색)
* BFS는 시작위치에서 가장 가까운 이웃노드를 다 돌아보고 더 이상 갈 곳이 없으면 방문한 곳에 연결된 노드를 방문하는 방식이다.
* BFS 알고리즘은 Queue와 visit리스트를 사용한다.
* BFS는 가까운 곳을 먼저 방문하기 때문에 최소경로를 찾을 수 있다.

In [7]:
class Queue:
    def __init__(self):
        self.q = []

    def enQueue(self, item):
        self.q.append(item)

    def deQueue(self):
        if self.isEmpty() == False:
            return self.q.pop(0)

    def size(self):
        return len(self.q)

    def isEmpty(self):
        if len(self.q) > 0:
            return False
        else:
            return True

    def peek(self):
        if self.isEmpty() == False:
            return self.q[0]

    def delete(self, item):
        if item in self.q:
            self.q.remove(item)
        else:
            print("해당 아이템이 존재하지 않습니다.")

In [14]:
class Graph:
    def __init__(self, graph):
        self.graph = graph
        
    def dfs(self, start):
        keys = list(self.graph.keys())
        if start not in keys:
            print("key error!")
        else:
            s = Stack()
            visit = []
            s.push(start)
            while s.isEmpty() == False:
                curnode = s.pop()
                if curnode not in visit:
                    for item in set(self.graph[curnode]) - set(visit):
                        s.push(item)
                    visit.append(curnode)
                else:
                    print(curnode, "에 cyle이 존재합니다.")
            return visit
        
    def bfs(self, start):
        keys = list(self.graph.keys())
        if start not in keys:
            print("key error!")
        else:
            q = Queue()
            visit = [start]
            for item in self.graph[start]:
                q.enQueue(item)
            while q.isEmpty() == False:
                curnode = q.deQueue()
                if curnode not in visit:
                    for item in set(self.graph[curnode]) - set(visit):
                        q.enQueue(item)
                    visit.append(curnode)
                else:
                    print(curnode, "에 cycle이 존재합니다.")
        return visit

bfs = Graph(g1)
print(bfs.bfs('A'))

E 에 cycle이 존재합니다.
G 에 cycle이 존재합니다.
['A', 'B', 'C', 'D', 'E', 'G', 'F']


## 연결성분 찾기

* 연결성분은 그래프에서 연결된 집합을 구하는 것이다.
* 그래프에서 임의 키를 선정하여 DFS를 수행하여 구한 경로를 하나의 집합으로 묶는다. 이후, 묶인 키를 키 집합에서 제외한 후 남은 키 집합에서 더 이상 남은 키가 없을 때까지 위의 과정을 반복한다.
<center><img src="https://drive.google.com/uc?id=1YfjZH4LJNc30GqhD4DhFBRMl8NJKbYYs" width="300" height="200" ></center>


In [15]:
g = {}
g[0] = [3]
g[1] = [6,10]
g[2] = [7,11]
g[3] = [0,6,8]
g[4] = [13]
g[5] = [14]
g[6] = [1,3,8,10,11]
g[7] = [2,11]
g[8] = [3,6,10,12]
g[9] = [13]
g[10] = [1,6,8]
g[11] = [2,6,7]
g[12] = [8]
g[13] = [4,9]
g[14] = [5]

def ConCom(g):
    keylist = list(g.keys())
    graph = Graph(g)
    cons = []
    while len(keylist) != 0:
        con = graph.dfs(keylist[0])
        cons.append(con)
        keylist = list(set(keylist)-set(con))
    return cons
ConCom(g)

2 에 cyle이 존재합니다.
1 에 cyle이 존재합니다.
8 에 cyle이 존재합니다.
8 에 cyle이 존재합니다.


[[0, 3, 6, 11, 7, 2, 10, 1, 8, 12], [4, 13, 9], [5, 14]]

## 위상정렬

* 시작지점부터 방향에 따라 이동하면서 방문처리한다.
* 끝노드를 만나면 끝노드부터 리스트에 기록한다.
* 갔던 방향 외 다른 방향이 있다면 다른 방향으로 이동한다.
* 방문한 노드가 이미 방문한 노드일 시 그 직전의 노드가 끝노드가 되어 리스트에 기록된다.
* 마지막으로 시작지점이 리스트에 기록된 후, 리스트를 거꾸로 뒤집어 리턴한다.

In [24]:
class Graph:
    def __init__(self, graph):
        self.graph = graph
        
    def dfs(self, start):
        keys = list(self.graph.keys())
        if start not in keys:
            print("key error!")
        else:
            s = Stack()
            visit = []
            s.push(start)
            while s.isEmpty() == False:
                curnode = s.pop()
                if curnode not in visit:
                    for item in set(self.graph[curnode]) - set(visit):
                        s.push(item)
                    visit.append(curnode)
                else:
                    print(curnode, "에 cyle이 존재합니다.")
            return visit
        
    def bfs(self, start):
        keys = list(self.graph.keys())
        if start not in keys:
            print("key error!")
        else:
            q = Queue()
            visit = [start]
            for item in self.graph[start]:
                q.enQueue(item)
            while q.isEmpty() == False:
                curnode = q.deQueue()
                if curnode not in visit:
                    for item in set(self.graph[curnode]) - set(visit):
                        q.enQueue(item)
                    visit.append(curnode)
                else:
                    print(curnode, "에 cycle이 존재합니다.")
        return visit
    
    def topology(self, start):
        keys = list(self.graph.keys())
        self.visited = dict.fromkeys(keys, False)
        self.path = []
        for node in keys:
            if self.visited[node] == False:
                self.visit(node)
        return self.path[::-1]
    
    def visit(self, node):
        self.visited[node] = True
        for item in self.graph[node]:
            if not self.visited[item]:
                self.visit(item)
        self.path.append(node)
        

g = {}
g['파이썬'] = ['자료구조','컴퓨터입문']
g['자료구조'] = ['운영체제','알고리즘']
g['컴퓨터입문'] = ['자료구조']
g['운영체제'] = ['인공지능']
g ['인공지능'] = ['알고리즘','데이터마이닝']
g ['알고리즘'] = ['데이터베이스']
g ['데이터베이스'] = ['데이터마이닝']
g ['데이터마이닝'] = ['SW프로젝트']
g ['SW프로젝트'] = []

path = Graph(g)
print(path.topology('파이썬'))

['파이썬', '컴퓨터입문', '자료구조', '운영체제', '인공지능', '알고리즘', '데이터베이스', '데이터마이닝', 'SW프로젝트']


## 최소비용신장트리

* 간선에 가중치가 존재하는 가중치 그래프에서 가중치의 합이 최소화되도록 구성한 트리를 말한다.
* 최소비용신장트리는 두개의 정점사이에 한개 경로만 존재한다. 그러므로 싸이클도 존재할 수 없다.
* 복잡한 그래프에서 최소비용신장트리를 구성하는 것은 네트워크가 작동할 수 있는 최소 조건을 구하는 의미가 있다.
* 최소비용 신장트리를 구하는 방법으로는 Kruskal 알고리즘, Prim 알고리즘, Sollin 알고리즘 등이 있다.

### Union Find Algorithm

* Union Find Algorithm은 노드 연결을 나타내는 리스트를 정의하고 추가 되는 엣지(n1, n2)에 대해 Union 해 간다.

In [26]:
# Union Find Algorithm
u = [[0, 1, 2],[3, 4]]
def isCycle(u, n1, n2):
    idx1 = -1
    idx2 = -1
    for i in range(len(u)):
        if n1 in u[i]:
            idx1 = i
        if n2 in u[i]:
            idx2 = i
    
    if idx1 == -1 and idx2 == -1:
        u.append([n1,n2])
        print(u)
        return False
    elif idx1 == -1:
        u[idx2].append(n1)
        print(u)
        return False
    elif idx2 == -1:
        u[idx1].append(n2)
        print(u)
        return False
    elif idx1 == idx2 and len(u[idx1])>2:
        print(u)
        return True
    elif idx1 != idx2:
        d1 = u[idx1]
        d2 = u[idx2]
        u = [d1 + d2]
        print(u)
        return False
    

print(isCycle(u,2,3))
print(isCycle(u,0,2))
print(isCycle(u,1,5))
print(isCycle(u,4,6))       

[[0, 1, 2, 3, 4]]
False
[[0, 1, 2], [3, 4]]
True
[[0, 1, 2, 5], [3, 4]]
False
[[0, 1, 2, 5], [3, 4, 6]]
False


### Kruskal 알고리즘
* 간선들의 가중값을 정렬한 후, 가장 작은 가중값을 가지는 간선부터 추가해간다.
* 추가중에 간선의 수가 n - 1이 되면 알고리즘이 종료된다. (n은 노드 수)
<center><img src="https://drive.google.com/uc?id=1udy_0nAYtLq8XrPQt1O1uexRGsMwyS1V" width="500" height="500" ></center>

In [29]:
class SpanningTree:
    def __init__(self, graph):
        self.graph = graph
        self.nodes = set()
        self.union = []
        
        for edge in self.graph:
            self.nodes.add(edge[0])
            self.nodes.add(edge[1])
        
        self.Nnode = len(self.nodes)
        
    def isCycle(self, n1, n2):
        idx1 = -1
        idx2 = -1
        for i in range(len(self.union)):
            if n1 in self.union[i]:
                idx1 = i
            if n2 in self.union[i]:
                idx2 = i
                
        if idx1 == -1 and idx2 == -1:
            self.union.append([n1,n2])
            return False
        elif idx1 == -1:
            self.union[idx2].append(n1)
            return False
        elif idx2 == -1:
            self.union[idx1].append(n2)
            return False
        elif idx1 == idx2 and len(self.union[idx1]) > 2:
            return True
        elif idx1 != idx2:
            d1 = self.union[idx1]
            d2 = self.union[idx2]
            self.union.remove(d1)
            self.union.remove(d2)
            self.union.append(d1+d2)
            return False
        else:
            return False
        
    def kruskal(self):
        self.graph.sort(key = lambda t : t[2])
        tree = []
        for item in self.graph:
            if self.isCycle(item[0], item[1]) == False:
                tree.append(item)
            else:
                print(item, "cycle")
            if len(tree) == self.Nnode - 1:
                break
        return tree
    
g = [(0,1,9),(0,2,10),(1,3,10),(1,4,5),(1,6,3),(2,3,9),(2,4,7),(2,5,2),(3,5,4),(3,6,8),(4,6,1),(5,6,6)]
t = SpanningTree(g)
print(t.kruskal())

(1, 4, 5) cycle
(2, 4, 7) cycle
(3, 6, 8) cycle
[(4, 6, 1), (2, 5, 2), (1, 6, 3), (3, 5, 4), (5, 6, 6), (0, 1, 9)]


## Prim 알고리즘

* 프림 알고리즘은 최소비용 엣지를 추가하는데 이미 추가된 노드와 연결 가능한 엣지 중 최소 비용 엣지를 추가하는 방법이다.
* 간선의 수가 n-1개가 되면 알고리즘이 종료된다 (n은 노드의 수)
* 사이클이 발생하는 엣지는 스킵한다.

In [38]:
class SpanningTree:
    def __init__(self, graph):
        self.graph = graph
        self.nodes = set()
        self.union = []
        
        for edge in self.graph:
            self.nodes.add(edge[0])
            self.nodes.add(edge[1])
        
        self.Nnode = len(self.nodes)
        
    def isCycle(self, n1, n2):
        idx1 = -1
        idx2 = -1
        for i in range(len(self.union)):
            if n1 in self.union[i]:
                idx1 = i
            if n2 in self.union[i]:
                idx2 = i
                
        if idx1 == -1 and idx2 == -1:
            self.union.append([n1,n2])
            return False
        elif idx1 == -1:
            self.union[idx2].append(n1)
            return False
        elif idx2 == -1:
            self.union[idx1].append(n2)
            return False
        elif idx1 == idx2 and len(self.union[idx1]) > 2:
            return True
        elif idx1 != idx2:
            d1 = self.union[idx1]
            d2 = self.union[idx2]
            self.union.remove(d1)
            self.union.remove(d2)
            self.union.append(d1+d2)
            return False
        else:
            return False
        
    def kruskal(self):
        self.graph.sort(key = lambda t : t[2])
        self.union = []
        tree = []
        for item in self.graph:
            if self.isCycle(item[0], item[1]) == False:
                tree.append(item)
            else:
                print(item, "cycle")
            if len(tree) == self.Nnode - 1:
                break
        return tree
    
    def prim(self):
        self.graph.sort(key = lambda t : t[2])
        self.union = []
        mst = []
        remains = set(self.graph)
        if self.isCycle(self.graph[0][0], self.graph[0][1]) == False:
            mst.append(self.graph[0])
        
        remains = list(set(self.graph) - set(mst))
        while len(mst) != self.Nnode - 1:
            nodes = self.getnode(mst)
            minedge = self.minedge(remains, nodes)
            if self.isCycle(minedge[0], minedge[1]) == False:
                mst.append(minedge)
            else:
                print(minedge, "Cycle")
            remains.remove(minedge)
        return mst
    
    def getnode(self, mst):
        nodes = []
        for edge in mst:
            nodes.append(edge[0])
            nodes.append(edge[1])
        nodes = set(nodes)
        return list(nodes)
    
    def minedge(self, remains, nodes):
        mini = float("inf")
        minedge = None
        for node in nodes:
            for item in remains:
                if item[0] == node or item[1] == node:
                    if item[2] < mini:
                        mini = item[2]
                        minedge = item
        return minedge
    
g = [(0,1,9),(0,2,10),(1,3,10),(1,4,5),(1,6,3),(2,3,9),(2,4,7),(2,5,2),(3,5,4),(3,6,8),(4,6,1),(5,6,6)]
t = SpanningTree(g)
print(t.kruskal())
print(t.prim())

(1, 4, 5) cycle
(2, 4, 7) cycle
(3, 6, 8) cycle
[(4, 6, 1), (2, 5, 2), (1, 6, 3), (3, 5, 4), (5, 6, 6), (0, 1, 9)]
(1, 4, 5) Cycle
(2, 4, 7) Cycle
(3, 6, 8) Cycle
[(4, 6, 1), (1, 6, 3), (5, 6, 6), (2, 5, 2), (3, 5, 4), (0, 1, 9)]


## Dijkstra 알고리즘
* BFS를 사용하여 최소거리 경로를 구할 수 있다.
* 다익스트라 알고리즘은 최소 Cost를 가지는 경로를 찾을 수 있는 알고리즘이다.
<center><img src="https://drive.google.com/uc?id=17-N_4cqBA_H9BKKVgTeZDuhCgwVKSH8s" width="300" height="150" ></center>

In [45]:
graph = {'start' : {'A': 6, 'B': 2}, 'A' : {'fin' : 1}, 'B' : {'A' : 3, 'fin': 5}, 'fin':{}}
costs = {'A': 6, 'B': 2, 'fin': float("inf")}
parents = {'A': 'start', 'B':'start','fin' : None}

In [46]:
def find_lowest_cost_node(costs, processed):
    lowestcost = float("inf")
    lowestnode = None
    for node, cost in costs.items():
        if cost < lowestcost and node not in processed:
            lowestcost = cost
            lowestnode = node
    return lowestnode

In [47]:
processed = []
node = find_lowest_cost_node(costs, processed)
print(node)
while node:
    cost = costs[node]
    neighbors = graph[node]
    for neighbor, value in neighbors.items():
        newcost = cost + value
        if newcost < costs[neighbor]:
            costs[neighbor] = newcost
            parents[neighbor] = node
    processed.append(node)
    node = find_lowest_cost_node(costs, processed)
    print(node)
    
print(costs)
print(parents)   

B
A
fin
None
{'A': 5, 'B': 2, 'fin': 6}
{'A': 'B', 'B': 'start', 'fin': 'A'}
