# 그래프
: 가장 일반화된 자료구조.

객체들이 서로 복잡하게 연결되어 있는 구조
- 정점 (Vertices) 또는 노드(node)
- 간선 (edge) 또는 링크(link) : 정점들 간의 관계 의미

<그래프의 역사>

-오일러 문제(1800년대)
* 다리를 한번만 건너서 처음 출발했던 장소로 돌아오는 문제 - 위치 : 정점(node), 다리 : 간선(edge)
* 오일러 정리 : 모든 정점에 연결된 간선의 수가 짝수이면 오일러 경로 존재함

<그래프의 종류>

> 무방향 그래프 (A,B) = (B,A)

> 방향 그래프 <A,B> != <B,A>

> 가중치 그래프 , 네트워크 : 간선에 비용이나 가중치가 할당된 그래프

> 부분 그래프

(인접 정점) : 간선에 의해 직접 연결된 정점

(차수) : 정점에 연결된 간선의 수

-무방향 그래프 : 차수의 합 -> 간선의 두배

-방향 그래프 : 진입차수, 진출차수 / 모든 진입(진출) 차수의 합은 간선의 수

(그래프의 경로)

-무방향 그래프의 정점 s로부터 정점 e까지의 경로

-방향 그래프의 정점 s로부터 정점 e까지의 경로

(경로의 길이) : 경로를 구성하는데 사용된 간선의 수

(단순 경로): 경로중에서 반복되는 간선이 없는 경로

(사이클) : 시작 정점과 종료 정점이 동일한 경로

(연결 그래프) : 모든 정점들 사이에 경로가 존재하는 그래프

(트리) : 사이클을 가지지 않는 연결 그래프

(완전 그래프) : 모든 정점 간에 간선이 존재하는 그래프 / n개의 정점을 가진 무방향 완전 그래프의 간선의 수 =nX(n-1)/2

## 인접 행렬을 이용한 표현

-인접 행렬 M을 이용

-간선(i,j)가 있으면 M[i][j] = 1,또는 true

-그렇지 않으면, M[i][j] = 0 또는 false

-무방향 그래프 : 인접 행렬이 대칭

## 인접 리스트를 이용한 표현

-무방향 그래프 / 방향 그래프 => 연결리스트로 표현

## 인접행렬과 인접 리스트의 복잡도 비교

<인접행렬>
- n^2개의 메모리 공간 필요(간선의 수 무관)
- 조밀 그래프(dense graph)
- 간선 유무는 M[u][v]를 조사하면 됨. => 복잡도 : O(1)
- 정점 차수 =degree(v) : 정점 v에 해당하는 행을 조사, O(n)
- 정점의 인접 정점을 구하는 adjacent(v) : 행의 모든 요소 조사, O(n)
- 모든 간선의 수를 알아내려면 행렬 전체를 조사해야 하므로 n^2번의 조사가 필요 , O(n^2)

<인접 리스트>
- n개의 연결리스트 & 2e개의 노드 필요 n+2e개의 메모리 공간 필요
- 희소 그래프(sparse graph)
- 간선 유무는 정점 u의 차수를 du라고 한다면, 복잡도 O(du)
- 정점 v의 차수 degree(v) : v의 연결 리스트 길이 반환 , O(dv)
- 정점 v에 직접 연결된 모든 정점 adjacent(v) : O(dv)
- 모든 간선의 수를 알아내려면 헤더 노드를 포함하여 모든 인접 리스트를 조사 필요 , O(n+e)

In [1]:
v = list('ABCDEFGH')


In [1]:
adjmat=[[0,1,1,0,0,0,0,0],
       [1,0,0,1,0,0,0,0],
       [1,0,0,1,1,0,0,0],
       [0,1,1,0,0,1,0,0],
       [0,0,1,0,0,0,1,1],
       [0,0,0,1,0,0,0,0],
       [0,0,0,0,1,0,0,1],
       [0,0,0,0,1,0,1,0]]


In [3]:
adjlist = [[1,2], #A의 인접정점 인덱스 
          [0,3],  #B의 인접정점 인덱스
          [0,3,4],#C
          [1,2,5],#D
          [2,6,7],#E
          [3],    #F
          [4,7],  #G
          [4,6]]  #H


In [12]:
graph = {'A':{'C','B'},
        'B':{'D','A'},
        'C':{'E','D','A'},
        'D':{'F','C','B'},
        'E':{'H','G','C'},
        'F':{'D'},
        'G':{'H','E'},
        'H':{'G','E'}}


In [5]:
graph['A']


{'B', 'C'}

## 그래프의 탐색

가장 기본적인 연산

-시작 정점부터 차례대로 모든 정점들을 한 번씩 방문

-많은 문제들이 단순히 탐색만으로 해결됨 ex) 도로망, 전자 회로

<깊이 우선 탐색>

: 한방향으로 끝까지 가다가 더이상 갈 수 없게 되면 가장 가까운 갈림길로 돌아와서 다른 방향으로 다시 탐색 진행
- 스택 필요(순환함수 호출)
- 인접 리스트 구현

<너비 우선 탐색>

: 시작 정점으로부터 가까운 정점을 먼저 방문하고 멀리 떨어져 있는 정점을 나중에 방문하는 순회 방법
- 큐를 사용하여 구현
- 인접 리스트 구현

<탐색 알고리즘 성능>

- 인접 행렬 표현 : O(n^2)
- 인접 리스트로 표현 : O(n+e) n: 정점의 수 , e: 간선의 수

완전 그래프와 같은 조밀 그래프 -> 인접 행렬이 유리

희소 그래프 -> 인접리스트가 유리

In [19]:
#깊이 우선 탐색

def dfs(graph,start,visited=set()):
    if start not in visited:
        visited.add(start)
        print(start,end=' ')
        print(visited)
        nbr = graph[start] - visited #왔던 길 visited로 다시 안가기 위해 graph[start]에서 제거해준다.
        print(nbr)
        for v in nbr:
            dfs(graph,v,visited)
            


In [23]:
g = {'S':{'A','C','B'},
        'A':{'S','D'},
        'D':{'A','C','B'},
        'C':{'S','D'},
        'B':{'S','D'}}
#dfs(g,'S')
bfs(g,'S')

S B A C D 

In [15]:
dfs(graph,'A')


A {'A'}
{'B', 'C'}
B {'B', 'A'}
{'D'}
D {'B', 'A', 'D'}
{'C', 'F'}
C {'B', 'C', 'A', 'D'}
{'E'}
E {'B', 'E', 'A', 'C', 'D'}
{'G', 'H'}
G {'G', 'B', 'E', 'A', 'C', 'D'}
{'H'}
H {'G', 'B', 'E', 'A', 'H', 'C', 'D'}
set()
F {'G', 'B', 'E', 'A', 'H', 'C', 'D', 'F'}
set()


In [22]:
import collections as col

def bfs(graph,start):
    visited = set([start])
    q = col.deque([start])
    while q:
        v = q.popleft() #deque
        print(v,end=' ')
        nbr = graph[v] - visited
        for v in nbr:
            visited.add(v)
            q.append(v)
        

In [12]:
bfs(graph,'A')

A C B D E F G H 

## 연결 성분 검사

In [13]:
def find_connected_component(graph):
    visited = set()
    colorList = []
    for vtx in graph:
        color = dfs_cc(graph,[],vtx,visited)
        colorList.append(color)
        
    print('그래프 연결성분 개수 = %d'%len(colorList))
    print(colorList)
    
def dfs_cc(graph,color,vertex,visited):
    if vertex not in visited:
        visited.add(vertex)
        color.append(vertex)
        nbr = graph[vertex] - visited
        for v in nbr:
            dfs_cc(graph,color,v, visited)
    return color

In [14]:
find_connected_component(graph)


그래프 연결성분 개수 = 8
[['A', 'C', 'D', 'B', 'F', 'E', 'G', 'H'], [], [], [], [], [], [], []]


## 신장 트리

: 그래프내의 모든 정점을 포함하는 트리 - 사이클을 포함하면 안됨. 간선의 수 = n-1
- 인접 리스트 구현

In [15]:
#너비 우선
def bfsST(graph,start):
    visited = set([start])
    q = col.deque([start]) # 너비 우선이기에 col 패키지를 활용해서 deque를 썼다.
    while q:
        v = q.popleft() #deque

        nbr = graph[v] - visited
        for u in nbr:
            print('(',v,',',u,')',end='')

            visited.add(u)
            q.append(u)
        

In [36]:
s = {'A':{'B','D','E'},
        'B':{'A','D','E'},
        'C':{'E','F'},
        'D':{'A','B','E'},
        'E':{'A','B','C','D','F'},
        'F':{'E','C'}}

In [37]:
bfsST(s,'A')


( A , B )( A , D )( A , E )( E , C )( E , F )

In [43]:
def t_sort(vertex,graph):
    n = len(vertex)
    inDeg = [0]*n
    
    for i in range(n):
        for j in range(n):
            if graph[i][j]>0: #i -> j link
                inDeg[j]+= 1
    #여기까지는 inDeg리스트의 진입차수 값들을 저장 과정.
    
    vlist = []
    for i in range(n):
        if inDeg[i] == 0: #만약 진입차수가 없다면,
            vlist.append(i) #방문가능하기 때문에 vlist에 추가.
    
    while len(vlist)>0: #
        v = vlist.pop()
        print(vertex[v],end = ' ')
        for u in range(n):
            if v != u and graph [v][u] >0: #다른점인데 v에서 u로 가는게 있다면
                inDeg[u] -= 1 #방문을 통해 제거를 했기때문에 진입차수를 1개 뺀다.
                if inDeg[u] == 0:
                    vlist.append(u)
                    

In [46]:
v = ['3','7','5','11','8','2','9','10']
t = [[0,0,0,0,1,0,0,1],
    [0,0,0,1,1,0,0,0],
    [0,0,0,1,0,0,0,0],
    [0,0,0,0,0,1,1,1],
    [0,0,0,0,0,0,1,0],
    [0,0,0,0,0,0,0,0],
    [0,0,0,0,0,0,0,0],
    [0,0,0,0,0,0,0,0]]

In [47]:
t_sort(v,t)

5 7 11 2 3 10 8 9 