# 그래프

## 그래프
- 데이터 간 관계를 표현한 자료구조
  - 관계? 데이터 사이의 연관성
- 연결관계를 갖는 비선형 자료구조

## INDEX

  - 그래프 기본
  - DFS
  - BFS
  - 서로소 집합
  - 최소비용 신장 트리(MST)
  - 최단 경로

## 개요

- 그래프 탐색
  - 완전 탐색 : DFS, BFS

- 서로소 집합
  - 대표 데이터 비교
  - 그래프에서는 싸이클 판별

- 최소비용
  - 최소신장트리(MST)
    - 전체 그래프에서 총합이 최소인 신장 트리

  - 최단 거리(다익스트라)
    - 정점 사이의 거리가 최단인 경로 찾기


In [None]:
# 인접 행렬
# 장점 : 구현이 쉽다
# 단점 : 메모리 낭비
#       0도 표시하기 때문에
graph = [
    [0,1,0,1,0],
    [1,0,1,1,1],
    [0,1,0,0,0],
    [1,1,0,0,1],
    [0,1,0,1,0]
]
# 인접리스트
# 갈 수 있는 지점만 저장하자
# 주의사항
#   각 노드마다 갈 수 있는 지점의 개수가 다름
#   -> range 쓸 때 index 조심
# 메모리가 인접 행렬에 비해 훨씬 효율적이다.

graph = [
    [1,3],
    [0,2,3,4],
    [1],
    [0,1,4],
    [1,3]
]

# 파이썬은 딕셔너리로도 사용가능
graph = {
    '0': [1,3],
    '1': [0,2,3,4],
    '2': [1],
    '3': [0,1,4],
    '4': [1,3]
}

In [None]:
# 인접 행렬
graph = [
    [0,1,0,1,0],
    [1,0,1,1,1],
    [0,1,0,0,0],
    [1,1,0,0,1],
    [0,1,0,1,0]
]

graph_l = [
    [1,3],
    [0,2,3,4],
    [1],
    [0,1,4],
    [1,3]
]


# DFS - 깊이 우선 탐색

# stack 버전
def dfs_stack(start):
    visited = []
    stack = [start]

    while stack:
        now = stack.pop()
        # 이미 방문한 지점이라면 continue
        if now in visited:
            continue

        # 방문하지 않은 지점이라면, 방문 표시
        visited.append(now)

        # 갈 수 있는 곳들을 stack에 추가
        # for next in range(5):
        # 작은 번호부터 조회
        for next in range(4,-1,-1):
            # 연결이 안되어 있다면 continue
            if graph[now][next] == 0:
                continue
            
            # 방문한 지점이라면 stack에 추가하지 않음
            if next in visited:
                continue

            stack.append(next)

    # 출력을 위한 반환
    return visited

print('dfs stack = ', end = '')
print(*dfs_stack(0))


# DFS - 재귀
# MAP 크기(길이)를 알 때는 
# append 형식말고 아래와 같이 사용하면 훨씬 빠름
visited = [0]*5
path = []  # 방문순서 기록

def dfs(now):
    visited[now] = 1    # 현재 지점 방문 표시
    print(now, end= ' ')

    # 인접한 노드들을 방문
    for next in range(len(graph_l[now])):
        if visited[graph_l[now][next]]:
            continue

        dfs(graph_l[now][next])

print('dfs 재귀 = ', end = '')
dfs(0)

In [None]:
# BFS - 너비 우선 탐색

# 인접 행렬
graph = [
    [0,1,0,1,0],
    [1,0,1,1,1],
    [0,1,0,0,0],
    [1,1,0,0,1],
    [0,1,0,1,0]
]


def bfs(start):
    visited = [0]*5

    # 먼저 방문했던 것을 먼저 처리해야한다.
    queue = [start]

    # 방문 체크 + 방문한 지점은 pass 여기서 해도 됨
    # visited[start] = 1

    # 더이상 방문할 곳이 없을 때 까지
    while queue:
        # queue 의 맨 앞 요소를 꺼냄
        now = queue.pop(0)
        print(now, end= ' ')
        visited[start] = 1

        # 인접한 노드들을 queue에 추가
        for next in range(5):
            if graph[now][next] ==0:
                continue

            # 방문한 지점이라면 queue에 추가하지 않음
            if visited[next]:
                continue
            
            queue.append(next)
            # bfs 이므로 여기서 방문체크 해줌
            visited[next] = 1

print('bfs_재귀 : ',end='')
bfs(0)

## 서로소 집합

- Disjoint-set
  - 서로소 또는 상호배타 집합들은 서로 중복 포함된 원소가 없는 집합들 / 교집합이 없다
  - 집합에 속한 하나의 특정 멤버를 통해 각 집합들을 구분한다. 이를 대표자(representative)라 한다.

- 상호배타 집합을 표현하는 방법
  - 연결 리스트
  - 트리
- 상호배타 집합 연산
  - Make-Set(x) - 하나의 원소가 포함된 그룹을 만들어줌?
  - Find-Set(x) - 대표가 누군지, 어느 그룹에 속해있는지 물음
  - Union(x,y) : 두 원소를 묶어줌 같은 집합 - 합쳤다는 건 대표자가 같다 - 같은 대표자? 동일한 그룹

1. 대표자 저장 ( 같은 그룹으로 묶기) - Union-Set
2. 각 요소가 내가 속한 그룹의 대표자를 어떻게 찾을지 - Find-Set


### 상호배타 집합 표현 방식

- 연결리스트
  - 연결 리스트의 맨 앞의 원소가 집합의 대표원소
  - 각 원소는 집합의 대표원소를 가리키는 링크를 갖는다
  - 끊기는 등 취약한 부분 존재

- 트리
  - 하나의 집합(a disjoint set)을 하나의 트리로 표현
  - 자식 노드가 부모 노드를 가리키면 루트 노드가 대표자
  - 트리의 배열을 이요하여 저장 가능 - 1차원
  - 부모가 부모자신을 가리키면 대표자

In [None]:
# 상호 배타 집합
# 0 ~ 9
# make set - 집합을 만들어 주는 과정
# 각 요소가 가르키는 값이 부모
parent = [i for i in range(10)]

# find
def find_set(x):
    if parent[x] == x:
        return x
    
    return find_set(parent[x])

# union
def union(x,y):
    # 1. 이미 같은 집합인지 체크
    x = find_set(x)
    y = find_set(y)

    # 대표자가 같으니, 같은 집합이다
    if x == y:
        print("싸이클이 발생해")
        return

    # 2. 다른 집합이라면, 같은 대표자로 수정
    # 다 작은거를 대표자로 하여 통일성 유지
    if x < y :
        parent[y] = x
    else:
        parent[x] = y

union(0,1)
union(2,3)
union(1,3)
#이미 같은 집합에 속해 있는  원소를 한번 더 union
# 싸이클이 발생
# union(0,2)

# 대표자 검색
print(find_set(0))
print(find_set(1))
print(find_set(2))
print(find_set(3))

# 같은 그룹인지 판별
t_x = 0
t_y = 1

if find_set(t_x) == find_set(t_y):
    print(f"{t_x}와 {t_y} 는 같은 집합에 속해 있습니다.")
else:
    print(f"{t_x}와 {t_y} 는 다른 집합에 속해 있습니다.")

In [None]:
# 트리의 rank 도 따로 저장하여 효율적으로 알고리즘을 구현한 방법
class UnionFind:
    def __init__(self, n):
        self.parent = [i for i in range(n)]  # 각 원소의 부모를 자신으로 초기화
        self.rank = [0] * n  # 트리의 깊이(랭크)를   저장

    def find_set(self, x):
        if self.parent[x] == x:
            return x

        return self.find_set(self.parent[x])

        # 경로 압축 (path compression)을 통해 부모를 루트로 설정
        # self.parent[x] = self.find_set(self.parent[x])
        # return self.parent[x]

    def union(self, x, y):
        root_x = self.find_set(x)
        root_y = self.find_set(y)

        if root_x != root_y:
            # 랭크를 비교하여 더 높은 트리의 루트를 부모로 설정
            if self.rank[root_x] < self.rank[root_y]:
                self.parent[root_x] = root_y
            elif self.rank[root_x] > self.rank[root_y]:
                self.parent[root_y] = root_x
            else:
                self.parent[root_y] = root_x
                self.rank[root_x] += 1

# 예제 사용법
n = 5  # 원소의 개수
uf = UnionFind(n)

# 원소 0과 원소 1을 합침
uf.union(0, 1)

# 원소 2와 원소 3을 합침
uf.union(2, 3)

# uf.union(3, 4)

target_x = 2
target_y = 4

# 원소 1과 원소 2가 같은 집합에 속해 있는지 확인
if uf.find_set(target_x) == uf.find_set(target_y):
    print(f"원소 {target_x}과 원소 {target_y}는 같은 집합에 속해 있습니다.")
else:
    print(f"원소 {target_x}과 원소 {target_y}는 다른 집합에 속해 있습니다.")


## 최소 신장 트리

- 그래프에서 최소비용 문제
  1. 모든 정점을 연결하는 간선들의 가중치의 합이 최소가 되는 트리
  2. 두 정점 사이의 최소 비용의 경로 찾기

- 신장 트리란?
    - 모든 정점을 연결
    - 사이클이 존재하지 않는 부분 그래프
      - 간선의 개수 : N-1 개
    - 한 그래프에서 여러 개의 신장 트리가 나올 수 있다

- 최소 신장 트리
  - 무방향 가중치 그래프에서 신장 트리를 구성하는 간선들의 가중치의 합이 최소인 신장 트리


우리는 도로 건설 계획을 세우고 있다. <br>
총 N개의 도시를 연결하는 도로를 건설하려고 할 때 모든 도시에 갈 수 있도록 하며,
가장 비용이 적게 들도록 도로를 건설하는 경우의 수를 구하시오
<br>

1. 갈 수 있는 곳들 중 제일 짧은 곳으로 가자!
   - 모든 정점을 방문할 때 까지
   - DFS와 비슷? + 가중치들 활용

2. 전체 간선들 중에서 제일 가중치가 적은 곳부터 선택
    - 간선 정보를 정렬




### Prim 알고리즘

- 하나의 정점에서 연결된 간선들 중에 하나씩 선택하면서 MST를 만들어 가는 방식
  1. 임의 정점을 하나 선택해서 시작
  2. 선택한 정점과 인접하는 정점들 중의 최소 비용의 간선이 존재하는 정점을 선택
  3. 모든 정점이 선택될 때 까지 1,2 과정 반복

- 서로소인 2개의 집합(2 disjoint-sets) 정보를 유자
  - 트리 정점들(tree verticles) - MST를 만들기 위해 선택된 정점들
  - 비트리 정점들(none verticles) - 선택되지 않은 정점들  

In [None]:
'''
7 11
0 1 3
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
'''
import heapq

def prim(start):
    heap = []
    # MST 에 포함되었는 지 여부
    MST = [0] * V

    # 가중치, 정점 정보
    heapq.heappush(heap,(0,start))

    # 누적합 저장
    sum_weight = 0

    while heap:
        # 가장 적은 가중치를 가진 정점을 꺼냄
        weight , v = heapq.heappop(heap)

        # 이미 방문한 노드라면 pass
        if MST[v]:
            continue

        # 방문 체크
        MST[v] = 1

        # 누적합 추가
        sum_weight += weight

        # 갈 수 있는 노드들을 체크
        for next in range(V):
            # 갈 수 없거나 이미 방문했다면 pass
            if graph[v][next] == 0 or MST[next]:
                continue

            heapq.heappush(heap,(graph[v][next], next))

    return sum_weight



V, E = map(int, input().split())
# 인접행렬
graph = [[0]*V for _ in range(V)]

for _ in range(E):
    f,t,w = map(int, input().split())
    graph[f][t] = w
    graph[t][f] = w     # 무방향 그래프


print(f'최소 비용 : {prim(0)}')


### KRUSKAL 알고리즘

- 간선을 하나씩 선택해서 MST를 찾는 알고리즘
    1. 최초 , 모든 간선을 가중치에 따라 오름차순으로 정렬
    2. 가중치가 가장 낮은 간선부터 선택하면서 트리를 증가시킴
        - 사이클이 존재하면 다음으로 가중치가 낮은 간선 선택
    3. n-1개의 간선이 선택될 때 까지 2를 반복

In [None]:
'''
7 11
0 1 3
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
'''

# 모든 간선들 중 비용이 가장 적은 걸 우선으로 고르자

V, E = map(int, input().split())
edge = []
for _ in range(E):
    f, t, w = map(int, input().split())
    edge.append([f,t,w])

# w를 기준으로 정렬
edge.sort(key=lambda x: x[2])

# 사이클 발생 여부를 union find 로 해결
parents = [i for i in range(V)]


def find_set(x):
    if parents[x] == x:
        return x
    
    parents[x] = find_set(parents[x])
    return parents[x]


def union(x,y):
    x = find_set(x)
    y = find_set(y)

    if x==y:
        return
    
    if x<y:
        parents[y] = x
    else:
        parents[x] = y


# 현재 방문한 정점수
cnt = 0
sum_weight = 0
for f,t,w in edge:
    # 싸이클이 발생하지 않는다면
    if find_set(f) != find_set(t):
        cnt += 1
        sum_weight += w
        union(f,t)
        # MST 구성이 끝나면
        if cnt == V:
            break

print(f'최소 비용 = {sum_weight}')


## 최단 경로

- 최단 경로란?
  - 간선의 가중치가 있는 그래프에서 두 정점 사이의 경로들 중에 간선의 가중치의 합이 최소인 경로

- 하나의 시작 정점에서 끝 정점까지의 최단경로
  - 다익스트라(dijkstra) 알고리즘
    - 음의 가중치를 허용하지 않음
  - 벨만-포드(Bellman-Ford) 알고리즘
    - 음의 가중치 허용

- 모든 정점들에 대한 최단 경로
  - 플로이드-워샬(Floyd-Warshall) 알고리즘

### Dijkstra 알고리즘

- 시작 정점에서 거리가 최소인 정점을 선택해 나가면서 최단 경로를 구하는 방식
  - 프림과의 차이점 : 누적 거리 사용 

- 시작정점(s) 에서 끝정점(t) 까지의 최단 경로에 정점 x가 존재
- 이때, 최단경로는 s 에서 x 까지의 최단경로와 x 에서 t 까지의 최단경로 구성

- 탐욕 기법을 사용한 알고리즘 MST의 프림 알고리즘과 유사

- 현재까지 최단거리일 때 다음에 가장 최소인 곳을 선택하면 최단 거리 보장

In [None]:
# Dijkstra 알고리즘

'''
6 8
0 1 2
0 2 4
1 2 1
1 3 7
2 4 3
3 4 2
3 5 1
4 5 5
'''

# 내가 갈 수 있는 경로 중 누적거리가 제일 짧은 것부터 고르자!
import heapq

# 입력
n, m = map(int, input().split())
# 인접리스트
graph = [[] for i in range(n)]
for _ in range(m):
    f, t, w = map(int, input().split())
    graph[f].append([t, w])

# 1. 누적 거리를 계속 저장
INF = int(1e9) # 최대값으로 1억 - 대충 엄청 큰 수
distance = [INF] * n

def dijkstra(start):
    # 2. 우선순위 큐
    pq = []
    # 출발점 초기화
    heapq.heappush(pq, (0, start))
    distance[start] = 0

    while pq:
        # 현재 시점에서
        # 누적 거리가 가장 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(pq)

        # 이미 방문한 지점 + 누적 거리가 더 짧게 방문한 적이 있다면 pass
        if distance[now] < dist:
            continue

        # 인접 노드를 확인
        for next in graph[now]:
            next_node = next[0]
            cost = next[1]

            # next_node 로 가기 위한 누적 거리
            new_cost = dist + cost

            # 누적 거리가 기존보다 크네 ?
            if distance[next_node] <= new_cost:
                continue
            
         
            distance[next_node] = new_cost
            heapq.heappush(pq, (new_cost, next_node))
            

dijkstra(0)
print(distance)
 

## 최단거리 문제 유형

1. 특정 지점 -> 도착 지점까지의 최단 거리 : 다익스트라
2. 가중치에 음수가 포함되어 있네? : 벨만포드
3. 여러 지점 -> 여러 지점까지의 최단 거리
    - 여러 지점 모두 다익스트라 돌리기 -> 시간 복잡도 계산 잘해야 함
    - 플로이드-워샬


- 다익스트라에서 음의 가중치가 있는 경우
  - 순환이 안걸리는 경우는 구할 수 있음
  - 


In [None]:
# 다익스트라 음수일 때 문제점
# Dijkstra 알고리즘

'''
6 9
1 2 6
1 3 2
2 3 2
2 4 2
3 5 1
4 6 2
5 2 -2
5 6 4
5 4 3
'''
# 5 2 -4  # 1 , -2, -4  -2일떄는 찾을 수 있지만 -4는 순환걸려서 무한 반복
# 내가 갈 수 있는 경로 중 누적거리가 제일 짧은 것부터 고르자!
import heapq

# 입력
n, m = map(int, input().split())
# 인접리스트
graph = [[] for i in range(n+1)]
for _ in range(m):
    f, t, w = map(int, input().split())
    graph[f].append([t, w])

# 1. 누적 거리를 계속 저장
INF = int(1e9)  # 최대값으로 1억 - 대충 엄청 큰 수
distance = [INF] * (n+1)


def dijkstra(start):
    # 2. 우선순위 큐
    pq = []
    # 출발점 초기화
    heapq.heappush(pq, (0, start))
    distance[start] = 0

    while pq:
        # 현재 시점에서
        # 누적 거리가 가장 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(pq)
        print(f'누적값 {dist}, 현재 위치 {now}')
        # 이미 방문한 지점 + 누적 거리가 더 짧게 방문한 적이 있다면 pass
        if distance[now] < dist:
            continue

        # 인접 노드를 확인
        for next in graph[now]:
            next_node = next[0]
            cost = next[1]
            # next_node 로 가기 위한 누적 거리
            new_cost = dist + cost

            # 누적 거리가 기존보다 크네 ?
            if distance[next_node] <= new_cost:
                continue

            distance[next_node] = new_cost
            heapq.heappush(pq, (new_cost, next_node))


dijkstra(1)
print(distance)

# 다익스트라 음수값 지나칠때
'''
누적값 0, 현재 위치 1
누적값 3, 현재 위치 3
누적값 4, 현재 위치 2
누적값 2, 현재 위치 3
[1000000000, 0, 4, 2]
'''
'''

'''