# 알고리즘 6일차

### 서로소 집합(Disjoint-sets)
서로소 또는 상호 배타 집합들은 서로 중복 포함된 원소가 없는 집합들이다. 다시 말해 교집합이 없다.

집합에 속한 하나의 특정 멤버를 통해 각 집합들을 구분한다. 이를 대표자(representative)라 한다.

상호배타 집합을 표현하는 방법
- 연결 리스트
- 트리

상호배타 집합 연산
- Make-Set(x)
- Find-Set(x)
- Union(x,y)

### 연결리스트
같은 집합의 원소들은 하난의 연결리스트로 관리한다.

연결리스트의 맨 앞의 원소를 집합의 대표 원소로 삼는다

각 원소는 집합의 대표원소를 가리키는 링크를 갖는다

### 트리
하나의 집합(a disjoint set)을 하나의 트리로 표현한다.

자식 노드가 부모 노드를 가리키며 루트 노드가 대표자가 된다.


Make-Set(x) : 유일한 멤버 x를 포함하는 새로운 집합을 생성하는 연산
```
    Make-Set(x)
        p[x]<-x
```

Find-Set(x) : x를 포함하는 집합을 찾는 연산
```
    Find-Set(x)
        IF x == p[x] : RETURN x
        ELSE         : RETURN Find_Set(p[x])
```

Union(x,y) : x와 y를 포함하는 두 집합을 통합하는 연산
```
    Union(x,y)
        p[Find-set(y)] <- Find-Set(x)
```

참고
Find_Set(x) : x를 포함하는 집합을 찾는 연산(반복)
```
    Find-Set(x)
        while x != p[x]
            x = p[x]
        return x
```

### 상호배타집합에 대한 연산
연산의 효율을 높이는 방법
- Rank를 이용한 Union
    - 각 노드는 자신을 루트로 하는 subtree의 높이를 랭크 Rank라는 이름으로 저장한다.
    - 두 집합을 합칠 때 rank가 낮은 집합을 rank가 높은 집합에 붙인다
- path compression
    - Find-Set을 행하는 과정에서 만나는 모든 노드들이 직접 root를 가리키도록 포인터를 바꿔준다

Make_Set 연산
- Make_Set(x): 유일한 멤버 x를 포함하는 새로운 집합을 생성하는 연산

    ```
        p[x] : 노드 x의 부모 저장
        rank[x] : 루트 노드가 x인 트리의 랭크 값 저장

        Make_Set(x)
            p[x] <- x
            rank[x] <- 0
    ```

Find_Set 연산
- Find_Set(x) : x를 포함하는 집합을 찾는 오퍼레이션

    ```
        Find_Set(x)
            IF x != p[x]    // x가 루트가 아닌 경우
                    p[x] <- Find_Set(p[x])
            RETURN p[x]
    ```

- Find_Set 연산은 특정 노드에서 루트까지의 경로를 찾아가면서 노드의 부모 정보를 갱신한다

Union 연산
- Union(x,y) : x와 y를 포함하는 두 집합을 통합하는 오퍼레이션
    ```
        Union(x,y)
            Link(Find_Set(x), Find_Set(y))
    ```

    ```
        Link(x,y)
            IF rank[x] > rank[y]
                p[y] <- x
            ELSE
                p[x] <- y
                IF rank[x] == rank[y]
                    rank[y]++
    ```

### 최소 신장 트리(MST)

그래프에서 최소 비용 문제
1. 모든 정점을 연결하는 간선들의 가중치의 합이 최소가 되는 트리
2. 두 정점 사이의 최소 비용의 경로 찾기

신장 트리
- n개의 정점으로 이루어진 `무방향 그래프`에서 n개의 정점과 n-1개의 간선으로 이루어진 트리

최소 신장 트리(Minimum Spanning Tree)
- `무방향 가중치 그래프`에서 신장 트리를 구성하는 간선들의 가중치의 합이 최소인 신장 트리

### Prim 알고리즘
하나의 정점에서 연결된 간선들 중에 하나씩 선택하면서 MST를 만들어 가는 방식
1. 임의 정점을 하나 선택해서 시작
2. 선택한 정점과 인접하는 정점들 중의 최소 비용의 간선이 존재하는 정점을 선택
3. 모든 정점이 선택될 떄 까지 1,2 과정을 반복

서로소인 2개의 집합(2disjoint-sets) 정보를 유지
- 트리 정점들(tree vertices) - MST를 만들기 위해 선택된 정점들
- 비트리 정점들(nontree vertices) - 선택 되지 않은 정점들

알고리즘

```
    MST_PRIM(G,r)                   //G:그래프, r: 시작 정점
        FOR u in G.V
            u.key <- INF            // u.key: u에 연결된 간선 중 최소 가중치
            u.(pi) <- NULL          // u.(pi) : 트리에서 u의 부모
        r.key <- 0
        Q <- G.V                    // 우선순위 Q에 모든 정점을 넣는다
        WHILE Q != 0                // 빈 Q가 아닐 동안 반복
            u <- Extract_MIN(Q)     // key 값이 가장 작은 정점 가져오기
            FOR v in G.Adj[u]       // u의 인접 정점들
                IF v in Q AND w(u,v) < v.key    // Q에 있는 v의 key값 생성
                    v.(pi) <- u
                    v.key <- w(u,v)
```

### KRUSKAL 알고리즘
간선을 하나씩 선택해서 MST를 찾는 알고리즘
1. 최초, 모든 간선을 가중치에 따라 오름차순으로 정렬
2. 가중치가 가장 낮은 간선부터 선택하면서 트리를 증가시킴
    - 사이클이 존재하면 다음으로 가중치가 낮은 간선 선택
3. n-1개의 간선이 선택될 때까지 2를 반복

알고리즘
```
    MST-KRUSKAL(G,w)
        A <- 0                  // 0 : 공집합
        FOR vertex v in G.V     // G.v : 그래프의 정점 집합
            Make_Set(v)         // G.E : 그래프의 간선 집합
        G.E에 포함된 간선들을 가중치 w에 의해 정렬

        FOR 가중치가 가장 낮은 간선 (u,v) in G.E 선택(n-1개)
            IF Finde_Set(u) != Find_Set(v)
                A <- A U(합집합) {(u,v)}
                Union(u,v);
        RETURN A
```

### 최단 경로
최단 경로 정의
- 간선의 가중치가 있는 그래프에서 두 정점 사이의 경로들 중에 간선의 가중치의 합이 최소인 경로

하나의 시작 정점에서 끝 정점까지의 최단경로
- 다익스트라(dijkstra) 알고리즘
    - 음의 가중치를 허용하지 않음
- 벤만-포드(Bellman-Ford)알고리즘
    - 음의 가중치 허용

모든 정점들에 대한 최단 경로
    - 플로이드-워샬(Floyd-Warchall)알고리즘

### Dijkstra 알고리즘
시작 정점에서 거리가 최소인 정점을 선택해 나가면서 최단 경로를 구하는 방식이다.

시작 점점(s)에서 끝 정점(t)까지의 최단 경로에 정점 x가 존재한다

이때, 최단 경로는 s에서 x까지의 최단 경로와 x에서 t까지의 최단경로로 구성된다.

탐욕 기법을 사용한 알고리즘으로 MST의 프림 알고리즘과 유사하다

![Alt text](floydwarshalll.PNG)

### Floyd-Warshall

In [1]:
inf=int(21e8)
arr=[
    [0,5,inf,8],
    [7,0,9,inf],
    [2,inf,0,4],
    [inf,inf,3,0]
]

for ky in range(4):
    for si in range(4):
        for do in range(4):
            if arr[si][do]>arr[si][ky]+arr[ky][do]:
                arr[si][do]=arr[si][ky]+arr[ky][do]

for i in range(4):
    for j in range(4):
        print(arr[i][j],end=' ')
    print()

0 5 11 8 
7 0 9 13 
2 7 0 4 
5 10 3 0 


연습해볼만한 문제
백준 11403 경로찾기
백준 11404 가장빠른버스노선구하기
백준 2458 키순서

In [4]:
# 문자열 2개 입력받고 입력받은 두 문자열이 anagram 관계인지 확인하기

arr1 = input()
arr2 = input()

# result = "anagram" if sorted(arr1)==sorted(arr2) else "no anagram"

dic1 = {}
dic2 = {}

for i in arr1:
    if i in dic1:
        dic1[i] +=1
    else:
        dic1[i] = 1

for i in arr2:
    if i in dic2:
        dic2[i] +=1
    else:
        dic2[i] = 1

result = "anagram"
for i in dic1.keys():
    if i in dic2.keys():
        if dic1[i]==dic2[i]:
            continue
        else:
            result = "no anagram"
            break
    else:
        result = "no anagram"
        break

print(result)

no anagram


In [8]:
# 문자열 2개를 입력 받고 최소 몇개의 글자를 지우면 두 문자열이 anagram이 되나요(두 문자열은 반드시 1개의 애너그램이 존재한다고 가정)

arr1 = input()
arr2 = input()

if len(arr1) < len(arr2):
    arr1,arr2 = arr2,arr1

dic1 = {}
dic2 = {}

for i in arr1:
    if i in dic1:
        dic1[i] +=1
    else:
        dic1[i] = 1

for i in arr2:
    if i in dic2:
        dic2[i] +=1
    else:
        dic2[i] = 1

cnt=0

for i in dic1.keys():
    if i in dic2.keys():
        if dic1[i]==dic2[i]:
            continue
        else:
            cnt += abs(dic1[i]-dic2[i])
    else:
        cnt += dic1[i]

print(cnt)



2


In [None]:
arr1 = input()
arr2 = input()

dat = [0]*26

for i in arr1:
    dat[ord(i)-ord('a')]+=1
for i in arr2:
    dat[ord(i)-ord('a')]-=1

cnt = 0
for i in range(26):
    if dat[i]:
        cnt+=abs(dat[i])
print(cnt)


In [21]:
# arr1 sort 한 것이랑 arr2 sort 비교( sliding window )

arr1=input()
arr2=input()
cnt=0
for i in range(len(arr2)-len(arr1)+1):
    if sorted(arr1)==sorted(arr2[i:i+len(arr1)]):
        cnt+=1
print(cnt)


2


# 위상정렬
![Alt text](topological_sort.PNG)

In [None]:
# 위상정렬

from collections import deque
name=['cs','language','datastructure','algorithm','project','codingtest','to be a programmer']
arr=[
    [0,0,0,0,0,0,1],
    [0,0,1,1,0,0,0],
    [0,0,0,0,0,1,0],
    [0,0,0,0,0,1,0],
    [0,0,0,0,0,0,1],
    [0,0,0,0,0,0,1],
    [0,0,0,0,0,0,0]]

acc=[0]*7   # 사전 작업 개수
used=[0]*7  # 작업 들어갈지 check

q=deque()
for j in range(7):     # acc 배열에 사전 작업 개수 넣기
    for i in range(7):
        if arr[i][j]==1:
            acc[j]+=1

for i in range(7):    # 바로 작업 착수 가능한 것들은 used에 1 체크하고 큐에 등록
    if acc[i]==0:
        used[i]=1
        q.append(i)

while q:
    now=q.popleft()
    print(name[now],end=' ')
    for i in range(7):
        if arr[now][i]==1 and used[i]==0:
            if acc[i]==1:
                used[i]=1
                acc[i]-=1
                q.append(i)
            else:
                acc[i]-=1
