# Kruskal algorithm

- **알고리즘**
    1. 가중치가 가장 작은 노드를 찾는다.
    2. 두 노드를 연결한다.
    3. 두 노드를 연결했을 때 loop가 생성되는지 검사하고, loop가 생성되지 않으면 섹션을 병합한다.
    4. 앞의 과정을 모든 노드가 하나의 섹션으로 통합될 때까지 반복한다.

In [37]:
# 코드
def kruskal(array):
    len_ary = len(array)
    sections = [(i + 1) for i in range(len_ary)]  # 섹션 상태 초기화(각 노드는 자기자신만을 요소로 갖는 독립된 섹션에 추가되어 있음.)
    T = []
    flag = 0
    
    while flag == 0:
        _from, best, wg = 0, 0, 1000  # wg = 가중치(임시)
        
        for fr in range(len_ary):

            for to in range(len_ary):  # 가중치가 가장 작은 노드 찾기
                if array[fr][to] < wg and array[fr][to] != 0:  # 0은 자기자신이므로 제외.
                    _from, best, wg = fr, to, array[fr][to]
                    
        if sections[_from] == sections[best]:  # loop 검사(loop가 생기려면 서로 같은 섹션끼리 연결해야 함.)
            array[_from][best] = array[best][_from] = 1000  # 검색 대상에서 제외시킴.
            flag = 0
        
        else:
            T.append((_from + 1, best + 1, array[_from][best]))  # 트리에 추가.
            array[_from][best] = array[best][_from] = 0  # 섹션에 합병됨. 거리 0.
            
            print("%s <=> %s" %(_from + 1, best + 1))
            
            sections = [sections[_from] if sections[i] == sections[best] else sections[i] for i in range(len_ary)]  # 섹션 합병.
            sections = [sections[best] if sections[i] == sections[_from] else sections[i] for i in range(len_ary)]  # 섹션 합병.
            
            if len(set(sections)) == 1:  # 모든 노드가 한 섹션으로 합병됐는지 검사.
                flag = 1
    
    print("Total distance:", sum(T[i][-1] for i in range(len(T))))
    
    return T

In [38]:
# 사용할 데이터
weights = [[0, 8, 7, 20, 14, 1000],  # node 1
           [1000, 0, 1000, 13, 1000, 1000],  # node 2
           [1000, 1000, 0, 1000, 5, 1000],  # node 3
           [12, 1000, 1000, 0, 1000, 1000],  # node 4
           [11, 1000, 1000, 6, 0, 4],  # node 5
           [1000, 1000, 1000, 10, 1000, 0]]  # node 6

kruskal(weights)

5 <=> 6
3 <=> 5
5 <=> 4
1 <=> 3
1 <=> 2
Total distance: 30


[(5, 6, 4), (3, 5, 5), (5, 4, 6), (1, 3, 7), (1, 2, 8)]

[See Dijkstra algorithm](#Dijkstra-algorithm)  
[See Floyd algorithm](#Floyd-algorithm)  
[See Back tracking](#Back-tracking)  
[See Sequence alignment](#Sequence-alignment)  

------
------

# Dijkstra algorithm

- **알고리즘**
    1. 가중치가 가장 작은 간선을 찾는다.
    2. 출발점에서 각 노드까지의 최단거리(가중치의 합계)가 바뀌었는지 검사한다.
    3. 최단거리가 바뀌었다면 값을 갱신한다.
    4. 앞의 과정을 반복한다.

In [18]:
# 코드
def dijkstra(array):
    len_ary = len(array)
    dis = array[0][:]  # 출발점(= node 1)과 다른 노드들 사이의 거리.
    frm = [1 for i in range(len_ary)]  # frm[n] = k에서 n은 ?
    T = []
    
    print("frm = ", frm, "\n", "dis = ", dis, "\n", "T = ", T, sep = "")
    print("Start!\n")
    
    for i in range(len_ary - 1):  # 간선 개수 = 노드 개수 - 1
        best, wg = 0, 1000
        
        for j in range(len_ary):
            if dis[j] < wg and dis[j] != 0:  # 가중치가 가장 작은 간선 찾기.
                best, wg = j, dis[j]
                
        T.append((frm[best], best + 1))  # 트리 확장 순서 기록.
        
        for a in range(len_ary):
            if (dis[a] > dis[best] + array[best][a]):
                dis[a] = dis[best] + array[best][a]  # 가중치 합계 업데이트
                frm[a] = best + 1  # 출발지(다음 실행 시 사용) 업데이트
        
        dis[best] = 0  # 트리에 추가되었으므로 거리 0.
        
        print("frm = ", frm, "\n", "dis = ", dis, "\n", "T = ", T, "\n", sep = "")
        
    return T

In [19]:
# 사용할 데이터
weights = [[0, 8, 7, 20, 14, 1000],  # node 1
           [1000, 0, 1000, 13, 1000, 1000],  # node 2
           [1000, 1000, 0, 1000, 5, 1000],  # node 3
           [12, 1000, 1000, 0, 1000, 1000],  # node 4
           [11, 1000, 1000, 6, 0, 4],  # node 5
           [1000, 1000, 1000, 10, 1000, 0]]  # node 6

T = dijkstra(weights)
print(T)

frm = [1, 1, 1, 1, 1, 1]
dis = [0, 8, 7, 20, 14, 1000]
T = []
Start!

frm = [1, 1, 1, 1, 3, 1]
dis = [0, 8, 0, 20, 12, 1000]
T = [(1, 3)]

frm = [1, 1, 1, 1, 3, 1]
dis = [0, 0, 0, 20, 12, 1000]
T = [(1, 3), (1, 2)]

frm = [1, 1, 1, 5, 3, 5]
dis = [0, 0, 0, 18, 0, 16]
T = [(1, 3), (1, 2), (3, 5)]

frm = [1, 1, 1, 5, 3, 5]
dis = [0, 0, 0, 18, 0, 0]
T = [(1, 3), (1, 2), (3, 5), (5, 6)]

frm = [1, 1, 1, 5, 3, 5]
dis = [0, 0, 0, 0, 0, 0]
T = [(1, 3), (1, 2), (3, 5), (5, 6), (5, 4)]

[(1, 3), (1, 2), (3, 5), (5, 6), (5, 4)]


[See Kruskal algorithm](#Kruskal-algorithm)  
[See Floyd algorithm](#Floyd-algorithm)  
[See Back tracking](#Back-tracking)  
[See Sequence alignment](#Sequence-alignment)  

------
------

# Floyd algorithm

- 기본 지식  
_<div style="color:#a199f1; font-size:18pt;">D<sub>k</sub>(i, j) = min[D<sub>k-1</sub>(i, j), D<sub>k-1</sub>(i, k) + D<sub>k-1</sub>(k, j)]</div>_
k = (0 ~ k)까지의 노드를 경유할 수 있다는 뜻.  
i = 출발지 노드의 번호  
j = 도착지 노드의 번호


------
<k = 0 (최초)>  

| D<sub>0</sub> | i = 1 |  2 |  3 |  4 |  5 |
|:-------------:|:-----:|:--:|:--:|:--:|:--:|
|   **j = 1**   |   0   |  6 |  4 | 99 | 99 |
|     **2**     |   99  |  0 | 99 |  7 |  5 |
|     **3**     |   3   | 99 |  0 |  2 | 99 |
|     **4**     |   99  |  4 | 99 |  0 |  6 |
|     **5**     |   2   | 99 |  7 | 99 |  0 |


<k = 1>  

| D<sub>1</sub> | i = 1 | 2 |  3 |  4 |  5 |
|:-------------:|:-----:|:-:|:--:|:--:|:--:|
|   **j = 1**   |   0   | 6 |  4 | 99 | 99 |
|     **2**     |   99  | 0 | 99 |  7 |  5 |
|     **3**     |   3   | 9 |  0 |  2 | 99 |
|     **4**     |   99  | 4 | 99 |  0 |  6 |
|     **5**     |   2   | 8 |  6 | 99 |  0 |


<k = 2>  

| D<sub>2</sub> | i = 1 | 2 |  3 |  4 |  5 |
|:-------------:|:-----:|:-:|:--:|:--:|:--:|
|   **j = 1**   |   0   | 6 |  4 | 13 | 11 |
|     **2**     |   99  | 0 | 99 |  7 |  5 |
|     **3**     |   3   | 9 |  0 |  2 | 14 |
|     **4**     |   99  | 4 | 99 |  0 |  6 |
|     **5**     |   2   | 8 |  6 | 15 |  0 |


<k = 3>  

| D<sub>3</sub> | i = 1 | 2 |  3 |  4 |  5 |
|:-------------:|:-----:|:-:|:--:|:--:|:--:|
|   **j = 1**   |   0   | 6 |  4 |  6 | 11 |
|     **2**     |   99  | 0 | 99 |  7 |  5 |
|     **3**     |   3   | 9 |  0 |  2 | 14 |
|     **4**     |   99  | 4 | 99 |  0 |  6 |
|     **5**     |   2   | 8 |  6 |  8 |  0 |


<k = 4>  

| D<sub>4</sub> | i = 1 | 2 |  3 |  4 |  5 |
|:-------------:|:-----:|:-:|:--:|:--:|:--:|
|   **j = 1**   |   0   | 6 |  4 |  6 | 11 |
|     **2**     |   99  | 0 | 99 |  7 |  5 |
|     **3**     |   3   | 6 |  0 |  2 |  8 |
|     **4**     |   99  | 4 | 99 |  0 |  6 |
|     **5**     |   2   | 8 |  6 |  8 |  0 |


<k = 5 (끝)>  

| D<sub>5</sub> | i = 1 | 2 |  3 |  4 |  5 |
|:-------------:|:-----:|:-:|:--:|:--:|:--:|
|   **j = 1**   |   0   | 6 |  4 |  6 | 11 |
|     **2**     |   7   | 0 | 11 |  7 |  5 |
|     **3**     |   3   | 6 |  0 |  2 |  8 |
|     **4**     |   8   | 4 | 12 |  0 |  6 |
|     **5**     |   2   | 8 |  6 |  8 |  0 |


------


- 알고리즘  
    1. _D<sub>k</sub>(i, j)_ plot...?

In [39]:
# 코드
def printFloyd(array, lable):
    len_ary = len(array)
    
    print("<%s>" %lable)
    
    for i in range(len_ary):
        
        for j in range(len_ary):
            print("%2s\n" %array[i][j] if (j == len_ary - 1) else "%2s  " %array[i][j], end = "")
    
    print("")
    
    return


def floyd(array):
    _len = len(array)
    
    P = [[0 for n in range(_len)] for p in range(_len)]  # P 초기화
    D = array[:]  # 복사
    
    printFloyd(P, "P")
    printFloyd(D, "Initialize")
    print("##########Start##########\n")
    
    for k in range(_len):
        
        for i in range(_len):  # 배열 D에서 각 셀의 값을 업데이트.
            
            for j in range(_len):
                if D[i][k] + D[k][j] < D[i][j]:
                    D[i][j] = D[i][k] + D[k][j]  # 값 업데이트
                    P[i][j] = k + 1  # 경유지(k) 번호 기록
            
        printFloyd(D, "k = %s" %(k + 1))
    
    print("##########End##########\n")
    printFloyd(D, "D(Final)")
    printFloyd(P, "P(Final)")
    
    return P


def pathFinder(_from, _to, P):
    via = P[_from][_to]
    
    if via != 0:
        pathFinder(_from, via - 1, P)
        print(via, ", ", end = "")
        pathFinder(via - 1, _to, P)
    
    return

In [40]:
# 사용할 데이터
raw_data = [
    [0, 6, 4, 99, 99],
    [99, 0, 99, 7, 5],
    [3, 99, 0, 2, 99],
    [99, 4, 99, 0, 6],
    [2, 99, 7, 99, 0]
]

P = floyd(raw_data)

for i in range(len(P)):
    
    for j in range(len(P)):
        if i == j:  # 자기자신으로 이동하는 경우는 제외함.
            pass
        
        elif P[i][j] == 0:  # 경유를 하지 않는 경우.
            print("%s => %s : %s , %s" %(i + 1, j + 1, i + 1, j + 1))
        
        elif P[i][j] != 0:  # 경유하는 경우.
            print("%s => %s : %s , " %(i + 1, j + 1, i + 1), end = "")
            pathFinder(i, j, P)
            print(j + 1)

<P>
 0   0   0   0   0
 0   0   0   0   0
 0   0   0   0   0
 0   0   0   0   0
 0   0   0   0   0

<Initialize>
 0   6   4  99  99
99   0  99   7   5
 3  99   0   2  99
99   4  99   0   6
 2  99   7  99   0

##########Start##########

<k = 1>
 0   6   4  99  99
99   0  99   7   5
 3   9   0   2  99
99   4  99   0   6
 2   8   6  99   0

<k = 2>
 0   6   4  13  11
99   0  99   7   5
 3   9   0   2  14
99   4  99   0   6
 2   8   6  15   0

<k = 3>
 0   6   4   6  11
99   0  99   7   5
 3   9   0   2  14
99   4  99   0   6
 2   8   6   8   0

<k = 4>
 0   6   4   6  11
99   0  99   7   5
 3   6   0   2   8
99   4  99   0   6
 2   8   6   8   0

<k = 5>
 0   6   4   6  11
 7   0  11   7   5
 3   6   0   2   8
 8   4  12   0   6
 2   8   6   8   0

##########End##########

<D(Final)>
 0   6   4   6  11
 7   0  11   7   5
 3   6   0   2   8
 8   4  12   0   6
 2   8   6   8   0

<P(Final)>
 0   0   0   3   2
 5   0   5   0   0
 0   4   0   0   4
 5   0   5   0   0
 0   1   1   3   0

1 => 

[See Kruskal algorithm](#Kruskal-algorithm)  
[See Dijkstra algorithm](#Dijkstra-algorithm)  
[See Back tracking](#Back-tracking)  
[See Sequence alignment](#Sequence-alignment)  

------
------

# Back tracking


- **알고리즘**
    1. ?

In [42]:
# 코드
def place(k, B):
    i = 0
    
    while i < k:
        if (B[i] == B[k]) or (abs(B[i] - B[k]) == abs(i - k)):
            return False
        
        i += 1
    
    return True


def queens(k):
    global B
    
    n = len(B)
    
    for i in range(n):
        B[k - 1] = i + 1
        
        if place(k - 1, B) == True:
            if k == n:
                print("Solution:", B)
                
            else:
                queens(k + 1)
    
    return

In [44]:
# 사용할 데이터
B = [1, 2, 3, 4, 5]
queens(1)

Solution: [1, 3, 5, 2, 4]
Solution: [1, 4, 2, 5, 3]
Solution: [2, 4, 1, 3, 5]
Solution: [2, 5, 3, 1, 4]
Solution: [3, 1, 4, 2, 5]
Solution: [3, 5, 2, 4, 1]
Solution: [4, 1, 3, 5, 2]
Solution: [4, 2, 5, 3, 1]
Solution: [5, 2, 4, 1, 3]
Solution: [5, 3, 1, 4, 2]


[See Kruskal algorithm](#Kruskal-algorithm)  
[See Dijkstra algorithm](#Dijkstra-algorithm)  
[See Floyd algorithm](#Floyd-algorithm)  
[See Sequence alignment](#Sequence-alignment)  

------
------

# Sequence alignment


- 알고리즘  
    1. Sum matrix 생성하기.  
        + 일치 = 1, 불일치 = 0으로 채워진 matrix를 생성한다.  
        + 가로축과 세로축이 의미하는 sequence에 주의할 것.  
    2. Sum matrix의 셀 값 업데이트하기.  
        + 업데이트 시 알고리즘은 과제 제출했던 것 참고.  
        + 우측 하단에서부터 좌측 상단 순서로 업데이트한다.  
    3. Sum matrix를 이용해서 sequence 정렬하기.  
        + 대각선으로 이동할지,  
        + 오른쪽으로 이동할지,  
        + 아래쪽으로 이동할지 선택해야 함.

In [10]:
# 코드


In [11]:
# 사용할 데이터
seq_ref = "ABCNYRQCLCRPM"  # col
seq_target = "AYCYNRCKCRBP"  # row

# ary = summatrix(seq_ref, seq_target)

[See Kruskal algorithm](#Kruskal-algorithm)  
[See Dijkstra algorithm](#Dijkstra-algorithm)  
[See Floyd algorithm](#Floyd-algorithm)  
[See Back tracking](#Back-tracking)  

------
------