<h1>파이썬 알고리즘 정리</h1>

<h2>Divide and Conquer</h2>

* 문제를 작은 단위로 나누고 해결하는 방법
* Divide + Conquer + Merge
* Subproblem이 전체 문제에 비해 크기가 작을 때 유리(ex : N times -> N/2 times -> N/4 times ...)

<h3>1. Binary Search(이진탐색) : 정렬된 리스트에서 특정 값의 위치를 찾는 알고리즘</h3>


* Recursive implementation

In [1]:
def binarySearch(arr, l, r, x):
    
    if r >= l:                                              # base case : 오른쪽 인덱스가 왼쪽 인덱스보다 커야 함. 그렇지 않으면 -1을 리턴
        mid = l + (r - 1) // 2                              # 가운데 위치를 계산

        if arr[mid] == x:                                   # 찾는 값이 가운데에 있으면
            return mid                                      # mid 인덱스를 반환
        
        elif arr[mid] > x:                                  # 찾는 값이 중간값보다 작으면
            return binarySearch(arr, l, mid-1, x)           # 왼쪽 배열에서 다시 탐색을 진행
        
        else:                                               # 찾는 값이 중간값보다 크면
            return binarySearch(arr, mid+1, r, x)           # 오른쪽 배열에서 다시 탐색을 진행
    
    else:
        return -1


# driver code
arr = [2,3,4,10,40]
x = 10

print(binarySearch(arr, 0, len(arr)-1, x))                  # 3

3


* Iteravive implementation

In [2]:
def binarySearch_iter(arr, l, r, x):
    
    while l <= r:
        mid = l + (r-1) // 2

        if arr[mid] == x:
            return mid
        
        elif arr[mid] > x:
            r = mid - 1                                 # 함수 호출 없이 인덱스를 이동
        
        else:
            l = mid + 1                                 # 함수 호출 없이 인덱스를 이동
    
    return -1

# driver code
arr = [2,3,4,10,40]
x = 10

print(binarySearch_iter(arr, 0, len(arr)-1, x))         # 3

3


<h3>2. Merge Sort(합병정렬) : 리스트 정렬 알고리즘 - divde -> sort -> merge</h3>

In [4]:
def mergeSort(arr):
    
    if len(arr) > 1:                            # base case : 배열의 길이가 1보다 길어야 함
        mid = len(arr) // 2                     # mid인덱스 계산
        l = arr[:mid]                           # 왼쪽 배열 생성
        r = arr[mid:]                           # 오른쪽 배열 생성

        mergeSort(l)                            # 왼쪽 배열 정렬
        mergeSort(r)                            # 오른쪽 배열 정렬

        i = j = k = 0                           # 인덱스 초기화

        # merge
        while i < len(l) and j < len(r):        # 양쪽 배열 모두 남아있으면
            if l[i] < r[j]:                     # 왼쪽 값이 오른쪽 값보다 작으면
                arr[k] = l[i]                   # 왼쪽 값을 배열에 넣음
                i += 1
            else:                               # 오른쪽 값이 더 작으면
                arr[k] = r[j]                   # 오른쪽 값을 배열에 넣음
                j += 1
            k += 1

        while i < len(l):                       # 왼쪽 배열에 남아있는게 있으면
            arr[k] = l[i]                       # 배열에 하나씩 넣음
            i += 1
            k += 1
        
        while j < len(r):                       # 오른쪽 배열에 남아있는게 있으면
            arr[k] = r[j]                       # 배열에 하나씩 넣음
            j += 1
            k += 1
            

# driver code
arr = [12,11,5,13,6,7]
mergeSort(arr)
print(arr)                                      # [5,6,7,11,12,13]

[5, 6, 7, 11, 12, 13]


<h3>3. Quick Sort(퀵 정렬) : 리스트 정렬 알고리즘 - pivot기준</h3>

In [10]:
def partition(array, low, high):
    
    pivot = array[high]                                             # 가장 마지막 값으로 pivot을 설정
    i = low - 1

    for j in range(low, high):                                      # array를 돌면서
        if array[j] <= pivot:                                       # pivot보다 작은 값이 있으면
            i += 1
            (array[i], array[j]) = (array[j], array[i])             # 앞쪽으로 swap

    (array[i+1], array[high]) = (array[high], array[i+1])           # pivot의 값을 가운데로 swap
    return i + 1


def quickSort(array, low, high):

    if low < high:                                                  # base case : array에 하나 이상의 숫자가 존재
        pi = partition(array, low, high)                            # pivot을 기준으로 왼쪽을 pivot보다 작게, 오른쪽은 pivot보다 크게 분할  - divide
        quickSort(array, low, pi - 1)                               # 왼쪽 array에 대해서 반복                                          - conquer
        quickSort(array, pi + 1, high)                              # 오른쪽 array에 대해서 반복                                        -conquer


# driver code
array = [10,7,8,9,1,5]
quickSort(array, 0, len(array) - 1)
print(array)                                                        # [1,5,7,8,9,10]

[1, 5, 7, 8, 9, 10]


<h2>Dynamic Programming</h2>

* Subproblem이 전체문제와 크기가 비슷할 때(D&C가 비효율적일때)(ex : N times -> N-1 times -> N-2 times ...) or Subproblem에 중복이 발생할 때 유리(ex : x5 = x3 + x4, x4 = x3 + x2 ...)
* 하나의 문제는 한번만 풀도록 하는 알고리즘
* Bottom up, Save and Reuse(lookup), clever enumeration
* 예시를 통해 수학적 표현을 얻고(recursion) 반복문을 통해 테이블을 채워나가는 방식
* Principle of optimality : optimal substructure(subproblem에서의 답은 original problem에서도 동일하다)

<h3>1. Fibonacci(피보나치 수열) : fib(n) = fib(n-1) + fib(n-2)</h3>

* Recursive implementation(D&C)

In [11]:
def Fibonacci(n):
    if n < 0:                                       # base code : n은 0 이상
        return -1
    
    elif n == 0 :
        return 0
    
    elif n == 1 or n == 2:
        return 1
    
    else:
        return Fibonacci(n-1) + Fibonacci(n-2)      # recursive call

# driver code
Fibonacci(9)                                        # 34

34

* Dynamic Programing

In [12]:
FibArray = [0,1]                                            # lookup table

def fibonacci(n):

    if n < 0:
        return -1
    
    elif n < len(FibArray):                                 # table에 값이 있으면 reuse
        return FibArray[n]

    else:
        FibArray.append(fibonacci(n-1) + fibonacci(n-2))    # table에 값이 없으면 save
        return FibArray[n]

# driver code
fibonacci(9)                                                # 34

34

* Space optimized(DP)

In [13]:
def fibonacci_opt(n):
    a = 0
    b = 1

    if n < 0:
        return -1
        
    elif n == 0:
        return a
    elif n == 1:
        return b

    else:
        for i in range(1, n):                               # 1 ~ n까지 bottom up으로 계산
            c = a + b
            a = b
            b = c
        return b

# driver code
fibonacci_opt(9)                                            # 34

34

<h3>2. Binomial Coefficient(이항계수) : (n,k) = (n-1,k-1) + (n-1,k)</h3>

In [14]:
def binomialCoef(n,k):
    C = [[0 for x in range(k+1)]for x in range(n+1)]    # lookup table 초기화

    for i in range(n+1):                                # table을 채워나감
        for j in range(min(i, k)+1):
            if j == 0 or j == i:
                C[i][j] = 1
            else:
                C[i][j] = C[i-1][j-1] + C[i-1][j]
    
    return C[n][k]                                      # 최종 계산결과 반환

# driver code
n, k = 5, 2
binomialCoef(n,k)                                           # 10

10

<h3>3. Chained Matrix Multiplication(연쇄행렬 최소곱셈) : 주어진 행렬들의 곱을 최소의 연산으로 수행하는 최소 횟수를 구하는 알고리즘</h3>

* M[i,j] = min(M[i,k] + M[k+1,j] + C(i-1)*C(k)*C(j)) for i<= k<=j-1, M[i,i] = 0

In [15]:
maxint = int(1e9+7)

def MatrixChainOrder(p,n):
    m = [[0 for x in range(n)] for x in range(n)]           # lookup table 초기화

    for i in range(n):
        m[i][i] = 0                                         # 자기자신과의 곱셈은 0
    
    for L in range(2,n):                                    # L = matrix chain의 길이
        for i in range(1, n-L + 1):
            j = i + L-1
            m[i][j] = maxint                                # i번째 matrix부터 j번째 matrix까지의 곱셈횟수를 maxint값으로 초기화

            for k in range(i,j):                            # 중간에 나눌 곳을 이동하면서
                q = m[i][k] + m[k+1][j] + p[i-1]*p[k]*p[j]  # 곱셈 횟수를 계산
                if q < m[i][j]:                             # 현재값보다 적은 횟수가 가능하면
                    m[i][j] = q                             # 값을 교체해서 save
    
    return m[1][n-1]                                        # 최종 계산결과를 반환

# driver code
arr = [1,2,3,4]
MatrixChainOrder(arr, len(arr))                             # 18

18

 <h3>4. Floyd Warshall Algorithm : 그래프에서 가능한 모든 노드 쌍에 대해 최단 거리를 구하는 알고리즘</h3>

* D(k)[i,j] = min(D(k-1)[i,j], D(k-1)[i,k]+D(k-1)[i,j]) : i~j까지의 최단거리 = k를 경유하지 않는 경우와 k를 경유하는 경우 중 작은 값

In [20]:
V = 4
INF = 99999

def floydWarshall(graph):
    dist = graph.copy()                                                     # lookup table 초기화 (=graph)

    for k in range(V):                                                      # 경유할 노드를 돌면서
        for i in range(V):                                                  # 출발지부터
            for j in range(V):                                              # 도착지까지
                dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j])       # 최단거리를 계산하여 save
    
    print(dist)

# driver code
graph = [[0,5,INF,10],                                                      #         10
         [INF,0,3,INF],                                                     #   (0) ------> (3) 
         [INF,INF,0,1],                                                     #    |          /|\
         [INF,INF,INF,0]]                                                   #  5 |           | 1
                                                                            #   \|/          |
                                                                            #   (1) ------> (2)
                                                                            #          3

floydWarshall(graph)                                                        # [0,5,8,9],[INF,0,3,4],[INF,INF,0,1],[INF,INF,INF,0]

[[0, 5, 8, 9], [99999, 0, 3, 4], [99999, 99999, 0, 1], [99999, 99999, 99999, 0]]


<h3>5. Bellman Ford Algorithm : 한 노드에서 다른 노드까지의 최단거리를 구하는 알고리즘(nagative edge 포함)</h3>

* 매번 전체 간선을 하나씩 확인하면서 최단거리 테이블을 갱신
* 동일 과정을 반복했을 때 값이 줄어들면 neagative cycle이 존재

In [21]:
class Graph:

    def __init__(self, vertices):                                           # 그래프 생성
        self.V = vertices
        self.graph = []
    
    def addEdge(self, u, v, w):                                             # 간선 추가
        self.graph.append([u,v,w])
    
    def BellmanFord(self, src):
        dist = [float('Inf')] * self.V                                      # lookup table 초기화
        dist[src] = 0                                                       # 출발지까지의 거리 = 0

        for _ in range(self.V - 1):                                         # 각 노드까지
            for u,v,w in self.graph:                                        # 모든 간선을 조사
                if dist[u] != float('Inf') and dist[u] + w < dist[v]:       # 간선이 존재하고 이 간선을 지나가는 것이 더 거리가 짧다면
                    dist[v] = dist[u] + w                                   # lookup table에 값을 save
        
        for u,v,w in self.graph:                                            # negative cycle 검사
            if dist[u] != float('Inf') and dist[u] + w < dist[v]:           # 최단거리 계산 이후 간선을 추가했을 때 값이 더 줄어들면 negative cycle이 존재한다고 판단
                return -1
        
        print(dist)

# driver code
graph = [[0,1,-1],
         [0,2,4],            
         [1,2,3], 
         [1,3,2], 
         [1,4,2], 
         [3,2,5], 
         [3,1,1], 
         [4,3,-3]]

g = Graph(5)
for u,v,w in graph:
    g.addEdge(u,v,w)

g.BellmanFord(0)                                                            # [0,-1,2,-2,1]

[0, -1, 2, -2, 1]


<h3>6. 0/1 Knapsack(배낭문제) : 조합 최적화 문제</h3>

* 한정된 무게를 담을 수 있는 배낭에 담을 수 있는 최대 가치의 물건 조합을 찾는 문제
* P[i,w] = max(P[i-1,w], P[i-1,w-w(i)]+p(i)) : 무게w에서의 배낭의 최대 가치 = i번째 물건을 담지 않았을 때의 가치와 i번째 물건을 담았을 때 배낭의 가치 중 최댓값

In [22]:
def knapSack(W, wt, val, n):
    K = [[0 for x in range(W+1)] for x in range(n+1)]                   # lookup table 초기화(n * W)

    for i in range(n+1):
        for w in range(W+1):                                            # table을 돌면서
            if i == 0 or w == 0:
                K[i][w] = 0
            elif wt[i-1] <= w:                                          # 물건의 무게가 여유공간보다 작으면(w : 배낭의 여유공간)
                K[i][w] = max(K[i-1][w], K[i-1][w-wt[i-1]]+val[i-1])    # 물건을 담았을 때와 담지 않았을 때의 가치를 비교하여 더 큰 값을 save
            else:                                                       # 물건의 무게가 여유공간보다 크면
                K[i][w] = K[i-1][w]                                     # 물건을 넣지 않음
    
    return K[n][W]                                                      # 계산 결과값을 반환

# driver code
val = [60,100,120]
wt = [10,20,30]
W = 50
n = len(val)
knapSack(W, wt, val, n)                                                 # 220

220

<h3>7. Subset Sum(부분집합 합 문제)</h3>

* 집합의 원소의 합이 특정값이 되는지 판단하는 문제
* Knapsack의 Special case

In [24]:
def isSubsetSum(set, n, sum):
    subset = [[False for i in range(sum + 1)] for i in range(n + 1)]                # lookup table 초기화(n * sum)

    for i in range(n + 1):
        subset[i][0] = True

        for i in range(1, sum + 1):
            subset[0][i] = False
        
        for i in range(1, n + 1):
            for j in range(1, sum + 1):                                             # table을 돌면서
                if j < set[i-1]:                                                    # 집합의 원소가 target보다 크면 넘어감
                    subset[i][j] = subset[i-1][j]
                else:                                                               # 집합의 원소가 target보다 작으면
                    subset[i][j] = subset[i-1][j] or subset[i-1][j-set[i-1]]        # 선택하거나 선택하지 않았을 때 target이 나오는지 판단

    return subset[n][sum]                                                           # 계산 결과를 반환

# driver code
set = [3,34,4,12,5,2]
sum = 9
n = len(set)
isSubsetSum(set, n, sum)                                                            # True

True

<h3>8. Optimal BST(최적 이진탐색트리)</h3>

* 이진탐색트리에서 평균 탐색 횟수를 최소로 만드는 이진탐색트리
*  키와 각 키가 검색될 확률이 주어지면 평균계산횟수를 반환
* C[i][j] = min(C[i][k-1]+C[k+1][j] + sum(freq)i->j)
* cost = frequency * 탐색횟수
* CMM과 비슷한 논리(k1~kn을 3등분하여 반복)

In [None]:
INT_MAX = 214783647

def optimalSearchTree(keys, freq, n):
    cost = [[0 for x in range(n)] for x in range(n)]            # lookup table 초기화

    for i in range(n):
        cost[i][i] = freq[i]                                    # main diagonal = freq 
    
    for L in range(2, n+1):
        for i in range(n-L+1):
            j = i + L - 1
            off_set_sum = sum(freq, i, j)                       # root에서의 탐색 cost(모든 노드는 root에서 탐색을 한번 수행)
            cost[i][j] = INT_MAX

            for r in range(i, j+1):
                c = 0
                if r > i:                                       # left subtree의 탐색 cost
                    c += cost[i][r-1]
                if r < j:
                    c += cost[r+1][j]                           # right subtree의 탐색 cost
                c += off_set_sum                                # root에서의 탐색 cost
                if c < cost[i][j]:
                    cost[i][j] = c                              # cost가 작은 값을 save
    
    return cost[0][n-1]                                         # 계산 결과를 반환

def sum(freq, i, j):                                            # i부터 j까지 frequency의 합
    s = 0
    for k in range(i, j + 1):
        s += freq[k]
    return s

# driver code
keys = [10,12,20]
freq = [34,8,50]
n = len(keys)
optimalSearchTree(keys, freq, n)                                # 142

142

<h2>Greedy</h2>

* 매 순간 최선의 선택을 하는 알고리즘
* Local optimal choice ==> Global optimal solution(Optimal substructure)
* Select : 한가지 경우의 수 선택 -> Feasibility check : 최선인지 검사 -> Solution check : 답이 나왔는지 검사

<h3>1. Prim's MST : 그래프에서 간선들의 가중치의 합이 최소인 신장트리를 구하는 알고리즘</h3>

* root에서 시작하여 가장 가까운 노드들을 선택하여 트리를 구성

In [1]:
class Graph:
    def __init__(self, vertices):
        self.V = vertices
        self.graph =[[0 for column in range(vertices)] for row in range(vertices)]    

    def minKey(self, key, mstSet):
        min = 1e9+7
        for v in range(self.V):
            if key[v] < min and mstSet[v] == False:                                                     # 트리에 포함되어있지 않고 간선의 비용이 현재보다 작으면
                min = key[v]                                                                            # 간선을 선택
                min_index = v
        
        return min_index
    
    def primMST(self):
        key = [1e9+7] * self.V                                                                          # 지금까지 탐색한 트리의 간선의 최소비용
        parent = [None] * self.V                                                                        # 노드의 부모노드를 저장하는 리스트
        key[0] = 0
        mstSet = [False] * self.V                                                                       # 트리에 포함된 노드를 기록
        parent[0] = -1                                                                                  # root node = 0번 노드

        for count in range(self.V):                                                                     # 전체 노드를 돌면서
            u = self.minKey(key, mstSet)                                                                # 현재 노드에 연결된 최소 비용의 간선을 찾고 (u = node)
            mstSet[u] = True                                                                            # 최소비용으로 이어진 노드를 트리에 포함시킴

            for v in range(self.V):                                                                     # 전체 노드를 돌면서
                if self.graph[u][v] > 0 and mstSet[v] == False and key[v] > self.graph[u][v]:           # 두 노드가 연결되어있고 노드가 트리에 포함되지 않았으며 지금까지의 최솟값보다 비용이 적은 간선이 있으면
                    key[v] = self.graph[u][v]                                                           # 최솟값을 업데이트
                    parent[v] = u                                                                       # 간선을 선택
        
        for i in range(1, self.V):
            print(parent[i], i, self.graph[i][parent[i]])


# driver code
g = Graph(5)
g.graph = [[0,2,0,6,0],
           [2,0,3,8,5],
           [0,3,0,0,7],
           [6,8,0,0,9],
           [0,5,7,9,0]]
g.primMST()                                                                                             # 0 -- 1 -- 2
                                                                                                        #   \   \
                                                                                                        #     -3  -4

0 1 2
1 2 3
0 3 6
1 4 5


<h3>2. Kruskal's MST : 그래프에서 간선들의 가중치의 합이 최소인 신장트리를 구하는 알고리즘</h3>

* 가장 비용이 낮은 간선들을 먼저 선택
* 모든 노드가 연결되도록 하는 간선들을 모아 트리를 구성

In [3]:
class Graph:

    def __init__(self, vertices):
        self.V = vertices
        self.graph = []
    
    def addEdge(self, u, v, w):
        self.graph.append([u,v,w])

    def find(self, parent, i):                                          # root를 찾는 함수
        if(parent[i] == i):                                             # 부모노드가 없으면(그 트리의 root면)
            return i                                                    # 노드를 반환
        return self.find(parent, parent[i])                             # 부모노드가 있으면 다시 탐색
    
    def union(self, parent, rank, x, y):                                # 두 트리를 합치는 함수
        xroot = self.find(parent, x)                                    # 각 트리의 root를 찾고
        yroot = self.find(parent, y)
        
        if rank[xroot] < rank[yroot]:                                   # 크기가 작은 트리의 root를 큰 트리의 root에 연결
            parent[xroot] = yroot
        elif rank[xroot] > rank[yroot]:
            parent[yroot] = xroot
        else:
            parent[yroot] = xroot
            rank[xroot] += 1
        
    def KruskalMST(self):
        result = []
        i = 0                                                           # 그래프를 참조하는 인덱스
        e = 0                                                           # rank를 참조하는 인덱스
        
        self.graph = sorted(self.graph, key=lambda item : item[2])      # 모든 간선들을 오름차순으로 정렬
        parent = []
        rank = []

        for node in range(self.V):                                      # 노드들의 집합 생성
            parent.append(node)                                         # 모든 노드의 parent를 자기자신으로 초기화
            rank.append(0)                                              # 모든 노드의 rank를 0으로 초기화
        
        while e < self.V - 1:                                           # 모든 간선을 돌면서
            u, v, w = self.graph[i]
            i = i + 1
            x = self.find(parent, u)                                    # sorce node의 root를 찾고    
            y = self.find(parent, v)                                    # destination node의 root를 찾은 뒤

            if x != y:                                                  # 두 노드의 root가 다르다면
                e = e + 1
                result.append([u,v,w])                                  # MST에 간선을 추가
                self.union(parent, rank, x, y)                          # 두 트리를 합침
            
        minimumCost = 0
        for u, v, w in result:
            minimumCost += w
            print(u, v, w)
        print(minimumCost)

# driver code
g = Graph(4)
e = [[0,1,10],
     [0,2,6],
     [0,3,5],
     [1,3,15],
     [2,3,4]]
 
for u,v,w in e:
    g.addEdge(u,v,w)
                                                                        #      4     5      10
g.KruskalMST()                                                          # (2) -- (3) -- (0) -- (1)

2 3 4
0 3 5
0 1 10
19


<h3>3. Dijkstra's Algorithm : 한 노드에서 다른 노드까지의 최단거리를 구하는 알고리즘(positive edge only)</h3>

* Greedy : 현재까지 알고 있던 최단경로를 계속해서 갱신

In [17]:
class Graph():
    
    def __init__(self, vertices):
        self.V = vertices
        self.graph = [[0 for column in range(vertices)] for row in range(vertices)]

    def minDistance(self, dist, sptSet):
        min = 1e9+7

        for u in range(self.V):                                                                             # 노드를 돌면서
            if dist[u] < min and sptSet[u] == False:                                                        # 트리에 포함되지 않은 가장 가까운 노드를 찾음
                min = dist[u]
                min_index = u
        
        return min_index
    
    def dijkstra(self, src):
        dist = [1e9+7] * self.V                                                                             # 출발 노드부터의 최소거리를 저장하는 리스트
        dist[src] = 0
        sptSet = [False] * self.V                                                                           # spanning tree

        for count in range(self.V):
            x = self.minDistance(dist, sptSet)                                                              # 가장 가까운 노드를 찾고
            sptSet[x] = True                                                                                # 트리에 포함시킨 뒤
            
            for y in range(self.V):
                if self.graph[x][y] > 0 and sptSet[y] == False and dist[y] > dist[x] + self.graph[x][y]:    # 각 노드의 최소거리를 갱신
                    dist[y] = dist[x] + self.graph[x][y]
        
        for node in range(self.V):
            print(node, dist[node])

# driver code
g = Graph(5)
g.graph = [[0,2,0,3,0],
           [2,0,4,1,0],
           [0,4,0,5,3],
           [3,1,5,0,4],
           [0,0,3,4,0]]
g.dijkstra(0)

0 0
1 2
2 6
3 3
4 7


<h3>4. Job Sequencing : 제한시간 안에 최대의 이익을 내도록 주어진 일의 순서를 짜는 알고리즘</h3>

* job의 deadline과 profit이 주어지고 모든 job은 한번에 하나씩 수행됨
* deadline안에 최대의 profit을 내도록 job을 scheduling

In [27]:
def jobScheduling(arr, t):
    n = len(arr)
    for i in range(n):                                          # job을 profit이 큰 순서로 정렬
        for j in range(n - 1 - i):
            if arr[j][2] < arr[j+1][2]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
    
    result = [False] * t
    job = ['-1'] * t

    for i in range(len(arr)):                                   # job의 수만큼 반복하면서
        for j in range(min(t-1, arr[i][1] - 1), -1, -1):        # job의 deadline부터 안쪽으로 돌면서
            if result[j] is False:                              # free slot을 찾으면
                result[j] = True
                job[j] = arr[i][0]                              # job을 slot에 넣음
                break
    
    print(job)

# driver code
arr = [['a',2,100],
       ['b',1,19],
       ['c',2,27],
       ['d',1,25],
       ['e',3,15]]
jobScheduling(arr, 3)

['c', 'a', 'e']


<h2>BackTracking</h2>

* 원하는 답이 나올 가능성이 없는 곳은 탐색하지 않음
* DFS로 각 node가 promising하면 탐색, 그렇지 않으면 backtrack(pruning)
* promising function의 설계가 중요함

<h3>1. N-Queens : 체스판에 N개의 퀸을 안전한 상태로 놓는 문제</h3>

In [1]:
global N
N = 4

def isSafe(board, row, col):
    for i in range(col):                                    # 가로줄이 안전한지 확인
        if board [row][i] == 1:
            return False
    
    for i,j in zip(range(row,-1,-1), range(col,-1,-1)):     # \ 방향 대각선이 안전한지 확인
        if board[i][j] == 1:
            return False
    
    for i,j,in zip(range(row,N,1), range(col,-1,-1)):       # / 방향 대각선이 안전한지 확인
        if board[i][j] == 1:
            return False
    
    return True

def solveNQUtil(board, col):
    if col >= N:                                            # base case : 모든 퀸이 보드에 놓였으면 True를 반환
        return True
    
    for i in range(N):                                      # 가로 열을 따라서
        if isSafe(board, i, col):                           # (i,col)이 안전하면
            board[i][col] = 1                               # 퀸을 놓고
            if solveNQUtil(board, col+1) == True:           # 다음 행으로 진행(recursive call)
                return True                                 # 모든 퀸을 놓았으면 True
            board[i][col] = 0                               # 그렇지 않으면 퀸을 수거
    return False                                            # 방법이 없으면 False

def solveNQ():
    board = [[0,0,0,0],
             [0,0,0,0],
             [0,0,0,0],
             [0,0,0,0]]
    if solveNQUtil(board, 0) == False:
        return -1
    
    for i in range(N):
        for j in range(N):
            print(board[i][j], end=" ")
        print()

# driver code
solveNQ()                                                   # 0 0 1 0
                                                            # 1 0 0 0
                                                            # 0 0 0 1
                                                            # 0 1 0 0

0 0 1 0 
1 0 0 0 
0 0 0 1 
0 1 0 0 


<h3>2. Subset Sum(부분집합 합 문제)</h3>

* 집합의 원소의 합이 특정값이 되는지 판단하는 문제
* Knapsack의 Special case

In [36]:
def isSafe(sum, target_sum):
    if sum <= target_sum:                                                                   # subset sum이 target sum보다 작거나 같으면 True
        return True
    else:
        return False

def subsetSumUtil(subset, sum, set, i, n, target_sum):
    if sum == target_sum:                                                                   # base case : subset sum이 target sum과 같으면 True
        return True
    
    for s in range(i, n):                                                                   # 전체 집합을 돌면서
        if isSafe(sum, target_sum):                                                         # 현재 subset sum이 target sum을 넘지 않았다면
            subset.append(set[s])                                                           # subset에 원소를 추가
            if subsetSumUtil(subset, sum + set[s], set, s+1, n, target_sum) == True:        # 다음 원소에 대해 조사(recursive call)하고
                return True                                                                 # subset sum == target sum인 subset을 찾으면 True
            subset.pop()                                                                    # subset에서 가장 최근의 원소를 뺌(backtrack)
            
    return False

def subsetSum(set, target_sum):
    set.sort()
    n = len(set)
    subset = []
    if subsetSumUtil(subset, 0, set, 0, n, target_sum):
        print(subset)
        return True
    else:
        return False

# driver code
set = [3,34,4,12,5,2]
target_sum = 10
subsetSum(set, target_sum)                                                                  # [2,3,5]

[2, 3, 5]


True

<h3>3. M-coloring : 주어진 그래프에 m개의 색을 겹치지 않고 칠할 수 있는지 판단하는 문제</h3>

* 인접한 칸의 색은 모두 달라야 함

In [5]:
N = 4

def isSafe(graph, color):
    for i in range(N):
        for j in range(i+1, N):
            if graph[i][j] and color[j] == color[i]:    # 인접한 두 노드의 색이 같으면 False
                return False
    return True

def graphColoring(graph, m, i, color):
    if(i == 4):                                         # base case : 마지막 노드까지 색칠한 뒤
        if(isSafe(graph, color)):                       # 그래프를 검사하고 이상이 없으면 True
            return True
        return False
    
    for j in range(1, m+1):                             # 색깔의 수만큼 돌면서
        color[i] = j                                    # i번째 노드에 j번째 색을 칠하고
        if graphColoring(graph, m, i+1, color):         # 다음 노드로 진행한 뒤 이상이 없으면 True
            return True
        color[i] = 0                                    # 겹치는 구간이 있었으면 backtrack
    return False

# driver code
graph = [[0,1,1,1],                                     # (3) --- (2)
         [1,0,1,0],                                     # |      / |
         [1,1,0,1],                                     # |    /   |
         [1,0,1,0]]                                     # |  /     |  
m = 3                                                   # (0) --- (1)
color = [0 for i in range(N)]
if graphColoring(graph, m, 0, color):
    for i in range(N):
        print(color[i], end=" ")                        # 1 2 3 2

1 2 3 2 

<h3>4. Hamiltonian Cycle : 그래프에서 해밀턴 경로를 찾는 알고리즘</h3>

* Hamiltonian Cycle : 모든 꼭짓점을 한번씩 지나고 출발노드로 돌아오는 경로

In [13]:
class Graph:
    def __init__(self, vertices):
        self.V = vertices
        self.graph = [[0 for column in range(vertices)] for row in range(vertices)]
    
    def isSafe(self, v, pos, path):
        if self.graph[path[pos-1]][v] == 0:                     # path의 직전 노드에서 현재노드로 이어진 간선이 없으면 False
            return False
    
        for vertex in path:                                     # path에 현재 노드가 이미 있으면 False
            if vertex == v:
                return False
        return True
    
    def hamCycleUtil(self, path, pos):
        if pos == self.V:                                       # base case : 마지막 노드까지 path에 추가한 뒤
            if self.graph[path[pos-1]][path[0]] == 1:           # 출발 노드와 이어진 간선이 있으면 True
                return True
            else:
                return False
        
        for v in range(1, self.V):                              # 모든 노드를 돌면서
            if self.isSafe(v, pos, path) == True:               # 현재 노드가 방문 가능하면
                path[pos] = v                                   # 노드를 방문하고
                if self.hamCycleUtil(path, pos+1) == True:      # 다음 노드를 탐색하고 문제가 없으면 True
                    return True
                path[pos] = -1                                  # cycle이 만들어지지 않으면 backtrack
        
        return False
    
    def hamCycle(self):
        path = [-1] * self.V
        path[0] = 0
        
        if self.hamCycleUtil(path, 1) == False:
            return False
        
        for vertex in path:
            print(vertex, end=" ")
    
# driver code
g = Graph(5)
g.graph = [[0,1,0,1,0],                                         # (0) -- (1) -- (2)
           [1,0,1,1,1],                                         #  |     / \     |
           [0,1,0,0,1],                                         #  |    /   \    |
           [1,1,0,0,1],                                         #  |   /     \   |
           [0,1,1,1,0]]                                         # (3) --------- (4)  
g.hamCycle()

0 1 2 4 3 

<h2>Branch and Bound</h2>

* 원하는 답이 나올 가능성이 없는 곳은 탐색하지 않음
* BFS로 bound function을 만족하면 탐색, 그렇지 않으면 pruning
* Bound function : f = g + h < BEST ==> 현재값 + heuristic이 BEST값보다 작으면(upper bound / 크면 => lower bound) safe.
* Heuristic : solition이 있을 가능성을 보장하는 값

<h3>1. 0/1 Knapsack(배낭문제) : 조합 최적화 문제</h3>

* 한정된 무게를 담을 수 있는 배낭에 담을 수 있는 최대 가치의 물건 조합을 찾는 문제
* Maximization Optimization : upper bound
* bound function : f = g + h
* g : 배낭에 담긴 물건의 가치의 합. sum(profit[item_1] ~ profit[item_i])
* h : 남은 공간에 최대로 넣을 수 있는 물건 가치의 합(fractional knapsack). sum(profit[item_i+1] ~ profit[item_k]) + W-sum(w[1] ~ w[k]) * profit[k+1]/w[k+1] 

In [41]:
class Priority_Queue:
    def __init__(self):
        self.pqueue = []
        self.length = 0
    
    def insert(self, node):
        for i in self.pqueue:
            get_bound(i)
        i = 0
        
        while i < len(self.pqueue):
            if self.pqueue[i].bound > node.bound:
                break
            i += 1
        
        self.pqueue.insert(i, node)
        self.length += 1
    
    def remove(self):
        if self.length > 0:
            result = self.pqueue.pop()
            self.length -= 1
            
            return result
    
class Node:
    def __init__(self, level, profit, weight):
        self.level = level
        self.profit = profit
        self.weight = weight
        self.items = []

def get_bound(node):
    if node.weight >= W:
        return 0
    else:
        result = node.profit
        j = node.level + 1
        total_weight = node.weight
        while j <= n-1 and total_weight + w[j] <= W:
            total_weight = total_weight + w[j]
            result = result + p[j]
            j += 1
        k = j
        if k <= n-1:
            result = result + (W - total_weight) * p_per_weight[k]
        return result


n = 4
W = 16
p = [40,30,50,10]
w = [2,5,10,5]
p_per_weight = [ p / w for p,w in zip(p,w)]

nodes_generated = 0
pq = Priority_Queue()
v = Node(-1,0,0)
nodes_generated += 1
maxprofit = 0
v.bound = get_bound(v)

pq.insert(v)

while pq.length != 0:
    v = pq.remove()

    if v.bound > maxprofit:
        u = Node(0,0,0)
        nodes_generated += 1
        u.level = v.level + 1
        u.profit = v.profit + p[u.level]
        u.weight = v.weight + w[u.level]

        u.items = v.items.copy()
        u.items.append(u.level)

        if u.weight <= W and u.profit > maxprofit:
            maxprofit = u.profit
            bestitems = u.items
        
        u.bound = get_bound(u)

        if u.bound > maxprofit:
            pq.insert(u)
        
        u2 = Node(u.level, v.profit, v.weight)
        nodes_generated += 1
        u2.bound = get_bound(u2)
        u2.items = v.items.copy()

        if u2.bound > maxprofit:
            pq.insert(u2)

print(maxprofit, bestitems)

90 [0, 2]


<h3>2. 8-puzzle : 3*3크기의 숫자퍼즐을 푸는 문제</h3>

* 퍼즐은 1~8까지의 숫자와 공백 한칸으로 구성
* 초기 퍼즐의 모양과 결과를 입력하면 한칸씩 움직이면서 답을 찾음
* Minimization Optimazation : lower bound
* g : 초기 위치부터 지금까지 이동한 횟수
* h : 완성되지 못한 타일이 앞으로 움직여야 하는 최소 횟수

<h3>3. TSP(외판원 문제) : 그래프에서 모든 노드를 한번만 방문하고 시작점으로 돌아오는 최소비용의 경로를 구하는 알고리즘</h3>

* Minimization Optimization : lower bound
* g : 지금까지의 경로의 길이
* h : 모든 노드를 가장 길이가 짧은 간선으로 방문하고 두번째로 길이가 짧은 간선으로 나간다고 가정했을 때 두 간선의 길이의 평균값
* f = g + h, bound = 직전bound - f

In [39]:
maxsize = float('inf')

def copyToFinal(curr_path):
    final_path[:N+1] = curr_path[:]
    final_path[N] = curr_path[0]

def firstMin(adj,i):                                                                                    # 현재 노드에서 가장 가까운 노드까지의 거리를 반환
    min = maxsize
    for k in range(N):
        if adj[i][k] < min and i != k:
            min = adj[i][k]
    return min

def secondMin(adj,i):                                                                                   # 현재 노드에서 두번째로 가까운 노드까지의 거리를 반환
    first, second = maxsize, maxsize
    for j in range(N):
        if i == j:
            continue
        if adj[i][j] <= first:                                                                          # 가장 가까운 노드까지의 거리를 first에 저장
            second = first                                                                              # 현재 firstMin을 secondMin으로 변경
            first = adj[i][j]
        elif adj[i][j] <= second and adj[i][j] != first:                                                # firstMin이 아니고 secondMin보다 가까운 노드를 찾으면
            second = adj[i][j]                                                                          # secondMin에 저장
    return second

def TSPRec(adj, curr_bound, curr_weight, level, curr_path, visited):
    global final_res
    if level == N:                                                                                      # 마지막 노드까지 방문했다면
        if adj[curr_path[level-1]][curr_path[0]] != 0:                                                  # 가장 마지막에 방문한 노드가 출발지와 연결되어있다면
            curr_res = curr_weight + adj[curr_path[level-1]][curr_path[0]]                              # 지금까지의 경로의 거리를 갱신
        if curr_res < final_res:                                                                        # 지금까지의 경로의 거리가 최솟값보다 작다면
            copyToFinal(curr_path)                                                                      # 현재의 경로를 결과에 복사
            final_res = curr_res                                                                        # 현재 경로의 거리를 최솟값으로 지정
        return
    
    for i in range(N):                                                                                  # 모든 노드를 돌면서
        if adj[curr_path[level-1]][i] != 0 and visited[i] == False:                                     # 경로의 마지막 노드에서 이번 노드까지 간선이 있고 이번 노드를 방문하지 않았다면
            temp = curr_bound                                                                           # 현재의 h value를 임시저장하고
            curr_weight += adj[curr_path[level-1]][i]                                                   # g value를 갱신(지금까지의 경로의 거리)

            if level == 1:                                                                              # 만약 첫번째로 방문한 노드라면
                curr_bound -= ((firstMin(adj, curr_path[level-1]) + firstMin(adj,i)) / 2)               # h value값을 갱신(현재 h값 - (직전노드의 firstMin + 현재노드의 firstMin) / 2)
            else:                                                                                       # 첫번째가 아니라면
                curr_bound -= ((secondMin(adj, curr_path[level-1]) + firstMin(adj, i)) / 2)             # h value값을 갱신(현재 h값 - (직전노드의 secondMin + 현재노드의 firstMin) / 2)
            
            if curr_bound + curr_weight < final_res:                                                    # g + h < BEST라면
                curr_path[level] = i                                                                    # 경로에 현재 노드를 추가하고
                visited[i] = True                                                                       # 노드를 방문

                TSPRec(adj, curr_bound, curr_weight, level+1, curr_path, visited)                       # 다음 노드 방문(recursive call)
                                                                                                        # g + h >= BEST라면(prunung)
            curr_weight -= adj[curr_path[level-1]][i]                                                   # g value 복구
            curr_bound = temp                                                                           # h value 복구

            visited = [False] * len(visited)                                                            # 방문한 노드 정보 복구
            for j in range(level):
                if curr_path[j] != -1:
                    visited[curr_path[j]] = True

def TSP(adj):
    curr_bound = 0                                                                                      # h value
    curr_path = [-1] * (N+1)                                                                            # 현재 경로
    visited = [False] * N                                                                               # 방문한 노드

    for i in range(N):
        curr_bound += ((firstMin(adj,i) + secondMin(adj, i)))                                           # 초기 h값 설정(ceil(모든 노드의 firstMin과 secondMin의 합 / 2))
    
    curr_bound = (curr_bound / 2) + 1 if (curr_bound / 2) > (curr_bound // 2) else (curr_bound / 2)

    visited[0] = True                                                                                   # 출발 노드 방문
    curr_path[0] = 0

    TSPRec(adj, curr_bound, 0, 1, curr_path, visited)

# driver code
adj = [[0,10,15,20],
       [10,0,35,25],
       [15,35,0,30],
       [20,25,30,0]]
N = 4
final_path = [None] * (N+1)
visited = [False] * N
final_res = maxsize
TSP(adj)
print(final_res)                                                                                            # 80
for i in range(N+1):
    print(final_path[i], end=' ')                                                                           # 0 1 3 2 0

80
0 1 3 2 0 