<h1>파이썬 알고리즘 정리</h1>

<h2>Divide and Conquer</h2>

* 문제를 작은 단위로 나누고 해결하는 방법
* Divide + Conquer + Merge
* Subproblem이 전체 문제에 비해 크기가 작을 때 유리(ex : N times -> N/2 times -> N/4 times ...)

<h3>1. Binary Search(이진탐색) : 정렬된 리스트에서 특정 값의 위치를 찾는 알고리즘</h3>


* Recursive implementation

In [1]:
def binarySearch(arr, l, r, x):
    
    if r >= l:                                              # base case : 오른쪽 인덱스가 왼쪽 인덱스보다 커야 함. 그렇지 않으면 -1을 리턴
        mid = l + (r - 1) // 2                              # 가운데 위치를 계산

        if arr[mid] == x:                                   # 찾는 값이 가운데에 있으면
            return mid                                      # mid 인덱스를 반환
        
        elif arr[mid] > x:                                  # 찾는 값이 중간값보다 작으면
            return binarySearch(arr, l, mid-1, x)           # 왼쪽 배열에서 다시 탐색을 진행
        
        else:                                               # 찾는 값이 중간값보다 크면
            return binarySearch(arr, mid+1, r, x)           # 오른쪽 배열에서 다시 탐색을 진행
    
    else:
        return -1


# driver code
arr = [2,3,4,10,40]
x = 10

print(binarySearch(arr, 0, len(arr)-1, x))                  # 3

3


* Iteravive implementation

In [2]:
def binarySearch_iter(arr, l, r, x):
    
    while l <= r:
        mid = l + (r-1) // 2

        if arr[mid] == x:
            return mid
        
        elif arr[mid] > x:
            r = mid - 1                                 # 함수 호출 없이 인덱스를 이동
        
        else:
            l = mid + 1                                 # 함수 호출 없이 인덱스를 이동
    
    return -1

# driver code
arr = [2,3,4,10,40]
x = 10

print(binarySearch_iter(arr, 0, len(arr)-1, x))         # 3

3


<h3>2. Merge Sort(합병정렬) : 리스트 정렬 알고리즘 - divde -> sort -> merge</h3>

In [4]:
def mergeSort(arr):
    
    if len(arr) > 1:                            # base case : 배열의 길이가 1보다 길어야 함
        mid = len(arr) // 2                     # mid인덱스 계산
        l = arr[:mid]                           # 왼쪽 배열 생성
        r = arr[mid:]                           # 오른쪽 배열 생성

        mergeSort(l)                            # 왼쪽 배열 정렬
        mergeSort(r)                            # 오른쪽 배열 정렬

        i = j = k = 0                           # 인덱스 초기화

        # merge
        while i < len(l) and j < len(r):        # 양쪽 배열 모두 남아있으면
            if l[i] < r[j]:                     # 왼쪽 값이 오른쪽 값보다 작으면
                arr[k] = l[i]                   # 왼쪽 값을 배열에 넣음
                i += 1
            else:                               # 오른쪽 값이 더 작으면
                arr[k] = r[j]                   # 오른쪽 값을 배열에 넣음
                j += 1
            k += 1

        while i < len(l):                       # 왼쪽 배열에 남아있는게 있으면
            arr[k] = l[i]                       # 배열에 하나씩 넣음
            i += 1
            k += 1
        
        while j < len(r):                       # 오른쪽 배열에 남아있는게 있으면
            arr[k] = r[j]                       # 배열에 하나씩 넣음
            j += 1
            k += 1
            

# driver code
arr = [12,11,5,13,6,7]
mergeSort(arr)
print(arr)                                      # [5,6,7,11,12,13]

[5, 6, 7, 11, 12, 13]


<h3>3. Quick Sort(퀵 정렬) : 리스트 정렬 알고리즘 - pivot기준</h3>

In [10]:
def partition(array, low, high):
    
    pivot = array[high]                                             # 가장 마지막 값으로 pivot을 설정
    i = low - 1

    for j in range(low, high):                                      # array를 돌면서
        if array[j] <= pivot:                                       # pivot보다 작은 값이 있으면
            i += 1
            (array[i], array[j]) = (array[j], array[i])             # 앞쪽으로 swap

    (array[i+1], array[high]) = (array[high], array[i+1])           # pivot의 값을 가운데로 swap
    return i + 1


def quickSort(array, low, high):

    if low < high:                                                  # base case : array에 하나 이상의 숫자가 존재
        pi = partition(array, low, high)                            # pivot을 기준으로 왼쪽을 pivot보다 작게, 오른쪽은 pivot보다 크게 분할  - divide
        quickSort(array, low, pi - 1)                               # 왼쪽 array에 대해서 반복                                          - conquer
        quickSort(array, pi + 1, high)                              # 오른쪽 array에 대해서 반복                                        -conquer


# driver code
array = [10,7,8,9,1,5]
quickSort(array, 0, len(array) - 1)
print(array)                                                        # [1,5,7,8,9,10]

[1, 5, 7, 8, 9, 10]


<h2>Dynamic Programming</h2>

* Subproblem이 전체문제와 크기가 비슷할 때(D&C가 비효율적일때)(ex : N times -> N-1 times -> N-2 times ...) or Subproblem에 중복이 발생할 때 유리(ex : x5 = x3 + x4, x4 = x3 + x2 ...)
* 하나의 문제는 한번만 풀도록 하는 알고리즘
* Bottom up, Save and Reuse(lookup), clever enumeration
* 예시를 통해 수학적 표현을 얻고(recursion) 반복문을 통해 테이블을 채워나가는 방식
* Principle of optimality : optimal substructure(subproblem에서의 답은 original problem에서도 동일하다)

<h3>1. Fibonacci(피보나치 수열) : fib(n) = fib(n-1) + fib(n-2)</h3>

* Recursive implementation(D&C)

In [11]:
def Fibonacci(n):
    if n < 0:                                       # base code : n은 0 이상
        return -1
    
    elif n == 0 :
        return 0
    
    elif n == 1 or n == 2:
        return 1
    
    else:
        return Fibonacci(n-1) + Fibonacci(n-2)      # recursive call

# driver code
Fibonacci(9)                                        # 34

34

* Dynamic Programing

In [12]:
FibArray = [0,1]                                            # lookup table

def fibonacci(n):

    if n < 0:
        return -1
    
    elif n < len(FibArray):                                 # table에 값이 있으면 reuse
        return FibArray[n]

    else:
        FibArray.append(fibonacci(n-1) + fibonacci(n-2))    # table에 값이 없으면 save
        return FibArray[n]

# driver code
fibonacci(9)                                                # 34

34

* Space optimized(DP)

In [13]:
def fibonacci_opt(n):
    a = 0
    b = 1

    if n < 0:
        return -1
        
    elif n == 0:
        return a
    elif n == 1:
        return b

    else:
        for i in range(1, n):                               # 1 ~ n까지 bottom up으로 계산
            c = a + b
            a = b
            b = c
        return b

# driver code
fibonacci_opt(9)                                            # 34

34

<h3>2. Binomial Coefficient(이항계수) : (n,k) = (n-1,k-1) + (n-1,k)</h3>

In [14]:
def binomialCoef(n,k):
    C = [[0 for x in range(k+1)]for x in range(n+1)]    # lookup table 초기화

    for i in range(n+1):                                # table을 채워나감
        for j in range(min(i, k)+1):
            if j == 0 or j == i:
                C[i][j] = 1
            else:
                C[i][j] = C[i-1][j-1] + C[i-1][j]
    
    return C[n][k]                                      # 최종 계산결과 반환

# driver code
n, k = 5, 2
binomialCoef(n,k)                                           # 10

10

<h3>3. Chained Matrix Multiplication(연쇄행렬 최소곱셈) : 주어진 행렬들의 곱을 최소의 연산으로 수행하는 최소 횟수를 구하는 알고리즘</h3>

* M[i,j] = min(M[i,k] + M[k+1,j] + C(i-1)*C(k)*C(j)) for i<= k<=j-1, M[i,i] = 0

In [15]:
maxint = int(1e9+7)

def MatrixChainOrder(p,n):
    m = [[0 for x in range(n)] for x in range(n)]           # lookup table 초기화

    for i in range(n):
        m[i][i] = 0                                         # 자기자신과의 곱셈은 0
    
    for L in range(2,n):                                    # L = matrix chain의 길이
        for i in range(1, n-L + 1):
            j = i + L-1
            m[i][j] = maxint                                # i번째 matrix부터 j번째 matrix까지의 곱셈횟수를 maxint값으로 초기화

            for k in range(i,j):                            # 중간에 나눌 곳을 이동하면서
                q = m[i][k] + m[k+1][j] + p[i-1]*p[k]*p[j]  # 곱셈 횟수를 계산
                if q < m[i][j]:                             # 현재값보다 적은 횟수가 가능하면
                    m[i][j] = q                             # 값을 교체해서 save
    
    return m[1][n-1]                                        # 최종 계산결과를 반환

# driver code
arr = [1,2,3,4]
MatrixChainOrder(arr, len(arr))                             # 18

18

 <h3>4. Floyd Warshall Algorithm : 그래프에서 가능한 모든 노드 쌍에 대해 최단 거리를 구하는 알고리즘</h3>

* D(k)[i,j] = min(D(k-1)[i,j], D(k-1)[i,k]+D(k-1)[i,j]) : i~j까지의 최단거리 = k를 경유하지 않는 경우와 k를 경유하는 경우 중 작은 값

In [20]:
V = 4
INF = 99999

def floydWarshall(graph):
    dist = graph.copy()                                                     # lookup table 초기화 (=graph)

    for k in range(V):                                                      # 경유할 노드를 돌면서
        for i in range(V):                                                  # 출발지부터
            for j in range(V):                                              # 도착지까지
                dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j])       # 최단거리를 계산하여 save
    
    print(dist)

# driver code
graph = [[0,5,INF,10],                                                      #         10
         [INF,0,3,INF],                                                     #   (0) ------> (3) 
         [INF,INF,0,1],                                                     #    |          /|\
         [INF,INF,INF,0]]                                                   #  5 |           | 1
                                                                            #   \|/          |
                                                                            #   (1) ------> (2)
                                                                            #          3

floydWarshall(graph)                                                        # [0,5,8,9],[INF,0,3,4],[INF,INF,0,1],[INF,INF,INF,0]

[[0, 5, 8, 9], [99999, 0, 3, 4], [99999, 99999, 0, 1], [99999, 99999, 99999, 0]]


<h3>5. Bellman Ford Algorithm : 한 노드에서 다른 노드까지의 최단거리를 구하는 알고리즘(nagative edge 포함)</h3>

* 매번 전체 간선을 하나씩 확인하면서 최단거리 테이블을 갱신
* 동일 과정을 반복했을 때 값이 줄어들면 neagative cycle이 존재

In [21]:
class Graph:

    def __init__(self, vertices):                                           # 그래프 생성
        self.V = vertices
        self.graph = []
    
    def addEdge(self, u, v, w):                                             # 간선 추가
        self.graph.append([u,v,w])
    
    def BellmanFord(self, src):
        dist = [float('Inf')] * self.V                                      # lookup table 초기화
        dist[src] = 0                                                       # 출발지까지의 거리 = 0

        for _ in range(self.V - 1):                                         # 각 노드까지
            for u,v,w in self.graph:                                        # 모든 간선을 조사
                if dist[u] != float('Inf') and dist[u] + w < dist[v]:       # 간선이 존재하고 이 간선을 지나가는 것이 더 거리가 짧다면
                    dist[v] = dist[u] + w                                   # lookup table에 값을 save
        
        for u,v,w in self.graph:                                            # negative cycle 검사
            if dist[u] != float('Inf') and dist[u] + w < dist[v]:           # 최단거리 계산 이후 간선을 추가했을 때 값이 더 줄어들면 negative cycle이 존재한다고 판단
                return -1
        
        print(dist)

# driver code
graph = [[0,1,-1],
         [0,2,4],            
         [1,2,3], 
         [1,3,2], 
         [1,4,2], 
         [3,2,5], 
         [3,1,1], 
         [4,3,-3]]

g = Graph(5)
for u,v,w in graph:
    g.addEdge(u,v,w)

g.BellmanFord(0)                                                            # [0,-1,2,-2,1]

[0, -1, 2, -2, 1]


<h3>6. 0/1 Knapsack(배낭문제) : 조합 최적화 문제</h3>

* 한정된 무게를 담을 수 있는 배낭에 담을 수 있는 최대 가치의 물건 조합을 찾는 문제
* P[i,w] = max(P[i-1,w], P[i-1,w-w(i)]+p(i)) : 무게w에서의 배낭의 최대 가치 = i번째 물건을 담지 않았을 때의 가치와 i번째 물건을 담았을 때 배낭의 가치 중 최댓값

In [22]:
def knapSack(W, wt, val, n):
    K = [[0 for x in range(W+1)] for x in range(n+1)]                   # lookup table 초기화(n * W)

    for i in range(n+1):
        for w in range(W+1):                                            # table을 돌면서
            if i == 0 or w == 0:
                K[i][w] = 0
            elif wt[i-1] <= w:                                          # 물건의 무게가 여유공간보다 작으면(w : 배낭의 여유공간)
                K[i][w] = max(K[i-1][w], K[i-1][w-wt[i-1]]+val[i-1])    # 물건을 담았을 때와 담지 않았을 때의 가치를 비교하여 더 큰 값을 save
            else:                                                       # 물건의 무게가 여유공간보다 크면
                K[i][w] = K[i-1][w]                                     # 물건을 넣지 않음
    
    return K[n][W]                                                      # 계산 결과값을 반환

# driver code
val = [60,100,120]
wt = [10,20,30]
W = 50
n = len(val)
knapSack(W, wt, val, n)                                                 # 220

220

<h3>7. Subset Sum(부분집합 합 문제)</h3>

* 집합의 원소의 합이 특정값이 되는지 판단하는 문제
* Knapsack의 Special case

In [24]:
def isSubsetSum(set, n, sum):
    subset = [[False for i in range(sum + 1)] for i in range(n + 1)]                # lookup table 초기화(n * sum)

    for i in range(n + 1):
        subset[i][0] = True

        for i in range(1, sum + 1):
            subset[0][i] = False
        
        for i in range(1, n + 1):
            for j in range(1, sum + 1):                                             # table을 돌면서
                if j < set[i-1]:                                                    # 집합의 원소가 target보다 크면 넘어감
                    subset[i][j] = subset[i-1][j]
                else:                                                               # 집합의 원소가 target보다 작으면
                    subset[i][j] = subset[i-1][j] or subset[i-1][j-set[i-1]]        # 선택하거나 선택하지 않았을 때 target이 나오는지 판단

    return subset[n][sum]                                                           # 계산 결과를 반환

# driver code
set = [3,34,4,12,5,2]
sum = 9
n = len(set)
isSubsetSum(set, n, sum)                                                            # True

True

<h3>8. Optimal BST(최적 이진탐색트리)</h3>

* 이진탐색트리에서 평균 탐색 횟수를 최소로 만드는 이진탐색트리
*  키와 각 키가 검색될 확률이 주어지면 평균계산횟수를 반환
* C[i][j] = min(C[i][k-1]+C[k+1][j] + sum(freq)i->j)
* cost = frequency * 탐색횟수
* CMM과 비슷한 논리(k1~kn을 3등분하여 반복)

In [36]:
INT_MAX = 214783647

def optimalSearchTree(keys, freq, n):
    cost = [[0 for x in range(n)] for x in range(n)]            # lookup table 초기화

    for i in range(n):
        cost[i][i] = freq[i]                                    # main diagonal = freq 
    
    for L in range(2, n+1):
        for i in range(n-L+1):
            j = i + L - 1
            off_set_sum = sum(freq, i, j)                       # root에서의 탐색 cost(모든 노드는 root에서 탐색을 한번 수행)
            cost[i][j] = INT_MAX

            for r in range(i, j+1):
                c = 0
                if r > i:                                       # left subtree의 탐색 cost
                    c += cost[i][r-1]
                if r < j:
                    c += cost[r+1][j]                           # right subtree의 탐색 cost
                c += off_set_sum                                # root에서의 탐색 cost
                if c < cost[i][j]:
                    cost[i][j] = c                              # cost가 작은 값을 save
    
    return cost[0][n-1]                                         # 계산 결과를 반환

def sum(freq, i, j):                                            # i부터 j까지 frequency의 합
    s = 0
    for k in range(i, j + 1):
        s += freq[k]
    return s

# driver code
keys = [10,12,20]
freq = [34,8,50]
n = len(keys)
optimalSearchTree(keys, freq, n)                                # 142

142