# Tree

- 트리는 empty이거나, empty가 아니면 루트 R과 트리의 집합으로 구성되는데 각 트리의 루트는 R의 자식노드이다. 단, 트리의 집합은 공집합일 수도 있다.

### 용어

- 루트(Root): 트리의 최상위에 있는 노드
- 자식(Child)노드: 노드 하위에 연결된 노드
- 차수(Degree): 자식노드 수
- 부모(Parent)노드: 노드의 상위에 연결된 노드
- 이파리(Leaf): 자식이 없는 노드
- 형제(Sibling)노드: 동일한 부모를 가지는 노드
- 조상(Ancestor)노드: 루트까지의 경로상에 있는 모든 노드들의 집합
- 후손(Descendant)노드: 노드 아래로 매달린 모든 노드들의 집합
- 서브트리(Subtree): 노드 자신과 후손노드로 구성된 트리
- 레벨(Level): 루트가 레벨 1에 있고, 아래 층으로 내려가며 레벨이 1씩 증가한다. 레벨은 깊이(Depth)와 같다.
- 높이(Heigh): 트리의 최대 레벨
- 키(Key): 탐색에 사용되는 노드에 저장된 정보

### 응용

- 왼쪽자식-오른쪽형제 표현은 노드의 차수가 일정하지 않은 일반적인 트리를 구현하는 매우 효율적인 자료구조
- HTML과 XML의 문서 트리, 운영체제의 파일시스템, 탐색트리, 이항(Binomial)힙, 피보나치힙과 같은 우선순위큐에 사용된다.

## 이진트리

- empty이거나, empty가 아니면, 루트와 2개의 이진트리인 왼쪽 서브트리와 오른쪽 서브트리로 구성된다.
- 포화이진트리(Full Binary Tree): 모든 이파리의 깊이가 같고 각 내부노드가 2개의 자식노드를 가지는 트리
- 완전이진트리(Complete Binary Tree): 마지막 레벨을 제외한 각 레벨이 노드들로 꽉 차있고, 마지막 레벨에는 노드들이 왼쪽부터 빠짐없이 채워진 트리. 포화이진트리는 완전이진트리이기도 하다.
- 레벨 k에 있는 최대 노드 수는 2^k-1이다. 단, k=1,2,3,...이다.
- 높이가 h인 포화이진트리에 있는 노드 수는 2^n -1이다.
- N개의 노드를 가진 완전이진트리의 높이는 log2(N+1)이다.

In [6]:
class Node:
    def __init__(self, item, left=None, right=None):
        self.item = item
        self.left = left
        self.right = right
        
class BinaryTree:
    def __init__(self):
        self.root = None
    
    '''
    # 전위순회
    노드 n에 도착했을 때 n을 먼저 방문한다.
    그 다음에 n의 왼쪽 자식노드로 순회를 계속한다.
    n의 왼쪽 서브트리의 모든 노드들을 방문한 후에는
    n의 오른쪽 서브트리의 모든 후손 노드들을 방문한다.
    '''
    def preorder(self, n):
        if n != None:
            print(str(n.item), ' ', end='')
            if n.left:
                self.preorder(n.left)
            if n.right:
                self.preorder(n.right)
                
    '''
    # 중위순회
    노드 N에 도착하면 n의 방문을 보류하고 n의 왼쪽 서브트리로 순회를 진행한다.
    왼쪽 서브트리의 모든 노드들을 방문한 후에 n을 방문한다.
    n을 방문한 후에는 n의 오른쪽 서브트리를 같은 방식으로 방문한다.
    '''
    def inorder(self, n):
        if n != None:
            if n.left:
                self.inorder(n.left)
            print(str(n.item), ' ', end='')
            if n.right:
                self.inorder(n.right)
                
    '''
    # 후위순회
    노드 n에 도착하면 n의 방문을 보류하고 n의 왼쪽 서브트리로 순회를 진행한다.
    n의 왼쪽 서브트리를 방문한 후에는 n의 오른쪽 서브트리를 같은 방식으로 방문한다.
    마지막에 n을 방문한다.
    '''
    def postorder(self, n):
        if n != None:
            if n.left:
                self.postorder(n.left)
            if n.right:
                self.postorder(n.right)
            print(str(n.item), ' ', end='')
    
    '''
    # 레벨순회
    루트가 있는 최상위 레벨부터 시작하여 각 레벨마다 좌에서 우로 노드들을 방문한다.
    '''
    def levelorder(self, root):
        q = []
        q.append(root)
        while len(q) != 0:
            t = q.pop(0)
            print(str(t.item), ' ', end='')
            if t.left != None:
                q.append(t.left)
            if t.right != None:
                q.append(t.right)
                
    '''
    # 이진트리의 높이
    트리의 높이 = 1 + max(루트의 왼쪽서브트리의 높이, 루트의 오른쪽 서브트리의 높이)
    1은 루트 자신
    '''
    def height(self, root):
        if root == None:
            return 0
        return max(self.height(root.left), self.height(root.right)) + 1

In [7]:
t = BinaryTree()
n1 = Node(100)
n2 = Node(200)
n3 = Node(300)
n4 = Node(400)
n5 = Node(500)
n6 = Node(600)
n7 = Node(700)
n8 = Node(800)
n1.left = n2
n1.right = n3
n2.left = n4
n2.right = n5
n3.left = n6
n3.right = n7
n4.left = n8
t.root = n1

print('트리 높이 =', t.height(t.root))
print('전위순회:\t', end='')
t.preorder(t.root)
print('\n중위순회:\t', end='')
t.inorder(t.root)
print('\n후위순회:\t', end='')
t.postorder(t.root)
print('\n레벨순회:\t', end='')
t.levelorder(t.root)

트리 높이 = 4
전위순회:	100  200  400  800  500  300  600  700  
중위순회:	800  400  200  500  100  600  300  700  
후위순회:	800  400  500  200  600  700  300  100  
레벨순회:	100  200  300  400  500  600  700  800  

- 스레드 이진트리

각 노드의 오른쪽 None 레퍼런스를 다음 방문할 노드를 참조하게 하고, 각 노드의 왼쪽 None 레퍼런스를 직전 방문한 노드를 참조하게 한 이진트리

## 이진힙

- 완전이진트리로서 부모의 우선순위가 자식의 우선순위보다 높은 자료구조

In [9]:
class BHeap:
    def __init__(self, a):
        self.a = a
        self.N = len(a) - 1
        
    def create_heap(self):
        for i in range(self.N//2, 0, -1):
            self.downheap(i)
            
    def insert(self, key_value):
        self.N += 1
        self.a.append(key_value)
        self.upheap(self.N)
        
    def delete_min(self):
        if self.N == 0:
            print('힙이 비어 있음')
            return None
        minimum = self.a[1]
        self.a[1], self.a[-1] = self.a[-1], self.a[1]
        del self.a[-1]
        self.N -= 1
        self.downheap(1)
        return minimum
    
    def downheap(self, i):
        while 2*i <= self.N:
            k = 2*i
            if k < self.N and self.a[k][0] > self.a[k+1][0]:
                k += 1
            if self.a[i][0] < self.a[k][0]:
                break
            self.a[i], self.a[k] = self.a[k], self.a[i]
            i = k
            
    def upheap(self, j):
        while j > 1 and self.a[j//2][0] > self.a[j][0]:
            self.a[j], self.a[j//2] = self.a[j//2], self.a[j]
            j = j//2
            
    def print_heap(self):
        for i in range(1, self.N+1):
            print('[%2d' % self.a[i][0], self.a[i][1], ']', end='')
        print('\n힙 크기 = ', self.N)

In [10]:
a = [None] *1
a.append([90, 'watermelon'])
a.append([80, 'pear'])
a.append([70, 'melon'])
a.append([50, 'lime'])
a.append([60, 'mango'])
a.append([20, 'cherry'])
a.append([30, 'grape'])
a.append([35, 'orange'])
a.append([10, 'apricot'])
a.append([15, 'banana'])
a.append([45, 'lemon'])
a.append([40, 'kiwi'])
b = BHeap(a)
print('힙 만들기 전:')
b.print_heap()
b.create_heap()
print('최소힙:')
b.print_heap()
print('최솟값 삭제 후')
print(b.delete_min())
b.print_heap()
b.insert([5, 'apple'])
print('5 삽입 후')
b.print_heap()

힙 만들기 전:
[90 watermelon ][80 pear ][70 melon ][50 lime ][60 mango ][20 cherry ][30 grape ][35 orange ][10 apricot ][15 banana ][45 lemon ][40 kiwi ]
힙 크기 =  12
최소힙:
[10 apricot ][15 banana ][20 cherry ][35 orange ][45 lemon ][40 kiwi ][30 grape ][80 pear ][50 lime ][60 mango ][90 watermelon ][70 melon ]
힙 크기 =  12
최솟값 삭제 후
[10, 'apricot']
[15 banana ][35 orange ][20 cherry ][50 lime ][45 lemon ][40 kiwi ][30 grape ][80 pear ][70 melon ][60 mango ][90 watermelon ]
힙 크기 =  11
5 삽입 후
[ 5 apple ][35 orange ][15 banana ][50 lime ][45 lemon ][20 cherry ][30 grape ][80 pear ][70 melon ][60 mango ][90 watermelon ][40 kiwi ]
힙 크기 =  12


## 파이썬의 heapq

- heapq.heappush(heap, item) : insert()와 동일
- heapq.heappop(heap) : delete_min()와 동일
- heapq.heappushpop(heap, item) : item을 삽입후 delete_min()을 수행
- heapq.heapify(x) : create_heap()와 동일
- heapq.heapreplace(heap, item) : delete_min() 수행후, item 삽입

### 응용

- 이진힙은 우선순위를 가진 데이터를 처리하는 자료구조
- 관공서, 은행, 병원, 우체국, 대형마켓, 공항 등에서 이루어지는 업무와 관련된 이벤트 처리, 컴퓨터 운영체제의 프로세스 처리, 네트워크 라우터에서의 패킷 처리 등에 적합한 자료구조
- 실시간 급상승 검색어(데이터 스트림에서 Top k 항목 유지) 제공을 위한 적절한 자료구조
- 파일 압축에 사용되는 허프만 코딩, 힙정렬, Prim의 최소신장트리 알고리즘, Dijkstra의 최단경로 알고리즘에 활용

## 요약

- 트리는 계층적 자료구조로서 파이썬의 리스트나 연결리스트의 단점을 보완
- 왼쪽자식-오른쪽형제 표현은 노드의 차수가 일정하지 않은 일반적인 트리를 구현하는 매우 효율적인 자료구조
- 이진트리의 순회 방법은 전위순회(NLR), 중위순회(LNR), 후외순회(LRN), 레벨순회가 있다. 레벨순회는 큐 자료구조를 사용해서 구현된다.
- 이진트리의 높이는 후위순회 방식으로 계산한다.
- 스택 없이 이진트리를 순회하기 위해 노드의 None 레퍼런스 대신 다음에 방문할 노드의 레퍼런스를 저장한 이진트리를 스레드 이진트리라 한다.
- 이진트리의 높이 계산, 트리의 각 순회 방식은 트리의 모든 노드들을 방문해야 하므로 각각 O(N) 시간이 소요된다.
- 우선순위큐는 가장 높은 우선순위를 가진 항목을 접근, 삭제, 삽입 연산을 지원하는 자료구조
- 이진힙은 완전이진트리로서 부모의 우선순위가 자식의 우선순위보다 높은 우선순위큐 자료구조이다. 이진힙은 키값이 작을수록 높은 순위를 가지는 최소힙과 클수록 더 높은 우선순위를 가지는 최대힙이 있다.
- 파이썬은 우선순위큐를 위해 heapq를 라이브러리로 제공한다.