# 트리
- 계층적인 자료의 표현에 적합한 자료구조
- 응용분야
    - 폴더 구조의 표현
    - 탐색 트리
    - 힙 트리(우선순위 큐 결합)
    - 결정 트리(인공지능의 의사 결정 구조)
- 용어 
    - tree T
        - 노드들의 집합(a set of nodes)
        - 노드는 부모, 자식 관계(parent-child relationship)
    - 루트 노드(root)
        - T가 noneempty일 때, 부모가 없는 노드
        - 계층의 가장 높은 곳에 있는 노드
    - 간선 또는 에지: 노드와 노드를 연결한 선
    - 부모 노드(parent)
        - 자신의 레벨(level)보다 이전에 있는 노드
        - 즉 자신의 (level - 1)인 노드
    - 자식 노드(child)
        - 어떤 노드가 unuque parent node를 가질 때, 부모 w를 가진 도느들은 w의 자식(child)이다.
    - 형제 노드
        - 동일한 부모 노드를 가진 노드
        - 복수의 노드가 같은 부모의 children일 때
    - 조상(ancestor) 노드
        - 어떤 노드의 root까지 경로에 있는 노드들
    - 자손(decendant) 노드
        - 어떤 노드를 출발점으로 하위 레벨에 연결된 모든 노드들
    - 단말(terminal, leaf, enternal) 노드
        - 자식 노드가 업는 노드
    - 비단말 노드(nonterminal/internal)
        - children이 있는 노드
    - 간선 또는 에지(edge) / 링크(link)
        - 부모 노드와 자식 노드를 연결한 선 or vice versa
    - 노드 차수(node degree)
        - 어떤 노드가 가지고 있는 자식의 수
    - 트리 차수(Tree degree)
        - tree T의 노드 차수 중에서 가장 큰 차수
    - 레벨(level)
        - root부터 시작하여 한 세대씩 내려가면서 1씩 증가
        - 교재에서는 1부터 시작(0부터 시작하기도 함)
    - 깊이(depth)
        - 자신부터 root까지의 edge 수. Unique path
        - root의 depth은 0
    - 높이(height)
        - 자신부터 가장 멀리 있는 leaf node까지의 경로의 edge 수
        - leaf node의 height은 0
    - 경로(path)
        - 두 노드 사이를 연결하는 edge sequence
        - 경로 길이: edge의 수
    - 트리 높이(height)
        - tree T의 레벨 중에서 가장 큰 값(0부터 시작할 때). 즉, root의 높이(height)
        - 교재에서는 트리가 가지고 있는 최대 레벨로 계산(레벨은 1부터 시작)
    - 서브 트리(subtree)
        - 어떤 노드와 그 노드의 자손 노드들로만 구성된 트리
    - 포레스트(forest)
        - 트리들의 서로소 집합(disjoint set)
- 기본 성질
    - 트리는 재귀적이다.
        - 하나의 트리는 여러 개의 subtree로 구성되어있기 떄문이다.
    - 노드가 n개인 트리는 항상 n-1개의 edge를 가진다.
    - 트리에서, 루트에서 어떤 노드로 가는 경로는 유일하다.
        - 또한, 임의의 두 노드 간의 경로도 유일하다. (단, 같은 노드를 두 번 이상 방문하지 않을 때)

## 이진 트리
- 모든 노드가 2개의 서브 트리를 갖는 트리
    - 서브트리는 공집합일 수 있다
    - 모든 노드의 차수는 2 이하이다.
    - 왼쪽 자식이 오른쪽 자식보다 order가 높다
    - 이진 트리는 순환적으로 정의된다.
    - 서브트리간의 순서도 존재한다 (왼쪽, 오른쪽 순)
        - 노드의 번호는 위에서 아래, 왼쪽에서 오른쪽 순서로 번호를 할당한다.
### 이진 트리의 분류
- 포화 이진 트리(full binary tree)
    - 트리의 각 레벨에 노드가 꽉 차있는 이진 트리
    - 노드의 개수를 n, height가 h일 때, n=2^h-1이다.
- 완전 이진 트리(complete binary tree)
    - 노드의 개수를 n, height가 h일 때
        - 2^h-1 < n < 2^h-1
    - 높이가 h일때, 레벨1부터 h-1까지는 노드가 모두 채워짐
    - 마지막 레벨 h에서는 노드가 왼쪽부터 순서대로 채워짐
    - 예: heap 구조

### 이진 트리의 연산
- 순회
    - 트리에 속하는 모든 노드를 한 번씩 방문하는 체계적인 방법
    - 선형 자료구조는 순회가 단순함
    - 비선형 구조인 트리는 다양한 방법이 있음
    - 예) treeT의 모든 노드의 key를 출력하기

#### 순회 연산
- 규칙은 root, left subtree, right subtree를 방문하는 순서에 따라
    - L: 왼쪽 서브트리, R: 오른쪽 서브트리, V: 루트 노드
    - 전위 순회(preorder traversal): VLR
    - 중위 순회(inorder traversal): LVR
    - 후위 순회(postorder traversal): LRV
- 각 서브트리의 노드 방문: 동일한 순회
- 전체 트리나 서브트리나 구조는 동일
    - 순환(재귀: recursion)
- 응용 예시
    - 노드의 레벨 계산
    - 구조화된 문서 출력

In [3]:
class TNode:								
    def __init__ (self, data, left, right):	
        self.data = data 					
        self.left = left					
        self.right = right

# VLR 예시
def preorder(n): # 전위 순회 함수
    if n is not None :
        print(n.data, end=' ') #먼저 루트노드 처리(화면 출력)
        if n.left:
            preorder(n.left) #왼쪽 서브트리 처리
        if n.rignt:
            preorder(n.right) #오른쪽 서브트리 처리

# LVR 예시
def inorder(n): # 	중위 순회 함수
    if n is not None:
        if n.left:
            inorder(n.left)	#왼쪽 서브트리 처리
        print(n.data, end=' ')	#루트노드 처리(화면 출력)
        if n.right:
            inorder(n.right) #오른쪽 서브트리 처리	

# LRV 예시
def postorder(n) :
    if n is not None :
        if n.left: #왼쪽 서브트리 처리
            postorder(n.left)
        if n.right: #오른쪽 서브트리 처리	
            postorder(n.right)
        print(n.data, end=' ') #루트노드 처리(화면 출력)

#### 레벨 순회 (BFS)
- 노드를 세벨 순으로 검사하는 순회방법
    - 큐를 사용해 구현
    1. root를 큐에 삽입
    2. 큐에서 노드 한 개 삭제
        - 삭제한 노드로 트리 방문
        - 방문한 노드의 자식을 큐에 삽입(왼쪽, 오른쪽 자식 순으로)
    3. 큐가 empty가 될 때까지 2를 반복(Recursion)

In [9]:
MAX_QSIZE = 100
class CircularQueue:
    def __init__(self):		
        self.front = 0			
        self.rear = 0			
        self.items = [None] * MAX_QSIZE	

    def isEmpty(self):
        return self.front == self.rear
    def isFull(self):
        return self.front == (self.rear+1)%MAX_QSIZE
    def clear(self):
        self.front = self.rear

    def enqueue(self, item):
        if not self.isFull():			            
            self.rear = (self.rear+1)% MAX_QSIZE	
            self.items[self.rear] = item		    

    def dequeue(self):
        if not self.isEmpty():			            
            self.front = (self.front+1)% MAX_QSIZE	
            return self.items[self.front]	        

    def peek(self):
        if not self.isEmpty():
            return self.items[(self.front + 1) % MAX_QSIZE]

    def size(self):
       return (self.rear - self.front + MAX_QSIZE) % MAX_QSIZE

    def display(self):
        out = []
        if self.front < self.rear :
            out = self.items[self.front+1:self.rear+1]
        else:
            out = self.items[self.front+1:MAX_QSIZE] \
                + self.items[0:self.rear+1]		
        print("[f=%s,r=%d] ==> "%(self.front, self.rear), out)


# level order 예시
def levelorder(root):
    queue = CircularQueue()			
    queue.enqueue(root)				
    while not queue.isEmpty():		
        n = queue.dequeue()			
        if n is not None:
            print(n.data, end=' ')	
            queue.enqueue(n.left)	
            queue.enqueue(n.right)

#### 노드 개수
- 후위 순회 방식 Postorder
- 왼쪽 서브트리 노드 수+오른쪽 서브트리 노드 수+ 루트 노드 수

In [10]:
def count_node(n): #순환을 이용해 트리의 노드 수를 계싼하는 함수
    if n is None:  # n이 None이면 공백트리이므로 0을 반환
        return 0
    else: 		    #좌우 서브트리의 노드수의 합 + 1을 반환 (순환 이용)	
        return 1 + count_node(n.left) + count_node(n.right)


#### 단말 노드의 수
- leaf node: 왼쪽과 오른쪽 링크가 None인 노드

In [11]:
def count_leaf(n):
    if n is None:	# n이 None이면 공백트리이므로 0을 반환
        return 0
    elif n.left is None and n.right is None : # 단말 노드이므로 1을 반환
        return 1
    else: 		# 비단말 노드이므로 좌으 서브트리의 결과 합을 반환
        return count_leaf(n.left) + count_leaf(n.right)

#### 트리의 높이
- 후위 순회방식
- 왼쪽 서브트리의 높이 / 오른쪽 서브트리의 높이
- leftSub / rightSub 중 큰 값 +1

In [12]:
def calc_height(n):
    if n is None: 		# n이 None이면 공백트리이므로 0을 반환			
        return 0
    hLeft = calc_height(n.left)		# 왼쪽 트리의 높이는 hleft
    hRight = calc_height(n.right)	# 오른쪽 트리 높이는 hright
    if (hLeft > hRight): 			# 더 높은 트리의 높이에 1을 더해 반환
        return hLeft + 1
    else: 
        return hRight + 1

# 이렇게도 쓸 수 있다.
def calc_height_2(n):
    if n is None:
        return 0
    return max(calc_height(n.left), calc_height(n.right) + 1)

In [13]:
# Test Drive
d = TNode('D', None, None)
e = TNode('E', None, None)
b = TNode('B', d, e)
f = TNode('F', None, None)
c = TNode('C', f, None)
root = TNode('A', b, c)

print('\n   In-Order : ', end='')
inorder(root)
print('\n  Pre-Order : ', end='')
preorder(root)
print('\n Post-Order : ', end='')
postorder(root)
print('\nLevel-Order : ', end='')
levelorder(root)
print()

print(" 노드의 개수 = %d개" % count_node(root))
print(" 단말의 개수 = %d개" % count_leaf(root))
print(" 트리의 높이 = %d" % calc_height(root))


   In-Order : D B E A F C 
  Pre-Order : A B D 

AttributeError: 'TNode' object has no attribute 'rignt'