# 트리
## 개관
**트리**는 **계층 관계**를 갖는 객체들을 표현하기 위해 만들어진 자료구조.  
하지만 이 외 계층 관계가 없는 자료들을 트리로 표현하여 같은 연산을 더 빠르게 하는 경우가 많다.

## 종만북 chapter 21. 트리의 구현과 순회
앞서 본 자료구조들은 기본적으로 **선형 구조**를 나타내기 위해 사용되었다.  
하지만 **계층 구조**와 같이 선형으로 표현하기 어려운 형태의 자료를 표현하기 위한 자료구조가 바로 **트리(tree)**다.  
처음엔 이와 같은 현실 세계의 개념을 추상화해 표현하는 자료 구조로 고안되었지만, 탐색형 자료구조로도 유용하게 쓰인다.  
특정한 조건들을 지키도록 구성된 트리들을 이용하면 배열이나 리스트를 사용하는 것보다 같은 작업을 더 빠르게 할 수 있다.(이진검색트리)  

## 정의와 용어

- **트리의 구성요소**
    - 트리는 자료가 저장된 **노드(Node)**들이 **간선(Edge)**으로 서로 연결되어 있는 자료 구조이다.
    - 노드 간에는 상/하위 관계가 있으며 두 노드가 연결되었을 때 한 노드는 좀더 상위, 다른 노드는 좀더 하위에 있어야 한다.
    - 노드들의 상대적 관계를 지칭하기 위해 가계도에서 사용하는 용어를 사용.
        - 두 연결된 노드 중 상위 노드를 **부모(Parent)**노드, 하위 노드를 **자식(Child)**노드라고 부른다.
        - 부모 노드가 같은 두 노드는 **형제(Sibling)** 노드라고 부른다.
        - 부모 노드와 그의 부모들을 통틀어 **선조(Ancestor)**라고 부른다.
        - 자식 노드와 그의 자식들을 통틀어 **자손(Descendant)**이라고 부른다.
    - 트리의 한 노드는 여러 개의 자식을 가질 수 있어도 부모는 하나만 가질 수 있다.
        - 다른 모든 노드들을 자손으로 갖는 딱 하나의 노드를 **루트(Root)**노드라고 부른다.
        - 자식이 하나도 없는 노드들을 트리의 잎 노드 혹은 **리프(Leaf)** 노드라고 부른다.
- **트리와 노드의 속성**
    - 루트에서 어떤 노드에 도달하기 위해 거쳐야 하는 간선의 수를 해당 노드의 **깊이(Depth)**라고 한다.
        - 깊이가 깊을수록 트리 아래 쪽에 있는 노드를 지칭함. 트리에서 가장 깊숙히 있는 노드의 깊이를 해당 트리의 **높이(Height)**라고 함. 
- **트리의 재귀적 속성**
    - 트리에서 한 노드와 그의 자손들을 모두 모으면 그들도 하나의 트리가 된다. 
        - 어떤 노드 t와 그 자손들로 구성된 트리를 't를 루트로 하는 **서브트리(Subtree)**라고 한다.
    - 트리를 다루는 코드들은 대개 재귀 호출을 이용해 구현된다.
- **트리의 표현**
    - 트리 구현의 가장 일반적 형태는 각 노드를 하나의 구조체/객체로 표현하고 , 이들을 서로의 포인터로 연결하는 것.
    - 각 노드들은 자신의 부모와 모든 자손들에 대한 포인터를 가지고 있다. 
    ```c++
// 트리의 노드를 표현하는 객체의 구현
struct TreeNode {
    string label; // 저장할 자료 (문자열일 필요는 없다.)
    TreeNode* parent; // 부모 노드를 가리키는 포인터
    vector<TreeNode*> children; // 자손 노드들을 가리키는 포인터의 배열
```
    - 트리의 구조나 사용 용도에 따라 다른 구현방법을 이용
        - 이진 검색 트리는 왼쪽, 오른쪽에 최대 하나씩의 자식만을 가질 수 있다.
            - 자식 노드의 포인터 배열 대신 두 개의 포인터 left, right만을 이용해 자식들 저장.
        - 힙에서는 노드가 들어갈 수 있는 자리가 비어 있는 일이 없기 때문에 배열을 이용해 트리의 내용을 표현할 수 있다.
        - 상호 배타적 집합 구조에서는 각 노드가 자신의 부모를 가리키는 포인터를 갖고 있을 뿐, 각 자식에 대한 정보는 없다.
    

### 트리의 순회
자료 구조의 가장 기초적인 연산 중 하나는 포함되어 있는 자료를 전부 순회하는 것.  
선형 자료구조와 달리 트리는 그 구조가 일정하지 않기 때문에 포함된 모든 자료들을 순회하기가 쉽지 않다.  
트리의 재귀적 속성을 이용하여 쉽게 할 수 있음.  
모든 트리는 각 자식들을 루트로 하는 서브트리와 루트로 나눌 수 있으므로, 트리의 루트가 주어질 때 루트를 '방문'한 뒤 각 서브트리를 재귀적으로 방문하는 함수를 만들어 트리의 모든 노드를 순회할 수 있다.  
```c++
// 트리를 순회하며 모든 노드에 포함된 값을 출력하기

// 주어진 트리의 각 노드에 저장된 값을 모두 출력한다.
void printLabels(TreeNode* root) {
    // 루트에 저장된 값을 출력한다.
    cout << root->label << endl;
    // 각 자손들을 루트로 하는 서브트리에 포함된 값들을 재귀적으로 출력한다.
    for (int i = 0; i < root->children.size(); ++i)
        printLabels(root->children[i]);
}
```
또한 트리의 높이를 구하는 문제도 순회를 이용하여 풀 수 있다.  
```c++
// 순회를 이용해 트리의 높이 계산하기

// root를 루트로 하는 트리의 높이를 구한다.
int height(TreeNode* root) {
    int h = 0;
    for (int i = 0; i < root->children.size(); i++)
        h = max(h, 1 + height(root->children[i]));
    return h;
}
```
노드가 n개 있을 때 모두 순회하기 위해서 O(n) 소요.  

### 문제: 트리 순회 순서 변경(TRAVERSAL)
트리는 1차원적인 구조가 아니기 때문에 단 한 가지의 당연한 순서가 존재하지 않고 필요에 맞춰 순서를 정의해야 한다.  
**이진 트리(Binary Tree)**는 모든 노드에 왼쪽과 오른쪽, 최대 두 개의 자손이 있는 트리를 말하는데, 이진 트리의 순회 순서 중 유명한 세 가지로 **전위 순회(Preorder Traverse), 중위 순회(Inorder Traverse) 그리고 후위 순회(Postorder Traverse)**가 있다.  
이들은 모두 왼쪽 서브트리를 오른쪽보다 먼저 방문한다는 점에서 같지만, 트리의 루트를 언제 방문하는지가 서로 다르다.  
1. 전위 순회는 맨 처음에 루트를 방문하고, 왼쪽과 오른쪽 서브트리를 순서대로 방문한다.
2. 중위 순회는 왼쪽과 오른쪽 서브트리 사이에 트리의 루트를 방문한다.
3. 후위 순회는 왼쪽과 오른쪽 서브트리를 모두 방문한 뒤에야 루트를 방문한다.
  
```
               27
          16        54
      9           36  72
        12
```
위 모양의 이진 트리가 있다면, 전위 순회하면 27, 16, 9, 12, 54, 36, 72의 순서로 방문.  
중위 순회하면 9, 12, 16, 27, 36, 54, 72의 순서로 방문,  
후위 순회하면 12, 9, 16, 36, 72, 54, 27의 순서로 방문.   
  
어떤 이진 트리를 전위 순회한 방문순서와 중위 순회했을 때 방문순서가 주어졌을 때, 이 트리를 후위 순회했을 때 노드들의 방문 순서는??
  
#### 입력
첫 줄 테스트 케이스의 수 C(1<=C<=100)  
각 테스트 케이스는 세 줄. 첫 줄에는 트리에 포함된 노드의 수 N(1<=N<=100)  
그 후 두 줄에 각각 트리를 전위 순회한 결과, 중위순회한 결과 N개의 정수로 주어짐. 각 노드는 1000이하의 자연수.  
  
#### 출력
각 테스트 케이스마다 한 줄에 해당 트리의 후위 순회했을 때 노드들의 방문 순서를 출력
  
#### 예제 입력
```
1
7
27 16 9 12 54 36 72
9 12 16 27 36 54 72
```
#### 예제 출력
```
12 9 16 36 72 54 27
```


#### 풀이: 트리 순회 순서 변경
재귀 호출을 이용하여 아주 간단하게 구현할 수 있다. printPostOrder()함수를 정의해 보자.  
printPostOrder(preorder[], inorder[]) = 트리의 전위 순회 순서 preorder[]와 중위 순회 순서 inorder[]가 주어질 때 후위 순회 순서를 출력.  
1. 트리의 루트는 전위 순회에서 가장 먼저 방문되므로 preorder[0]이 루트의 번호다. 
2. 루트를 찾았으면 inorder[]에서 root를 찾는다.
    - 루트보다 먼저 방문된 노드들은 왼쪽 서브트리, 늦게 방문된 녿들은 오른쪽 서브트리에 있고 각 서브트리의 크기 L, R을 알 수 있음.
    - preorder[]와 inorder[]를 적절히 잘라 왼쪽 서브트리의 방문 순서, 오른쪽 서브트리의 방문 순서로 나눌 수 있다.  
    - 각 서브트리를 후위 순회한 결과를 재귀 호출을 이용해 출력하고, 마지막으로 루트의 번호를 출력하면 된다.  
  
이 함수의 수행시간을 지배하는 것을 선형 시간이 걸리는 std::find()와 slice()함수의 호출.  
트리는 각 노드마다 printPostOrder()가 한 번씩 호출되므로 전체 시간 복잡도는 $O(N^2)$이다.  
```c++
// 트리 순회 순서 변경 문제를 해결하는 재귀 호출 코드
vector<int> slice(const vector<int>& v, int a, int b) {
    return vector<int>(v.begin() + a, v.begin() + b);
}
// 트리의 전위탐색 결과와 중위탐색 결과가 주어질 때 후위탐색 결과를 출력한다.
void pringPostOrder(const vector<int>& preorder, const vector<int>& inorder) {
    // 트리에 포함된 노드의 수
    const int N = preorder.size();
    // 기저 사례: 텅 빈 트리면 곧장 종료.
    if (preorder.empty()) return;
    // 이 트리의 루트는 전위 탐색 결과로부터 곧장 알 수 있다.
    const int root = preorder[0];
    // 이 트리의 왼쪽 서브트리의 크기는 중위 탐색 결과에서 루트의 위치를 찾아서 알 수 있다. 
    const int L = find(inorder.begin(), inorder.end(), root) - inorder.begin();
    // 오른쪽 서브트리의 크기는 N에서 왼쪽 서브트리와 루트를 빼면 알 수 있다.
    const int R = N - 1 - L;
    // 왼쪽과 오른쪽 서브트리의 순회 결과를 출력
    printPostOrder(slice(preorder, 1, L + 1), slice(inorder, 0, L));
    printPostOrder(slice(preorder, L + 1, N), slice(inorder, L + 1, N));
    // 후위 순회이므로 루트를 가장 마지막에 출력한다.
    cout << root << ' ';
}
```

### 문제: 요새(FORTRESS)  
<img src="http://algospot.com/media/judge-attachments/6b98991b489acef77ed1b63dc31bc32f/castle.svg.png">  
중세의 성과 요새들은 보안을 튼튼히 하면서도 더 넓은 영역을 보호하기 위해 여러 개의 성벽을 갖고 있었다고 하지요.  
전세계에서 가장 편집증이 심한 영주가 지은 스트로고(Strawgoh) 요새는 이의 극치를 보여줍니다.  
이 요새는 그림과 같이 커다란 원형 외벽 내에 여러 개의 원형 성벽이 겹겹이 지어진 형태로 구성되어 있는데,  
어떤 성벽에도 문이 없어서 성벽을 지나가려면 사다리를 타고 성벽을 오르내려야 합니다.  
요새 내에서도 한 곳에서 다른 곳으로 이동하는 데 시간이 너무 오래 걸린다는 원성이 자자해지자,  
영주는 요새 내에서 왕래가 불편한 곳들을 연결하는 터널을 만들기로 했습니다.  
계획을 세우기 위해 요새 내에서 서로 왕래하기 위해 가장 성벽을 많이 넘어야 하는 두 지점을 찾으려고 합니다.  
예를 들어 위 그림의 경우, 별표로 표시된 두 지점 간을 이동하기 위해서는 다섯 번이나 성벽을 넘어야 하지요.
  
성벽들의 정보가 주어질 때 가장 성벽을 많이 넘어야 하는 두 지점 간을 이동하기 위해 몇 번이나 성벽을 넘어야 하는지 계산하는 프로그램을 작성하세요.  
  
#### 입력 
입력의 첫 줄에는 테스트 케이스의 수 C (1 <= C <= 100) 가 주어집니다.  
각 테스트 케이스의 첫 줄에는 성벽의 수 N (1 <= N <= 100) 이 주어집니다.  
그 후 N 줄에는 각 3개의 정수로 각 성벽의 위치와 크기에 대한 정보 xi , yi , ri 가 주어집니다.(0 <= xi, yi <= 1000,1 <= ri <= 1000,0 <= i < N)  
이 때 i 번 성벽은 (xi, yi) 를 중심으로 하는 반지름 ri 인 원형으로 설치되어 있습니다.  
편의상 모든 성벽의 두께는 0이라고 가정하며, 입력에 주어지는 성벽들은 서로 겹치거나 닿지 않습니다.  
입력에 주어지는 첫 번째 성벽은 외벽이며, 외벽은 입력에 주어지는 모든 다른 성벽을 포함합니다.  
  
#### 출력
각 테스트 케이스마다 한 줄에 두 지점 간 이동을 위해 최대 몇 번이나 성벽을 넘어야 하는지를 출력하세요.  
  
#### 예제 입력
    2
    3
    5 5 15
    5 5 10
    5 5 5
    8 
    21 15 20 
    15 15 10 
    13 12 5 
    12 12 3 
    19 19 2 
    30 24 5 
    32 10 7 
    32 9 4 
#### 예제 출력
    2
    5

#### 풀이: 요새
성벽들이 서로 닿거나 겹치지 않는다는 조건에 주목하면 성이 계층적 구조로 구성되어 있음을 알 수 있다.  
성벽들 간의 포함 관계를 트리로 나타내서 문제를 풀어보자.  
먼저 성벽으로 구분된 요새 내부의 각 '구역'에 번호를 매긴다.  
해당 구역을 감싸는 성벽의 번호를 해당 구역의 번호로 갖도록 번호를 매기면 한 구역이 다른 구역을 직접 포함할 경우 이 두 구역을 연결해서 포함 관계를 트리로 표현할 수 있다.  
두 구역이 성벽을 맞대고 있지 않다면 트리에서 연결되지 않는점에 유의.  
이렇게 트리를 구성하고 나면, 한 구역에서 인접한 다른 구역으로 가기 위해 성벽을 넘는 일은 트리에서 간선을 따라 다른 노드로 옮겨가는 것으로 대응된다.  
따라서 두 지점을 왕래하기 위해 성벽을 가장 많이 넘어야 하는 경우를 찾는 문제는 트리에서 가장 멀리 떨어진 두 노드를 찾는 문제가 된다.  
이때 두 노드 사이를 연결하는 간선들을 트리 위의 경로(path)라고 부른다.  
#### 트리에서 가장 긴 경로 찾기
위와 같은 모델링 과정을 거치면 이 문제는 주어진 트리에서 가장 긴 경로를 구하는 문제로 바뀐다.  
최장 경로의 양 끝 노드가 항상 루트 혹은 잎 노드여야 한다!!  
루트도 아니고 잎도 아닌 노드, 즉 트리의 내부 노드(internal node)가 경로의 끝 점이라고 가정하자.  
이 때 내부 노드는 항상 두 개 이상의 간선과 연결되어 있다.(부모, 자식) 따라서 내부 노드에서 경로가 끝나는 경우 남은 간선이 최소 하나 존재.  
따라서 최장 경로의 길이는 다음 둘 중 더 큰 값이 된다.
1. 가장 긴 루트-잎 경로의 길이  &rarr; 트리의 높이
2. 가장 긴 잎-잎 경로의 길이
    - 어떤 노드까지 쭉 위로 올라가다 쭉 아래로 내려가는 형태로 구성.(최상위 노드) 
    - 트리 순회 과정에서 각 노드마다 각 노드를 최상위 노드로 갖는 가장 긴 잎-잎 노드를 계산하고, 그 중 최댓값을 선택하자.
  
- 주어진 노드를 최상위 노드로 갖는 가장 긴 잎-잎 경로를 구하는 방법?  
    - 각 서브트리의 높이를 계산한 뒤, 가장 높은 두 개의 서브트리를 선택.
    ```c++
    // 트리에서 가장 긴 경로를 찾는 재귀 호출 알고리즘
    struct TreeNode {
        vector<TreeNode*> children;
    };
    // 지금까지 찾은 가장 긴 잎-잎 경로의 길이를 저장한다.
    int longest; 
    // root를 루트로 하는 서브트리의 높이를 반환한다.
    int height(TreeNode* root) {
        // 각 자식을 루트로 하는 서브트리의 높이를 계산한다.
        vector<int> heights;
        for (int i = 0; i < root->children.size(); ++i)
            heights.push_back(height(root->children[i]));
        // 만약 자식이 하나도 없다면 0을 반환
        if (heights.empty()) return 0;
        sort(heights.begin(), heights.end());
        // root를 최상위 노드로 하는 경로를 고려.
        if (heights.size()) >= 2) 
            longest = max(longest, 2 + heights[heights.size() - 2] + heights[heights.size() - 1];
        // 트리의 높이는 서브트리 높이의 최대ㅣ에 1을 더해 계산한다.
        return heights.back() + 1;
    }
    // 두 노드 사이의 가장 긴 경로의 길이를 계산한다.
    int solve(TreeNode* root) {
        longest = 0;
        // 트리의 높이와 최대 잎-잎 경로 길이 중 큰 것을 선택한다.
        int h = height(root);
        return max(longest, h);
    }
    ```
    - height()로 트리 전체를 처리하는 데 서비트리들의 높이를 정렬하는 데 드는 O(nlogn)의 시간을 무시하면 트리의 순회와 같은 O(n).

#### 실제 구현
문제의 실제 구현은 입력으로부터 트리를 생성하는 과정과 생성한 트리에서의 최장 경로를 구하는 부분으로 나눌 수 있다.  
이 문제에서 트리를 만드는 가장 직관적인 방법은 트리의 루트부터 시작하는 것.  
0번 성벽은 다른 모든 성벽을 포함하는 외벽이므로, 항상 트리의 루트가 된다. 이떄 0번 성벽 바로 밑에 들어갈 성벽들을 찾고,  
각각의 성벽을 루트로 하는 서브트리를 재귀적으로 생성한다.
```c++
// 주어진 번호의 성벽에 포함된 구역들을 표현하는 트리를 생성
// root성벽을 루트로 하는 트리를 생성
TreeNode* getTree(int root) {
    TreeNode* ret = new TreeNode();
    for (int ch = 0; ch < n; ch++)
        // ch 성벽이 root 성벽에 직접적으로 포함되어 있다면
        // 트리를 만들고 자손 목록에 추가한다.
        if (isChild(root, ch)) 
            ret->children.push_back(getTree(ch));
        return ret;
    }
```
isChild() 함수를 구현하는 가장 간단한 방법은 다른 모든 성벽들을 보면서 주어진 두 성벽 사이에 있는 성벽이 확하는 것. 
```c++
// 한 성벽이 다른 성벽에 포함되었는지, 그리고 직접 포함되었는지 확인하는 함수
// 입력 데이터
int n, y[100], x[100], radius[100];
// x^2를 반환
int sqr(int x) {
    return x * x
}
// 두 성벽 a, b의 중심점 간의 거리의 제곱을 반환한다.
int sqrdist(int a, int b) {
    return sqr(y[a] - y[b]) + sqr(x[a] - x[b]);
}
// 성벽 a가 성벽 b를 포함하는지 확인한다.
bool encloses(int a, int b) {
    return radius[a] > radius[b] && sqrdist(a, b) < sqr(radius[a] - radius[b]);
}
// '성벽'트리에서 parent가 child의 부모인지 확인
// parent는 child를 꼭 직접 포함해야 한다.
bool isChild(int parent, int child) {
    if (!encloses(parent, child)) return false;
    for (int i = 0; i < n; i++)
        if (i != parent && i != child && encloses(parent, i) && encloses(i, child))
            return false;
    return true;
}    
```
이러면 isChild()는 O(n)에 수행. 전체 트리 생성 과정의 시간 복잡도는 $O(n^3)$.  
최적화 하기 위해 트리를 잎에서부터 시작해 거꾸로 생성할 수 있다.  
모든 성벽에는 하나의 부모 성벽 밖에 없기 때문에, 자신을 포함하는 성벽 중 가장 작은 성벽을 찾으면 그것이 부모 성벽이 된다.  
미리 성벽들을 크기 순서대로 정렬해 두면, 트리 생성 과정을 $O(n^2)$에 수행할 수 있다.  