# Chapter 8 Trees
## 8.1 General Tress
생산성의 전문가들은 혁신이 "비선형적으로(nonlinearly)" 생각할 때 일어난다고 말한다. 이번 챕터에서는 컴퓨팅 세계에서 가장 중요한 비선형 자료 구조 중 하나인 트리를 다룬다. 트리 구조를 이용하면 배열 기반의 리스트나 링크드 리스트와 같은 선형 데이터 구조를 이용할 때보다 많은 알고리즘을 훨씬 빠르게 구현할 수 있었고 이는 자료 구조의 세계에 혁신과도 같았다. 트리는 또한 그 구조가 자연스러웠기에 파일 시스템, GUI, 데이터베이스, 웹 사이트 등과 같은 많은 컴퓨터 시스템의 보편적인 구조가 되었다.

생산성의 전문가들이 "비선형적인" 생각을 해야한다고 할 때 무엇이 비선형적인 것인지에 대한 개념은 선명하지 않지만 트리가 "비선형적"이라고 말할때 무엇을 의미하는 가는 확실하다. 트리는 시퀀스의 객체들 사이의 "이전(before)"과 "이후(after)" 라는 간단한 관계가 아닌 훨씬 더 풍부한 관계를 제공한다. 트리의 관계는 **계층적(hierarchical)**이다. 계층적 구조에서는 객체들은 다른 객체의 "위(above)"에 있거나 "아래(below")에 위치한다. 트리 자료 구조에서는 관계를 설명하기 위해 "부모", "자식", "조상", "후손" 들과 같은 용어가 주로 사용된다.

<img width="700" alt="figure-8.1" src="https://user-images.githubusercontent.com/20944657/36784850-43276d8a-1cc4-11e8-8070-9daeab57ecf2.png">

### 8.1.1 Tree Definitions and Properties
**트리(Tree)**는 원소를 계층적으로 저장하는 추상 자료형이다. 가장 위의 원소를 제외하면 트리의 모든 원소는 **부모(parent)** 원소를 갖고, 모든 원소는 0개 이상의 **자식(children)** 원소를 갖는다. 트리는 주로 안에 원소가 들어있는 타원이나 직사각형으로 표현되고, 자식과 부모 간의 관계는 직선으로 표현된다. 우리는 일반적으로 가장 위에 있는 원소를 트리의 **루트(뿌리, root)**라고 부르지만 실제로는 다른 원소들이 모두 그 아래에 연결된다(실제 나무는 뿌리가 가장 아래에 있으니 완전히 반대이다).
<img width="400" alt="figure-8.2" src="https://user-images.githubusercontent.com/20944657/36785020-c6b5087e-1cc4-11e8-84ec-fa228aa5ceb8.png">

### Formal Tree Definition
우리는 **트리(tree)** $T$를 **부모-자식(parent-child)** 관계를 가지면서 다음의 성질을 만족하고 원소를 저장하는 **노드(node)**들의 집합으로 정의한다:

- $T$가 비어있지 않다면 $T$는 부모를 갖지 않는 특별한 노드를 갖고, 그 노드는 $T$의 **루트(root)**라고 부른다.
- $T$의 루트가 아닌 모든 노드 $v$는 유일한 **부모(parent)** 노드 $w$를 갖는다. 부모가 $w$인 모든 노드는 $w$의 **자식(child)**이다.
우리의 정의에 따르면 트리는 아무 노드도 갖지 않은 채로 비어있을 수 있다. 이러한 관례에 따르면 우리는 트리를 재귀적으로(recursively) 정의할 수 있다. 이 정의에 따르면 트리 T는 비어있거나, $T$의 노드 $r$과 $r$의 자식들을 루트로 하는 서브트리들의 집합으로 구성된다. 

### Other Node Relationships
같은 부모를 갖는 자식들인 두 노드를 **형제자매(siblings)**라고 한다. 노드 $v$가 자식을 갖지 않을 때 **외부(external)** 노드라 부른다. 노드 $v$가 하나 이상의 자식을 가지면 **내부(internal)** 노드라 부른다. 외부 노드는 또한 **잎(leaves)**이라고도 알려져 있다.
<img width="500" alt="figure-8.3" src="https://user-images.githubusercontent.com/20944657/36785755-49673678-1cc7-11e8-8753-d81894702463.png">

$u = v$이거나 $u$가 $v$의 부모의 조상(ancestor)이면 노드 $u$를 노드 $v$의 **조상(ancestor)**이라 한다. 반대로, $u$가 $v$의 조상이면 노드 $v$를 $u$의 **자손(descendant)**이라 한다. 예를 들어 위의 그림에서 `cs252/`는 `papers/`의 조상이고, `pr3`은 `cs016/`의 후손이다.$v$의 자손으로 이루어진 트리를 $v$를 루트로 하는 $T$의 **서브트리(subtree)**라 부른다. 위의 그림에서 `cs016`을 루트로 하는 서브트리는 `cs016/`, `grades`, `homeworks/`, `programs/`, `hw1`, `hw2`, `hw3`, `pr1`, `pr2`, `pr3` 노드로 구성된다.

### Edges and Paths in Trees
트리 $T$의 **엣지(edge)**는 노드의 쌍 ($u$, $v$)을 의미한다. 이 때 $u$는 $v$의 부모이다. 트리 $T$의 **경로(path)**는 노드의 시퀀스인데, 이 때 경로 안에서 연속적인 두 노드는 엣지를 형성한다. 예를 들어 위의 그림에서 (`cs252/`, `projects/`, `demos/`, `market`)은 경로가 된다.

<img width="600" alt="figure-8.4" src="https://user-images.githubusercontent.com/20944657/36786943-9f0d9366-1ccb-11e8-8b54-385bca628e94.png">

파이썬에서 모든 클래스들은 built-in 클래스 `object`를 루트로 하는 하나의 계층구조로 이루어져있다. `object` 클래스는 모든 파이썬 객체의 직접 혹은 간접적 기반 클래스(base class)가 된다(새로운 클래스를 정의할 때 직접 선언하지 않더라도). 따라서 위의 그림에서 묘사하는 계층구조는 파이썬 클래스 계층구조의 일부일 뿐이다.

<img width="400" alt="figure-8.5" src="https://user-images.githubusercontent.com/20944657/36787013-ed32b0f8-1ccb-11e8-832e-d2cfb8522379.png">

### Ordered Trees
만약 노드의 자식들 사이에 의미있는 선형적 순서가 존재할 때 우리는 그 트리를 **순서 트리**라고 부른다. 이 때 순서(order)는 보통 형제자매들을 왼쪽부터 오른쪽까지 순서에 맞게 배치하여 표현된다.
<img width="600" alt="figure-8.6" src="https://user-images.githubusercontent.com/20944657/36787092-373ae602-1ccc-11e8-8c70-1a3118ccd06f.png">

### 8.1.2 The Tree Abstract Data Type
Section 7.4의 위치 리스트에서 했던 것처럼 우리는 트리 ADT를 트리의 노드를 위한 추상화인 **위치(position)**의 개념을 이용하여 정의한다. 원소는 각각의 위치에 저장되며, 위치들은 트리 구조를 정의하는 부모-자식 관계를 만족한다. 트리의 위치 객체는 다음의 메소드를 지원한다:
- **p.element():** Return the element stored at position p

트리 ADT는 사용자가 트리의 다양한 위치를 이동할 수 있게 해주는 다음의 **접근자 메소드(accessor methods)**를 지원한다:
- **T.root():** Return the position of the root of tree T, or None if T is empty.
- **T.is_root(p):** Return True if position p is the root of Tree T.
- **T.parent(p):** Return the position of the parent of position p, or None if p is the root of T.
- **T.num_children(p):** Return the number of children of position p.
- **T.children(p):** Generate an iteration of the children of position p.
- **T.is_leaf(p):** Return True if position p does not have any children.
- **len(T):** Return the number of positions (and hence elements) that are contained in tree T.
- **T.is_empty():** Return True if tree T does not contain any positions.
- **T.positions():** Generate an iteration of all positions of tree T.
- **iter(T):** Generate an iteration of all elements stored within tree T.

위에서 위치를 인자로 전달받는 모든 메소드는 만약 그 위치가 $T$ 안에서 유효하지 않다면 `ValueError`를 발생시켜야 한다. 만약 트리 $T$가 순서 트리라면 `T.children(p)`는 자연스러운 순서로 $p$의 자식들을 보여준다. 만약 $p$가 잎(leaf)이라면 `T.children(p)`는 비어있는 iteration을 생성한다. 비슷하게, 트리 $T$가 비어있다면 `T.positions()`와 `iter(T)`는 모두 비어있는 iteration을 생성한다. 우리는 트리의 모든 위치를 순회하는 일반적인 방법을 Section 8.4에서 다룰 것이다.

우리는 아직 트리를 만들거나 수정하는 메소드는 정의하지 않았다. 그 이유는 우리가 트리 인터페이스의 특정한 구현방식이나 트리의 특수한 응용사례를 다룰 때 서로 다른 트리 업데이트 메소드를 설명하는 것을 선호하기 때문이다.

### A Tree Abstract Base Class in Python
객체 지향 디자인 원칙 중 추상화를 설명할 때, 파이썬에서는 **덕 타이핑(duck typing)**을 통해 추상 자료 형의 퍼블릭 인터페이스를 관리한다고 말한 바 있다. 예를 들어 우리는 Section 6.2에서 큐 ADT를 정의하고 큐 인터페이스를 구현하는 여러 클래스를 살펴보았다(e.g. `ArrayQueue`, `LinkedQueue`, `CircularQueue`). 그러나 우리는 파이썬에서 큐 ADT의 형식적인 정의를 내리지는 않았다. 모든 구현은 자족 가능하면서도 같은 퍼블릭 인터페이스를 갖게 되었을 뿐이다. 같은 추상화의 서로 다른 구현 사이의 관계를 지정하는 형식적인 메커니즘은 **추상 기초 클래스(abstract base class)**의 기능을 하는 클래스를 정의하고 **구상 클래스(concrete class)**가 상속하게끔 하는 것이다(See Section 2.4.3.)

이러한 설명을 바탕으로, 우리는 트리 ADT에 해당하는 추상 자료 형인 `Tree` 클래스를 정의할 것이다. 이렇게 하는 이유는 추상화의 수준에서도 많은 유용한 코드를 작성하는 것이 가능하고, 이렇게 함으로써 이후 정의하는 구상(concrete)적인 트리의 구현에서 많은 양의 코드를 재활용할 수 있기 때문이다. `Tree` 클래스는 중첩 클래스인 `Position`을 정의하며(역시 추상 클래스임), 트리 ADT에 포함된 많은 접근자(accessor) 메소드를 선언한다. 

하지만 `Tree` 클래스는 트리를 저장하기 위한 내부 표현에 대해서는 어떠한 정의도 제공하지 않고, `root`, `parent`, `num_children`, `children`, `__len__` 메소드는 **추상(abstract)** 메소드로 유지한다. 이 메소드를 선언하면 `NonImplementedError`가 발생한다(더 형식적으로 추상 기초 클래스와 추상 메소드를 `abc` 모듈을 이용하여 정의하는 법에 대해서는 Section 2.4.3 참고). 이 추상 기초 클래스를 상속받는 서브 클래스들은 `children`과 같은 메소드를 오버라이드해서 잘 작동하게끔 구현을 제공해야 한다.

`Tree` 클래스가 추상 자료형이긴 하지만 클래스 안의 추상 메소드의 호출에 의존하는 여러 **구상(concrete)** 메소드를 포함하고 있다. 지난 섹션에서 트리 ADT를 정의할 때 우리는 10개의 접근자 메소드를 선언했다. 이 중 5개는 추상 메소드이지만 나머지 5개의 메소드는 이 추상 메소드들을 이용하며 잘 구현되어 있다. 이렇게 설계하는 것의 장점은 `Tree` 추상 기초 클래스 안에서 정의된 구상 메소드들이 `Tree`의 서브 클래스들에 의해 상속된다는 것이다. 이는 서브 클래스에서 이러한 동작들을 다시 구현할 필요가 없게 함으로써 코드 재사용을 늘리게 된다.

한 가지 마지막으로 덧붙일 말은, `Tree` 클래스는 추상 기초 클래스이기 때문에 `Tree` 클래스의 인스턴스를 만들 필요가 없으며 만든다 하더라도 그 인스턴스는 별로 쓸모가 없다. 이 클래스는 상속을 위한 베이스로서만 존재하며, 사용자들은 그 구상 서브클래스들의 인스턴스를 만들 것이다.

In [6]:
class Tree:
    """Abstract base class representing a tree structure."""
    
    # ------------------------ nested Position class -------------------------
    class Position:
        """An abstraction representing the location of a single element."""
        
        def element(self):
            """Return the element stored at this Position."""
            raise NotImplementedError('must be implemented by subclass')
            
        def __eq__(self, other):
            """Return True if other Position represents the same location."""
            raise NotImplemenetedError('must be implemented by subclass')
            
        def __ne__(self, other):
            """Return True if other does not represent the same location."""
            return not (self == other)              # opposite of __eq__
        
    # ------- abstract methods that concrete subclass must support -----------
    def root(self):
        """Return Position representing the tree's root (or None if empty)."""
        raise NotImplementedError('must be implemented by subclass')
        
    def parent(self, p):
        """Return Position representing p's parent (or None if p is root)."""
        raise NotImplementedError('must be implemented by subclass')
        
    def num_children(self, p):
        """Return the number of children that position p has."""
        raise NotImplementedError('must be implemented by subclass')
    
    def children(self, p):
        """Generate an iteration of Positions representing p's children."""
        raise NotImplementedError('must be implemented by subclass')
        
    def __len__(self):
        """Return the total number of elements in the tree."""
        raise NotImplementedError('must be implemented by subclass')
        
    # ------- concrete methods implemented in this class ---------------------
    def is_root(self, p):
        """Return True if Position p represents the root of the tree."""
        return self.root() == p
    
    def is_leaf(self, p):
        """Return True if Position p does not have any children."""
        return self.num_children(p) == 0
    
    def is_empty(self):
        """Return True if the tree is empty."""
        return len(self) == 0    

### 8.1.3 Computing Depth and Height
트리 $T$에 속한 노드의 위치를 $p$라 하자. $p$의 **깊이(depth)**는 $p$ 자기 자신을 제외한 조상의 수로 정의한다. 이러한 정의에 따르면  $T$의 루트의 깊이는 0이다. $p$의 깊이는 다음과 같이 재귀적으로 정의할 수도 있다.

- $p$가 루트라면 $p$의 깊이는 0이다.
- $p$가 루트가 아니라면 $p$의 깊이는 $p$의 부모의 깊이 + 1이다.

In [7]:
def depth(self, p):
    """Return the number of levels separating Position p from the root."""
    if self.is_root(p):
        return 0
    else:
        return 1 + self.depth(self.parent(p))

이 알고리즘은 $p$의 조상 각각에 대해 상수 시간이 소요되는 recursive step을 실행하므로 `T.depth(p)`의 작동 시간은 $O(d_{p}+1)$이고, 이 때 $d_{p}$는 $p$의 깊이를 의미한다. 따라서 알고리즘 `T.depth(p)`는 최악의 경우 $O(n)$의 시간이 걸린다. 모든 노드가 하나의 가지를 이루고 있을 경우 $T$의 위치가 $n-1$의 깊이를 갖기 때문이다. 이 때 작동시간이 입력 사이즈의 함수이긴 하지만 $d_{p}$가 $n$보다 작을 수 있기 때문에 $d_{p}$를 이용하는 것이 훨씬 유용한 정보를 줄 수 있다.

### Height
위치 $p$의 **높이(height)**는 다음과 같이 재귀적으로 정의된다:

- 만약 $p$가 잎이라면 $p$의 높이는 0이다.
- $p$가 잎이 아니라면 $p$의 높이는 $p$의 자식들의 높이 중 가장 큰 높이 + 1이다.

비어있지 않은 트리 $T$의 **높이**는 $T$의 루트의 높이이다. 높이는 다음과 같이 볼 수도 있다.

**Proposition 8.4:** 비어있지 않은 트리 $T$의 높이는 잎(leaf)의 위치들의 깊이 중 최대값과 같다.(The height of a nonempty tree T is equal to the maximum of the depths of its leaf positions)

In [8]:
def _height1(self):                 # works, but O(n^2) worst-case time
    """Return the height of the tree."""
    return max(self.depth(p) for p in self.positions() if self.is_leaf(p))

불행히도 `height` 알고리즘은 매우 비효율적이다. 아직 `positions()` 메소드를 정의하지만 않았지만, $n$을 $T$의 위치들의 수라고 할 때 `positions()` 메소드는 $O(n)$ 시간 복잡도를 갖게끔 구현할 수 있다. `height1`이 $T$의 각각의 잎에 대해 `depth(p)` 알고리즘을 호출하므로 총 작동시간은 $O(n + \sum_{p \in L}(d_{p}+1))$이고, 이 때 $L$은 $T$의 잎 위치들의 집합이다. 최악의 경우 $\sum_{p \in L}(d_{p}+1)$이 $n^{2}$에 비례하므로 알고리즘 `height`은 최악의 경우 $O(n^{2})$ 시간 복잡도를 갖는다.

우리는 위의 명제가 아니라 처음의 재귀적 정의를 이용해서 트리의 높이를 더 효율적으로 $O(n)$ 시간 안에 계산할 수 있다. 이를 위해서는 트리 내의 위치를 루트로 하는 서브트리의 높이를 계산하는 함수를 정의하고 이를 이용해서 트리 $T$의 높이를 계산한다.

In [9]:
def _height2(self, p):
    """Return the height of the subtree rooted at Position p."""
    if self.is_leaf(p):
        return 0
    else:
        return 1 + max(self._height2(c) for c in self.children(p))

왜 알고리즘 `height2`가 `height1`보다 효율적인지 이해하는 게 중요하다. 이 알고리즘은 재귀적이면서 탑-다운 방식으로 이루어진다. 메소드가 처음에 루트 $T$에 대해 호출된다면 이는 결국 $T$의 모든 위치에서 호출될 것이다. `height2` 알고리즘의 작동 시간을 결정하기 위해서는 각각의 호출에서 nonrecursive한 부분의 시간 소모가 얼마나 되는지를 계산하고 이를 모든 위치에 대해 더해줘야 한다. 우리의 구현에서는 각각의 위치마다 상수만큼의 작업이 이루어진다. 거기에다가 자식들을 순회하면서 최대값을 계산하는 오버헤드까지 고려해줘야 한다. 아직 `children(p)`를 구현하지는 않았지만 우리는 그러한 iteration이 $O(c_{p} + 1)$ 시간 복잡도를 가질 것이라고 가정할 수 있다. 이 때 $c_{p}$는 $p$의 자식들의 수를 의미한다. `height2` 알고리즘은 각각의 위치 $p$에서 최댓값을 계산하기 위해 $O(c_{p}+1)$ 시간을 사용하고, 전체 작동 시간은 $O(\sum_{p}(c_{p}+1)) = O(n + \sum_{p} c_{p})$가 된다. 이제 분석을 마무리하기 위해 다음의 성질을 이용할 것이다.

**Proposition 8.5:** $n$개의 위치를 가진 트리 $T$를 두고, $T$의 임의의 위치 $p$의 자식들의 수를 $c_{p}$라고 하자. 그러면 $\sum_{p} c_{p} = n-1$이다.<br>
**Justification:** 루트를 제외한 $T$의 모든 위치는 다른 위치의 자식이 되고, 따라서 위의 합에서 한 단위씩 더해진다.

이제 명제 8.5를 이용하면 `height2`를 $T$의 루트에 호출했을 때의 작동시간은 $O(n)$이다. `Tree` 클래스의 퍼블릭 인터페이스를 다시 생각해보자. 서브트리의 높이를 계산할 수 있는 동작이 있으면 좋겠지만 사용자는 트리 루트를 지정하지 않고서도 트리 전체의 높이를 계산하기를 원할 것이다. 따라서 `height2`를 이용하면서도 아래와 같이 구현하면 위의 두 조건을 모두 만족할 수 있다.

In [10]:
def height(self, p=None):
    """Return the height of the subtree rooted at Position p.
    
    If p is None, return the height of the entire tree.
    """
    if p is None:
        p = self.root()
    return self._height2(p)        # start _height2 recursion

## 8.2 Binary Trees
**이진 트리(Binary Tree)**는 다음의 성질을 만족하는 순서 트리이다
1. 모든 노드가 최대 2개의 자식을 갖는다
2. 모든 노드는 **왼쪽 자식** 혹은 **오른쪽 자식**으로 이름이 부여된다.
3. 왼쪽 자식은 순서 상으로 오른쪽 자식에 앞선다.

내부 노드 $v$의 왼쪽 혹은 오른쪽 자식 노드를 루트로 하는 서브트리를 $v$의 **왼쪽 서브트리(left subtree)** 혹은 **오른쪽 서브트리(right subtree)**라고 한다. 만약 모든 노드가 0개 혹은 2개의 자식 노드를 가진다면 그 때 이진 트리를 **proper**하다고 한다. 어떤 사람들은 이런 이진 트리를 **정 이진 트리(full binary tree)**라고 부른다. 따라서 정 이진 트리의 경우 모든 내부 노드가 정확히 두 자식일 갖는다. 정 이진 트리가 아닌 바이너리 트리를 **improper**하다고 말한다. 이진 트리의 중요한 클래스 예제로는 **결정 트리(decision tree)**가 있다.

<img width="500" alt="figure-8.7" src="https://user-images.githubusercontent.com/20944657/36841100-9b77527c-1d8a-11e8-9ce0-0c78772be242.png">

### A Recursive Binary Tree Definition
이진 트리를 재귀적으로 정의하는 것도 가능하다. 이진 트리는 비어있거나, 다음으로 구성되어 있다:

- 원소를 저장하는 $T$의 루트 노드 $r$
- $T$의 왼쪽 서브트리라 불리는 이진 트리(비어있을 수도 있다)
- $T$의 오른쪽 서브트리라 불리는 이진 트리(비어있을 수도 있다)

## 8.2.1 The Binary Tree Abstract Data Type
추상 자료 형으로서의 이진 트리는 다음의 추가적인 접근자 메소드를 지원하는 특별한 형태의 트리이다.
- **T.left(p):** $p$의 왼쪽 자식을 표현하는 위치를 반환한다. $p$가 왼쪽 자식이 없으면 None을 반환한다.
- **T.right(p):** $p$의 오른쪽 자식을 표현하는 위치를 반환한다. $p$가 오른쪽 자식이 없으면 None을 반환한다.
- **T.sibling(p):** $p$의 형제자매를 표현하는 위치를 반환한다. $p$가 형제가 없으면 None을 반환한다.

### The BinaryTree Abstract Base Class in Python
이제 `Tree` 클래스를 상속받아 이진 트리 ADT와 관련된 `BinaryTree` 클래스를 정의해보자. 주의해야할 점은 `BinaryTree` 클래스도 추상 클래스이기 때문에 내부적인 구조나 필요한 동작들에 대한 구현은 제공하지 않을 것이다.

In [11]:
class BinaryTree(Tree):
    """Abstract base class representing a binary tree structure."""
    
    # ------------------ additional abstract methods -------------------
    def left(self, p):
        """Return a Position representing p's left child.
        
        Return None if p does not have a left child.
        """
        raise NotImplementedError('must be implemented by subclass')
        
    def right(self, p):
        """Return a Position representing p's right child.
        
        Return None if p does not have a right child.
        """
        raise NotImplementedError('must be implemented by subclass')
        
    # ------- concrete methods implemented in this class --------------
    def sibling(self, p):
        """Return a Position representing p's sibling (or None if no sibling)"""
        parent = self.parent(p)
        if parent is None:                        # p must be the root
            return None                           # root has no sibling
        else:
            if p == self.left(parent):
                return self.right(parent)         # possibly None
            else:
                return self.left(parent)          # possibly None
            
    def children(self, p):
        """Generate an iteration of Positions representing p's children."""
        if self.left(p) is not None:
            yield self.left(p)
        if self.right(p) is not None:
            yield self.right(p)

### 8.2.2 Properties of Binary Trees
이진 트리는 그 높이와 노드의 수 사이의 관계를 다루는 흥미로운 특징들을 갖는다. 같은 깊이 $d$를 갖는 $T$의 모든 노드들의 집합을 $T$의 **레벨(level)** $d$라 한다. 이진트리에서 레벨 0은 최대 1개의 노드를 갖고(루트), 레벨 1은 최대 2개, 레벨 2는 최대 4개, ..., 레벨 $d$는 최대 $2^{d}$개의 노드를 갖는다.
<img width="600" alt="figure-8.9" src="https://user-images.githubusercontent.com/20944657/36841741-a834125a-1d8c-11e8-9f30-8f11456b84de.png">
트리의 아래로 내려갈수록 최대 노드의 수는 지수적으로 증가한다. 이러한 간단한 관찰로부터 우리는 이진트리 $T$의 높이와 노드의 수의 관계에 대한 다음의 성질들을 도출할 수 있다.

**Proposition 8.8:** $T$를 비어있지 않은 이진트리라 하고, $n$, $n_{E}$, $n_{I}$, $h$를 각각 노드의 수, 외부 노드의 수, 내부 노드의 수, 높이라 하자. 그러면 $T$는 다음의 성질을 갖는다:
1. $h+1 \leq n \leq 2^{h+1} - 1$
2. $1 \leq n_{E} \leq 2^{h}$
3. $h \leq n_{I} \leq 2^{h}-1$
4. $log(n+1) - 1 \leq h \leq n-1$

만약 $T$가 proper하다면 다음의 성질 또한 갖는다:
1. $2h + 1 \leq n \leq 2^{h+1}-1$
2. $h + 1 \leq n_{E} \leq 2^{h}$
3. $h \leq n_{I} \leq 2^{h} - 1$
4. $log(n + 1) - 1 \leq h \leq (n-1)/2$

### Relating Internal Nodes to External Nodes in a Proper Binary Tree
만약 이진 트리가 proper하면 내부 노드와 외부 노드의 수에는 다음의 관계가 존재한다.

**Proposition 8.9:** 비어있지 않은 정 이진트리(proper binary tree)에서 $n_{E}$개의 외부 노드와 $n_{I}$개의 내부 노드에 대해 $n_{E} = n_{I} + 1$이 성립한다.
**Justification:** $T$가 비는 순간까지 $T$의 노드를 제거하며 내부 노드 더미와 외부 노드 더미로 나누면서 분류하는 과정을 생각해보자. 처음엔 더미가 비어있지만 끝날 때가 되면 외부 노드의 더미가 내부 노드 더미보다 노드의 수가 하나 더 많음을 보일 수 있다. 다음의 두 케이스를 생각해보자:

**케이스 1:** 만약 $T$가 하나의 노드 $v$만 갖는다면 우리는 $v$를 제거하고 이를 외부 노드 더미에 넣는다. 그러면 외부 노드 더미는 하나의 노드를 갖고 내부 노드는 비어있다.

**케이스 2:** $T$가 두개 이상의 노드를 갖는다면 $T$에서 (임의의) 외부 노드 $w$와 그 부모 노드 $v$를 제거한다. $w$를 외부 노드 더미에 넣고 $v$를 내부 노드 더미에 넣자. 만약 $v$가 부모 노드 $u$를 갖는다면 우리는 $u$를 $w$의 형제였던 $z$와 다시 연결한다. 이러한 연산은 1개의 외부 노드와 1개의 내부 노드를 제거하고 트리를 여전히 정이진트리로 유지한다.

<img style="float: left" width="300" alt="figure-8.10a" src="https://user-images.githubusercontent.com/20944657/36842725-ec420a1c-1d8f-11e8-941c-4efe246c900b.png">
<img style="float: left"  width="300" alt="figure-8.10b" src="https://user-images.githubusercontent.com/20944657/36842726-ec779164-1d8f-11e8-85f2-a5375d294673.png">
<img width="300" alt="figure-8.10c" src="https://user-images.githubusercontent.com/20944657/36842728-eca6f670-1d8f-11e8-8d04-c97cd28314ce.png">
<div style="clear: both"></div>

이러한 연산을 반복하면 우리는 하나의 노드로만 이루어진 마지막 트리를 만나게 된다. 지금까지 외부 노드와 내부 노드를 한개씩 빼서 저장했으니 현재 외부 노드와 내부 노드 더미에는 같은 수의 노드가 있다. 이제 마지막 트리의 노드를 제거하고 외부 노드 더미에 넣으면, 외부 노드 더미는 내부 노드 더미보다 노드의 수가 하나 많다.

## 8.3 Implementing Trees
지금까지 정의한 `Tree`와 `BinaryTree` 클래스는 모두 형식적으로 **추상 기초 클래스(abstract base classes)**이다. 추상 기초 클래스는 도움이 많이 되지만 직접 인스턴스로 만드는 것이 불가능하다. 우리는 아직 트리가 내부적으로 어떻게 표현되어야 하는 지에 대해 다루지 않았고, 어떻게 부모와 자식 사이를 효율적으로 탐색할 수 있는지도 다루지 않았다. 특히, 트리의 구체적인 구현은 `root`, `parent`, `num_children`, `children`, `__len__`과 같은 메소드를 제공해야 하고, `BinaryTree`의 경우 `left`와 `right` 메소드도 제공해야 한다. 트리의 내부적인 구현을 위한 방법은 여러가지가 있지만 가장 일반적인 표현 방식을 다뤄보자. 우선 그 모양이 구체적으로 정의되는 **이진 트리(binary tree)**부터 시작하자.

### 8.3.1 Linked Structure for Binary Trees
이진 트리 $T$를 구현하는 자연스러운 방법은 **링크 구조(linked structure)**를 이용하는 것이다. 하나의 노드는 위치 $p$에 저장된 원소로의 참조와 부모&자식으로의 참조를 저장한다. 만약 $p$가 $T$의 루트라면 $p$의 `parent` 필드는 `None`이다. 루트 노드가 존재한다면 트리는 직접 그 루트 노드로의 참조를 담는 인스턴스 변수를 저장하고, $T$의 전체 노드의 수를 표현하는 `size`라는 변수도 저장한다. 다음의 그림은 설명한 바를 그림으로 나타낸 것이다.

<img style="float: left " width="300" alt="figure-8.11a" src="https://user-images.githubusercontent.com/20944657/36843407-371eb2f4-1d92-11e8-83d9-0dc9de264ddc.png">
<img width="400" alt="figure-8.11b" src="https://user-images.githubusercontent.com/20944657/36843408-375b7252-1d92-11e8-833c-5232d9cb7341.png">

### Python Implementation of a Linked Binary Tree Structure
이번 섹션에서는 `BinaryTree` 클래스의 서브클래스인 `LinkedBinaryTree` 클래스를 통해 이진 트리 ADT를 구현해보자. 접근 방식은 Section 7.4에서 `PositionalList`를 구현할 때와 비슷하다. 노드를 표현하기 위해 간단한 nonpublic `_Node` 클래스를 정의하고, 그 노드를 감싸는 `Position` 퍼블릭 클래스를 정의하자. 위치가 주어졌을 때 그 위치가 유효한 위치인지 확인하는 `_validate`, 노드를 다시 위치로 변환해서 호출자에게 반환하는 `_make_position` 메소드도 정의할 것이다.

우리는 `BinaryTree.Position`을 직접 상속하는 새로운 `Position` 클래스를 선언할 것이다. 기술적인 관점에서 보면, `BinaryTree` 클래스의 정의는 `Position`이라는 중첩 클래스를 선언한 적이 없고, `Tree.Position`을 상속받은 것이다. 굳이 `Position` 클래스를 상속받게 함으로써 얻는 사소한 이득으로는 `__ne__` 스페셜 메소드를 상속받게 해서 `__eq__`만 정의해도 `p != q`가 잘 실행되게 할 수 있다는 점이다. 또, 우리는 `Tree`와 `BinaryTree` 클래스의 추상 메소드를 구현할 것이고, `_root`를 None으로, `_size`를 0으로 초기화하는 빈 트리를 만드는 생성자도 구현할 것이다. 이러한 접근자 메소드들은 `_validate`와 `_make_position`을 이용하여 신중하게 구현되어야 한다.

### Operations for Updating a Linked Binary Tree
지금까지 우리는 이미 존재하는 이진 트리를 설명하기 위한 기능들만 설명했다. `LinkedBinaryTree` 클래스의 생성자가 비어있는 트리를 만들긴 하지만 아직 트리의 구조나 내용을 바꾸기 위한 어떠한 수단도 제공하지 않은 것이다. 우리가 `Tree`나 `BinaryTree` 추상 기초 클래스에서 여러가지 이유로 업데이트 메소드를 선언하지 않은 데에는 몇가지 이유가 있다. 첫번째 이유는 캡슐화의 원칙이 클래스의 외부 동작으로 하여금 내부 표현에 의존하지 않게끔 해주었지만 그럼에도 불구하고 연산의 *효율성*은 내부 표현에 크게 의존한다는 것이다. 우리는 구체적인 트리의 구현에서 트리를 업데이트하는 데 가장 적합한 옵션을 제공하게끔 하기를 원했다.

두번째 이유로는 그러한 업데이트 메소드들이 퍼블릭 인터페이스의 일부가 되지 않기를 원했기 때문이다. 트리는 많은 응용이 가능하고 그 중 일부에서는 적합하게 여겨지는 업데이트 방식이 다른 사례에서는 매우 부적합할 수 있다. 그런데도 만약에 우리가 기초 클래스에 업데이트 메소드를 둔다면 그 기초 클래스를 상속받는 클래스는 그 업데이트 메소드까지도 상속받게 될 것이다. 예를 들어 위치 $p$의 원소를 $e$로 교체하는 `T.replace(p,e)` 메소드를 생각해보자. **산술 연산 트리**의 경우에는 일부 내부 트리의 원소를 연산자로만 제한해야 하기 때문에 저렇게 일반적인 메소드는 적합하지 않다.

링크드 바이너리 트리에서 일반적으로 쓰이는 업데이트 메소드들의 집합은 다음과 같다:
- **T.add_root(e):** 비어있는 트리의 루트를 생성하고 원소 $e$를 저장한 후 루트의 위치를 반환한다. 트리가 비어있지 않다면 에러가 발생한다.
- **T.add_left(e):** 원소 $e$를 저장하는 새로운 노드를 만들고, 그 노드를 위치 $p$의 왼쪽 자식으로 연결한 후 위치를 반환한다. $p$가 이미 왼쪽 자식을 갖고 있다면 에러가 발생한다.
- **T.add_right(p, e):** 원소 $e$를 저장하는 새로운 노드를 만들고, 그 노드를 위치 $p$의 오른쪽 자식으로 연결한 후 위치를 반환한다. $p$가 이미 오른쪽 자식을 갖고 있다면 에러가 발생한다.
- **T.replace(p, e):** $p$에 저장된 원소를 $e$로 교체하고 이전에 저장되어 있던 원소를 반환한다.
- **T.delete(p):** 위치 $p$의 노드를 제거하고 만약 자식이 있다면 그 자식 노드로 교체한 후, $p$에 저장되어 있던 원소를 반환한다. 만약 $p$의 자식이 둘이라면 에러가 발생한다.
- **T.attach(p, T1, T2):** 트리 $T1$과 $T2$의 내부 구조를 각각 $T$의 잎 위치(leaf position) $p$의 왼쪽 서브트리, 오른쪽 서브트리로 붙이고, $T1$과 $T2$를 빈 트리로 만든다. 만약 $p$가 잎이 아니라면 에러가 발생한다.

특별히 이 연산들을 고른 이유는 링크드 구조에서 $O(1)$ worst-case time을 갖기 때문이다. 이 중에서 가장 복잡한 메소드는 `delete`와 `attach`인데, 경계 상황이나 다양한 부모-자식 관계 케이스에 대한 분석이 필요하기 때문이다. 그럼에도 불구하고 이 연산들 또한 $O(1)$ 시간복잡도를 갖는다(이 메소드들의 구현은 만약 센티널 노드를 이용할 경우 매우 간단해진다. See Exercise C-8.40). 위에서 설명했듯이, 적합하지 않은 업데이트 메소드가 서브 클래스에 의해 상속되는 경우를 피하기 위해 위의 메소드들을 `nonpublic` 메소드로 선언할 것이다. 이렇게 하면 내부적으로는 nonpublic 메소드를 자유롭게 이용하면서도 각각의 응용 상황에 적합한 퍼블릭 인터페이스를 제공하는 것이 가능하다. 서브클래스는 이를 위해 하나 이상의 nonpublic 업데이트 메소드를 묶어서 사용자에게 public 메소드로 제공해야한다.

In [12]:
class LinkedBinaryTree(BinaryTree):
    """Linked representation of a binary tree structure."""
    
    class Node:          # lightweight, nonpublic class for storing a node.
        __slots__ = '_element', '_parent', '_left', '_right'
        def __init__(self, element, parent=None, left=None, right=None):
            self._element = element
            self._parent = parent
            self._left = left
            self._right = right
            
    class Position(BinaryTree.Position):
        """An abstraction representing the location of a single element."""
        
        def __init__(self, container, node):
            """Constructer should not be invoked by user."""
            self._container = container
            self._node = node
            
        def element(self):
            """Return the element stored at this Position."""
            return self._node._element
        
        def __eq__(self, other):
            """Return True if other is a Position representing the same location."""
            return type(other) is type(self) and other._node is self._node
        
    def _validate(self, p):
        """Return associated node, if position is valid."""
        if not isinstance(p, self.Position):
            raise TypeError('p must be proper Position type')
        if p._conatiner is not self:
            raise ValueError('p does not belong to this container')
        if p._node._parent is p._node:       # convention for deprecated nodes
            raise ValueError('p is no longer valid')
        return p._node
    
    def _make_position(self, node):
        """Return Position instance for given node (or None if no node)."""
        return self.Position(self, node) if node is not None else None
    
    # ------------------ binary tree constructor ---------------------------
    def __init__(self):
        """Create an initially emptry binary tree."""
        self._root = None
        self._size = 0
        
    # ----------------- public accessors -----------------------------------
    def __len__(self):
        """Return the total number of elements in the tree."""
        return self._size
    
    def root(self):
        """Return the root Position of the tree (or None if tree is empty)."""
        return self._make_position(self._root)
    
    def parent(self, p):
        """Return the Position of p's parent (or None if p is root)."""
        node = self._validate(p)
        return self._make_position(node._parent)
    
    def left(self, p):
        """Return the Position of p's left child (or None if no left child)."""
        node = self._validate(p)
        return self._make_position(node._left)
    
    def right(self, p):
        """Return the Position of p's right child (or None if no right child)."""
        node = self._validate(p)
        return self._make_position(node._right)
    
    def num_children(self, p):
        """Return the number of children of Position p."""
        node = self._validate(p)
        count = 0
        if node._left is not None:           # left child exists
            count += 1
        if node._right is not None:          # right child exists
            count += 1
        return count
    
    def _add_root(self, e):
        """Place element e at the root of an empty tree and return new Position.
        
        Raise ValueError if tree nonempty.
        """
        if self._root is not None: raise ValueError('Root exists')
        self._size = 1
        self._root = self._Node(e)
        return self._make_position(self._root)
    
    def _add_left(self, p, e):
        """Create a new left child for Position p, storing element e.
        
        Return the Position of new node.
        Raise ValueError if Position p is invalid or p already has a left child.
        """
        node = self._validate(p)
        if node._left is not None: raise ValueError('Left child exists')
        self._size +=1
        node._left = self._Node(e, node)                    # node is its parent
        return self._make_position(node._left)
    
    def _add_right(self, p, e):
        """Create a new right child for Position p, storing element e.
        
        Return the Position of new node.
        Raise ValueError if Position p is invalid or p already has a left child.
        """
        node = self._validate(p)
        if node._right is not None: raise ValueError('Right child exists')
        self._size += 1
        self._right = self._Node(e, node)
        return self._make_position(node._right)
    
    def _replace(self, p, e):
        """Replace the element at position p with e, and return old element."""
        node = self._validate(p)
        old = node._element
        node._element = e
        return old
    
    def _delete(self, p):
        """Delete the node at Position p, and replace it with its child, if any.
        
        Return the element that had been stored at Position p.
        Raise ValueError if Position p is invalid or p has two children.
        """
        node = self._validate(p)
        if self.num_children(p) == 2: raise ValueError('p has two children')
        child = node._left if node._left else node._right     # might be None
        if child is not None:
            child._parent = node._parent    # child's grandparent becomes parent
        if node is self._root:
            self._root = child              # child becomes root
        else:
            parent = node._parent
            if node is parent._left:
                parent._left = child
            else:
                parent._right = child
        self._size -= 1
        node._parent = node                 # convention for deprecated node
        return node._element
    
    def _attach(self, p, t1, t2):
        """Attach trees t1 and t2 as left and right subtrees of external p."""
        node = self._validate(p)
        if not self.is_leaf(p): raise ValueError('position must be leaf')
        if not type(self) is type(t1) is type(t2):   # all 3 trees must be same type
            raise TypeError('Tree types must match')
        self._size += len(t1) + len(t2)
        if not t1.is_empty():                        # attached t1 as left subtree of node
            t1._root._parent = node
            node._left = t1._root
            t1._root = None                          # set t1 instance to empty
            t1._size = 0
        if not t2.is_empty():                        # attached t2 as right subtree of node
            t2._root._parent = node
            node._right = t2._root
            t2._root = None                          # set t2 instance to empty
            t2._size = 0

### Performance of the Linked Binary Tree Implementation
`LinkedBinaryTree` 클래스 안의 메소드들의 효율성을 분석해보자.
- `LinkedBinaryTree` 클래스에서 구현된 `len` 메소드는 $T$의 노드 수를 저장하고 있는 인스턴스 변수를 이용하므로 $O(1)$ 시간이 걸린다. `Tree`에서 상속받은 `is_empty` 메소드는 `len`을 한 번 호출하므로 $O(1)$ 시간이 걸린다.
- `LinkedBinaryTree`에서 직접 구현하는 `root`, `left`, `right`, `parent`, `num_children` 액세서 메소드는 $O(1)$ 시간이 걸린다. `BinaryTree`에서 상속받는 `sibling`과 `children` 메소드는 다른 액세서들을 상수번 호출하므로 역시 $O(1)$ 시간이 걸린다.
- `depth`와 `height` 메소드는 Section 8.1.3에서 이미 분석했다. 위치 $p$에서 `depth` 메소드는 $O(d_{p}+1)$ 시간이 걸리고, 이 때 $d_{p}$는 $p$의 깊이이다. 루트에서 `height` 메소드는 $O(n)$ 시간이 걸린다.
- `add_root`, `add_left`, `add_right`, `replace`, `delete`, `attach`와 같은 다양한 업데이트 메소드(nonpublic)들은 노상수개의 노드를 다시 연결해주기만 하면 되므로 $O(1)$ 시간 안에 작동한다.

### Array-Based Representation of a Binary Tree
이진트리 $T$를 표현하는 다른 방식은 $T$의 위치에 숫자를 매기는 방법이다. $T$의 모든 위치 $p$에 대해서 $f(p)$를 다음과 같은 정수로 정의하자.
- 만약 $p$가 $T$의 루트라면 $f(p) = 0$이다.
- 만약 $p$가 위치 $q$의 왼쪽 자식이라면 $f(p) = 2f(q) + 1$이다.
- 만약 $p$가 위치 $q$의 오른쪽 자식이라면 $f(p) = 2f(q) + 2$이다.

넘버링 함수 $f$는 이진트리 $T$의 위치에 대한 **레벨 넘버링** 이라고 알려져 있다. $f$는 $T$의 각 레벨에 있는 위치들을 왼쪽부터 오른쪽까지 오름차순으로 숫자를 매겨준다. 레벨 넘버링은 트리 내의 실제 위치가 아닌 *잠재적인(potential)* 위치에 기반해서 이루어지기에 모든 위치들의 숫자가 연속적이지는 않다. 예를 들어 아래의 그림에서는 노드 6이 자식이 없기 때문에 노드 13, 14가 존재하지 않는다.

<img width="600" alt="figure-8.12" src="https://user-images.githubusercontent.com/20944657/36847446-b151d7a4-1da1-11e8-98f3-bacb87ef7a85.png">

이와 같은 레벨 넘버링 함수 $f$를 이용하면 이진트리 $T$를 배열 기반의 구조(파이썬 `list`와 같은) $A$로 표현할 수 있다. 이 때 위치 $p$의 원소는 배열의 인덱스 $f(p)$에 저장된다.  아래는 트리를 배열로 나타낸 예시이다.

<img width="600" alt="figure-8.13a" src="https://user-images.githubusercontent.com/20944657/36847545-0255d75e-1da2-11e8-8833-802f54e143d3.png">
<img width="700" alt="figure-8.13b" src="https://user-images.githubusercontent.com/20944657/36847532-f7a6aca2-1da1-11e8-8948-caa4c1929668.png">

이진트리를 배열 기반의 구조로 표현하는 것의 이점은 위치 $p$가 정수 $f(p)$로 표현되기 때문에 `root`, `parent`, `left`, `right`와 같은 위치에 기반한 메소드들이 $f(p)$에 대한 간단한 산술 연산으로 구현될 수 있다는 것이다. 레벨 넘버링 공식에 따르면 위치 $p$의 왼쪽 자식은 $2f(p)+1$ 인덱스를 갖고, 오른쪽 자식은 $2f(p)+2$ 인덱스를 갖고, $p$의 부모는 $\lfloor (f(p) - 1)/2 \rfloor$ 인덱스를 갖는다. 제대로 된 구현은 연습문제에 있다(R-8.18).

배열 기반 표현방식의 공간 복잡도는 트리의 모양에 의해 결정된다. $T$의 노드 수를 $n$이라 하고 $f_{M}$을 $T$의 모든 노드에 대한 $f(p)$ 중 가장 큰 값이라 두자. 배열 $A$의 원소는 $A[0]$부터 $A[f_{M}]$까지 있으므로 $N = 1 + f_{M}$이어야 한다. 이 때 $A$가 존재하지 않는 노드에 대한 빈 셀을 갖는다는 점에 주목하자. 이러한 이유 때문에 최악의 경우에 $N = 2^{n} - 1$이 될 수 있다. Section 9.3에서는 $N = n$인 경우의 이진 트리 클래스 "힙(heapq)"을 보게 될 것이다. 즉, 최악의 경우의 공간 복잡도에도 불구하고 이진트리의 배열 표현방식이 효율적인 경우들이 있다. 물론 공간 복잡도가 지수가 되는 경우엔 배열 표현방식을 이용해서는 안된다.

배열 표현방식의 또 다른 단점은 일부 업데이트 연산이 효율적으로 이루어질 수 없다는 점이다. 예를 들 배열 표현에서는 노드를 삭제하고 자식 노드를 위로 끌어올리려면 자식만 위치를 옮기는 게 아니라 자식의 모든 후손들이 자리를 옮겨야 하므로 $O(n)$의 시간이 걸린다.

### 8.3.3 Linked Structure for General Trees
이진 트리에서는 모든 노드가 자식 노드를 위해 명시적으로 `left`, `right` 필드를 갖지만, 일반적인 트리에서는 노드가 가질 수 있는 자식의 수에 제한이 없다. 일반적인 트리 $T$를 링크 구조로 실현하는 자연스러운 방법은 모든 노드가 자식들에 대한 참조를 저장하는 하나의 *컨테이너*를 갖는 것이다. 예를 들어 노드의 `children` 필드는 노드의 자식들에 대한 참조를 담는 파이썬 `list` 일 수 있다. 대략적인 묘사는 아래의 그림과 같다.

<img width="200" alt="figure-8.14a" src="https://user-images.githubusercontent.com/20944657/36848200-e567392e-1da3-11e8-9e8a-8c4faef8d83e.png">
<img width="500" alt="figure-8.14b" src="https://user-images.githubusercontent.com/20944657/36848201-e5a0e138-1da3-11e8-900c-0eff9e21570b.png">

아래의 표는 링크 구조를 이용해서 일반적인 트리를 구현했을 때의 효율성을 나타낸 표이다. 자세한 분석 방법은 연습문제(R-8.14)로 남기지만, 주목해야 할 점은 각각의 위치 $p$에서 자식들을 집합으로 저장하기 때문에 `children(p)`를 구현할 때는 그냥 그 집합을 iterate하기만 하면 된다는 것이다.

<img width="400" alt="table-8.2" src="https://user-images.githubusercontent.com/20944657/36848362-5f593f70-1da4-11e8-9f2f-b75bc007b6cf.png">

## 8.4 Tree Traversal Algorithms
트리 $T$의 **탐색(traversal)**은 $T$의 모든 위치를 접근 혹은 "방문"하는 체계적인 방법이다. 위치 $p$를 "방문" 하면서 어떤 동작을 할 지는 이 탐색이 어떠한 트리의 응용 사례에서 실시되고 있는 지에 달려있고, 카운터를 증가시키는 것 부터 $p$에 대한 복잡한 연산을 하는 것까지 어떤 동작이든 이루어질 수 있다. 이번 섹션에서는 트리를 탐색하기 위한 여러가지 방법을 알아보고 다양한 트리 클래스에 대해 이를 구현해보자.

### 8.4.1 Preorder and Postorder Traversals of General Trees
트리 $T$의 **전위 운행법(preorder traversal)**에서는, $T$의 루트를 방문한 후 그 자식들을 루트로 하는 서브트리들을 재귀적으로 방문하게 된다. 만약 트리에 순서가 있다면 서브트리는 자식들의 순서대로 방문된다. 전위 운행의 psuedo-code는 다음과 같다.

**Algorithm** preorder(T, p):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perform the "visit" action for position p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;for each child c in T.children(p) **do**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;preorder(T, c)

아래는 이러한 전위 운행 알고리즘이 실행되는 예시를 그림으로 나타낸 것이다.

<img width="600" alt="figure-8.15" src="https://user-images.githubusercontent.com/20944657/36877423-70200592-1dfd-11e8-9d55-3a6c6da45491.png">

### Postorder Traversal
또 다른 중요한 트리 탐색 알고리즘은 **후위 운행법(postorder traversal)**이다. 이 알고리즘은 먼저 루트의 자식을 루트로 하는 서브트리를 재귀적으로 방문한 후 루트를 방문하므로 전위 운행법의 반대로 볼 수도 있다. 아래는 후위 운행의 psuedo-code와 그림으로 나타낸 예제이다.

**Algorithm** postodrer(T, p):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**for** each child c in T.children(p) **do**<br> 
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;postorder(T, c)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perform the "visit" action for position p


<img width="600" alt="figure-8.16" src="https://user-images.githubusercontent.com/20944657/36877554-1e7b1a78-1dfe-11e8-8f2c-9d2edaed6ca6.png">

### Running-Time Analysis
전위 운행과 후위 운행 알고리즘 모두 트리의 모든 위치를 방문하기 위한 효율적인 알고리즘이다. 이 탐색 알고리즘의 분석은 Section 8.1.3에서 했던 `height2` 알고리즘의 분석과 비슷하다. 모든 위치 $p$에서 탐색 알고리즘의 nonrecursive한 부분은 $O(c_{p} +1)$을 필요로 한다. 이 때 $c_{p}$는 $p$의 자식의 수이고, "방문" 자체는 $O(1)$ 시간이 걸린다고 가정한다. 이렇게 되면 명제 8.5에 의해서 트리 탐색에 필요한 전체 시간은 $O(n)$이고 이 때 $n$은 트리의 위치의 수이다. 이 작동시간은 점근적으로 최적인데, 탐색은 반드시 트리의 $n$개 위치 모두를 방문해야 하기 때문이다.

### 8.4.2 Breadth-First Tree Traversal
전위 운행과 후위 운행 탐색이 트리의 위치를 방문하는 보편적인 방법이긴 하지만, 다른 보편적인 방법은 깊이가 $d+1$인 위치를 방문하기 전에 깊이가 $d$인 모든 위치를 방문하면서 탐색을 실시하는 것이다. 이러한 알고리즘을 **너비 우선 탐색(breadth-first traversal, BFT, BFS)**이라 한다.

너비 우선 탐색은 게임 플레이 소프트웨어에서 흔하게 사용되는 방법이다. **게임 트리(game tree)**는 게임의 초기 세팅을 루트로 해서 게임 도중 플레이어에 의해 만들어질 수 있는 가능한 선택들을 나타내는 트리이다. 예를 들어 다음 그림은 틱-택-토의 게임 트리 중 일부를 그림으로 표현한 것이다.

<img width="600" alt="figure-8.17" src="https://user-images.githubusercontent.com/20944657/36877764-2a7f6594-1dff-11e8-8a8a-5461609a3f1b.png">

게임 트리에서는 컴퓨터가 제한된 시간 안에 모든 게임 트리를 탐색하는 것이 불가능하기 때문에 너비 우선 탐색이 선호되는 경향이 있다. 컴퓨터는 컴퓨팅 시간이 허락하는 만큼 깊이있게 모든 선택을 고려하고, 그 선택들에 반응하게 될 것이다. 너비 우선 탐색의 pseudo-code는 다음과 같다. 한 번에 모든 서브트리를 탐색하고 있지 않기 때문에 너비 우선 탐색은 재귀적이지 않다.너비 우선 탐색에서는 노드를 방문하는 순서를 유지하기 위해, FIFO(first-in first-out) 원칙을 따르는 큐를 이용한다. 이 때 `enqueue`와 `dequeue`를 각각 $n$번 호출하기 때문에 전체 작동 시간은 $O(n)$이다.

**Algorithm** breadthfirst(T):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Initialize queue Q to contain T.root()<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**while** Q not empty **do**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;p = Q.dequeue()<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perfrom the "visit" action for position p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**for** each child c in T.children(p) **do**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Q.enqueue(c)<br>

### 8.4.3 Inorder Traversal of a Binary Tree
일반적인 트리에 적용할 수 있는 표준적인 전위, 후위, 너비 우선 탐색은 이진 트리에도 모두 직접 적용할 수 있다. 이번 섹션에서는 특히 이진 트리를 위한 탐색 알고리즘을 알아보자. **중위 운행법(inorder traversal)**에서는 위치 $p$를 그 왼쪽 자식 서브트리와 오른쪽 자식 서브트리를 방문하는 도중에 방문한다. 좀 엄밀하지 않게 얘기하자면 $T$의 노드를 "왼쪽부터 오른쪽으로" 방문하는 것이다. 실제로, 모든 위치 $p$에 대해 중위 운행법은 $p$의 왼쪽 서브트리의 모든 위치를 방문한 후에 $p$를 방문하고 그 다음에 $P$의 오른쪽 서브트리의 모든 위치를 방문한다. 

**Algorithm** inorder(p):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**if** p has a left child lc **then**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;inorder(lc)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perform the "visit" action for position p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**if** p has a right child rc **then**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;inorder(rc)<br>

<img width="600" alt="figure-8.18" src="https://user-images.githubusercontent.com/20944657/36878564-e952402e-1e02-11e8-8fd0-263f9bcc5de1.png">

중위 운행법은 여러가지 중요한 응용 상황에서 사용된다. 만약 위와 같은 산술 표현에서 이진 트리를 이용한다면 중위 운행법은 수식의 표준적인 표현방식의 순서를 따라 방문을 하게 된다. 위에서는 $3 + 1 * 3 / 9 - 5 + 2 ...$와 같이 된다.

### Binary Search Trees
이진 트리에 원소들을 순서가 있는 시퀀스로 저장했을 때 우리는 그 구조를 **이진 탐색 트리(binary search tree)**라고 하고, 이는 중위 탐색 알고리즘의 중요한 응용 사례가 된다. $S$를 순서 관계를 갖는 유일한 원소들의 집합이라 하자. 예를 들어 $S$는 정수의 집합이 될 수 있다. 이진 탐색 트리 $S$는 모든 위치 $p$에 대해 다음의 성질을 만족하는 트리 $T$이다:
- 위치 $p$는 $e(p)$로 표현되는 $S$의 원소를 저장한다.
- $p$의 왼쪽 서브트리에 저장된 원소들은 $e(p)$보다 작다.
- $p$의 오른쪽 서브트리에 저장된 원소들은 $e(p)$보다 크다.

이진 탐색 트리의 예제는 아래와 같다. 위의 성질이 만족되면 이진 탐색 트리 $T$에 대한 중위 탐색은 원소들을 오름차순으로 방문하게 된다.

<img width="400" alt="figure-8.19" src="https://user-images.githubusercontent.com/20944657/36878961-b0a1635c-1e04-11e8-930c-bde887d10304.png">

우리는 $S$의 원소 $v$를 찾기 위해 이진 탐색 트리 $T$를 활용할 수 있다. 루트에서 시작해서, $p$에 저장된 원소 $e(p)$와 $v$를 비교하고, 만약 $v \lt e(p)$이면 $p$의 왼쪽 서브트리로 탐색을 이어나가고, $v = e(p)$이면 탐색이 성공적으로 끝난다. 만약 $v \gt e(p)$이면 $p$의 오른쪽 서브트리로 탐색을 이어간다. 마지막으로, 만약 비어있는 서브트리에 도달하면 탐색이 실패한 것이다. 이진 탐색 트리는 각각의 내부 노드에서 그 노드의 원소가 찾고 있는 원소값보다 큰지 작은지에 대한 질문을 받는 이진 결정 트리로 볼 수도 있다. 

이진 탐색 트리 $T$의 작동 시간은 $T$의 높이에 비례한다. 명제 8.8에 의하면 $n$개의 노드를 갖는 이진 트리의 높이는 $log(n+1) - 1$ 이상이고 $n-1$ 이하이다. 따라서 이진 탐색 트리는 높이가 낮을 때 제일 효율적이다. Chapter 11에서 탐색 트리를 더 자세히 다룰 것이다.

### 8.4.4 Implementing Tree Traversals in Python
Section 8.1.2에서 트리 ADT를 처음 정의할때 우리는 트리 T가 다음의 메소드들에 대한 지원을 포함해야 한다고 말했었다:
- **T.positions():** 트리 $T$의 모든 *위치*에 대한 iteration을 생성한다.
- **iter(T):** 트리 $T$에 저장된 모든 *원소*의 iteration을 생성한다.

그 때 우리는 이 iteration이 결과를 보고하는 순서에 대해서는 떠허나 가정도 하지 않았다. 이번 섹션에서는 어떻게 트리 탐색 알고리즘이 이러한 iteration을 만드는 데 쓰일 수 있는지 알아보자. 모든 원소를 순회하는 일은 모든 위치를 순회하는 것과 같다고 생각하면, `iter(T)`는 `Tree` 추상 기초 클래스 안의 스페셜 메소드 `__iter__`를 다음과 같이 구현하면 된다.

```python
def __iter__(self):
    """Generate an iteration of the tree's elements."""
    for p in self.position():         # use same order as positions()
        yield p.element()             # but yield each element
```

이제 `positions` 메소드를 구현하기 위해서는 어떤 탐색 알고리즘을 써야 할지 결정해야한다. 탐색 순서에 따른 장점이 서로 다르므로 사용자에 의해 직접 호출될 수 있는 여러 구현을 제공하고, 그 중 하나를 트리 ADT의 기본 `positions` 메소드로 적용하자.

### Preorder Traversal
**전위 운행** 알고리즘을 먼저 이용하자. 우리는 `T.preorder()`를 호출하면 트리 내의 모든 위치에 대한 전위 운행 iteration을 반환하게끔 할 것이다. 그런데, 전위 운행의 재귀적 알고리즘은 반드시 트리 내의 특정한 위치를 파라미터로 제공해서 그 위치를 루트로 하는 서브트리를 탐색하게 해야 한다. 이러한 상황에 대한 일반적인 해결책은 해당하는 재귀적 파라미터를 포함하는 nonpublic 메소드를 만들고, public 메소드 `preorder`로 하여금 트리의 루트에 대해 nonpublic 메소드를 호출하게 하는 것이다.

이를 위해서는 `Tree` 클래스 안에 다음의 코드를 포함하면 된다.

In [13]:
def preorder(self):
    """Generate a preorder iteration of positions in the tree."""
    if not self.is_empty():
        for p in self._subtree_preorder(self.root()):       # start recursion
            yield p
            
def _subtree_preorder(self, p):
    """Generate a preorder iteration of positions in subtree rooted at p."""
    yield p                                        # visit p before its subtrees
    for c in self.children(p):                     # for each child c
        for other in self._subtree_preorder(c):    # do preorder of c's subtree
            yield other                            # yielding each to our caller

형식적으로, `preorder`와 `_subtree_preorder` 모두 제너레이터이다. 우리는 코드 안에서 "방문" 동작을 실행하기보다는 호출자에게 각각의 위치를 반환해서 호출자가 그 위치에 어떤 동작을 취할지 알아서 결정하게 하였다. `_subtree_preorder` 메소드는 재귀적이다. 그러나 우리는 전통적인 함수가 아니라 제너레이터에 의존하고 있기 때문에 재귀가 약간 다른 형태를 갖는다. 자식 $c$의 서브트리 안에서 모든 위치를 반환하기 위해 우리는 재귀 호출 `self._subtree_preorder(c)`에 의해 반환되는 모든 위치에 대해 루프를 돌고 그 각각의 위치를 다시 외부에 반환했다. 만약 $p$가 잎(leaf)이라면 `self.children(p)`에 대한 루프는 trivial하다(이 경우가 재귀의 종료 조건이 된다).

우리는 `preorder`에서도 비슷한 테크닉을 이용해서 트리의 루트에서 시작하는 재귀 프로세스에 의해 생성되는 모든 위치를 다시 반환했다(re-yield). 만약 트리가 비어있다면 아무것도 반환되지 않을 것이다. 이제 사용자들은 다음과 같은 코드를 작성할 수 있게 되었다.
```python
for p in T.preorder():
    # "visit" position [
```

공식적인 트리 ADT는 모든 트리가 `positions` 메소드를 지원하기를 요구한다. 전위 운행법을 iteration의 기본 순서로 두기 위해서 우리는 `Tree` 클래스 안에 아래의 정의를 포함할 것이다. `preorder` 호출에 의해 반환되는 모든 결과에 대해 루프를 돌기보다는 우리는 전체 iteration을 객체로서 반환한다.

```python
def positions(self):
    """Generate an iteration of the tree's positions."""
    return self.preorder()         # return entire preorder iteration
```

### Postorder Traversal
전위 운행법과 비슷한 방법으로 후위 운행법도 구현할 수 있다. 유일한 차이는 재귀적으로 서브트리의 위치들을 반환한 *후*에 위치 $p$를 반환한다는 것이다.

In [14]:
def postorder(self):
    """Generate a postorder iteration of positions in the tree."""
    if not self.is_empty():
        for p in self._subtree_postorder(self.root()):    # start recursion
            yield p
            
def _subtree_postorder(self, p):
    """Generate a postorder iteartion of positions in subtree rooted at p."""
    for c in self.children(p):                        # for each child c
        for other in self._subtree_postorder(c):      # do postorder of c's subtree
            yield other                               # yielding each to our caller
    yield p                                           # visit p after its subtrees

### Breadth-First Traversal
너비 우선 탐색 알고리즘은 재귀적이지 않다. 이 알고리즘은 탐색 과정을 관리하기 위해 위치들의 큐에 의존한다. 이번에는 Section 7.1.2의 `LinkedQueue`를 이용하였지만 큐 ADT의 구현 중 아무 것이나 이용해도 괜찮다.

In [15]:
def breadthfirst(self):
    """Generate a breadth-first iteration of the positions of the tree."""
    if not self.is_empty():
        fringe = LinkedQueue()               # known positions not yet yielded
        fringe.enqueue(self.root())          # starting with the root
        while not fringe.is_empty():
            p = fringe.dequeue()             # remove from front of the queue
            yield p                          # report this position
            for c in self.children(p):
                fringe.enqueue(c)            # add children to back of queue

### Inorder Traversal for Binary Trees
전위, 후위, 너비 우선 탐색 알고리즘은 모든 트리에 적용이 가능하므로 `Tree` 추상 기초 클래스에서 구현하면 되고, 이 메소드는 모두 `BinaryTree` 추상 클래스, `LinkedBinaryTree` 구상 클래스, 그리고 기타 등등 `Tree`를 상속하는 모든 트리에 의해 상속된다. 그러나 중위 운행 알고리즘은 명시적으로 노드의 왼쪽, 오른쪽 자식 개념에 의존하기 때문에 이진 트리에만 적용할 수 있다. 따라서 우리는 `BinaryTree` 클래스 내부에 중위 운행 메소드를 정의할 것이다.

그 특성상 중위 운행 알고리즘이 이진 트리의 많은 응용 사례에 적합하기 때문에 우리는 `BinaryTree` 클래스의 기본 알고리즘으로 중위 운행 알고리즘을 선택할 것이다. 이를 위해 `positions` 메소드를 오버라이드 해야한다.

In [16]:
def inorder(self):
    """Generate an inorder iteration of positions in the tree."""
    if not self.is_empty():
        for other in self._subtree_inorder(self.left(p)):
            yield other
    yield p
    if self.right(p) is not None:
        for other in self._subtree_inorder(self.right(p)):
            yield other
            
# override inheritted version to make inorder the default
def positions(self):
    """Generate an iteration of the tree's positions."""
    return self.inorder()               # make inorder the default

### 8.4.5 Applications of Tree Traversals
이번 섹션에서 표준 탐색 알고리즘의 일부 수정된 버전과 함께 트리 탐색의 몇몇 응용 사례를 다뤄보자.

### Table of Contents
문서의 위계 구조를 표현하기 위해 트리를 사용할 때는 전위 운행 알고리즘을 통해 목차를 만드는 것이 자연스럽다. 예를 들어 다음의 트리를 보자.
<img width="600" alt="figure-8.15" src="https://user-images.githubusercontent.com/20944657/36877423-70200592-1dfd-11e8-9d55-3a6c6da45491.png">

위 트리를 목차로 나타내면 다음과 같이 나타낼 수 있을 것이다. 왼쪽은 들여쓰기를 하지 않았고, 오른쪽은 들여쓰기를 했는데, 오른쪽이 각각의 원소의 깊이를 나타낸다는 점에서 더 매력적이다.
```
Paper              Paper
Title                Title
Abstract             Abstract
§1                   §1
§1.1                   §1.1
§1.2                   §1.2
§2                   §2
§2.1                   §2.1
...                    ...
```

우선 첫번째 들여쓰기를 하지 않은 목차는 다음과 같이 구현할 수 있다.
```python
for p in T.preorder():
    print(p.element())
```

들여쓰기를 한 목차의 경우 각각의 원소를 `T.depth(p)*2` 만큼 들여쓰기를 해줘야 한다. 위의 루프에서 body 부분을 `print(2*T.depth(p)*' ' + str(p.element()))`로 바꿔도 되지만 이런 접근방식은 쓸데없이 비효율적이다. 전위 운행 알고리즘은 $O(n)$의 시간복잡도를 갖지만 `depth`의 호출은 추가적인 비용을 필요로 한다. 앞서 Section 8.1.3에서 `height1` 알고리즘을 분석할 때 봤듯이 트리의 모든 위치에서 `depth`를 호출하는 것은 $O(n^{2})$ worst-time을 갖는다.

따라서 들여쓰기가 있는 목차를 만들 때 일반적으로 선호되는 방식은 현재의 depth를 추가적인 파라미터로 갖는 새로운 탑-다운 재귀를 설계하는 것이다.

```python
def preorder_indent(T, p, d):
    """Print preorder representation of subtree of T rooted at p at depth d"""
    print(2*d*' ' + str(p.element()))
    for c in T.children(p):
        preorder_indent(T, c, d+1)
```

위의 코드는 모든 위치에서 `T.depth(p)`를 호출하지 않으므로 $O(n)$의 시간 복잡도를 갖는다.

위의 예제는 트리의 원소 자체가 넘버링이 되어있는 운이 좋은 예제이다. 일반적으로는 전위 운행법을 이용해서 트리의 구조를 나타낼 때 들여쓰기를 하면서도 각각의 원소에 넘버링을 하기를 원한다. 예를 들어 우리는 다음과 같이 트리를 표현하기를 원한다.
```
Electronics R'Us
    1 R&D
    2 Sales
        2.1 Domestic
        2.2 International
            2.2.1 Canada
            2.2.2 S. America
```

이는 좀 더 어려운데, 라벨로 사용되는 각각의 숫자들은 트리 내에 명시적으로 존재하는 것이 아니라 암묵적으로 존재하는 것이기 때문이다. 라벨은 각각의 위치의 인덱스, 형제 자매와의 상대적인 위치, 루트부터 현재 위치까지의 경로에 의존한다. 이러한 일을 해내기 위해서는 재귀 함수의 추가적인 파라미터로 경로를 넣어줘야 한다. 구체적으로, 우리는 zero-indexed 리스트를 이용해서 경로를 따라 내려오면서 만나는 각각의 위치에 대해 루트를 제외하고 모두 숫자를 부여한다(출력할 때는 이 숫자들을 다시 one-indexed form으로 바꿔준다).

실제로 구현할 때에는 이 리스트들을 복사하여 다음 레벨의 재귀 호출에 파라미터로 넘겨주는 것의 비효율성을 피해야 한다. 이를 위한 방법으로는 재귀 과정 내내 하나의 리스트를 공유하게끔 하는 방법이 있다. 

In [17]:
def preorder_label(T, p, d, path):
    """Print labeled representation of subtree of T rooted at p at depth d."""
    label = '.'.join(str(j+1) for j in path)
    print(2*d*' ' + label, p.elemnt())
    path.append(0)
    for c in T.children(p):
        preorder_label(T, c, d+1, path)
        path[-1] += 1
    path.pop()

### parenthetic Representation of a Tree
위에서 봤던 들여쓰기 없는 목차와 같은 원소들의 전위 운행 시퀀스만을 가지고 일반적인 트리를 다시 만들어내는 것은 불가능하다. 트리의 구조가 잘 정의되게 하기 위해서는 추가적인 정보가 필요하다. 들여쓰기나 숫자 라벨도 그러한 정보 중에서도 매우 인간-친화적인(human-friendly) 표현이다. 그러나 컴퓨터-친화적인(computer-friendly)하면서도 더 정확한 트리의 문자열 표현 방식이 존재한다.

이번 섹션에서는 그러한 표현 방식인 **parenthetic string representation** $P(T)$를 다룰 것이다. $P(T)$는 다음과 같이 재귀적으로 정의할 수 있다: 만약 $T$가 하나의 위치 $p$로 이루어져있다면

$P(T) = str(p.element())$.

그렇지 않고 여러 위치로 이루어져있다면,

$P(T)$ = `str(p.element())` + `'('` + $P(T_{1})$ + `', '` + $\cdots$ +`', '`+ $P(T_{k})$ + `')'`.

이 때 $p$는 $T$의 루트이고 $T_{1}, T_{2}, ... , T_{k}$는 $p$의 자식들을 루트로 하는 서브트리이며, 만약 $T$가 순서 트리라면 자식들의 순서에 따라 서브트리의 순서가 결정된다.

우리는 "+"를 문자열 병합을 나타내는 기호로 사용했다. 예를 들어 Electronics R'Us의 예제는 parenthetic representation을 이용하면 다음과 같이 표현될 것이다.

`Electronics R'Us (R&D, Sales (Domestic, International (Canada, S. America, Overseas (Africa, Europe, Asia, Australia))), Purchasing, Manufacturing (TV, CD, Tuner))`

parenthetic representation이 본질적으로 전위 운행 알고리즘이긴 하지만 우리는 `preorder`의 구현을 이용한다면 추가적인 구두점들을 만들어내는 것이 쉽지가 않다. 여는 괄호('(')의 경우 위치의 자식들에 대한 루프를 돌기 전에 생성되어야 하고, 닫는 괄호(')')의 경우 루프가 끝나고 나서 생성이 되어야 한다. 게다가, 콤마(,) 또한 생성되어야 한다. 따라서 이러한 점들을 고려한 파이썬 함수 `parenthesize`를 다음과 같이 구현하자.

In [18]:
def parenthesize(T, p):
    """Print parenthesized representation of subtree of T rooted at p."""
    print(p.element(), end='')            # use of end avoids trailing newline
    if not T.is_leaf(p):
        first_time = True
        for c in T.children(p):
            sep = ' (' if first_time else ', '       # determine proper separator
            print(sep, end='')
            first_time = False            # any future passes will not be the first
            parenthesize(T, c)            # recur on child
        print(')', end='')                # include closing parenthesis

### Computing Disk Space
Section 8.1에서 내부 노드를 디렉토리로, 잎을 파일로 표현하는 트리를 파일-시스템 구조의 모형으로 사용할 수 있다고 말한 적이 있다. 사실 Chapter 4에서는 파일 시스템의 예제를 직접 살펴본 적도 있다(Section 4.1.4). 명시적으로 트리를 모형으로 사용하지는 않았지만 디스크 사용량을 계산하기 위한 알고리즘을 구현하기도 했다.

디스크 사용량의 재귀적 계산은 *후위 운행* 알고리즘의 대표격이라 할 수 있다. 자식 디렉토리에 의해 사용되는 사용량을 알기 전에는 디렉토리에 의해 사용되는 전체 사용량을 효율적으로 계산하는 것이 불가능하기 때문이다. 불행히도 이전에 우리가 정의한 `postorder`는 이러한 목적으로 사용하기에 적합하지 않다. 디렉토리를 방문하기는 하지만 이전의 어떤 위치가 그 디렉토리의 자식 노드를 의미하는지, 얼마만큼의 재귀적 디스크 사용량이 할당되었는지 알 수 있는 방법이 없기 때문이다.

우리는 자식들로 하여금 탐색 과정의 일부로서 부모에게 정보를 반환하게끔 하는 메커니즘이 필요하다. 디스크 사용량 문제에 대한 솔루션은 이런 방식을 이용해서 재귀가 일어날 때마다 호출자에게 반환값을 제공하게 하는 것이다.

```python
def disk_space(T, p):
    """Return total disk space for subtree of T rooted at p."""
    subtotal = p.element().space()              # space used at position p
    for c in T.children(p):
        subtotal += disk_space(T, c)            # add child's space to subtotal
    return subtotal
```

### 8.4.6 Euler Tours and the Template Method Pattern
Section 8.4.5의 다양한 응용 사례들은 재귀적 트리 탐색이 얼마나 유용한지 잘 보여준다. 그러나 불행히도 이 예제들은 또한 우리가 구현했던 `Tree`의 `preorder`, `postorder` 메소드나 `BinaryTree`의 `inorder` 메소드가 우리가 필요로 하는 다양한 계산에 쓰이기에는 일반적이지 않다는 것을 보여주기도 한다. 일부 케이스에서는 이 접근방식들을 섞어서 써야하기도 하고, 서브트리에 대한 재귀를 실행하기 전에 초기 작업을 해줘야 하기도 하며, 재귀가 다 실행된 이후에 추가적인 작업을 실행해주기도 해야 한다. 그리고 이진 트리의 경우에는 왼쪽 트리와 오른쪽 트리에 대한 재귀 호출 사이에 추가적인 작업을 해줘야 하는 경우도 있다. 게다가, 어떤 상황에서는 그 위치의 깊이를 아는 것이 중요하기도 하고, 아니면 루트에서 그 위치까지의 완전한 경로를 아는 것도 필요하기도 하다. 또, 특정 재귀에서 다른 재귀로 정보를 넘겨줘야 하는 경우도 있다. 이전의 예제에서는 재귀적인 아이디어를 적용하기 위해 각각의 경우에 대해 구현할 수 있었지만, 객체 지향 프로그래밍의 훌륭한 원칙은 **적응성(adaptability)**과 **재사용성(reusability)**을 포함한다.

이번 섹션에서는 **오일러 투어 탐색(Euler tour traversal)**이라고 알려진 컨셉을 이용하여 트리 탐색을 구현하는 일반적인 프레임워크를 다룬다. 일반적인 트리 $T$의 오일러 탐색은 엄밀하지 않게 정의하자면 $T$를 따라 "걷는 것"이라고 할 수 있다. 우리는 루트부터 시작해서 가장 왼쪽 자식을 향해서 걸어가는데, $T$의 엣지들을 항상 우리의 왼쪽에 둬야 하는 "벽"이라 생각한다. 그렇게 다시 루트로 돌아갈 때까지 벽을 왼쪽에 두고 계속 걸으면 된다.

<img width="600" alt="figure-8.21" src="https://user-images.githubusercontent.com/20944657/36888448-d777b812-1e38-11e8-8aaa-8194db65f96f.png">

이러한 '걷기'의 복잡도는 $O(n)$인데, 걷다 보면 정확히 트리의 $n-1$ 엣지들을 두 번 지나기 때문이다. 한번은 엣지를 따라 내려가고, 한번은 엣지를 따라 올라온다. 전위 운행과 후위 운행 탐색의 개념을 통합하기 위해 각각의 위치 $p$에 대한 두 번의 "방문"이 있다고 생각할 수 있다:
- "pre visit"은 그 위치에 처음 도달했을 때 발생한다. 즉, 우리의 시각화에서는 노드의 왼쪽을 지나 걸을 때 발생한다.
- "post visit"은 그 위치를 지나 위로 올라갈 때 발생한다. 즉, 우리의 시각화에서는 노드의 오른쪽을 지나 걸을 때 발생한다.

오일러 투어의 과정은 재귀적으로 쉽게 볼 수 있다. 주어진 위치의 "pre visit"과 "post visit" 사이에는 그 서브트리에 대한 재귀 투어가 존재할 것이다. 위의 그림을 다시 보자. "/" 노드의 "pre visit"과 "post visit" 사이에는 "X"를 루트로 하는 왼쪽 서브트리와 "+"를 루트로 하는 오른쪽 서브트리에 대한 오일러 투어가 이루어진다. 위치 $p$를 루트로 하는 서브트리의 오일러 투어에 대한 pseudo-code는 다음과 같다.

**Algorithm** eulertour(T, p):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perform the "pre visit" action for position p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**for** each child c in T.children(p) **do**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;eulertour(T, c)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;perform the "post visit" action for position p<br>

### The Template method pattern
재사용성과 적응성을 갖춘 프레임워크를 제공하기 위해서는 **템플릿 메소드 패턴(template method pattern)**이라는 흥미로운 객체 지향 소프트웨어 디자인 패턴을 이용하는 것이 좋다. 템플릿 메소드 패턴은 특정 응용 사례에 특화되게끔 만들기 위해 일부 스텝을 다시 정의하는 포괄적인 계산(computation) 메커니즘을 의미한다. 개별 맞춤화(customization)을 위해서 주 알고리즘은 프로세스의 지정된 스텝에서 **훅(hook)**이라 불리는 보조 함수를 호출한다.

오일러 투어 탐색에서는 두개의 훅을 정의하는데, 첫번째는 서브트리가 탐색되기 전에 호출되는 pre visit 훅과 서브트리의 탐색이 완료된 후에 호출되는 postvisit 훅이 있다. 우리의 구현은 프로세스를 관리하는 `EulerTour` 클래스의 형태를 갖출 것이고, 아무 작업도 하지 않는 trivial한 훅만 정의할 것이다. 그러고 나면 이제 `EulerTour`의 서브클래스를 만들어 훅을 오버라이드함으로써 특화된 동작을 제공하는 탐색을 커스터마이징하는 것이 가능해진다.

### Python Implementation

In [19]:
class EulerTour:
    """Abstract base class for performing Euler tour of a tree.
    
    _hook_previsit and _hook_postvisit may be overrideen by subclasses.
    """
    def __init__(self, tree):
        """Prepare an Euler tour template for given tree."""
        self._tree = tree
        
    def tree(self):
        """Return reference to the tree being traversed."""
        return self._tree
    
    def execute(self):
        """Perform the tour and return any result from post visit of root."""
        if len(self._tree) > 0:
            return self._tour(self._tree.root(), 0, [])      # start the recursion
        
    def _tour(self, p, d, path):
        """Perform tour of subtree rooted at Position p.
        
        p         Position of current node being visited
        d         depth of p in the tree
        path      list of indices of children on path from root to p
        """
        self._hook_previsit(p ,d, path)                            # "pre visit" p
        results = []
        path.append(0)             # add new index to end of path before recursion
        for c in self._tree.children(p):
            results.append(self._tour(c, d+1, path))    # recur on child's subtree
            path[-1] += 1            # increment index
        path.pop()                   # remove extraneous index from end of path
        answer = self._hook_postvisit(p ,d, path, results)         # "post visit" p
        return answer
    
    def _hook_previsit(self, p, d, path):                       # can be overridden
        pass
    
    def _hook_postvisit(self, p, d, path):                      # can be overridden
        pass

Section 8.4.5에서 탐색을 커스터마이징했던 경험에 기초해서 `EulerTour`가 재귀의 깊이와 탐색 경로에 대한 정보를 유지하게끔 하였다. 또, 하나의 재귀 레벨이 다른 레벨에 값을 반환하게끔 하였다. 우리의 프레임워크는 특화될 수 있는 두 개의 훅에 의존한다:
- method `_hook_previsit(p, d, path)`<br> 이 함수는 서브트리에 대한 탐색이 이루어지기 전에 각 위치에 대해 한번씩 호출된다. 파라미터 $p$는 트리의 위치이고, $d$는 그 위치의 깊이이고, `path`는 인덱스의 리스트이다. 이 함수에서는 값을 반환하지 않아도 된다.
- method `_hook_postvist(p, d, path, results)`<br> 이 함수는 서브트리에 대한 탐색이 끝난 후 각 위치에 대해 한번씩 호출된다. 앞의 파라미터 세개는 `_hook_previsit`과 같다. 마지막 파라미터는 $p$의 서브트리들의 post visit에서 반환된 객체들의 리스트이다. 이 호출에 의해 반환되는 값은 그 부모 $p$의 postvisit에서 이용 가능해진다.

더 복잡한 일을 처리해야 하는 경우에는 `EulerTour`의 서브클래스가 훅 내부에서 접근가능한 인스턴스 변수의 형태로 추가적인 상태를 초기화하고 유지하게끔 할 수 있다.

### Using the Euler Tour Framework
오일러 투어 프레임워크의 유연성을 설명하기 위해 Section 8.4.5에서 살펴봤던 예제를 다시 다뤄보자. 간단한 예제로, 들여쓰기가 있는 목차를 만드는 탐색은 다음과 같은 간단한 서브클래스를 통해 생성할 수 있다.

```python
class PreorderPrintIndentedTour(EulerTour):
    def _hook_previsit(self, p, d, path):
        print(2*d*' ' + str(p.element()))
```

이제 주어진 트리 $T$에 대해 서브클래스의 인스턴스를 만들고 `execute` 메소드를 실행하면 된다.
```python
tour = PreorderPrintIndentedTour(T)
tour.execute()
```

그러면 Electronics R'Us의 예제 또한 다음과 같이 쉽게 구현할 수 있다.

```python
class PreorderPrintIndentedLabeledTour(EulerTour):
    def _hook_previsit(self, p, d, path):
        label = '.'.join(str(j+1) for j in path)    # labels are one-indexed
        print(2*d*' ' + label, p.element())     
```

역시나 parenthetic string representation도 쉽게 구현할 수 있다. 이 경우는 previsit과 postvisit 모두 오버라이드 해야 한다.

```python
class ParenthesizeTour(EulerTour):
    def _hook_previsit(self, p, d, path):
        if path and path[-1] > 0:            # p follows a sibling
            print(', ', end='')              # so preface with comma
        print(p.element(), end='')           # then print element
        if not self.tree().is_leaf(p):       # if p h as children
            print(' (', end='')              # print opening parenthesis
            
    def _hook_postvisit(self, p, d, path, results):
        if not self.tree().is_leaf(p):       # if p has children
            print(')', end='')               # print closing parenthesis
```

훅 안에서 탐색 중인 트리 인스턴스에 대해 메소드를 실행해야 하고 있다는 점에 주목하자. `EulerTree` 클래스의 `tree()` 퍼블릭 메소드는 트리에 접근할 수 있게 해준다.

마지막으로, 디스크 사용량을 계산하는 작업도 `EulerTour`를 이용하면 쉽게 할 수 있다.
```python
class DiskSpaceTour(EulerTour):
    def _hook_postvisit(self, p, d, path, results):
        # we simply add space associated with p to that of its subtrees
        return p.element().space() + sum(results)
```

### The Euler Tour Traversal of a Binary Tree
지금까지, Section 8.4.6에서는 일반적인 그래프의 오일러 투어 탐색 개념을 소개하고, 템플릿 메소드 패턴을 이용해서 `EulerTour` 클래스를 설계했다. `EulerTour` 클래스는 투어를 커스터마이즈하기 위해 오버라이드할 수 있는 `_hook_previsit`과 `_hook_postvisit` 메소드를 제공한다. 이제 우리는 추가적인 `_hook_invisit` 메소드를 포함하는 `BinaryEulerTour` 서브클래스를 소개하고자 한다. `_hook_invisit` 메소드는 모든 위치에 대해 왼쪽 서브트리의 탐색이 끝나고, 오른쪽 서브트리의 탐색이 시작되기 전에 호출된다.

우리의 `BinaryEulerTour` 클래스의 구현은 원래의 `_tour` 유틸리티 메소드를 노드가 최대 두개만 갖는 경우에 대해서 특화되게끔 교체할 것이다. 또, 만약 노드가 한 개의 자식만 가질 경우 투어는 그 자식이 왼쪽 자식이 오른쪽 자식인지를 구분하고, "in place"가 왼쪽 자식에 대한 방문이 끝나고 나서 일어나는지, 오른쪽 자식에 대한 방문이 이루어지기 전에 일어나는지를 결정한다. 잎(leaf)의 경우에는 세 개의 훅이 연속적으로 실행될 것이다.

In [20]:
class BinaryEulerTour(EulerTour):
    """Abstract base class for performing Euler tour of a binary tree.
    
    This version includes an additional _hook_invisit that is called after the tour
    of the left subtree (if any), yet before the tour of the right subtree (if any).
    
    Note: Right child is always assigned index 1 in path, even if no left sibling.
    """
    def _tour(self, p, d, path):
        results = [None, None]            # will update with results of recursions
        self._hook_previsit(p, d, path)                   # "pre visit" for p
        if self._tree.left(p) is not None:                # consider left child
            path.append(0)
            results[0] = self._tour(self._tree.left(p), d+1, path)
            path.pop()
        self._hook_invisit(p, d, path)                    # "in visit" for p
        if self._tree.right(p) is not None:               # consider right child
            path.append(1)
            results[1] = self._tour(self._tree.right(p), d+1, path)
            path.pop()
        answer = self._hook_postvisit(p, d, path, results)        # "post visit" p
        return answer
    
    def _hook_invisit(self, p, d, path):                          # can be overridden
        pass           

<img width="600" alt="figure-8.22" src="https://user-images.githubusercontent.com/20944657/36930013-6e54380c-1edc-11e8-83c8-a8e0c0c9633b.png">

`BinaryEulerTour` 프레임워크의 사용을 설명하기 위해 위와 같이 이진 트리의 레이아웃을 계산해주는 서브클래스를 만들어보자. 기하는 바이너리 트리 $T$의 모든 위치 $p$에 $x$, $y$ 좌표를 할당해주는 알고리즘에 의해 다음과 같이 결정된다:

- $x(p)$는 $T$의 중위 운행 탐색에서 $p$ 전에 방문했던 위치의 수
- $y(p)$는 $p$의 깊이

이번 예제에서는 $x$ 좌표가 왼쪽에서 오른쪽으로 갈 수록 증가하고, $y$ 좌표가 위에서 아래로 갈 수록 증가한다는 컴퓨터 그래픽스의 관례를 따르도록 하겠다. 따라서 원점은 컴퓨터 화면의 왼쪽 위 코너가 된다. 다음의 코드는 `BinaryLayout` 서브클래스를 구현한 것이다. 우리는 지금까지 실행했던 "in visits"의 수를 기록하는 `_count` 인스턴스 변수를 추가적으로 저장하게끔 함으로써 `BinaryEulerTour` 프레임워크를 수정했다. 각각의 위치의 $x$ 좌표는 그 카운터에 의해 결정될 것이다.

In [21]:
class BinaryLayout(BinaryEulerTour):
    """Class for computing (x,y) coordinates for each node of a binary tree."""
    def __init__(self, tree):
        super().__init__(tree)                # must call the parent constructor
        self._count = 0                       # initialize count of processed nodes
        
    def _hook_invisit(self, p, d, path):      
        p.element().setX(self._count)         # x-coordinate serialized by count
        p.elelemnt().setY(d)                  # y-coordinate is depth
        self._count += 1                      # advance count of processed nodes

## 8.5 Case Study: An Expression Tree
<img width="600" alt="figure-8.8" src="https://user-images.githubusercontent.com/20944657/36930118-003e12b4-1ede-11e8-93d6-67121750406c.png">

이전에 우리는 산술 연산의 구조를 표현하기 위해 이진 트리를 사용한 예제를 본 적이 있다. 이번 섹션에서는 그런 트리를 만들고, 출력하고, 연산을 평가(evaluate)하는 `ExpressionTree` 클래스를 정의해보자. 우리의 `ExpressionTree` 클래스는 `LinkedBinaryTree`의 서브클래스로 정의할 것이고, nonpublic mutator들을 이용할 것이다. 각각의 내부 노드는 반드시 binary operator를 정의하는 문자열을 담고 있어야 하고(e.g., '+'), 각각의 잎은 수치 값을 저장하고 있어야 한다.

우리의 최종 목표는 $(((3 + 1) \times 4)/((9 - 5) + 2))$와 같은 복잡한 식에 대해 트리를 만드는 것이다. 그럼에도 불구하고 `ExpressionTree`는 다음의 기초적인 형태의 초기화를 지원하기만 하면 된다:
- **ExpressionTree(value):** 루트에 주어진 값을 저장하는 트리를 생성한다.
- **ExpressionTree(op, E1, E2):** 문자열 `op`(e.g., +)를 루트에 저장하는 트리를 생성하고, 이미 존재하는 `ExpressionTree` 인스턴스 $E_{1}$, $E_{2}$를 각각 루트의 왼쪽, 오른쪽 서브트리로 둔다.

`ExpressionTree` 클래스는 형식적으로 `LinkedBinaryTree`를 상속하기 때문에 우리가 Section 8.3.1에서 정의했던 모든 non-public 업데이트 메소드들에 접근할 수 있다. `ExpressionTree` 클래스의 생성자(constructor)는 `_add_root`를 이용해서 첫번째 인자로 전달받은 토큰을 저장하는 트리의 루트를 만들고, 파라미터가 추가로 더 있는지 확인한다. 만약 파라미터가 더 없다면 실행이 끝난 것이고, 파라미터가 총 세개라면 상속받은 `_attach` 메소드를 이용해서 $E_{1}$, $E_{2}$ 트리를 루트의 서브트리로 연결한다.

### Composing a Parenthesized String Representation
`ExpressionTree`의 인스턴스를 $(((3+1)\times4)/((9-5)+2))$와 같이 문자열로 표현하려면 중위 운행법을 이용해서 원소를 출력하고, 전위 운행과 후위 운행에서 각각 여는 괄호와 닫는 괄호를 출력해야 한다. `ExpressionTree` 클래스에서는 스페셜 메소드 `__str__`을 통해 이러한 문자열을 출력한다. 문자열을 그때 그때 합치는 것 보다는 합칠 개별 문자열들의 시퀀스를 만드는 것이 더 효율적이기 때문에(Section 5.4.2의 "Composing Strings" 논의를 참고하라), `__str__` 메소드는 리스트에 문자열을 append하는 nonpublic, recursive 메소드 `_parenthesize_recur`를 이용했다.

In [22]:
class ExpressionTree(LinkedBinaryTree):
    """An arithmetic expression tree."""
    
    def __init__(self, token, left=None, right=None):
        """Create an expression tree.
        
        In a single parameter form, token should be a leaf value (e.g., '42'),
        and the expression tree will have that value at an isolated node.
        
        In a three-parameter version, token should be an operator,
        and left and right should be existing ExpressionTree instances
        that become the operands for the binary operator.
        """
        super().__init__()                               # LinkedBinaryTree initialization
        if not isinstance(token, str):
            raise TypeError('Token must be a string')
        self._add_root(token)                            # use inherited, nonpublic method
        if left is not None:                             # presumably three-parameter form
            if token not in '+-*x/':
                raise ValueError('token must be valid operator')
            self._attach(self.root(0, left, right))      # use inherited, nonpublic method
            
    def __str__(self):
        """Return string representation of the expression."""
        pieces = []                  # sequence of piecewise strings to compose
        self._parenthesize_recur(self.root(), pieces)
        return ''.join(pieces)
    
    def _parenthesize_recur(self, p, result):
        """Append piecewise representation of p's subtree to resulting list."""
        if self.is_leaf(p):
            result.append(str(p.element()))                   # leaf value as a string
        else:
            result.append('(')                                # opening parenthesis
            self._parenthesize_recur(self.left(p), result)    # left subtree
            result.append(p.element())                        # operator
            self._parenthesize_recur(self.right(p), result)   # right subtree
            result.append(')')                                # closing parenthesis

### Expression Tree Evaluation
표현 트리(expression tree)의 수치적 평가는 후위 운행의 간단한 응용을 통해 가능하다. 만약 내부 위치의 두 서브트리에 의해 표현되는 값을 알고 있다면, 우리는 그 위치가 지시하는 연산의 결과를 계산할 수 있다. 위치 $p$를 루트로 하는 서브트리에 의해 표현되는 값의 재귀적 평가에 대한 pseudo-code는 다음과 같다.

**Algorithm** evaluate_recur(p):<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if p is a leaf **then**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**return** the value stored at p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**else**<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;let @ be the operator stored at p<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;x = evaluate_recur(left(p))<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;y = evaluate_recur(right(p))<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**return** x@y

위의 알고리즘을 파이썬 `ExpressionTree` 클래스에서 구현하기 위해 `T.evaluate()`의 형태로 호출할 수 있는 `evaluate` 퍼블릭 메소드를 정의하자.

In [23]:
def evaluate(self):
    """Return the numeric result of the expression."""
    return self._evaluate_recur(self.root())

def evaluate_recur(self, p):
    """Return the numeric result of subtree rooted at p."""
    if self.is_leaf(p):
        return float(p.element())                # we assume element is numeric
    else:
        op = p.element()
        left_val = self._evaluate_recur(self.left(p))
        right_val = self._evaluate_recur(self.right(p))
        if op == '+': return left_val + right_val
        elif op == '-': return left_val - right_val
        elif op == '/': return left_val / right_val
        else: return left_val * right_val         # treat 'x' or '*' as multiplcation.

### Building an Expression Tree
`ExpressionTree` 클래스의 생성자는 더 큰 표현 트리를 만들기 위해 이미 존재하는 트리들을 병합하는 기본적인 기능을 제공한다. 그러나 여전히 의문이 남는 부분은, 어떻게 $(((3+1)\times4)/((9-5)+2))$와 같은 식을 표현하는 트리를 어떻게 만들 수 있는가에 대한 것이다. 이러한 과정을 자동화하기 위해 우리는 bottom-up construction 알고리즘에 의존한다. 이 알고리즘에서는 먼저 문자열을 토큰화(tokenize)해서 한자리 수가 아닌 숫자들도 전부 숫자 하나하나로 구분하고, 식이 완전히 parenthesized 되어있다고 가정한다. 이 알고리즘은 숫자 값, 연산자, 오른쪽 괄호를 찾기 위해 입력받은 식 $E$의 토큰을 검색하면서 스택 $S$를 이용한다.
- 만약 연산자 @를 본다면 그 문자열을 스택에 푸쉬한다.
- 만약 literal value $v$를 본다면 $v$를 저장하는 하나의 노드로 이루어진 표현 트리 $T$를 만들고 스택에 푸쉬한다.
- 만약 오른쪽 괄호 ')'를 본다면 스택 $S$에서 3개의 항목을 팝(pop)한다. 이는 식 $(E_{1} @ E_{2})$을 의미한다. 그 다음에는 $@$를 저장하는 루트의 서브트리로 $E_{1}$과 $E_{2}$를 갖는 트리 $T$를 만들고, 이를 다시 스택에 푸쉬한다.

이러한 과정을 $E$가 완전히 처리될 때까지 반복하면, 스택의 가장 위에 있는 원소가 $E$의 표현 트리가 된다. 전체 작동 시간은 $O(n)$이다. 이 알고리즘의 구현은 아래에서 `build_expression_tree`라는 이름의 함수의 형태로 이루어진다.

In [24]:
def build_expression_tree(tokens):
    """Returns an ExpressionTree based upon by a tokenized expression."""
    S = []                                     # we use Python list as stack
    for t in tokens:
        if t in '+-x*/':                       # t is an operator symbol
            S.append(t)                        # push the operator symbol
        elif t not in '()':                    # consider t to be a literal
            S.append(ExpressionTree(t))        # push trivial tree storing value
        elif t == ')':         # compose a new tree from three constituent parts
            right = S.pop()                    # right subtree as per LIFO
            op = S.pop()                       # operator symbol
            left = S.pop()                     # left subtree
            S.append(ExpressionTree(op, left, right)) # repush tree
        # WE IGNORE A LEFT PARENTHESIS
    return S.pop()