## 6.6. Parse Tree

* With the implementation of our tree data structure complete, we now look at an example of how a tree can be used to solve some real problems. 
* 트리 데이터 구조를 구현해봤으므로 이제 우리는 문제를 해결할때 어떤식으로 사용되는지 확인해 볼것이다.
* In this section we will look at parse trees.
* 이 섹션에서 우리는 parse tree 대해 볼것이다.
* Parse trees can be used to represent real-world constructions like sentences or mathematical expressions.
* parse Tree는 문장이나 수학적 표현을 분석할때 나타낼 수 있다.

* Figure 1 shows the hierarchical structure of a simple sentence. 
* Figure 1은 간단한 문장의 계층적 구조를 나타낸다.
* Representing a sentence as a tree structure allows us to work with the individual parts of the sentence by using subtrees.
* 문장을 트리 구조로 표현하는 것이 우리가 문장의 개별 파트를 서브트리를 이용해 표현할 수 있게 한다.

* We can also represent a mathematical expression such as ((7+3)∗(5−2)) as a parse tree, as shown in Figure 2.
* 우리는 또한 ((7+3)∗(5−2))와 같은 수학적 표현을 parse Tree로 표현하자면 아래 그림과 같이 나타난다.
* We have already looked at fully parenthesized expressions, so what do we know about this expression? 
* 우리는 이미 완전히 괄호표시된 표기법을 살펴보았는데, 우리가 이 표현법에 대해 어떤것을 알아야 하는가?
* We know that multiplication has a higher precedence than either addition or subtraction.
* 우리는 곱셈이 덧셈이나 뺄셈보다 더 높은 우선순위를 가지고 있다는 것을 알고 있다.
* Because of the parentheses, we know that before we can do the multiplication we must evaluate the parenthesized addition and subtraction expressions.
* 괄호로 인해서, 우리는 곱셈을 하기 전에 괄호 알에 있는 덧셈과 뺼셈 표현을 먼저 한다.
* The hierarchy of the tree helps us understand the order of evaluation for the whole expression. 
* 트리의 계층구조는 전체 표현의 계산순서를 알게해주는데 도움을 준다.
* Before we can evaluate the top-level multiplication, we must evaluate the addition and the subtraction in the subtrees. 
* 최 상위 곱셈을 계산하기 전에, 우리는 반드시 서브트리 안에 있는 덧셈과 뺄셈을 계산해야 한다.
* The addition, which is the left subtree, evaluates to 10. 
* 왼쪽 서브 트리에 있는 덧셈은 10으로 계산된다.
* The subtraction, which is the right subtree, evaluates to 3.
* 왼쪽 서브트리에 있는 뺼샘을 계산하면 3으로 된다.
* Using the hierarchical structure of trees, we can simply replace an entire subtree with one node once we have evaluated the expressions in the children.
* 트리의 계층 구조를 사용해서, 우리는 단순히 전체 서브 트리를 표현식과 자식들을 이용하여 계산해서 한개의 노드로 바꿀 수 있다.
* Applying this replacement procedure gives us the simplified tree shown in Figure 3.
* 이것을 적용하여 Figure 3에 나와있는 단순한 트리로 바꿀 수 있다.

* In the rest of this section we are going to examine parse trees in more detail.
* 이 섹션에 나머지 부분에서 우리는 parse Tree을 좀더 자세히 볼것이다.
* In particular we will look at
* 특히 여기서는 다음에 대해 살펴볼 것이다.

* How to build a parse tree from a fully parenthesized mathematical expression.
* 완전히 괄호로 둘러싸인 수학적 표현식에서 어떻게 parse 트리를 만드는가.
* How to evaluate the expression stored in a parse tree.
* 어떻게 저장된 Parse tree에서 표현식을 계산할 것인가.
* How to recover the original mathematical expression from a parse tree.
* parse tree에서 어떻게 원래 수학 표현식을 나타낼 것인가

* The first step in building a parse tree is to break up the expression string into a list of tokens. 
* parse tree를 만들기 위한 첫번째 단계는 표현식 문자열을 토큰의 리스트로 만드는 것이다.
* There are four different kinds of tokens to consider: left parentheses, right parentheses, operators, and operands. 
* 여기에는 네가지 종류의 토큰들을 고려해야 한다. 왼쪽 괄호, 오른쪽 괄호, 연산자, 피연산자들.
* We know that whenever we read a left parenthesis we are starting a new expression, and hence we should create a new tree to correspond to that expression. 
* 우리는 왼쪽 괄호를 읽으면 새로운 표현식이 시작되는 것을 알고 있다.그리고 우리는 그 표현식에 대응하는 새로운 트리를 만들어야 한다.
* Conversely, whenever we read a right parenthesis, we have finished an expression.
* 반대로, 우리가 오른쪽 괄호를 읽을때. 우리는 표현식을 끝내야 한다.
* We also know that operands are going to be leaf nodes and children of their operators. 
* 또한 우리는 피연산자들이 리프 노드가 되어야 하고, 연산자들의 자식이 될것이라는 것을 알고 있다.
* Finally, we know that every operator is going to have both a left and a right child.
* 마지막으로, 우리는 모든 연산자들이 왼쪽, 오른쪽 자식들을 가지는 것을 알수있다.

* Using the information from above we can define four rules as follows:
* 위의 정보들을 활용하여 아래와 같은 4가지 룰을 정의할 수 있다.

* If the current token is a '(', add a new node as the left child of the current node, and descend to the left child.
* 만약 현재 토큰이 '(' 라면, 현재 노드의 왼쪽 차일드에 새로운 노드를 넣는다, 그리고 왼쪽 차일드로 이동한다.
* If the current token is in the list ['+','-','/','*'], set the root value of the current node to the operator represented by the current token.
* 만약 리스트 안에 현재 토큰이 +,-,/,* 라면 현재 노드의 루트 값을 현재 토큰의 연산자로 설정한다.
* Add a new node as the right child of the current node and descend to the right child.
* 새로운 노드를 현재 노드의 오른쪽 자식으로 설정하고, 오른쪽 자식으로 이동한다.
* If the current token is a number, set the root value of the current node to the number and return to the parent.
* 만약 현재 토큰이 숫자라면, 현재 노드의 루트 값을 넘버로 설정하고 부모로 돌아간다.
* If the current token is a ')', go to the parent of the current node.
* 만약 현재 토큰이 ')' 라면 현재 노드의 부모 노드로 넘어간다.

* Before writing the Python code, let’s look at an example of the rules outlined above in action.
* 파이썬 코드를 작성하기 전, 위에 나와있는 룰의 예제를 살펴보자 
* We will use the expression (3+(4∗5)). 
* 우리는 (3+(4∗5))를 사용할 것이다.
* We will parse this expression into the following list of character tokens ['(', '3', '+', '(', '4', '*', '5' ,')',')']. 
* 우리는 이 표현식을 문자의 리스트로 parse 할 것이다.
* Initially we will start out with a parse tree that consists of an empty root node.
* 먼저 우리는 비어있는 루트 노드로 구성된 parse tree에서 시작할 것이다.
* Figure 4 illustrates the structure and contents of the parse tree, as each new token is processed.
* Figure 4는 새로운 토큰이 진행될 때마다의 parse tree의 구조와 컨텐츠를 그린다 

* Using Figure 4, let’s walk through the example step by step:
* Figure 4를 이용해, 예제를 한단계씩 거쳐나가보자.

* A. Create an empty tree.
* A. 먼저 비어있는 트리를 만든다.

* B . Read ( as the first token. By rule 1, create a new node as the left child of the root. Make the current node this new child.
* B. 읽기(첫번째 토큰으로, 규칙 1에 따라 루트의 왼쪽 하위 노드로 새 노드를 만든다.)

* C. Read 3 as the next token. By rule 3, set the root value of the current node to 3 and go back up the tree to the parent.
* C. 3을 다음 토큰으로 읽는다. 규칙 3에 따라 현재 노드의 루트 값은 3 으로 정한다음, 트리의 부모로 돌아간다.

* D. Read + as the next token. By rule 2, set the root value of the current node to + and add a new node as the right child.
* D. +을 다음 토큰으로 읽는다. rule2로 인해, 현재 노드의 루트 값을 +로 설정하고 오른쪽 차일드에 새로운 노드를 추가한다.
* The new right child becomes the current node.
* 새로운 오른쪽 자식이 현재 노드가 된다.

* E. Read a ( as the next token. By rule 1, create a new node as the left child of the current node. The new left child becomes the current node.
* E. '(' 를 다음 토큰으로 읽는다. Rule 1에 의해서 새로운 노드를 현재 노드의 왼쪽 자식에 넣는다. 새로운 왼쪽 차일드가 새로운 현재 노드가 된다. 

* F. Read a 4 as the next token. By rule 3, set the value of the current node to 4. Make the parent of 4 the current node.
* F. 4를 다음 토큰으로 읽는다, 룰 3에 의해서 현재 노드의 값을 4로 정한다. 현재 노드의 부모 노드로 이동한다.

* G.Read * as the next token. By rule 2, set the root value of the current node to * and create a new right child. The new right child becomes the current node.
* G. *를 다음 토큰으로 읽는다. 룰 2에 의해서, 현재 노드의 루트 값을 *로 지정하고 새로운 오른쪽 차일드를 생성한다. 새로운 오른쪽 차일드는 현재 값으로 변한다.

* H. Read 5 as the next token. By rule 3, set the root value of the current node to 5. Make the parent of 5 the current node.
* H. 5를 다음 토큰으로 읽는다. 룰 3에 의해서 현재 노드의 루트 값을 5로 만든다. 5의 부모 노드를 현재 노드로 만든다.

* I. Read ) as the next token. By rule 4 we make the parent of * the current node.
* I. )를 다음 토큰으로 읽고, 룰 4에 의해서 * 의 부모를 현재 노드로 정한다.

* J. Read ) as the next token. By rule 4 we make the parent of + the current node. At this point there is no parent for + so we are done.
* J. 다음 토큰의 )를 읽는다. 룰 4에 의해서 현재 + 노드의 부모 를 현재 노드로 정한다. 이 지점에서 +의 부모는 없기떄문에, 우리는 다 한것이다.

* From the example above, it is clear that we need to keep track of the current node as well as the parent of the current node. 
* 위의 예제에서, 우리는 현재 노드나 현재 노드의 부모를 기록할 필요가 없다는것을 알게될 것이다.
* The tree interface provides us with a way to get children of a node, through the getLeftChild and getRightChild methods, but how can we keep track of the parent? 
* 트리 인터페이스는 우리에게 노드의 자식들로 가는 방법을 제공해 주지만, getLeftChild와 getRightChild 메서드를 통해 어떻게 부모의 이력을 저장해 둘것인가?
* A simple solution to keeping track of parents as we traverse the tree is to use a stack. 
* 부모를 계속 기록하는 간단한 방법은 스택을 사용해 use를 사용한 트리를 순회하는 것이다.
* Whenever we want to descend to a child of the current node, we first push the current node on the stack. 
* 현재 노드에서 차일드로 가고싶다면 우리는 스택의 현재 노드에서 push를 할 것이다.
* When we want to return to the parent of the current node, we pop the parent off the stack.
* 만약 우리가 현재 노드의 부모로 돌아가고 싶다면, 스택의 맨 위에서 pop을 할 것이다.

* Using the rules described above, along with the Stack and BinaryTree operations, we are now ready to write a Python function to create a parse tree. 
* 위의 설명된 룰 처럼 스택, 이진트리 연산을 통해 이제 우리는 parse tree를 만드는 파이선 펑션을 작성 할 수 있다.
* The code for our parse tree builder is presented in ActiveCode 1.
* parse tree bulder의 코드는 아래 코드로 나와있다.

In [1]:
from pythonds.basic import Stack
from pythonds.trees import BinaryTree

def buildParseTree(fpexp):
    fplist = fpexp.split()
    pStack = Stack()
    eTree = BinaryTree('')
    pStack.push(eTree)
    currentTree = eTree

    for i in fplist:
        if i == '(':
            currentTree.insertLeft('')
            pStack.push(currentTree)
            currentTree = currentTree.getLeftChild()

        elif i in ['+', '-', '*', '/']:
            currentTree.setRootVal(i)
            currentTree.insertRight('')
            pStack.push(currentTree)
            currentTree = currentTree.getRightChild()

        elif i == ')':
            currentTree = pStack.pop()

        elif i not in ['+', '-', '*', '/', ')']:
            try:
                currentTree.setRootVal(int(i))
                parent = pStack.pop()
                currentTree = parent

            except ValueError:
                raise ValueError("token '{}' is not a valid integer".format(i))

    return eTree

pt = buildParseTree("( ( 10 + 5 ) * 3 )")
pt.postorder()  #defined and explained in the next section

10
5
+
3
*


* The four rules for building a parse tree are coded as the first four clauses of the if statement on lines 12, 17, 23, and 26 of ActiveCode 1.
* parse tree를 만드는 네가지 룰은 첫 네번째 조건으로 코딩 되어있다. (12,17,23,26 라인)
* In each case you can see that the code implements the rule, as described above, with a few calls to the BinaryTree or Stack methods.
* 각각의 케이스 마다 당신은 코드 구현체를 볼것이다. 위에 설명되어있듯이 BinaryTree와 Stack 메서드 들을 약간 호출한다.
* The only error checking we do in this function is in the else clause where a ValueError exception will be raised if we get a token from the list that we do not recognize.
* 우리가 이 펑션에서 확인하는 유일한 에러는 else 절의 valueError 이고, 이것은 우리가 리스트 안의 토큰을 전달 받으면 이 에러는 알수 없을 것이다 

* Now that we have built a parse tree, what can we do with it? As a first example, we will write a function to evaluate the parse tree, returning the numerical result.
* 이제 우리는 parse tree를 완성했다, 이것을 가지고 어떤것을 할수 있을까? 첫번쨰 예제로, 우리는 parse tree를 계산하는 펑션을 작성하고, 숫자 결과 값을 반환하게 할 것이다.
* To write this function, we will make use of the hierarchical nature of the tree.
* 이 펑션을 작성하기 위해 우리는 트리의 계층적 구조를 활용할 것이다.
* Look back at Figure 2. 
* Figure 2를 살펴보라
* Recall that we can replace the original tree with the simplified tree shown in Figure 3. 
* 우리는 원본 트리를 대체하여 아래 figure 3에 있는 단순화된 트리로 바꿀 수 있다.
* This suggests that we can write an algorithm that evaluates a parse tree by recursively evaluating each subtree.
* 이것은 재귀적으로 각각의 서브 트리를 계산하여 우리가 모든 parse tree를 계산하는 알고리즘으로 바뀔 수있다.

* As we have done with past recursive algorithms, we will begin the design for the recursive evaluation function by identifying the base case. 
* 과거의 재귀적 알고리즘에서 했던 것처럼 우리는 base case를 정하기 위해  재귀적 평가를 하게 될 것이다.
* A natural base case for recursive algorithms that operate on trees is to check for a leaf node. 
* 기본적인 재귀적 알고리즘의 base case는 리프 노드인지 체크하는 것이다.
* In a parse tree, the leaf nodes will always be operands. 
* parse tree에서 leaf node는 항상 연산자 입니다.
* Since numerical objects like integers and floating points require no further interpretation, the evaluate function can simply return the value stored in the leaf node. 
* integer나 floating과 같은 숫자 오브젝트 추가적인 해석이 필요하지 않다, 따라서 평가하는 펑션은 단순히 leaf node에 저장된 값을 리턴할 것이다.
* The recursive step that moves the function toward the base case is to call evaluate on both the left and the right children of the current node.
* base case를 향해 움직이는 재귀적 단계는 앙쪽 왼쪽, 오른쪽과 현재 노드를 계산하는 것이다.
* The recursive call effectively moves us down the tree, toward a leaf node.
* 이 재귀 호출이 효과적으로 리프 노드를 향해 움직인다.

* To put the results of the two recursive calls together, we can simply apply the operator stored in the parent node to the results returned from evaluating both children. 
* 두가지 재귀적 호출을 같이 놓으면서, 우리는 단순하게 부모 노드에 있는 피연산자를 적용 할 수 있고, 
* In the example from Figure 3 we see that the two children of the root evaluate to themselves, namely 10 and 3. 
* Figure 3의 예제에서 볼수 있듯이, 우리는 루트의 두개의 자식들이 필요하다 스스로 계산해 10과 3으로 이름 붙여졌다. 
* Applying the multiplication operator gives us a final result of 30.
* 곱셈연산자를 적용해 최종 결과값이 30이 된다.

* The code for a recursive evaluate function is shown in Listing 1.
* 재귀적 계산 펑션은 아래 Listing 1에 나타나 있다.
* First, we obtain references to the left and the right children of the current node.
* 먼저 우리는 현재 노드에서 왼쪽과 오른쪽의 노드 레퍼런스를 갖는다. 
* If both the left and right children evaluate to None, then we know that the current node is really a leaf node. 
* 만약 양쪽 자식들이 None 이라면, 우리는 이 노드가 자식 노드라는 것을 알 수있다.
* This check is on line 7. 
* 이 체크는 7 라인에 나타나 있다.
* If the current node is not a leaf node, look up the operator in the current node and apply it to the results from recursively evaluating the left and right children.
* 만약 현재 노드가 리프 노드가 아니라면, 현재 노드의 연산자를 살펴보고, 재귀적으로 왼쪽과 오른쪽 자식들을 계산한다.

* To implement the arithmetic, we use a dictionary with the keys '+', '-', '*', and '/'. 
* 수식을 계산하기 위해 우리는 +,-,*ㅡ,/로 구성 된 dictionary를 사용하겠다.
* The values stored in the dictionary are functions from Python’s operator module.
* 딕셔너리에 저장된 밸류들은 파이썬의 오퍼레이터 모듈을 사용한다.
* The operator module provides us with the functional versions of many commonly used operators. 
* 오퍼레이터 모듈은 많이 일반적으로 사용되는 연산자들의 기능을 제공한다.
* When we look up an operator in the dictionary, the corresponding function object is retrieved. 
* 우리가 딕셔너리의 연산자를 찾아볼때, 일치하는 펑션 오브젝트가 반환된다.
* Since the retrieved object is a function, we can call it in the usual way function(param1,param2). 
* 만약 반환한 오브젝트가 펑션이라면, 우리는 이것을 일반적인 방법처럼 호출해 사용한다.
* So the lookup opers['+'](2,2) is equivalent to operator.add(2,2).
* 따라서 opers['+'](2,2)는 operator.add(2,) 이다.

In [2]:
# Listing 1

def evaluate(parseTree):
    opers = {'+':operator.add, '-':operator.sub, '*':operator.mul, '/':operator.truediv}

    leftC = parseTree.getLeftChild()
    rightC = parseTree.getRightChild()

    if leftC and rightC:
        fn = opers[parseTree.getRootVal()]
        return fn(evaluate(leftC),evaluate(rightC))
    else:
        return parseTree.getRootVal()

* Finally, we will trace the evaluate function on the parse tree we created in Figure 4. 
* 마지막으로 우리는 Figure 4에서 만든 parse tree를 평가하는 펑션을 만들어 볼 것이다.
* When we first call evaluate, we pass the root of the entire tree as the parameter parseTree. 
* 우리가 첫 호출을 할때, 우리는 전체 트리 파라미터인 parseTree를 전달한다.
* Then we obtain references to the left and right children to make sure they exist.
* 그리고 우리는 left와 right 자식에 대한 레퍼런스를 얻고 그것이 존재하는지 확인할 것이다.
* The recursive call takes place on line 9. 
* 재귀적인 호출은 9라인에서 일어난다.
* We begin by looking up the operator in the root of the tree, which is '+'. The '+' operator maps to the operator.
* 우리는 트리의 루트에서 연산자를 찾는데서 시작한다, '+' 라면 + 연산자는 오퍼레이터 맵에 연산자와 연결된다.

* add function call, which takes two parameters. 
* add 펑션 호출은 두개의 파라미터를 필요로 한다.
* As usual for a Python function call, the first thing Python does is to evaluate the parameters that are passed to the function. 
* 일반적인 파이선 펑션 호출, 파이썬에서 가장 먼저 하는 것은 펑션에 전달되는 파라미터를 계산하는 것이다.
* In this case both parameters are recursive function calls to our evaluate function. 
* 이 경우에서 두개의 파라미터들 모두 우리가 계산하는 재귀 펑션을 호출한다.
* Using left-to-right evaluation, the first recursive call goes to the left.
* 왼쪽에서 오른쪽순 계산을 이용해 첫번째 재귀 호출은 왼쪽으로 이동한다.
* In the first recursive call the evaluate function is given the left subtree. 
* 첫번쨰 재귀 호출은 왼쪽 서브트리의 계산 펑션을 제공한다
* We find that the node has no left or right children, so we are in a leaf node. 
* 만약 노드에 왼쪽이나 오른쪽 자식이 없다면, 우리는 리프 노드에 있는 것이다.
* When we are in a leaf node we just return the value stored in the leaf node as the result of the evaluation. In this case we return the integer 3.
* 만약 리프 노드에 있다면, 우리는 리프 노드에 저장되어 있는 값을 반환하고 이경우 우리는 정수 3을 반환한다.

* At this point we have one parameter evaluated for our top-level call to operator.add. But we are not done yet. 
* 이 시점에서 우리는 한가지 파라미터와 최상위 레벨의 호출인 operator.add를 가지고 있다.
* Continuing the left-to-right evaluation of the parameters, we now make a recursive call to evaluate the right child of the root. 
* 왼쪽에서 오른쪽으로 계속되는 파라미터 계산을 하기 위해 이제 우리는 재귀 호출을 만들어 루트의 오른쪽 자식을 계산한다.
* We find that the node has both a left and a right child so we look up the operator stored in this node, '*', and call this function using the left and right children as the parameters. 
* 우리가 왼쪽, 오른쪽 차일드가 존재하고 연산자를 찾을 수 있었다면 왼쪽 오른쪽 자식들을 파라미터로 사용한 펑션을 호출 할 것이다.
* At this point you can see that both recursive calls will be to leaf nodes, which will evaluate to the integers four and five respectively. 
* 여기서 우리는 두가지의 재귀적 연산이 리프 노드가 될것이고, 이것은 4와 5 정수형을 계산하게 될것이다.
* With the two parameters evaluated, we return the result of operator.mul(4,5). 
* 두개의 파라미터들이 평가되고, 우리는 이제 operator.mul(4,5)의 결과 값을 갖게된다.
* At this point we have evaluated the operands for the top level '+' operator and all that is left to do is finish the call to operator.add(3,20).
* 여기서  우리는 최 상위 연산자인 + 에서 계산하고, 유일하게 남은 것은 operator.add(3,20)을 계산하는 것이다. 
* The result of the evaluation of the entire expression tree for (3+(4∗5)) is 23.
* (3+(4∗5))을 계산하면 23이된다.