(sec:stacks)=
# 스택(Stack)

**참고** 

아래 내용은 [Problem Solving with Algorithms and Data Structures using Python](https://runestone.academy/ns/books/published/pythonds3/index.html)의 3장 내용을 
일부 활용한다. 

**슬라이드**

본문 내용을 요약한 [슬라이드](https://github.com/codingalzi/algopy/raw/master/slides/slides-stacks.pdf)를 다운로드할 수 있다.

**주요 내용**

- 스택 자료구조
- 스택 활용

## 스택의 정의

**스택**<font size='2'>stack</font>은 항목의 추가 및 삭제를 보통 **탑**<font size='2'>top</font>이라 불리는 한 쪽 끝에서만 허용한다.
반면에 다른 한 쪽 끝은 **베이스**<font size='2'>base</font>라 한다. 

- 탑: 가장 나중에 추가된 항목의 위치
- 베이스: 남아 있는 항목 중에서 가장 먼저 추가된 항목의 위치

가장 나중에 추가된 항목이 가장 먼저 삭제되는 후입선출<font size='2'>last-in first-out</font>(LIFO) 원리르 따른다.

<p><div align="center"><img src="https://raw.githubusercontent.com/codingalzi/algopy/master/jupyter-book/imgs/lifo.png" width="40%"></div></p>

## 스택 자료구조 구현

스택 자료구조는 큐 자료구조와는 달리 항목의 추가와 삭제를 한쪽에서만 처리한다.
하지만 그 이외에는 동일한 기능을 지원한다.
따라서 스택 자료구조를 큐와 동일하게 큐 추상 클래스를 상속하는 방식으로 정의할 수 있다.
실제로 파이썬이 제공하는 

{numref}`<>`

스택 자료구조를 `Stack` 클래스로 구현하기 위해 
리스트를 항목들의 저장 장치로 활용한다.
앞서 소개한 기능들은 모두 메서드로 정의한다.
스택의 탑 역할은 리스트의 오른쪽 끝(마지막 항목)이 수행하도록 한다. 
이유는 알고리즘의 시간복잡도 성능이 좋은 리스트의 `get()`와 `append()`를 활용하기 위해서이다.

In [1]:
class Stack:
    """리스트를 활용한 스택 구현"""

    def __init__(self, maxsize=0):
        """새로운 스택 생성"""
        self.maxsize = maxsize
        self._items = []

    def __repr__(self):
        """스택 표기법: <[1, 2, 3]> 등등"""
        return f"<{self._items}>"
        
    def empty(self):
        """비었는지 여부 확인"""
        return not bool(self._items)

    def full(self):
        """maxsize 충족 여부 확인"""
        if self.maxsize <= 0:
            return False
        elif self.qsize() == self.maxsize:
            return True
        else:
            return False

    def put(self, item):
        """새 항목 추가"""
        if self.full() == True:
            self.get()
            
        self._items.append(item)

    def get(self):
        """항목 제거"""
        return self._items.pop()

    def peek(self):
        """비어 있지 않은 경우 탑 항목 반환"""
        if not self.empty():
            return self._items[-1]
        else:
            print("스택이 비어 있어요!")

    def qsize(self):
        """항목 개수 반환"""
        return len(self._items)

앞서 살펴본 그림을 코드로 구현하면 다음과 같다.

In [2]:
s = Stack(maxsize=4)

print(s.empty())
s.put(4)
s.put("dog")
print(s.peek())
s.put(True)
print(s)
print(s.qsize())
print(s.empty())
s.put(8.4)
print(s)
print(s.full())
print(s.get())
print(s.get())
print(s)
print(s.qsize())

True
dog
<[4, 'dog', True]>
3
False
<[4, 'dog', True, 8.4]>
True
8.4
True
<[4, 'dog']>
2


**예제**

스택 연산을 아래와 같이 실행한 결과 탑에 위치한 항목을 확인해보자.

In [3]:
m = Stack()
m.put("x")
m.put("y")
m.get()
m.put("z")

In [4]:
m.peek()

'z'

**예제** 

스택에 항목이 없으면 탑 항목은 존재하지 않는다.

In [5]:
m = Stack()
m.put("x")
m.put("y")
m.put("z")

while not m.empty():
    m.get()

m.peek()

스택이 비어 있어요!


### 구현 방식에 따른 속도 차이

스택의 탑을 리스트의 첫째 항목으로 정하면 
항목을 추가할 때 `insert(0, item)`을,
항목을 삭제할 때 `pop(0)`를 사용할 수 있다.
`peek()` 함수도 적절한 수정이 필요하다.

In [6]:
class Stack_left:
    def __init__(self, maxsize=0):
        self.maxsize = maxsize
        self._items = []

    def __repr__(self):
        return f"<{self._items}>"
        
    def empty(self):
        return not bool(self._items)

    def full(self):
        if self.maxsize <= 0:
            return False
        elif self.qsize() == self.maxsize:
            return True
        else:
            return False

    def put(self, item):
        if self.full() == True:
            self.get()
            
        self._items.insert(0, item)

    def get(self):
        return self._items.pop(0)

    def peek(self):
        if not self.empty():
            return self._items[0]
        else:
            print("스택이 비어 있어요!")

    def qsize(self):
        return len(self._items)

기능면에서는 `Stack` 클래스와 완전히 동일하다.

In [7]:
s = Stack_left(maxsize=4)

print(s.empty())
s.put(4)
s.put("dog")
print(s.peek())
s.put(True)
print(s)
print(s.qsize())
print(s.empty())
s.put(8.4)
print(s)
print(s.full())
print(s.get())
print(s.get())
print(s)
print(s.qsize())

True
dog
<[True, 'dog', 4]>
3
False
<[8.4, True, 'dog', 4]>
True
8.4
True
<['dog', 4]>
2


**성능 비교**

항목을 추가하거나 삭제할 때 두 클래스의 성능에서 차이가 많이 난다.
아래 코드는 큐를 생성하여 1만개, 2만개, ..., 10만개의 항목을 추가하고 삭제하는 데에 필요한 시간을 측정한다.
먼저 `Stack` 클래스를 이용하면 다음과 같다.

In [8]:
counts = range(10000, 100001, 10000)

- `Stack` 클래스 활용: 항목 추가에 걸리는 시간

In [9]:
import time

for num in counts:
    s1 = Stack()
    
    start = time.time()

    for item in range(num):
        s1.put(item)

    end = time.time()

    print(f"{num}개 항목 추가에 걸리는 시간: {end - start}")

10000개 항목 추가에 걸리는 시간: 0.0
20000개 항목 추가에 걸리는 시간: 0.014008760452270508
30000개 항목 추가에 걸리는 시간: 0.0024111270904541016
40000개 항목 추가에 걸리는 시간: 0.016611576080322266
50000개 항목 추가에 걸리는 시간: 0.01901412010192871
60000개 항목 추가에 걸리는 시간: 0.021910667419433594
70000개 항목 추가에 걸리는 시간: 0.021999597549438477
80000개 항목 추가에 걸리는 시간: 0.02644515037536621
90000개 항목 추가에 걸리는 시간: 0.029467344284057617
100000개 항목 추가에 걸리는 시간: 0.03254961967468262


- `Stack` 클래스 활용: 항목 삭제에 걸리는 시간

In [10]:
import time

for num in counts:
    s1 = Stack()
    
    for item in range(num):
        s1.put(item)

    start = time.time()

    while not s1.empty():
        s1.get()

    end = time.time()

    print(f"{num}개 항목 삭제에 걸리는 시간: {end - start}")

10000개 항목 삭제에 걸리는 시간: 0.0
20000개 항목 삭제에 걸리는 시간: 0.014857053756713867
30000개 항목 삭제에 걸리는 시간: 0.01718759536743164
40000개 항목 삭제에 걸리는 시간: 0.009571552276611328
50000개 항목 삭제에 걸리는 시간: 0.008299112319946289
60000개 항목 삭제에 걸리는 시간: 0.015617132186889648
70000개 항목 삭제에 걸리는 시간: 0.03380608558654785
80000개 항목 삭제에 걸리는 시간: 0.020462751388549805
90000개 항목 삭제에 걸리는 시간: 0.015868186950683594
100000개 항목 삭제에 걸리는 시간: 0.03440666198730469


다음은 `Stack_left` 클래스를 이용한다. 
항목의 추가와 삭제 모두 훨씬 오래 걸린다.

- `Stack_left` 클래스 활용: 항목 추가에 걸리는 시간

In [11]:
import time

for num in counts:
    s1 = Stack_left()
    
    start = time.time()

    for item in range(num):
        s1.put(item)

    end = time.time()

    print(f"{num}개 항목 추가에 걸리는 시간: {end - start}")

10000개 항목 추가에 걸리는 시간: 0.028695106506347656
20000개 항목 추가에 걸리는 시간: 0.0892174243927002
30000개 항목 추가에 걸리는 시간: 0.20418453216552734
40000개 항목 추가에 걸리는 시간: 0.36127710342407227
50000개 항목 추가에 걸리는 시간: 0.5858893394470215
60000개 항목 추가에 걸리는 시간: 0.8843841552734375
70000개 항목 추가에 걸리는 시간: 1.1947391033172607
80000개 항목 추가에 걸리는 시간: 1.593348503112793
90000개 항목 추가에 걸리는 시간: 2.033482074737549
100000개 항목 추가에 걸리는 시간: 2.529245376586914


- `Stack_left` 클래스 활용: 항목 삭제에 걸리는 시간

In [12]:
import time

for num in counts:
    s1 = Stack_left()
    
    for item in range(num):
        s1.put(item)

    start = time.time()

    while not s1.empty():
        s1.get()

    end = time.time()

    print(f"{num}개 항목 삭제에 걸리는 시간: {end - start}")

10000개 항목 삭제에 걸리는 시간: 0.013001680374145508
20000개 항목 삭제에 걸리는 시간: 0.046868324279785156
30000개 항목 삭제에 걸리는 시간: 0.09375524520874023
40000개 항목 삭제에 걸리는 시간: 0.1643836498260498
50000개 항목 삭제에 걸리는 시간: 0.2968733310699463
60000개 항목 삭제에 걸리는 시간: 0.45313072204589844
70000개 항목 삭제에 걸리는 시간: 0.6424126625061035
80000개 항목 삭제에 걸리는 시간: 0.867316722869873
90000개 항목 삭제에 걸리는 시간: 1.1253547668457031
100000개 항목 삭제에 걸리는 시간: 1.3810582160949707


`Stack`을 이용하는 경우보다 많이 오래 걸리는 
이유는 리스트의 0번 인덱스를 탑으로 사용하면 항목을 추가하거나 삭제할 때마다 
나머지 항목들의 위치를 이동시키기 위해 보다 많은 시간이 요구되기 때문이다.

### `queue` 모듈의 `LifoQueue` 클래스

`queue` 모듈의 `LifoQueue` 클래스가 스택 자료구조를 가리킨다.
앞서 정의한 `Stack` 클래스보다 10배 정도 느리다.

- `LifoQueue` 클래스 활용: 항목 추가에 걸리는 시간

In [13]:
import time
from queue import LifoQueue

for num in counts:
    s1 = LifoQueue()
    
    start = time.time()

    for item in range(num):
        s1.put(item)

    end = time.time()

    print(f"{num}개 항목 추가에 걸리는 시간: {end - start}")

10000개 항목 추가에 걸리는 시간: 0.01300048828125
20000개 항목 추가에 걸리는 시간: 0.028430700302124023
30000개 항목 추가에 걸리는 시간: 0.041871070861816406
40000개 항목 추가에 걸리는 시간: 0.04974865913391113
50000개 항목 추가에 걸리는 시간: 0.07894349098205566
60000개 항목 추가에 걸리는 시간: 0.08714795112609863
70000개 항목 추가에 걸리는 시간: 0.09936118125915527
80000개 항목 추가에 걸리는 시간: 0.10067033767700195
90000개 항목 추가에 걸리는 시간: 0.1336076259613037
100000개 항목 추가에 걸리는 시간: 0.1500248908996582


- `LifoQueue` 클래스 활용: 항목 삭제에 걸리는 시간

In [14]:
import time

for num in counts:
    s1 = LifoQueue()
    
    for item in range(num):
        s1.put(item)

    start = time.time()

    while not s1.empty():
        s1.get()

    end = time.time()

    print(f"{num}개 항목 삭제에 걸리는 시간: {end - start}")

10000개 항목 삭제에 걸리는 시간: 0.016625165939331055
20000개 항목 삭제에 걸리는 시간: 0.033080101013183594
30000개 항목 삭제에 걸리는 시간: 0.06613373756408691
40000개 항목 삭제에 걸리는 시간: 0.08338737487792969
50000개 항목 삭제에 걸리는 시간: 0.10477256774902344
60000개 항목 삭제에 걸리는 시간: 0.11662173271179199
70000개 항목 삭제에 걸리는 시간: 0.1330564022064209
80000개 항목 삭제에 걸리는 시간: 0.16695117950439453
90000개 항목 삭제에 걸리는 시간: 0.18349242210388184
100000개 항목 삭제에 걸리는 시간: 0.19993185997009277


## 스택 실전 활용

### 괄호 짝맞추기 문제

아래 식에서처럼 함수나 또는 연산 실행을 위해 사용되는 괄호는 짝이 맞아야 한다.
즉, 여는 괄호 하나와 닫는 괄호 하나가 짝이 맞아야 한다. 

$$(5 + 6) * (7 + 8) / (4 + 3)$$

위 표현식에서 괄호만 고려하면 다음 모양이 되어 모든 괄호의 짝이 잘 맞음을 쉽게 확인할 수 있다.

    ()()()

그런데 괄호가 중첩되어 사용되면 보다 복잡해진다. 

    (()()()())

    (((())))

    (()((())()))

예를 들어, 아래 예제는 짝이 맞지 않는 괄호가 존재한다.

    ((((((())

    ()))

    (()()(()

표현식과 코드에 사용된 모든 괄호들의 짝이 맞는가를 확인하는 일은 매우 중요하다. 
파이썬의 경우 괄호가 맞지 않으면 실행 전에 바로 구문 오류(`SyntaxError`)를 발생시킨다.

```python
>>> (5 + 6) * (7 + 8) / (4 + 3
  Input In [7]
    (5 + 6) * (7 + 8) / (4 + 3
                              ^
SyntaxError: unexpected EOF while parsing
```

아래 코드는 스택을 이용하여 괄호로 이루어진 문자열이 짝이 맞는 괄호들로 이루어졌는지 여부를 판단하는
함수를 구현한다. 
스택 활용법은 다음과 같다.
괄호로 이루어진 문자열이 주어졌을 때 왼편부터 시작해서 여는 괄호와 닫는 괄호를 
만날 때마다 아래 작업을 반복한다. 

- 여는 괄호: 스택에 추가
- 닫는 괄호: 스택의 탑 항목 삭제

위 작업을 반복하다 보면 아래 세 가지 경우가 발생한다.

- 문자열을 다 확인하기 전에 스택이 비워지는 경우: 닫는 괄호가 너무 많음
- 끝까지 확인했을 때 스택이 비워지지 않은 경우: 여는 괄호가 너무 많음
- 그렇지 않으면 모든 괄호의 짝이 맞음.

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/simpleparcheck.png" width="50%"></div>
</figure>

In [15]:
def par_checker(symbol_string):

    s = Stack()
    
    for symbol in symbol_string:
        if symbol == "(":
            s.put(symbol)
        elif s.empty():
            return False
        else:
            s.get()

    return s.empty()

In [16]:
print(par_checker("((()))"))
print(par_checker("((()()))"))
print(par_checker("(()"))
print(par_checker(")("))

True
True
False
False


### 괄호 짝맞추기 문제(일반화)

소, 중, 대 세 종류의 괄호를 대상으로 짝맞추기 문제를 해결하는 알고리즘을 구현한다. 

- `(`, `)`: 튜플, 표현식 등
- `{`, `}`: 사전, 집합 등
- `[`, `]`: 리스트 등

아래 예제는 모두 괄호들의 짝이 맞는다.

    { { ( [ ] [ ] ) } ( ) }

    [ [ { { ( ( ) ) } } ] ]

    [ ] [ ] [ ] ( ) { }

반면 아래의 경우는 서로 다른 종류의 짝이 사용되고 있다.

    ( [ ) )

    ( ( ( ) ] ) )

    [ { ( ) ]

이전 코드를 조금 수정하면 일반화된 짝맞추기 문제를 해결할 수 있다. 
다만, 닫는 괄호를 처리할 때 동일한 종류인지 여부를 먼저 확인해야 한다.

In [17]:
def balance_checker(symbol_string):
    s = Stack()
    for symbol in symbol_string:
        if symbol in "([{":
            s.put(symbol)
        elif s.empty():
            return False
        elif not matches(s.get(), symbol):
            return False

    return s.empty()

def matches(sym_left, sym_right):
    all_lefts = "([{"
    all_rights = ")]}"
    return all_lefts.index(sym_left) == all_rights.index(sym_right)

In [18]:
print(balance_checker('{({([][])}())}'))
print(balance_checker('[{()]'))

True
False


## 중위/전위/후위 표기법

이항 연산자를 이용한 표현식을 작성하는 세 종류의 표기법을 살펴본다.
또한 표기법 변환 알고리즘과 변환된 표현식의 값을 계산하는 알고리즘을 스택 자료구조를 이용하여 구현한다.

### 중위 표기법

아래 두 수식에 사용되는 덧셈 연산자(`+`)와 
곱셈 연산자(`*`)는 더해지거나 곱해지는 두 
피연산자<font size='2'>operand</font>, 즉 두 인자의 사이에 위치한다.

```python
x + y
2 + 3 * 6
```

이렇게 이항 연산자를 
두 피연산자 사이에 위치시켜 표현식을 작성하는 방법을
**중위 표기법**<font size='2'>infix notation</font>이라 한다.
중위 표기법으로 작성된 표현식은 간단하게 **중위 표현식**이라 부른다.

중위 표현식을 해석할 때 연산자들의 **우선순위**를 잘 고려해야 한다.
예를 들어 `2 + 3 * 6`는 `2 + (3 * 6)`로 해석되어 최종적으로 20으로 계산된다.
이유는 덧셈 보다 곱셈의 우선순위가 높기 때문이다.
반면에 `(2 + 3) * 6` 처럼 연산자의 우선순위와 다르게 연산을 강요하려면
괄호를 사용한다. 그러면 괄호에 의해 `5 * 6`, 즉 30으로 계산된다. 

또한 `4 - x + 7`와 `2 / x * y` 처럼 우선순위가 동일한 연산자가 연속적으로 사용되었을 경우엔
왼쪽에 위치한 연산자부터 계산한다. 
즉, `4 - x + 7`는 `(4 - x) + 7`로, `2 / x * y`는 `(2 / x) * y` 로 계산된다.
`4 - (x + 7)` 또는 `2 / (x * y)` 는 다른 값으로 계산됨에 주의한다.

### 전위/후위 표기법

이처럼 중위 표기법을 사용하는 표현식은 의도된 계산을 명확히 하기 위해 괄호를 사용해야 한다.
반면에 **전위 표기법**<font size='2'>prefix notation</font> 
또는 **후위 표기법**<font size='2'>postfix notation</font>은 괄호를 필요로 하지 않으면서
하나의 표현식이 하나의 값만 가리키도록 해준다.

- 전위 표기법
    - 모든 연산자가 모든 피연산자(연산자의 인자)의 왼쪽에 위치
    - 피연산자는 연산자 오른쪽에 차례대로 위치
- 후위 표기법
    - 모든 연산자가 모든 피연산자(연산자의 인자)의 오른쪽에 위치
    - 피연산자는 연산자 왼쪽에 차례대로 위치

예를 들어 `x + y`를 전위 표기법과 후위 표기법으로 표현하면 다음과 같다.

| 중위 표기법 | 전위 표기법 | 후위 표기법 |
| :---: | :---: | :---: |
| `x + y` | `+ x y` | `x y +` |

`x + y * z`의 전위와 후위 표현식은 다음과 같다.

| 중위 표기법 | 전위 표기법 | 후위 표기법 |
| :---: | :---: | :---: |
| `x + y * z` | `+ x * y z` | `x y z * +` |

각 표기법으로 변환 과정은 다음과 같다. 
괄호로 감싸인 표현식은 아직 중위 표기법을 사용한다는 점에 주의한다.

- 전위 표기법으로의 변환

```
x + y * z => (x + (y * z)) => + x (y * z) => x * y z
```

- 후위 표기법으로의 변환

```
x + y * z => (x + (y * z)) => x (y * z) + => x y z * +
```

아래 표는 `(x + y) * z`의 전위와 후위 표현식을 보여준다.

| 중위 표기법 | 전위 표기법 | 후위 표기법 |
| :---: | :---: | :---: |
| `(x + y) * z` | `* + x y z` | `x y + z *` |

각 표기법으로 변환 과정은 다음과 같다. 
괄호로 감싸인 표현식은 아직 중위 표기법을 사용한다는 점에 주의한다.

- 전위 표기법으로의 변환

```
(x + y) * z => ((x + y) * z) => * (x + y) z => * + x y z
```

- 후위 표기법으로의 변환

```
(x + y) * z => ((x + y) * z) => (x + y) z * => x y + z *
```

이처럼 전위 또는 후위 표기법을 사용하면 괄호가 없어도 모든 표현식이 하나의 값만 가리킨다.

**예제**

아래 표에 포함된 보다 복잡한 중위 표현식을 전위와 후위 표현식으로 변환화는 과정을 묘사하면서
전위와 후위 표기법에 친숙해지도록 하기를 권장한다.

| 중위 표기법 | 전위 표기법 | 후위 표기법 |
| :---: | :---: | :---: |
| `x + y * z + v` | `+ + x * y z v` | `x y z * + v +` |
| `(x + y) * (z + v)` | `* + x y + z v` | `x y + z v + *` |
| `x * y + z * v` | `+ * x y * z v` | `x y * z v * +` |
| `x + y + z + v` | `+ + + x y z v` | `x y + z + v +` |

## 표기법 변환

### 괄호를 사용한 중위 표기법 변환

`A + B * C` 표현식의 의미는 `(A + (B * C))` 와 동일하다.
그리고 `(A + (B * C))`처럼 사용되는 모든 연산자를 대상으로 괄호가 사용된
표현식을 전위 또는 후위 표기법으로 변환하는 일은 어렵지 않다.
이유는 여는 괄호는 표현식의 시작을 의미하고, 
바로 옆에는 첫째 피연산자가, 그 다음엔 (중위) 연산자가,
그 다음엔 둘째 피연산자가 위치하며,
마지막의 닫는 괄호는 표현식의 끝을 의미하기 때문이다.

결국 `(B * C)` 와 같은 표현식을 `* B C` 또는 `B C *` 로 변환하는 
과정을 반복하기만 하면 아무리 복잡한 표현식이라도 
간단하게 전위 또는 후위 표기법으로 변환할 수 있다.

**예제**

`(A + B) * C - (D - E) * (F + G)` 를 전위/후위 표기법으로 표현하는 과정은 다음과 같다.

<figure>
<div align="center"><img src="https://runestone.academy/ns/books/published/pythonds3/_images/complexmove.png" width="80%"></div>
</figure>

### 표기법 변환 알고리즘

중위 표현식을 후위 표현식으로 변환하는 알고리즘을 구현해보자.

중위 표현식이 앞서 설명한 것처럼 모든 이항 연산에 대해 괄호를 철저하게 사용하였다면 아주 쉽게 변환할 수 있다.
하지만 일반적으로는 반드시 필요하지 않은 괄호는 생략하고 연산자의
우선순위에 따라 계산되도록 한다. 
예를 들어, `A + B * C` 는 `A + (B * C)`과 동일하기에 후위 표기법으로 `A B C * +` 로 변환된다.

중위 표현식을 후위 표현식으로 변환할 때 피연산자의 순서는 그대로 유지되지만
연산자의 순서는 연산자의 우선순위와 괄호에 의한 연산자 실행 순서에 의해 달라진다는
성질을 이용하여 표기법 변환 알고리즘을 작성한다.

- 중위 표현식의 왼쪽에서부터 차례대로 사용된 피연산자와 연산자를 확인한다.
- 피연산자가 확인되면 그대로 후위 표기법 표현식에 추가한다.
- 연산자의 경우엔 별도로 준비된 스택에 추가한다.
    단, 해당 연산자의 우선순위와 괄호의 사용 여부에 따라
    먼저 스택을 조작한 다음에 추가한다.

연산자들을 스택으로 관리하는 이유는 먼저 스택에 추가된 연산자보다 낮은 우선순위의 연산자를
만나는 순간 스택에 포함된 보다 높거나 같은 우선순위의 연산자와 관련된 계산을 먼저 실행해야 하기에
해당 연산자들을 스택에서 제거해서 바로 후위 표기법의 표현식에 추가할 수 있기 때문이다. 
또한 `(A + B) * C`의 경우처럼 괄호가 포함되면 여는 괄호도 스택에 추가한다.
반면에 닫는 괄호를 만나는 순간 스택에 있는 여는 괄호를 만날 때까지 스택을 비우면서
후위 표기법 표현식을 완성해 나간다.

이런 점들을 고려하면서 알고리즘을 묘사하면 다음과 같다.
먼저, 중위 표현식에 사용된 모든 연산자, 피연산, 괄호 등은 모두 공백(space)로
구분된 문자열로 주어진다고 가정한다.

1. 연산자와 여는 괄호를 쌓아 둘 스택 `op_stack`을 준비해 놓는다.
   또한 후위 표현식에 사용될 기호를 차례대로 저장할 빈 리스트 `postfix_list`도 준비한다.

   ```python
   op_stack = Stack()
   postfix_list = []
   ```

1. 문자열로 입력된 중위 표현식을 `split()` 메서드를 이용하여 리스트로 변환한다.

1. 리스트의 항목(토큰, token)의 종류에 따라 아래 과정을 처리한다.
   - 피연산자인 경우: `postfix_list`에 추가한다.
   - 여는 괄호인 경우: `op_stack`에 추가한다.
   - 닫는 괄호인 경우: `op_stack`에서 여는 괄호를 만날 때까지 탑을 빼서 `postfix_list`에 추가한다.
   - 연산자(`*`, `/`, `+`, `-`)인 경우: `op_stack`에 추가한다. 
      단, 먼저 `op_stack`으로부터 우선순위가 높거나 같은 연산자를 모두 탑에서 빼서 `postfix_list`에 추가해야 한다.

1. 입력된 중위 표현식에 사용된 모든 기호를 처리했다면 `op_stack`에 남아있는 모든 연산자를 빼서
   `postfix_list`에 추가한다.

아래 그림은 `A * B + C * D`를 후위 표기법으로 변환하는 과정을 잘 보여준다.

<figure>
<div align="center"><img src="https://runestone.academy/ns/books/published/pythonds3/_images/intopost.png" width="80%"></div>
</figure>

위 알고리즘을 파이썬 코드로 구현하기 위해 `Stack` 클래스를 이용한다.
후위 표현식으로 변환 알고리즘에서 사용될 연산자들의 우선순위는 `precedence` 이라는 사전으로 관리한다.

여는 괄호(`(`)에도 우선순위를 부여한다. 하지만 다른 연산자들에 비해 가장 낮다.
이유는 닫는 괄호가 아닌 다른 연산자에 의해 `op_stack`에서 제거되지 않도록 
하기 위해서이다. 

In [19]:
precedence = {'*': 3, '/': 3, '+': 2, '-': 2, '(': 1}

In [20]:
def infix_to_postfix(infix_expr):
    op_stack = Stack()
    postfix_list = []
    token_list = infix_expr.split()

    for token in token_list:
        if token not in '()*/+-':
            postfix_list.append(token)
        elif token == "(":
            op_stack.put(token)
        elif token == ")":
            top_token = op_stack.get()
            while top_token != "(":
                postfix_list.append(top_token)
                top_token = op_stack.get()
        else:
            while (not op_stack.empty()) and (precedence[op_stack.peek()] >= precedence[token]):
                postfix_list.append(op_stack.get())
            op_stack.put(token)

    while not op_stack.empty():
        postfix_list.append(op_stack.get())

    return " ".join(postfix_list)

**예제**

In [21]:
infix_to_postfix("A * B + C * D")

'A B * C D * +'

In [22]:
infix_to_postfix("( A + B ) * C - ( D - E ) * ( F + G )")

'A B + C * D E - F G + * -'

In [23]:
infix_to_postfix("( A + B ) * ( C + D )")

'A B + C D + *'

In [24]:
infix_to_postfix("( A + B ) * C")

'A B + C *'

In [25]:
infix_to_postfix("A + B * C")

'A B C * +'

## 후위 표기법 표현식 계산

후위 표현식을 실제로 계산하는 알고리즘을 스택을 이용하여 구현한다.
후위 표현식에서는 연산자보다 피연산자, 즉 연산자의 인자들이 먼저 확인되기에 
피연산자들을 스택에 쌓아두고 적절한 연산자가 확인될 때까지 기다리도록 해야 한다.
정리하면 다음과 같다.

후위 표현식을 계산하기 위해 왼쪽에서 오른쪽으로 표현식에 사용된 기호를 확인한다.
확인된 기호의 종류에 따라 다음 과정을 반복 실행한다.

- 수: 스택에 추가한다.
- 연산자: 스택에서 `get()`을 두 번 실행해서 얻어진 피연산자를 이용해서 연산 실행. 이후 결과를 다시 스택에 쌓는다.

표현식의 모든 기호를 확인하면 스택에 하나의 값만 남게 되고 해당 값이 바로 주어진 표현식이 나타내는 값이 된다.

**예제**

후위 표현식 `4 5 6 * +`을 설명된 알고리즘에 따라 계산하는 과정은 아래 그림과 같다.

<figure>
<div align="center"><img src="https://runestone.academy/ns/books/published/pythonds3/_images/evalpostfix1.png" width="55%"></div>
</figure>

**예제**

후위 표현식 `7 8 + 3 2 + /`을 설명된 알고리즘에 따라 계산하는 과정은 아래 그림과 같다.

<figure>
<div align="center"><img src="https://runestone.academy/ns/books/published/pythonds3/_images/evalpostfix2.png" width="60%"></div>
</figure>

**주의사항**

나눗셈과 뺄셈처럼 교환법칙이 성립하지 않은 이항 연산자처럼 첫째, 둘째 인자의 위치가 중요한 경우에는 스택을 활용할 때 조심해야 한다.
이유는 표현식을 왼쪽에서부터 확인할 때 첫째 인자가 먼저 스택에 쌓이기에 `get()` 연산을 실행하면 첫째 인자가 나중에 나온다.
따라서 `7 8 +`의 결과인 15가 `3 2 +`의 결과인 5 보다 먼저 스택에 쌓이게 되고,
최종적으로 `15 5 /`를 계산하기 위해 `get()`을 실행하면 5와 15 순서로 먼저 스택에서 나온다.
이때 그냥 바로 나눗셈을 계산하면 `15/5`가 아닌 `5/15`가 계산되어 잘못된 결과를 얻게 된다.

이점을 고려하면서 후위 표현식 계산 알고리즘을 정리하면 다음과 같다.
표현식에 사용된 연산 기호는 `*, /, +, -`로 제한한다.

1. `operand_stack` 라는 비어있는 스택을 준비한다.
1. 후위 표현식 문자열을 `split()` 메서드를 이용하여 리스트로 변환한다.
1. 리스트를 왼쪽에서부터 하나씩 차례대로 확인하면서 확인된 기호의 종류에 다라 아래 과정을 반복한다.
   - 피연산자인 경우: 수(number)로 변환한 다음 `operand_stack`에 추가한다.
   - `*, /, +, -` 중 하나인 경우: `operand_stack`을 두 번 `get()`한다. 
      첫번째로 얻어진 값은 둘째 인자로,
      두번째로 얻어진 값은 첫째 인자로 지정한다.
      두 인자를 이용하여 연산을 실행한 다음
      계산된 값을 다시 `operand_stack`에 추가한다.
1. 리스트의 모든 항목을 확인한 다음에 `operand_stack`에 납아있는 유일한 값을 주어진 표현식을 계산한 값으로 사용한다.

위 알고리즘을 파이썬으로 구현한 코드는 다음과 같다.
`do_math()` 함수는 연산자와 두 개의 피연산자가 주어졌을 때 해당 연산을 실행한다.

In [26]:
def do_math(op, op1, op2):
    if op == "*":
        return op1 * op2
    elif op == "/":
        return op1 / op2
    elif op == "+":
        return op1 + op2
    else:
        return op1 - op2

In [27]:
def postfix_eval(postfix_expr):
    operand_stack = Stack()
    token_list = postfix_expr.split()
    print(operand_stack)

    for token in token_list:
        if token not in '*/+-':
            operand_stack.put(int(token))
        else:
            operand2 = operand_stack.get()
            operand1 = operand_stack.get()
            result = do_math(token, operand1, operand2)
            operand_stack.put(result)
        print(operand_stack)

    return operand_stack.get()

In [28]:
postfix_eval("7 8 + 3 2 + /")

<[]>
<[7]>
<[7, 8]>
<[15]>
<[15, 3]>
<[15, 3, 2]>
<[15, 5]>
<[3.0]>


3.0

`infix_to_postfix()` 함수의 표기법 변환이 제대로 작동함을 다시 한 번 다음과 같이 확인할 수 있다.

In [29]:
postfix_eval(infix_to_postfix("( 7 + 8 ) / ( 3 + 2 )"))

<[]>
<[7]>
<[7, 8]>
<[15]>
<[15, 3]>
<[15, 3, 2]>
<[15, 5]>
<[3.0]>


3.0

## 연습 문제

1. [(실습) 스택](https://colab.research.google.com/github/codingalzi/algopy/blob/master/excs/exc-stacks.ipynb)

1. [(실습) 중위, 전위, 후위 표기법](https://colab.research.google.com/github/codingalzi/algopy/blob/master/excs/exc-infix_prefix_postfix.ipynb)