# Chapter 07 추상 데이터 타입

- 추상 데이터 타입(Abstract Data Type, ADT)은 유사한 동작을 가진 자료구조의 클래스에 대한 수학적 모델을 일컬음
- 추상 데이터 타입은 각기 클래스는 다르지만, 기능적으로는 동일하게 구현된 자료구조를 가질 수 있음
- 자료구조는 크게 배열 기반의 연속(continuation) 방식과 포인터 기반의 연결(link) 방식으로 분류
- 예를 들어 파이썬에서 연속적으로 할당된 자료구조는 문자열, 리스트, 튜플, 딕셔너리 등이 존재
- 이번 장에서는 조금 더 특화된 연속 구조의 예와 연결 구조의 예를 살펴본다

# 7.1 스택
<hr style="1px;">

- 스택은 배열의 끝에서만 데이터를 접근할 수 있는 선형 자료구조
- 배열 인덱스 접근이 제한되며, LIFO 구조
- 책상 위에 쌓여 있는 책이나 싱크대에 쌓여 있는 접시를 연상할 것
- 시간복잡도는 모두 O(1)

- **push** : 스택 맨 끝(맨 위)에 항목을 삽입
- **pop** : 스택 맨 끝 항목을 반환하는 동시에 스택에서 제거
- **top/peek** : 스택 맨 끝 항목을 조회
- **empty** : 스택이 비어 있는지 확인
- **size** : 스택 크기를 확인

리스트의 append()와 pop() 메서드로 스택을 구현 가능

In [1]:
# 1_stack.py
class Stack(object):
    def __init__(self):
        self.items = []
        
    def isEmpty(self):
        return not bool(self.items)
    
    def push(self, value):
        self.items.append(value)
        
    def pop(self):
        value = self.items.pop()
        if value is not None:
            return value
        else:
            print("Stack is empty.")
            
    def size(self):
        return len(self.items)
    
    def peek(self):
        if self.items:
            return self.items[-1]
        else:
            print("Stack is empty")
            
    def __repr__(self):
        return repr(self.items)
    
if __name__ == "__main__":
    stack = Stack()
    print(stack)
    print("스택이 비었나요? {0}".format(stack.isEmpty()))
    print("스택에 숫자 0~9를 추가합니다.")
    for i in range(10):
        stack.push(i)
    print("스택 크기: {0}".format(stack.size()))
    print("peek: {0}".format(stack.peek()))
    print("pop: {0}".format(stack.pop()))
    print("peek: {0}".format(stack.peek()))
    print("스택이 비었나요? {0}".format(stack.isEmpty()))
    print(stack)

[]
스택이 비었나요? True
스택에 숫자 0~9를 추가합니다.
스택 크기: 10
peek: 9
pop: 9
peek: 8
스택이 비었나요? False
[0, 1, 2, 3, 4, 5, 6, 7, 8]


아래 코드에서는 노드(객체)의 컨테이너로 스택을 구현함.

In [3]:
# 2_stack_with_node.py
class Node(object):
    def __init__(self, value=None, pointer=None):
        self.value = value
        self.pointer = pointer
        
class Stack(object):
    def __init__(self):
        self.head = None
        self.count = 0
        
    def isEmpty(self):
        return not bool(self.head)
    
    def push(self, item):
        self.head = Node(item, self.head)  # node.pointer에는 이전 노드의 주소값이 들어감
        self.count += 1
        
    def pop(self):
        if self.count > 0 and self.head:
            node = self.head
            self.head = node.pointer
            self.count -= 1
            return node.value
        else:
            print("Stack is empty.")
            
    def peek(self):
        if self.count > 0 and self.head:
            return self.head.value
        else:
            print("Stack is empty.")
            
    def size(self):
        return self.count
    
    def _printList(self):
        node = self.head
        while node:
            print(node.value, end=' ')
            node = node.pointer
        print()
        
if __name__ == "__main__":
    stack = Stack()
    print(stack)
    print("스택이 비었나요? {0}".format(stack.isEmpty()))
    print("스택에 숫자 0~9를 추가합니다.")
    for i in range(10):
        stack.push(i)
    stack._printList()
    print("스택 크기: {0}".format(stack.size()))
    print("peek: {0}".format(stack.peek()))
    print("pop: {0}".format(stack.pop()))
    print("peek: {0}".format(stack.peek()))
    print("스택이 비었나요? {0}".format(stack.isEmpty()))
    stack._printList()

<__main__.Stack object at 0x00000210D3C9CA08>
스택이 비었나요? True
스택에 숫자 0~9를 추가합니다.
9 8 7 6 5 4 3 2 1 0 
스택 크기: 10
peek: 9
pop: 9
peek: 8
스택이 비었나요? False
8 7 6 5 4 3 2 1 0 


- 스택은 깊이 우선 탐색(DFS)에서 유용하게 사용
- 깊이 우선 탐색은 14장에서 살펴볼 예정

# 7.2 큐
<hr>

- 큐(queue)는 스택과 다르게 항목이 들어온 순서대로 접근 가능, 즉, FIFO 구조
- 큐 역시 배열의 인덱스 접근이 제한
- 시간복잡도는 모두 O(1)

- **enqueue** : 큐 뒤쪽에 항목을 삽입
- **dequeue** : 큐 앞쪽의 항목을 반환하고, 제거
- **peek/front** : 큐 앞쪽의 항목을 조회
- **empty** : 큐가 비어 있는지 확인
- **size** : 큐의 크기를 확인

In [4]:
# 3_queue.py
class Queue(object):
    def __init__(self):
        self.items = []
        
    def isEmpty(self):
        return not bool(self.items)
    
    def enqueue(self, item):
        self.items.insert(0, item)
        
    def dequeue(self):
        value = self.items.pop()
        if value is not None:
            return value
        else:
            print("Queue is empty.")
            
    def size(self):
        return len(self.items)
    
    def peek(self):
        if self.items:
            return self.items[-1]
        else:
            print("Queue is empty.")
            
    def __repr__(self):
        return repr(self.items)
    

if __name__ == "__main__":
    queue = Queue()
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    print("큐에 숫자 0~9를 추가합니다.")
    for i in range(10):
        queue.enqueue(i)
    print("큐 크기: {0}".format(queue.size()))
    print("peek: {0}".format(queue.peek()))
    print("dequeue: {0}".format(queue.dequeue()))
    print("peek: {0}".format(queue.peek()))
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    print(queue)

큐가 비었나요? True
큐에 숫자 0~9를 추가합니다.
큐 크기: 10
peek: 0
dequeue: 0
peek: 1
큐가 비었나요? False
[9, 8, 7, 6, 5, 4, 3, 2, 1]


- 위 코드에서는 리스트의 insert() 메서드를 썼지만, 이는 모든 요소가 메모리에서 이동될 수 있으므로 비효율적(O(n))
- 두개의 스택(두개의 리스트)을 사용하면 효율적인 큐를 작성할 수 있음

In [4]:
# 4_queue_from_two_stacks.py
class Queue(object):
    def __init__(self):
        self.in_stack = []
        self.out_stack = []
        
    def _transfer(self):
        while self.in_stack:
            self.out_stack.append(self.in_stack.pop())
            
    def enqueue(self, item):
        return self.in_stack.append(item)
    
    def dequeue(self):
        if not self.out_stack:
            self._transfer()
        if self.out_stack:
            return self.out_stack.pop()
        else:
            print("Queue is empty!")
            
    def size(self):
        return len(self.in_stack) + len(self.out_stack)
    
    def peek(self):
        if not self.out_stack:
            self._transfer()
        if self.out_stack:
            return self.out_stack[-1]
        else:
            print("Queue is empty!")
            
    def __repr__(self):
        if not self.out_stack:
            self._transfer()
        if self.out_stack:
            return repr(self.out_stack)
        else:
            print("Queue is empty!")
            
    def isEmpty(self):
        return not (bool(self.in_stack) or bool(self.out_stack))
    
if __name__ == "__main__":
    queue = Queue()
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    print("큐에 숫자 0~9를 추가합니다.")
    for i in range(10):
        queue.enqueue(i)
    print("in_stack: {0}".format(queue.in_stack))
    print("out_stack: {0}".format(queue.out_stack))
    print("큐 크기: {0}".format(queue.size()))
    print("peek: {0}".format(queue.peek()))
    print("dequeue: {0}".format(queue.dequeue()))
    print("peek: {0}".format(queue.peek()))
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    print(queue)

큐가 비었나요? True
큐에 숫자 0~9를 추가합니다.
in_stack: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
out_stack: []
큐 크기: 10
peek 안에서 out_stack:  [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
peek: 0
dequeue: 0
peek: 1
큐가 비었나요? False
[9, 8, 7, 6, 5, 4, 3, 2, 1]


In [8]:
# 5_linked_queue.py
class Node(object):
    def __init__(self, value=None, pointer=None):
        self.value = value
        self.pointer = None
        
class LinkedQueue(object):
    def __init__(self):
        self.head = None
        self.tail = None
        self.count = 0
        
    def isEmpty(self):
        return not bool(self.head)
    
    def dequeue(self):
        if self.head:
            value = self.head.value
            self.head = self.head.pointer
            self.count -= 1
            return value
        else:
            print("Queue is empty.")
            
    def enqueue(self, value):
        node = Node(value)
        if not self.head:
            self.head = node
            self.tail = node
        else:
            if self.tail:
                self.tail.pointer = node
            self.tail = node
        self.count += 1
        
    def size(self):
        return self.count
    
    def peek(self):
        return self.head.value
    
    def print(self):
        node = self.head
        while node:
            print(node.value, end=' ')
            node = node.pointer
        print()
        
if __name__ == "__main__":
    queue = LinkedQueue()
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    print("큐에 숫자 0~9를 추가합니다.")
    for i in range(10):
        queue.enqueue(i)
    print("큐가 비었나요? {0}".format(queue.isEmpty()))
    queue.print()
    
    print("큐 크기: {0}".format(queue.size()))
    print("peek: {0}".format(queue.peek()))
    print("dequeue: {0}".format(queue.dequeue()))
    print("peek: {0}".format(queue.peek()))
    queue.print()

큐가 비었나요? True
큐에 숫자 0~9를 추가합니다.
큐가 비었나요? False
0 1 2 3 4 5 6 7 8 9 
큐 크기: 10
peek: 0
dequeue: 0
peek: 1
1 2 3 4 5 6 7 8 9 


# 7.3 데크
<hr>

- 데크(deque)는 스택과 큐의 결합체로 볼 수 있음
- 양쪽 끝에서 항목의 조회, 삽입, 삭제가 가능
- 앞에서 구현한 큐를 바탕으로 다음과 같이 구현 가능

In [7]:
# 6_deque.py
class Queue(object):
    def __init__(self):
        self.items = []
        
    def isEmpty(self):
        return not bool(self.items)
    
    def enqueue(self, item):
        self.items.insert(0, item)
        
    def dequeue(self):
        value = self.items.pop()
        if value is not None:
            return value
        else:
            print("Queue is empty.")
            
    def size(self):
        return len(self.items)
    
    def peek(self):
        if self.items:
            return self.items[-1]
        else:
            print("Queue is empty.")
            
    def __repr__(self):
        return repr(self.items)

    
class Deque(Queue):
    def enqueue_back(self, item):
        self.items.append(item)
        
    def dequeue_front(self):
        value = self.items.pop(0)
        if value is not None:
            return value
        else:
            print("Deque is empty.")
            
if __name__ == "__main__":
    deque = Deque()
    print("데크(Deque)가 비었나요? {0}".format(deque.isEmpty()))
    print("데크에 숫자 0~9를 추가합니다.")
    for i in range(10):
        deque.enqueue(i)
    print("데크 크기: {0}".format(deque.size()))
    print("peek: {0}".format(deque.peek()))
    print("dequeue: {0}".format(deque.dequeue()))
    print("peek: {0}".format(deque.peek()))
    print("데크가 비었나요? {0}".format(deque.isEmpty()))
    print()
    print("데크: {0}".format(deque))
    print("dequeue: {0}".format(deque.dequeue_front()))
    print("peek: {0}".format(deque.peek()))
    print("데크: {0}".format(deque))
    print("enqueue_back(50)을 수행합니다.")
    deque.enqueue_back(50)
    print("peek: {0}".format(deque.peek()))
    print("데크: {0}".format(deque))

데크(Deque)가 비었나요? True
데크에 숫자 0~9를 추가합니다.
데크 크기: 10
peek: 0
dequeue: 0
peek: 1
데크가 비었나요? False

데크: [9, 8, 7, 6, 5, 4, 3, 2, 1]
dequeue: 9
peek: 1
데크: [8, 7, 6, 5, 4, 3, 2, 1]
enqueue_back(50)을 수행합니다.
peek: 50
데크: [8, 7, 6, 5, 4, 3, 2, 1, 50]


- 이 코드 역시 끝이 아닌 다른 위치에 있는 항목을 삽입하거나 제거할 때는 비효율적
- 그 이유는 Queue 클래스에서 리스트의 insert() 메서드를 사용하기 때문
- collections 패키지의 deque 모듈을 사용하면 이 문제가 해결

In [8]:
from collections import deque
q = deque(["버피", "젠더", "윌로"])
q

deque(['버피', '젠더', '윌로'])

In [9]:
q.append("자일스")
q

deque(['버피', '젠더', '윌로', '자일스'])

In [10]:
q.popleft()

'버피'

In [11]:
q.pop()

'자일스'

In [12]:
q

deque(['젠더', '윌로'])

In [13]:
q.appendleft('엔젤')
q

deque(['엔젤', '젠더', '윌로'])

- deque 모듈을 사용하면 q = deque(maxlen=4) 같은 식으로 데크의 크기를 지정할 수 있음
- 또한 rotate(n) 메서드는 n이 양수이면 오른쪽으로, n이 음수이면 왼쪽으로 n만큼 시프트 시킴

In [14]:
q

deque(['엔젤', '젠더', '윌로'])

In [15]:
q.rotate(1)

In [16]:
q

deque(['윌로', '엔젤', '젠더'])

In [17]:
q.rotate(2)
q

deque(['엔젤', '젠더', '윌로'])

In [18]:
q.rotate(3)
q

deque(['엔젤', '젠더', '윌로'])

In [19]:
q.rotate(-1)
q

deque(['젠더', '윌로', '엔젤'])

In [20]:
q.rotate(-2)
q

deque(['엔젤', '젠더', '윌로'])

- collections 패키지의 deque 모듈은 동적 배열이 아닌 이중 연결 리스트(7.5 연결 리스트)를 기반으로 한다는 점도 기억해두자.

# 7.4 우선순위 큐와 힙
<hr>

- 우선순위 큐(primary queue)는 일반 스택과 큐와 비슷한 추상 데이터 타입이나, 각 항목마다 연관된 우선순위 존재
- 두 항목의 우선순위가 같으면 큐의 순서를 따른다
- 우선순위 큐는 힙을 사용하여 구현

## 7.4.1 힙
- 힙(heap)은 각 노드가 하위 노드보다 작은(또는 큰) 이진 트리
- 균형 트리의 모양이 수정될 때, 다시 이를 균형 트리로 만드는 시간복잡도는 O(log n)
- 힙은 리스트에서 가장 작은(또는 가장 큰) 요소에 반복적으로 접근하는 프로그램에 유용
- 최소(또는 최대) 힙을 사용하면 가장 작은(또는 가장 큰) 요소를 처리하는 시간복잡도는 O(1)
- 그 외의 조회, 추가, 수정을 처리하는 시간복잡도는 O(log n)

## 7.4.2 heapq 모듈
- heapq 모듈은 효율적으로 시퀀스를 힙으로 유지하면서 항목을 삽입하고 제거하는 함수 제공
- heapq.heapify() 함수를 사용하면 O(n) 시간에 리스트를 힙으로 변환 가능

In [5]:
import heapq
list1 = [4, 6, 8, 1]
heapq.heapify(list1)
list1

[1, 4, 8, 6]

항목을 힙에 삽입할 때는 heapq.heappush(heap, item)을 사용

In [6]:
h = []
heapq.heappush(h, (1, 'food'))
heapq.heappush(h, (2, 'have fun'))
heapq.heappush(h, (3, 'work'))
heapq.heappush(h, (4, 'study'))
h

[(1, 'food'), (2, 'have fun'), (3, 'work'), (4, 'study')]

heapq.heappop(heap) 함수는 힙에서 가장 작은 항목을 제거하고 반환한다

In [7]:
list1

[1, 4, 8, 6]

In [8]:
heapq.heappop(list1)

1

In [9]:
list1

[4, 6, 8]

- heapq.heappushpop(heap, item)은 새 항목을 힙에 추가한 후(push), 가장 작은 항목을 제거하고 반환(pop)
- heapq.heapreplace(heap, item)은 힙의 가장 작은 항목을 제거하고 반환 후(pop), 새 항목을 추가(push)
- heappush()와 heappop() 메서드를 따로 사용하는 것보다 한번에 heappushpop() 혹은 heapreplace() 메서드를 사용하는 것이 더 효율적

- 힙의 속성을 사용하면 많은 연산을 할 수 있음
- 예를 들어 heapq.merge(\*iterables)는 여러 개의 정렬된 반복 가능한 객체를 병합하여 하나의 정렬된 결과의 이터레이터를 반환

In [10]:
for x in heapq.merge([1,3,5], [2,4,6]):
    print(x)

1
2
3
4
5
6


- heapq.nlargest(n, iterable[, key])와 heapq.nsmallest(n, iterable[, key])는 데이터(반복 가능한 객체에 의해 정의된)에서 n개의 가장 큰 요소와 가장 작은 요소가 있는 리스트를 반환