# 자료구조 기초

- GOAL: 기본적인 자료구조 중 탐색에 주로 활용되는 스택(stack), 큐(queue), 우선순위 큐(priority queue), 트리(tree), 그래프(graph)의 기본을 이해하고 활용하기 위한 파이썬 구현방법에 대해 살펴본다.

### 스택(stack)
- LIFO(Last In, First Out): 가장 마지막에 들어간 데이터가 가장 먼저 빠져나가는 구조
- 데이터를 넣는것을 push, 빼내는 것을 pop이라고 부름
- 파이썬의 스택 구조는 기본적으로 단순 리스트만 활용하여 구현이 가능함
![nn](../w2/img/stack.png)

In [3]:
stack = []

stack.append(1)
stack.append(2)
stack.append(3)

print(stack)

stack.pop()
print(stack)

[1, 2, 3]
[1, 2]


- 리스트만으로도 스택 구현이 가능하나,
- 속도가 좀 더 빠른 스택 구조 만들 시 파이썬 <code>collections</code>의 <code>deque</code> 모듈 활용 추천
    - deque(double-ended queue: 큐 앞뒤 삽입/삭제 가능)는 양쪽 끝에서 빠르게 요소를 추가하고 제거할 수 있는 자료구조로, 스택과 큐를 구현하는 데 유용함
    - 리스트보다 요소의 추가 및 제거가 더 효율적이며, 큐나 스택 작업을 수행할 때 성능 이점이 있음

In [5]:
from collections import deque
stack = deque()

data = [1,2,3,4,5]
for i in data:
    stack.append(i)

print(stack)

stack.pop()
print(stack)

deque([1, 2, 3, 4, 5])
deque([1, 2, 3, 4])


### 큐(Queue)
- FIFO(First In, First Out): 가장 먼저 들어간 데이터가 가장 먼저 빠져나가는 구조
- 큐에 자료를 넣는 것을 enqueue, 빼내는 것은 dequeue라고 부름
- 파이썬에서는 deque(double-ended queue: 큐 앞뒤 삽입/삭제 가능)를 사용
![nn](../w2/img/queue.png)

In [7]:
from collections import deque

list = [1,2,3,4,5]
queue = deque(list)

queue.append(5)
print(queue)

queue.popleft()
print(queue)

deque([1, 2, 3, 4, 5, 5])
deque([2, 3, 4, 5, 5])


- 파이썬의 queue 라이브러리에서 Queue 모듈을 사용해도 큐를 구현할 수 있지만, 실습 시 속도 측면이나 사용 용이성 측면에서 deque 모듈 사용을 추천함
    - queue.Queue는 큐 내부 요소에 직접 접근/출력 기능을 제공하지 않음. 이 때문에 get으로 하나하나 빼내는 불편한 방식을 사용해야함.
    - (다만, queue 모듈이 무조건 나쁜 것이 아니라 빠르고 자주 데이터를 넣고 빼야하는 멀티 스레드 상황에서 안전성이 높다는 장점이 존재함)

In [10]:
from queue import Queue

que = Queue()
que.put(3)
que.put(6)
que.put(9)

print(que)

while not que.empty():
    print(que.get())

<queue.Queue object at 0x104690890>
3
6
9


##### 우선순위 큐(Priority Queue)
- 우선순위 큐는 FIFO 특성을 가진 일반 큐와 달리, 추가 순서와 무관하게 우선순위가 높은(가장 작은 값)을 제거하는 특이한 자료구조
- 앞서 활용한 queue 라이브러리 내 PriorityQueue 모듈 활용 가능

In [11]:
from queue import PriorityQueue

pque = PriorityQueue()
pque.put(4)
pque.put(1)
pque.put(2)
pque.put(7)

while not pque.empty():
    print(pque.get())
    


1
2
4
7


- 파이썬의 priority queue는 heapq 모듈로도 활용 가능

In [14]:
import heapq

heap = []

heapq.heappush(heap, (4,'task 4'))
heapq.heappush(heap, (1,'task 1'))
heapq.heappush(heap, (7,'task 7'))
heapq.heappush(heap, (9,'task 9'))

print(heap)

while heap:
    print(heapq.heappop(heap))


[(1, 'task 1'), (4, 'task 4'), (7, 'task 7'), (9, 'task 9')]
(1, 'task 1')
(4, 'task 4')
(7, 'task 7')
(9, 'task 9')


알고리즘 속도 표기법 중 가장 기본은 빅오 표기법(예: O(n))
  
알고리즘 속도는 시간으로 측정하지않고, 연산 횟수가 얼마나 증가하는지로 카운트함

# 트리(tree)

- 트리 구조는 노드들이 나무 가지처럼 연결된 비선형적이고 계층적인 자료구조. 그래프의 방향이 존재함
- 트리는 사실 그래프의 한 형태로 순환이 없는 연결 그래프의 일종임

트리는 클래스로 보통 만듦
<br/>
![nn](./img/tree.png)

In [9]:

#tree구조
#     1
#   /   \
#  2     3
# / \ 
#4  5

#tree생성을 위한 node
class Node:
    def __init__(self, data):
        self.data = data
        self.left = None
        self.right = None

root = Node(1)
root.left = Node(2)
root.right = Node(3)
root.left.left = Node(4)
root.right.right = Node(5)

print(root.data, root.left.data, root.left.left.data)


1 2 4


# 그래프(graph)

- 그래프 구조는 노드(혹은 버텍스)와 엣지로 구성된 관계를 나타내는 자료구조
- 보통 그래프는 G = (V, E) 로 표현하며, V는 노드의 집합, E는 엣지의 집합을 의미함

![nn](./img/graph.png)

- 그래프는 다음과 같은 여러 유형이 존재할 수 있음

![nn](./img/graph1.png)
![nn](./img/graph2.png)

#### 인접 행렬과 인접 리스트

- 그래프는 인접 행렬(중간) 혹은 인접리스트(우측)로 표현할 수 있음
![nn](./img/graph4.png)

In [3]:
#인접행렬

nodes = ['A', 'B', 'C', 'D', 'E']

adj_matrix = [
    [0, 1, 1, 0, 0], #A 
    [1, 0, 0, 0, 0], #B
    [1, 0, 0, 1 ,0], #C
    [0, 0, 1, 0, 1], #D
    [0, 0, 0, 1, 0] #E   
]

for i in range(len(adj_matrix)):
    connected_nodes = [nodes[j] for j in range(len(adj_matrix[i])) if adj_matrix[i][j] == 1]
    print(f"{nodes[i]}는 {', '.join(connected_nodes)}와 연결")

A는 B, C와 연결
B는 A와 연결
C는 A, D와 연결
D는 C, E와 연결
E는 D와 연결


In [4]:
#인접리스트

graph = {
    'A':['B', 'C'],
    'B':['A'],
    'C':['A','D'],
    'D':['C','E'],
    'E':['D']
}

for node in graph:
    print(f"{node}는 {', '.join(graph[node])}와 연결")

A는 B, C와 연결
B는 A와 연결
C는 A, D와 연결
D는 C, E와 연결
E는 D와 연결


## 8 Puzzle 만들기

- 트리 구조를 활용해 경로 탐색 용이하도록 문제 상황의 상태 공간을 class 로 구현

1. <strong>상태</strong> 정보를 담기 위한 속성
    - board
2. 다음 상태로의 전이를 가능케하는 <strong>전이모형</strong>에 해당하는 함수
    - get_new_board: 동작
    - expand: (동작 통해) 확장 가능 상태 생성
3. 그 외 함수
    - 객체(현재 상태)를 출력해 현재 상태를 확인하는 함수
    - 두 객체(현재 상태 vs. 목표 상태) 비교 하기 위한 함수

In [13]:
#클래스 설계 (상태, 전이모형, 그외 함수 포함)

class Puzzle:
    def __init__(self, board):
        self.board = board

    def get_new_board(self, i1, i2): #i1, i2인덱스에 위치한 값을 서로 바꿈
        new_board = self.board[:]
        new_board[i1], new_board[i2] = new_board[i2], new_board[i1]
        return Puzzle(new_board)
    
    #보드의 인덱스
    # 0, 1, 2
    # 3, 4, 5
    # 6, 7, 8

    def expand(self):
        result = []
        i = self.board.index(0) #빈칸의 위치를 파악
        if i not in [0,3,6]: #빈칸이 왼쪽끝 쪽에 위치하지 않으면
            result.append(self.get_new_board(i, i-1)) #왼쪽으로 이동
        if i not in [0,1,2]: #빈칸이 위쪽끝 쪽에 위치하지 않으면
            result.append(self.get_new_board(i, i-3)) #위쪽으로 이동
        if i not in [6,7,8]: #빈칸이 아래끝 쪽에 위치하지 않으면
            result.append(self.get_new_board(i, i+3)) #아래쪽으로 이동
        if i not in [2,5,8]: #빈칸이 오른쪽끝 쪽에 위치하지 않으면
            result.append(self.get_new_board(i, i+1)) #오른쪽으로 이동
        return result
    
    def __str__(self): #상태를 보기좋게 출력해주는 함수
        return str(self.board[:3])+ "\n" + str(self.board[3:6])+ "\n" + str(self.board[6:9])
    
    def __eq__(self, other): #보드와 다른보드간에 비교 
        return self.board == other.board
    
    def __ne__(self, other):
        return self.board != other.board

In [15]:
initial_state = [0,1,3,
                 4,2,5,
                 6,8,7]

In [18]:
initial_puzzle = Puzzle(initial_state)

In [19]:
print(initial_puzzle)

[0, 1, 3]
[4, 2, 5]
[6, 8, 7]


In [23]:
next_puzzle_list = initial_puzzle.expand()

for i, v in enumerate(next_puzzle_list):
    print(f"#{i}\n{v}")

#0
[4, 1, 3]
[0, 2, 5]
[6, 8, 7]
#1
[1, 0, 3]
[4, 2, 5]
[6, 8, 7]
