# 순차적 자료구조

## 1. 개요

### A. 배열과 리스트

`-` array, list

* 가장 기본적인 sequential 자료구조
* 읽기와 쓰기는 $O(1)$ 기본연산임 -> 리스트 원소의 주소를 가져오는 방식 : `id(A[2]) == id(A[0]) + 2*4bytes`
* 상수 시간 내에 개별 원소에 접근 가능한 자료구조를 배열이고 한다.

`-` Python : `List[]`

* 리스트의 각 원소가 따로 메모리를 차지함
* 리스트 인덱스는 원소가 저장된 메모리 주소를 가리킴
* 리스트 원소값을 바꿀 경우 객체는 그대로 남아있고, 인덱스가 가리키는 주소만 바뀌는 것임


`-` 리스트 사용

> 인덱싱, 삽입(append, insert), 삭제(pop, remove) 연산 존재
>
> 맨뒤의 경우 $O(n)$, 중간에 있는 값에 대한 연산을 위해서는 $O(n)$

* **`list().append()`** : 맨 뒤에 값을 삽입

* **`list().insert(i, v)`** : i번째에 v값을 삽입

* **`list().pop(i)`** : i번째 값을 제거하고 리턴

* **`list().remove(v)`** : 리스트에서 v에 해당하는 값을 제거

* **`list().index(v)`, `list().count(v)`** : v의 인덱스, v의 개수를 리턴

In [16]:
A = [2, 4, 0, 5]

A.append(6)
print(f"A.append(6) : {A}")
A.insert(0, -3)
print(f"A.insert(0, -3) : {A}")
print(f"A.pop(0) : {A.pop(0)}\nresult : {A}")
A.remove(0)
print(f"A.remove(0) : {A}")
print(f"A.index(6) & A.count(6) : {A.index(6)} & {A.count(6)}")

A.append(6) : [2, 4, 0, 5, 6]
A.insert(0, -3) : [-3, 2, 4, 0, 5, 6]
A.pop(0) : -3
result : [2, 4, 0, 5, 6]
A.remove(0) : [2, 4, 5, 6]
A.index(6) & A.count(6) : 3 & 1


### B. 파이썬의 리스트

`-` Dynamic Array

* 용량 Capacity 을 자동 조절

In [None]:
import sys

A = []
print(sys.getsizeof(A)) ## A가 차지하는 메모리 사이즈를 리턴

A.insert(0, 18)
print(sys.getsizeof(A)) ## 차지하는 메모리 공간이 커짐

56
88


`-` `List class`

* `capacity` : 용량 (초기 용량이 있음)
* `n` : 현재 저장된 값의 개수 (default = 0)


`A.append(x)`의 내부 동작 workflow

```Python
if A.n < A.capacity :
    A[n] = x
    A.n = n+1
else :
    ## 용량을 증가시킴
    A.n == A.capacity
    B = A.capacity*2 크기의 리스트

    ## O(n)만큼의 시간 필요(대입 연산)
    for i in range(n) :
        B[i] = A[i]

    del A
    A = B

    A[n] = x
    A.n = n+1
```


### C. stack, queue, dequeue

제한된 접근(삽입, 삭제)만 허용

`-` stack : LIFO Last In First Out 후입선출 구조

* 위에서부터 차곡차곡 쌓이는 자료구조 : push
* 위에 있는 값(가장 마지막에 들어온 값)이 나가야 다음 값이 나갈 수 있음

`-` queue : FIFO First In First Out 선입선출 구조

* 선착순 느낌
* 먼저 들어온 값이 먼저 나갈 수 있음

`-` Dequeue : Stack + Queue

* 양쪽이 뚫려있음
* 후입선출 / 선입선출 가능

### D. Linked List 연결 리스트

값들이 순차적으로 이어진 자료구조

* 값들이 연속되지 않은 메모리 공간에 독립적으로 저장되어 있음
* 처음 원소에 값뿐만 아니라 다음 원소의 주소를 쌍으로 가지고 있음. 값과 포인터를 동시에 가지고 있음
* 배열처럼 인덱스로 접근할 수 없음 -> 맨 처음부터 링크를 따라가면서 접근해야 함 -> 뒤의 원소일수록 추출에 더 많은 시간이 걸림

## 2. Stack

* 삽입 push : 위로 넣음
* 삭제 pop : 위에 있는 걸 뺌
* 맨 위의 값 반환, 스택 길이 반환 : top, len

> 파이썬의 리스트로 stack과 동일하게 생각할 수 있음 -> push == append / pop == pop
>
> 하지만 스택에서는 push, pop만 가능하기 때문에 오류를 막을 수 있음

In [2]:
class Stack :
    def __init__(self) :
        self.items = []
        
    def __len__(self) :
        return len(self.items) ## O(1) : 리스트 객체에 크기값 저장중
        
    def push(self, val) :
        self.items.append(val) ## O(1) : 맨 뒤에 값 삽입
    
    def pop(self) :
        try :
            return self.items.pop() ## O(1) : 맨 뒤의 값 제거
        except IndexError :
            print("EmptyError : Stack is empty")
            
    def top(self) :
        try :
            return self.items[-1] ## O(1) : 맨 뒤의 값 호출
        except IndexError :
            print("EmptyError : Stack is empty")

In [36]:
s = Stack()
s.push(10)
s.push(2)

print(s.pop())
print(s.top())
print(len(s))

2
10
1


`-` 스택으로 할 수 있는 일

(예 1)

* 괄호 맞추기

> `(()())` : 쌍이 맞음
>
> `(()))(` : 쌍은 세 쌍이긴 하나, 짝이 안맞음
>
> `(`가 나오면 스택에 원소를 추가하고, `)`가 나오면 스택에 원소를 빼내는 식으로 파악 가능

**문제**

```{raw}
input : 왼쪽, 오른쪽 괄호의 문자열
output : 괄호쌍이 맞춰져 있으면 True, 아니면 False
```

In [42]:
txt = input()

s = Stack()
pair = True
non_valid = False

for t in txt :
    if t == "(" :
        s.push(1)
    
    elif t == ")" :
        if len(s) > 0 :
            s.pop()
        else :
            pair = False
            break
        
    else :
        print("Your text include NON-VALID SYMBOL")
        non_valid = True
        break

if not (non_valid) :        
    if len(s) > 0 :
        print(False)
    else :
        print(pair)

Your text include NON-VALID SYMBOL


(예 2)

* 계산기 코드 작성

```{raw}
input : 사칙연산이 포함된 수식 텍스트
output : 연산 결과
```

> `2+3*5` 형태의 infix 수식 -> `235*+`의 postfix 수식

1. 괄호 치기 : `(2+(3*5))`
2. 연산자의 오른쪽 괄호 다음으로 연산자 이동
3. 괄호 지우기 : `235*+`

In [37]:
txt = input()
tokens = ["(", "*", "/", "+", "-", ")"]
splited_lst = []

start = 0

for i, t in enumerate(txt) :
    if t in tokens :
        if start != i :
            splited_lst.append(txt[start:i])
            
        splited_lst.append(t)
        start = i+1

splited_lst.append(txt[-(len(txt) - sum([len(t) for t in splited_lst])):])

op_stack = Stack()
output = []
level_dict = {t:i for i, t in enumerate(["(", "-", "+", "/", "*", ")"])}

for t in splited_lst :
    if t == "(" :
        op_stack.push(t)
        
    elif t == ")" :
        for _ in range(len(splited_lst)) :
            if op_stack.top() == "(" :
                op_stack.pop()
                break
            
            output.append(op_stack.pop())
        
    elif t in {"+", "-", "*", "/"} :
        if len(op_stack) == 0 :
            op_stack.push(t)
            
        else :      
            for _ in range(len(splited_lst)) :
                if level_dict[op_stack.top()] < level_dict[t] :
                    op_stack.push(t)
                    break
                
                output.append(op_stack.pop())
        
    else :
        output.append(t)

while len(op_stack) > 0 :
    output.append(op_stack.pop())
    
print("".join(output))

632-4*+


In [46]:
num_stack = Stack()

for t in output :
    if t in tokens :
        b = int(num_stack.pop())
        a = int(num_stack.pop())
        
        if t == "+" :
            num_stack.push(a + b)
        elif t == "-" :
            num_stack.push(a - b)
        elif t == "*" :
            num_stack.push(a * b)
        elif t == "/" :
            num_stack.push(a / b)
            
    else :
        num_stack.push(t)
        
print(f"result : {num_stack.top()}")

result : 10


## 3. Queue : FIFO

* 삽입 : `enqueue` -> 가장 깊은 곳에 자리잡음
* 제거 : `dequeue` -> 가장 먼저 들어갔던 값이 제거됨

> 두 개의 인덱스가 필요함 : 어느 인덱스로 들어올지, 어느 인덱스의 것이 제거될지

In [66]:
[1, 2].__repr__()

'[1, 2]'

In [70]:
class Queue :
    def __init__(self) :
        self.items = []
        self.front_index = 0
        
    def __len__(self) :
        return len(self.items) - self.front_index
    
    def __repr__(self) :
        return self.items[self.front_index:].__repr__()
    
    def enqueue(self, val) :
        self.items.append(val)
        
    def dequeue(self) :
        ## 삭제하면 다른 모든 원소들의 인덱스가 이동해야 하므로 O(n) -> 리스트의 시작 지점을 바꾸는 것으로 삭제의 효과를 볼 수 있음
        if self.front_index == len(self.items) :
            print("Your Queue is EMPTY")
            
        else :
            x = self.items[self.front_index]
            self.front_index += 1
            return x

In [72]:
q = Queue()

q.enqueue(1)
q.enqueue(2)

q.dequeue()
q.dequeue()

q.enqueue(3)
q.enqueue(4)

print(f"result : {q}\nlength : {len(q)}")

result : [3, 4]
length : 2


`-` 큐 활용의 예시

**(Josephus Problem)**

전투 중에 군인들이 동굴에 갇혀 적들에게 포위됨, 특정 규칙에 따라 나가서 싸우자.

* n과 k가 주어짐. 누가 살아남을 것인가?
* k번째 사람이 나가고, 그 사람 다음 k번째 사람이 나가고, 반복해서 하나가 남을 때까지

In [74]:
n, k = map(int, input().split())

Q = Queue()

for i in range(1, n+1) :
    Q.enqueue(i)

for i in range(n) :
    for j in range(k-1) :
        Q.enqueue(Q.dequeue())
    
    last = Q.dequeue()
    
print(last)

1


> 파이썬의 경우 `collections.deque`로 활용 가능함

## 4. 한방향 연결 리스트 Singly Linked List

&nbsp;배열의 경우 연속적으로 메모리가 할당되어 있기 때문에 i번째 원소의 id를 상수시간 안에 계산 가능하지만, 연결 리스트의 경우 $O(n)$이 걸림

* 원소가 저장되는 곳에 data(key)와 link가 같이 저장됨. (key, link) --> node
* 마지막 노드는 링크로 NULL을 반환함
* head node로부터 link를 따라가며 i번째 원소를 추적할 수밖에 없음
* key 이외에도 더 많은 정보를 추가할 수 있음 ㅇㅇ

`-` 특장점 : insert

* 배열에서 중간에 값을 삽입하고자 하면, 그 뒤의 모든 값들을 뒤로 밀어야 함 -> $O(n)$
* linked list에서는 중간 노드의 link를 새로운 데이터로 바꾸고, 해당 노드의 링크를 다음 데이터의 링크로 설정 -> $O(1)$ : 단, 중간 노드의 주소를 알고 있어야 함

`-` 양방향 연결 리스트

* 노드 하나에 key값 하나와 link 두 개를 가짐

In [76]:
class Node :
    def __init__(self, key = None) :
        self.key = key
        self.next = None
        
    def __str__(self) :
        return str(self.key)

In [77]:
a = Node(3)
b = Node(9)
c = Node(-1)

a.next = b
b.next = c

In [None]:
class SinglyLinkedList :
    def __init__(self) :
        self.head = None
        self.size = 0
        
    def __len__(self) :
        return self.size
    
    def __iter__(self) :
        ## 제너레이터 생성 : 왜 iterator 안쓰징
        v = self.head
        
        while v != None :
            yield v ## v를 호출한 곳으로 return
            v = v.next
    
    def PushFront(self, key) :
        new_node = Node(key) ## 새 노드를 만들고
        new_node.next = self.head ## 새 노드의 링크를 업데이트해주고(이전의 헤드 노드)
        self.head = new_node ## 새 노드를 헤드노드로 바꿔주고
        self.size += 1 ## 연결 리스트의 사이즈를 갱신
        
    def PushBack(self, key) :
        new_node = Node(key)
        
        if len(self) == 0 :
            self.head = new_node ## 아무것도 없는 빈 리스트의 tail node를 갱신하면, head node 갱신과 동일
            
        else :
            tail = self.head.next ## 새로운 노드를 맨 뒤에 부착하기 위해 순차적으로 호출
            
            while tail.next != None :
                tail = tail.next
            
            # for _ in range(self.size-1) :
            #     tail = tail.next
            
            tail.next = new_node
            
        self.size += 1
        
    def popFront(self) :
        if len(self) == 0 :
            return None
        
        else :
            x = self.head
            key = x.key
            self.head = x.next
            self.size -= 1
            del x ## 메모리 삭제

            return key
        
    def popBack(self) :
        if len(self) == 0 :
            return None
        
        else :
            ## Running Technique
            prev, tail = None, self.head
            
            while tail.next != None :
                prev = tail
                tail = tail.next
            
            if len(self) == 1 :
                self.head = None
            else :
                prev.next = tail.next ## None
                
            key = tail.key
            self.size -= 1
            del tail
            
            return key
        
    def search(self, key) :
        ## key값이 있는 노드를 리턴, 없으면 None 리턴 : O(n)
        v = self.head
        
        while v != None :
            if v.key == key :
                return v
            else :
                v = v.next
                
        return v ## None

In [82]:
L = SinglyLinkedList()
L.PushFront(-1) ## 앞에 와서 붙는 형태(뒤에 와서 붙으면 O(n)이니까 의미가 없음...)
L.PushFront(9) ## 9 -> -1
L.PushFront(3) ## 3 -> 9 -> -1

## 5. 양방향 연결 리스트 Doubly Linked List