# 순차적 자료구조

## 1. 개요

### A. 배열과 리스트

`-` array, list

* 가장 기본적인 sequential 자료구조
* 읽기와 쓰기는 $O(1)$ 기본연산임 -> 리스트 원소의 주소를 가져오는 방식 : `id(A[2]) == id(A[0]) + 2*4bytes`
* 상수 시간 내에 개별 원소에 접근 가능한 자료구조를 배열이고 한다.

`-` Python : `List[]`

* 리스트의 각 원소가 따로 메모리를 차지함
* 리스트 인덱스는 원소가 저장된 메모리 주소를 가리킴
* 리스트 원소값을 바꿀 경우 객체는 그대로 남아있고, 인덱스가 가리키는 주소만 바뀌는 것임


`-` 리스트 사용

> 인덱싱, 삽입(append, insert), 삭제(pop, remove) 연산 존재
>
> 맨뒤의 경우 $O(n)$, 중간에 있는 값에 대한 연산을 위해서는 $O(n)$

* **`list().append()`** : 맨 뒤에 값을 삽입

* **`list().insert(i, v)`** : i번째에 v값을 삽입

* **`list().pop(i)`** : i번째 값을 제거하고 리턴

* **`list().remove(v)`** : 리스트에서 v에 해당하는 값을 제거

* **`list().index(v)`, `list().count(v)`** : v의 인덱스, v의 개수를 리턴

In [16]:
A = [2, 4, 0, 5]

A.append(6)
print(f"A.append(6) : {A}")
A.insert(0, -3)
print(f"A.insert(0, -3) : {A}")
print(f"A.pop(0) : {A.pop(0)}\nresult : {A}")
A.remove(0)
print(f"A.remove(0) : {A}")
print(f"A.index(6) & A.count(6) : {A.index(6)} & {A.count(6)}")

A.append(6) : [2, 4, 0, 5, 6]
A.insert(0, -3) : [-3, 2, 4, 0, 5, 6]
A.pop(0) : -3
result : [2, 4, 0, 5, 6]
A.remove(0) : [2, 4, 5, 6]
A.index(6) & A.count(6) : 3 & 1


### B. 파이썬의 리스트

`-` Dynamic Array

* 용량 Capacity 을 자동 조절

In [None]:
import sys

A = []
print(sys.getsizeof(A)) ## A가 차지하는 메모리 사이즈를 리턴

A.insert(0, 18)
print(sys.getsizeof(A)) ## 차지하는 메모리 공간이 커짐

56
88


`-` `List class`

* `capacity` : 용량 (초기 용량이 있음)
* `n` : 현재 저장된 값의 개수 (default = 0)


`A.append(x)`의 내부 동작 workflow

```Python
if A.n < A.capacity :
    A[n] = x
    A.n = n+1
else :
    ## 용량을 증가시킴
    A.n == A.capacity
    B = A.capacity*2 크기의 리스트

    ## O(n)만큼의 시간 필요(대입 연산)
    for i in range(n) :
        B[i] = A[i]

    del A
    A = B

    A[n] = x
    A.n = n+1
```


### C. stack, queue, dequeue

제한된 접근(삽입, 삭제)만 허용

`-` stack : LIFO Last In First Out 후입선출 구조

* 위에서부터 차곡차곡 쌓이는 자료구조 : push
* 위에 있는 값(가장 마지막에 들어온 값)이 나가야 다음 값이 나갈 수 있음

`-` queue : FIFO First In First Out 선입선출 구조

* 선착순 느낌
* 먼저 들어온 값이 먼저 나갈 수 있음

`-` Dequeue : Stack + Queue

* 양쪽이 뚫려있음
* 후입선출 / 선입선출 가능

### D. Linked List 연결 리스트

값들이 순차적으로 이어진 자료구조

* 값들이 연속되지 않은 메모리 공간에 독립적으로 저장되어 있음
* 처음 원소에 값뿐만 아니라 다음 원소의 주소를 쌍으로 가지고 있음. 값과 포인터를 동시에 가지고 있음
* 배열처럼 인덱스로 접근할 수 없음 -> 맨 처음부터 링크를 따라가면서 접근해야 함 -> 뒤의 원소일수록 추출에 더 많은 시간이 걸림

## 2. Stack

* 삽입 push : 위로 넣음
* 삭제 pop : 위에 있는 걸 뺌
* 맨 위의 값 반환, 스택 길이 반환 : top, len

> 파이썬의 리스트로 stack과 동일하게 생각할 수 있음 -> push == append / pop == pop
>
> 하지만 스택에서는 push, pop만 가능하기 때문에 오류를 막을 수 있음

In [None]:
class Stack :
    def __init__(self) :
        self.items = []
        
    def __len__(self) :
        return len(self.items) ## O(1) : 리스트 객체에 크기값 저장중
        
    def push(self, val) :
        self.items.append(val) ## O(1) : 맨 뒤에 값 삽입
    
    def pop(self) :
        try :
            return self.items.pop() ## O(1) : 맨 뒤의 값 제거
        except IndexError :
            print("EmptyError : Stack is empty")
            
    def top(self) :
        try :
            return self.items[-1] ## O(1) : 맨 뒤의 값 호출
        except IndexError :
            print("EmptyError : Stack is empty")

In [36]:
s = Stack()
s.push(10)
s.push(2)

print(s.pop())
print(s.top())
print(len(s))

2
10
1


`-` 스택으로 할 수 있는 일

(예 1)

* 괄호 맞추기

> `(()())` : 쌍이 맞음
>
> `(()))(` : 쌍은 세 쌍이긴 하나, 짝이 안맞음
>
> `(`가 나오면 스택에 원소를 추가하고, `)`가 나오면 스택에 원소를 빼내는 식으로 파악 가능

**문제**

```{raw}
input : 왼쪽, 오른쪽 괄호의 문자열
output : 괄호쌍이 맞춰져 있으면 True, 아니면 False
```

In [42]:
txt = input()

s = Stack()
pair = True
non_valid = False

for t in txt :
    if t == "(" :
        s.push(1)
    
    elif t == ")" :
        if len(s) > 0 :
            s.pop()
        else :
            pair = False
            break
        
    else :
        print("Your text include NON-VALID SYMBOL")
        non_valid = True
        break

if not (non_valid) :        
    if len(s) > 0 :
        print(False)
    else :
        print(pair)

Your text include NON-VALID SYMBOL


(예 2)

* 계산기 코드 작성

```{raw}
input : 사칙연산이 포함된 수식 텍스트
output : 연산 결과
```

> `2+3*5` 형태의 infix 수식 -> `235*+`의 postfix 수식

1. 괄호 치기 : `(2+(3*5))`
2. 연산자의 오른쪽 괄호 다음으로 연산자 이동
3. 괄호 지우기 : `235*+`

In [66]:
txt = input()
tokens = ["(", "*", "/", "+", "-", ")"]
splited_lst = []

start = 0

for i, t in enumerate(txt) :
    if t in tokens :
        if start != i :
            splited_lst.append(txt[start:i])
            
        splited_lst.append(t)
        start = i+1

op_stack = Stack()
output = []
level_dict = {t:i for i, t in enumerate(["(", "-", "+", "/", "*", ")"])}

for t in splited_lst :
    if t == "(" :
        op_stack.push(t)
        
    elif t == ")" :
        for _ in range(len(splited_lst)) :
            if op_stack.top == "(" :
                op_stack.pop()
                break
            
            output.append(op_stack.pop())
        
    elif t in {"+", "-", "*", "/"} :
        if len(op_stack) == 0 :
            op_stack.push(t)
            
        else :      
            for _ in range(len(splited_lst)) :
                if level_dict[op_stack.top()] < level_dict[t] :
                    op_stack.push(t)
                    break
                
                output.append(op_stack.pop())
        
    else :
        output.append(t)

while len(op_stack) > 0 :
    output.append(op_stack.pop())

EmptyError : Stack is empty
EmptyError : Stack is empty
EmptyError : Stack is empty
EmptyError : Stack is empty
EmptyError : Stack is empty


In [68]:
output

['6', '3', '2', '-', '(', '+', None, None, None, None, None, '*']