# 자료구조

## 1. 배열

    - Python 에서는 list() 형태로 구현하고 타입도 요소 별로 각각 다르게 구현 가능
    - 탐색이 더 빠르고 삽입/삭제가 느림.
    

### 배열은 탐색이 빠르다.

In [1]:
arr = [1, 10, 5, 4, 22, 25] # 임의의 배열 arr 에서 우리는 2번 인덱스의 값인 5 를 가져오려고 한다.

# 이 때, 우리가 표현하는 arr[2] 는 arr 의 첫번째 주소값 + 2 * 4byte 를 순간적으로 계산해서 한 번에 2번의 메모리 주소를 이동한다.
arr[2] 

# 정리
# arr[2] = Pointer in arr[0] + 2 * 4byte(int type) -> 시간 복잡도 관점으로 big-O(1)
# 이것을 random access, 임의접근.

5

### 배열은 삽입/삭제가 느리다.

In [2]:
# arr 의 index 2 위치에 6을 삽입하고 싶다면 
arr[2] = 6
# 이라고 간단하게 쓰면 되지만 자료구조에서는 arr[2] = 6 을 처리하기 위해서 index 2번 ~ 끝 까지 모두 하나씩 밀어줘야한다.
# 만약 첫 번째 인덱스에 값을 넣게되면 모든 요소를 모두 뒤로 밀어내야 한다.

# 이것은 어느 위치에 하느냐에 따라 밀어내는 요소가 n 개이기 때문에
# 시간복잡도는 big - o(n) 이다.

In [None]:
# arr 의 index 1 의 요소를 삭제하고 싶다면
# 삽입과 반대로 이번엔 뒤에 요소를 당겨와야 하는데
# 이는 어느 위치에 따라 당기는 수량이 달라지기에 삽입과 똑같이
# 시간복잡도는 big - o(n) 이다.

---

## 2. 벡터
    - 동적 배열의 느낌. c++ 코테로 정말 많이 사용함.
    - size 변경가능한 점에 대해서도 마찬가지로 python 에서는 배열과 동일하다.

In [3]:
vector_v = []

vector_v.append((112, 146)) # tuple 로 사용해봄.
vector_v.append((897, 987))

print(f"size : {len(vector_v)}")

for p in vector_v:
    print(p)

size : 2
(112, 146)
(897, 987)


## 3. 연결 리스트
    
    - 삽입 / 삭제 O(1)
    - 탐색 O(n)
    - PS 에서는 많이 안쓰이지만 다른 구조들을 구현할 때 많이 쓰임. (배열과 특성이 반대되는 성격임.)
    
참고   
- [배열과 연결리스트의 장단점](https://bluejake.tistory.com/44)  
- [나무위키- 연결리스트 분석 부분 참고](https://namu.wiki/w/%EC%97%B0%EA%B2%B0%20%EB%A6%AC%EC%8A%A4%ED%8A%B8#s-4)
- [python 에서 연결리스트 구현](https://hudi.blog/ds-linked-list/)

## 4. 스택
    - 삽입 / 삭제 O(1)
    - FILO (First IN Last OUT) 선입후출 방식을 가지고 있음. <-> 후입선출 이라는 말도 적용됨.
    - Pyhton 에서는 stack 이라는 자료구조는 없음. 그냥 list() 사용
    - 사용사례
        - 인터넷 브라우저를 통해 웹서핑 후 뒤로가기

In [4]:
stack_list = []
stack_list.append(123)
stack_list.append(456)
stack_list.append(789)

while len(stack_list) > 0:
    print(stack_list[-1]) # Stack 의 top 에 해당하는 value
    stack_list.pop(-1) # First IN Last OUT

789
456
123


## 5. 큐

    - 삽입 / 삭제 O(1)
    - FIFO (First IN FIRST OUT) 선입선출 방식을 가지고 있음.
    - 시간복잡도가 Big-O 의 1인데 자칫하다가 배열과 같은 개념으로 오해할 수 있음. front 와 end 의 index 값을 인식하고 가져오는 것이 주목적

In [5]:
from collections import deque # 덱
# deque 은 queue 의 상위호환
# deque 은 양방향으로 값을 추출할 수 있음.
# double-ended-queue
queue_list = deque()
queue_list.append(123)
queue_list.append(456)
queue_list.append(789)

print(f"size -> {len(queue_list)}")
while len(queue_list) > 0:
    print(queue_list.popleft())
    # print(queue_list.pop())

size -> 3
123
456
789


In [6]:
from queue import Queue # 큐 모듈
# multi-thread 를 고려한 thread-safe 한 기능이 포함되어 있기에 성능이 느림.
# 알고리즘 테스트를 할 때는 multi-thread 를 고려하지 않기에 deque 을 사용하여 queue 를 구현함.
queue_list = Queue()
queue_list.put(123)
queue_list.put(456)
queue_list.put(789)

while queue_list.qsize() > 0:
    print(queue_list.get())

123
456
789


## 6. 우선순위 큐 (Heap)

    - 2진트리 최상단 요소를 root node : node 중 가장 큰값을 root node 로 지정, max heap
    - python 에서는 min-heap 을 root node 로 제공해줌.
    - 시간 복잡도 big-O 의 logN

In [7]:
from queue import PriorityQueue
# thread-safe 기능이 있기에 성능이 느림
pq = PriorityQueue()
pq.put(6)
pq.put(10)
pq.put(-5)
pq.put(3)
pq.put(1)
# min-heap 으로 우선 처리
while not pq.empty():
    print(pq.get()) # pop

-5
1
3
6
10


In [8]:
import heapq

heapq_list = []
heapq.heappush(heapq_list, 6)
heapq.heappush(heapq_list, -5)
heapq.heappush(heapq_list, 10)
heapq.heappush(heapq_list, 3)
heapq.heappush(heapq_list, 1)
heapq.heappush(heapq_list, -12)

# min-heap 으로 우선 처리
while heapq_list:
    print(heapq_list[0])
    heapq.heappop(heapq_list)

-12
-5
1
3
6
10


## 7. 맵 (Dictionary)
    - key, value 형태 -> json 구조
    - 삽입 삭제 python 에서는 big-O(1)
    - c++ 에서는 map 이 red-black tree 구조이기에 big-O(logN), python 은 hash 구성

In [9]:
map_dict = {}
map_dict["hello"] = 30
map_dict["world"] = 40
map_dict["everyone"] = 50

for key in map_dict:
    print(key, map_dict[key])

hello 30
world 40
everyone 50


## 8. 집합 (Set)
 
    - hash 기반 big-O(1) : python(c++ big-O(logN))
    

In [12]:
set_v = set()
set_v.add(10)
set_v.add(50)
set_v.add(20)
set_v.add(30)
set_v.add(40)
set_v.add(10)

# 중복을 허용하지 않음.
print(set_v)

# set_variable.pop() 기능이 있으나 random 값을 추출해주기에 remove(value) 를 사용
set_v.remove(40)
print(set_v)

{40, 10, 50, 20, 30}
{10, 50, 20, 30}
