>'잔재미코딩' 파이썬 자료를 공부한 내용입니다.

# 파이썬 자료구조

## 데이터 구조와 알고리즘이란?

### 데이터 구조

- 대량 데이터를 효율적으로 관리할 수 있는 데이터 구조(= 자료구조)
- 효율적인 데이터 처리를 위해 데이터의 특성에 따라 체계적으로 데이터를 구조화하는 것
    - ex)
        - 우편번호: 5자리 우편번호에서 앞 3자리는 시, 군, 자치구를 표기, 뒤 2자리는 일련번호로 구성
        - 학생관리: 학년, 반, 번호를 학생에게 부여해서 학생부를 관리

### 알고리즘 이란?

- 알고리즘: 어떤 문제를 풀기 위한 절차/방법
- 어떤 문제에 대해 특정한 '입력'을 넣으면 원하는 '출력'을 얻을 수 있도록 만드는 프로그래밍

## 알고리즘 복잡도 표현 방법

1. 알고리즘 복잡도 계산이 필요한 이유 : 하나의 문제를 푸는 알고리즘은 다양할 수 있음
    - 정수의 절대값 구하기
        - 방법 1. 정수값을 제곱한 값에 다시 루트를 씌우기
        - 방법 2. 정수가 음수인지 확인해서 음수일 때만 -1을 곱하기
        > 더 좋은 알고리즘을 활용하기 위해 복잡도를 정의하고 계산함
        
2. 알고리즘 복잡도 계산 항목
    1. 시간 복잡도: 알고리즘 실행 속도(중요!)
        - 주요 요소: 반복문
        - 입력의 크기가 커질수록 반복문이 알고리즘 수행 시간을 지배함
    2. 공간 복잡도: 알고리즘이 사용하는 메모리 사이즈    

- 알고리즘 성능 표기법
    - **Big O 표기법: O(N)**
        - 알고리즘 최악의 실행 시간을 표기
        - 일반적으로 많이 사용
        - 아무리 최악의 상황이라도, 이정도의 성능은 보장한다는 의미이기 떄문
    - $\Omega$ 표기법: $\Omega$(N)
        - 오메가 표기법은 알고리즘 최상의 실행 시간을 표기
    - $\Theta$ 표기법: $\Theta$(N)
        - 세타 표기법은 알고리즘 평균 실행 시간을 표기
    > 시간 복잡도 계산은 반복문이 핷미 요소임을 인지하고, Big O 표기법 중심으로 익히면 됨

3. 대문자 O 표기법
    - 빅 오 표기법
    - O(입력)
        - 입력 n에 따라 결정되는 시간 복잡도 함수
        - O(1), O(logn), O(n), O(nlogn), O(n<sup>2</sup>), O(2<sup>n</sup>), O(n!) 등으로 표기
        - 입력 n의 크기에 따라 기하급수적으로 시간 복잡도가 늘어날 수 있음
            - O(1) < O(logn) < O(n) < O(nlogn) < O(n<sup>2</sup>) < O(2<sup>n</sup>) < O(n!)
    - 단순하게 입력 n에 따라, 몇번 실행이 되는지를 계산하면 됨
        - n이 1이든 100이든, 1000이든, 10000이든 실행을
            - 무조건 2회(상수회) 실행한다: O(1)
            - n에 따라 n번, n + 10번, 3n + 10번 등 실행한다: O(n)
            - n에 따라, n<sup>2</sup>번, n<sup>2</sup> + 1000번, 또는 100n<sup>2</sup> - 100번 등 실행한다: O(n<sup>2</sup>)
    - 빅 오 입력값 표기 방법
        ex)
        - 만약 시간 복잡도 함수가 2n<sup>2</sup> + 3n 이라면
            - 가장 높은 차수는 2n<sup>2</sup>
            - 상수는 실제 큰 영향이 없음
            - 결국 빅 오 표기법으론 O(n<sup>2</sup>)

4. 실제 알고리즘으로 시간 복잡도와 빅 오 표기법 알아보기
> 연습: 1부터 n까지의 합을 구하는 알고리즘 작성1

In [1]:
def sum_all(n):
    total = 0
    for num in range(1, n + 1):
        total += num
    return total

In [6]:
sum_all(50)

1275.0

- 시간복잡도
    - 입력 n에 따라 덧셈을 n번 해야 함(반복문!)
    - 시간 복잡도: n, 빅오 표기법으로는 O(n)

> 연습: 1부터 n까지의 합을 구하는 알고리즘 작성2

In [3]:
def sum_all(n):
    return n * (n + 1) / 2

In [7]:
sum_all(50)

1275.0

- 시간복잡도
    - 입력 n이 어떻든 간에, 곱셈/덧셈/나눗셈 하면 됨(반복문이 없음!)
    - 시간 복잡도: 1, 빅오 표기법으로는 O(1)

## 배열(Array)
- 데이터를 나열하고, 각 데이터를 인덱스에 대응하도록 구성한 데이터 구조
- list

1. 배열이 왜 필요할까?
    - 장점
        1. 같은 종류의 데이터를 순차적으로 저장
        2. 빠른 접근 가능
    - 단점
        1. 추가/삭제가 쉽지 않음
        2. 미리 최대 길이를 지정해야 함

2. 파이썬과 배열
    - 파이썬 리스트 활용

In [11]:
# 1차원 배열
data = [1, 2, 3, 4, 5]
print(data)
print(data[0])

[1, 2, 3, 4, 5]
1


In [14]:
# 2차원 배열
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
print(data)
print(data[0])
print(data[1][2])

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
[1, 2, 3]
6


##  큐(Queue)

1. 큐 구조
    - 줄을 서는 행위와 유사
    - 가장 먼저 넣은 데이터를 가장 먼저 꺼낼 수 있는 구조(선입선출)
    - 스택과 꺼내는 순서가 반대

2. 용어
    1. Enqueue: 큐에 데이터를 넣는 것(맨 뒤로)
    2. Dequeue: 큐에서 데이터를 꺼내는 것(맨 앞에서부터)

3. 파이썬 queue 라이브러리 활용하여 큐 자료구조 사용하기
    - queue 라이브러리에는 다양한 큐 구조로 `Queue()`, `LifoQueue()`, `PriorityQueue()` 제공
        - Queue(): 가장 일반적인 큐 자료구조
        - LifoQueue(): 나중에 입력된 데이터가 먼저 출력되는 구조(스택 구조라고 보면 됨)
        - PriorityQueue(): 데이터마다 우선순위를 넣어서, 우선순위가 높은 순으로 데이터 출력

In [27]:
# Queue()
import queue

data = queue.Queue()

In [38]:
data.put('Kim')
data.put(100)

In [39]:
data.qsize()

2

In [40]:
data.get()

'Kim'

In [41]:
data.qsize() # 하나 뺴 감

1

In [42]:
data.get()

100

In [43]:
# LifoQueue()
import queue
data = queue.LifoQueue()
data.put('Kim')
data.put(100)

In [44]:
data.qsize()

2

In [45]:
data.get()

100

In [46]:
data.get()

'Kim'

In [51]:
# PriorityQueue()
import queue

data = queue.PriorityQueue()
data.put((10, 'korea'))
data.put((5, '100'))
data.put((15, 'china'))

In [52]:
data.qsize()

3

In [53]:
data.get()

(5, '100')

In [54]:
data.get()

(10, 'korea')

In [55]:
data.get()

(15, 'china')

참고: 어디에 큐가 많이 쓰일까?
- 멀티 태스킹을 위한 프로세스 스케쥴링 방식을 구현하기 위해 많이 사용됨(운영체제)

##  스택(Stack)

1. 스택 구조
    - 데이터를 제한적으로 접근할 수 있는 구조
        - 한쪽 끝에서만 자료를 넣거나 뺄 수 있는 구조
    - 가장 나중에 쌓은 데이터를 가장 먼저 빼낼 수 있는 데이터 구조
        - 선입후출, 후입선출
    - 대표적인 스택의 활용
        - 컴퓨터 내부의 프로세스 구조의 함수 구동 방식
    - 주요기능
      - push(): 데이터를 스택에 넣기
      - pop(): 데이터를 스택에서 꺼내기

2. 스택 구조와 프로세스 스택
    - 스택 구조는 프로세스 실행 구조의 가장 기본
        - 함수 호출시 프로세스 실행 구조를 스택과 비교해서 이해 필요

In [56]:
# 재귀 함수
def recursive(data):
    if data < 0:
        print('ended')
    else:
        print(data)
        recursive(data-1)
        print('returned', data)

In [58]:
recursive(3) # 바깥 쪽으로 트리가 생성되고, 트리 바깥 부분부터 처리해서 올라옴

3
2
1
0
ended
returned 0
returned 1
returned 2
returned 3


3. 자료 구조 스택의 장단점
    - 장점
        - 구조가 단순해서, 구현이 쉽다.
        - 데이터 저장/읽기 속도가 빠르다
    - 단점(일반적인 스택 구현시)
        - 데이터 최대 갯수를 미리 정해야 한다.
            - 파이썬의 경우 재귀 함수는 1000번 까지만 호출 가능함
        - 저장 공간의 낭비가 발생할 수 있음
            - 미리 최대 갯수만큼 저장공간을 확보해야 함  
            
> 스택은 단순하고 빠른 성능을 위해 사용되므로, 보통 배열 구조를 활용해서 구현하는 것이 일반적임. 

4. 파이썬 리스트로 스택 사용해보기
    - append, pop

In [59]:
data = list()
data.append(1)
data.append(2)
data.append(3)

In [60]:
data

[1, 2, 3]

In [61]:
data.pop()

3

In [62]:
data.pop()

2

In [63]:
data.pop()

1

In [64]:
data

[]

## 링크드 리스트(Linked List)

### 링크드 리스트 구조 
    - 연결 리스트라고도 함
    - 배열은 순차적으로 연결된 공간에 데이터를 나열하는 데이터구조
    - 링크드 리스트는 떨어진 곳에 존재하는 데이터를 화살표로 연결해서 관리하는 데이터 구조
        - c언어에서는 중요한 데이터 구조이지만, 파이썬은 리스트 타입이 링크드 리스트의 기능을 모두 지원
    - 링크드 리스트 기본 구조와 용어
        - 노드: 데이터 저장 단위(데이터 값, 포인터)로 구성
        - 포인터: 각 노드 안에서 다음이나 이전 노드와의 연결 정보를 가지고 있는 공간  
        
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FPePGx%2FbtqyzcNBw94%2FVeTyAKugKfD74KR8ZSbW4k%2Fimg.png)

### 간단한 링크드 리스트 예  
Node 구현
    - 보통 파이썬에서 링크드 리스트 구현시, 파이썬 클래스를 활용

In [136]:
class Node:
    def __init__(self, data, next = None):  
        self.data = data
        self.next = next

In [137]:
# Node와 Node 연결 (next는 포인터 -> 다음 node로 향함)
node1 = Node(1)
node2 = Node(2)
node1.next = node2
head = node1

In [138]:
####

In [139]:
# 링크드 리스트로 데이터 추가하기
class Node:
    def __init__(self, data, next = None):  
        self.data = data
        self.next = next # 값이 안 들어오면 self.next = None으로 초기화

# 추가 함수
def add(data): 
    node = head # 생성한 노드 객체
    while node.next: # 노드 객체.next 가 None이 아닐 때까지 반복(node.next가 있을 때만 반복)
        node = node.next 
    node.next = Node(data) # 인수로 받은 data로 새로운 객체를 next에 넣어줌

In [140]:
node1 = Node(1)
head = node1 
for index in range(2, 10):
    add(index)

In [141]:
# 링크드 데이터 출력(검색)
node = head
while node.next: # node.next가 있을 때만 반복
    print(node.data) # 데이터 출력
    node = node.next # node1 -> node2 -> node3 .... node9
print(node.data) # 출력 안 된 9번쨰 노드의 데이터를 출력

1
2
3
4
5
6
7
8
9


### 링크드 리스트의 장단점
    - 장점
        - 삽입과 삭제가 O(1)에 이루어진다.
        - 삽입과 삭제를 할 때마다 동적으로 링크드 리스트의 크기가 결정되므로 전통적인 배열(Array)에 비해 처음부터 큰 공간을 할당할 필요가 없어짐
        - 메모리 관리가 용이하다
    - 단점
        - 연결 정보를 찾는 시간이 필요하므로 접근 속도가 느림(인덱스를 통한 탐색 불가)
        - 탐색 시 O(N)이 걸린다(head ~ tail까지 모두 탐색 시)
        - 중간 데이터 삭제시 앞뒤 데이터의 연결을 재구성해야 하는 부가적인 작업 필요
        - 파이썬에서 링크드 리스트는 의미가 크게 없는 게, 그냥 리스트 쓰면 된다. C++의 STL vector보다도 훨씬 쓰기 간편하며, 어떠한 타입의 데이터도(심지어 튜플이나 리스트마저) 넣을 수 있고 동적으로 메모리 관리가 되기 때문에, 링크드 리스트의 의미가 크게 퇴색된다.
    

### 링크드 리스트의 복잡한 기능 1 : 링크드 리스트 데이터 사이에 데이터를 추가
     - 링크드 리스트는 유지 관리에 부가적인 구현이 필요함  
![출처: 위키패디아, 링크드리스트](https://upload.wikimedia.org/wikipedia/commons/4/4b/CPT-LinkedLists-addingnode.svg)

In [147]:
node1 = Node(1)
head = node1 
for index in range(2, 10):
    add(index)
# 링크드 데이터 출력(검색)
node = head
while node.next: # node.next가 있을 때만 반복
    print(node.data) # 데이터 출력
    node = node.next # node1 -> node2 -> node3 .... node9
print(node.data) # 출력 안 된 9번쨰 노드의 데이터를 출력

1
2
3
4
5
6
7
8
9


In [148]:
node3 = Node(1.5)

In [149]:
node = head
search = True
while search: # search 가 True일 떄 반복
    if node.data == 1: # node.data가 1이면 반복문 빠져나감
        search = False
    else:
        node = node.next # 아니면 다음 노드로

node_next = node.next # node_next에 node.data가 1인 노드의 next 노드를 할당(data가 2인 노드)
node.next = node3  # 현재노드(data가 1인 노드)의 다음노드를 node3으로 할당
node3.next = node_next # node3의 next를 data가 2인 노드로 할당

In [150]:
node = head
while node.next: 
    print(node.data) 
    node = node.next 
print(node.data) 

1
1.5
2
3
4
5
6
7
8
9


#### 파이썬 객체지향 프로그래밍으로 링크드 리스트 구현하기

In [158]:
class Node:
    def __init__(self, data, next = None):
        self.data = data
        self.next = next

class NodeMgmt:
    def __init__(self, data):
        self.head = Node(data) # head 노드 생성

    def add(self, data):
        if self.head == '': # head가 없으면 head 노드 생성
            self.head = Node(data)
        else:
            node = self.head # node 는 head 노드
            while node.next: # node.next가 None이 아니면 반복
                node = node.next # None이 아니면 다음 노드로 이동 ! 
            node.next = Node(data) # 다음 노드가 없으면(None)이면 새로운 노드객체 생성
    
    def desc(self):
        node = self.head # node는 head 노드
        while node: # 
            print(node.data)
            node = node.next # 마지막 노드에서 node.next가 None이 되면서 반복문 탈출

In [156]:
l_list1 = NodeMgmt(0)
l_list1.desc()

0


In [157]:
for data in range(1, 10):
    l_list1.add(data)
l_list1.desc()

0
1
2
3
4
5
6
7
8
9


### 링크드 리스트의 복잡한 기능 2 : 특정 노드를 삭제

In [167]:
# 위 코드에서 delete 메서드 추가
class Node:
    def __init__(self, data, next = None):
        self.data = data
        self.next = next

class NodeMgmt:
    def __init__(self, data):
        self.head = Node(data) # head 노드 생성

    def add(self, data):
        if self.head == '': # head가 없으면 head 노드 생성
            self.head = Node(data)
        else:
            node = self.head # node 는 head 노드
            while node.next: # node.next가 None이 아니면 반복
                node = node.next # None이 아니면 다음 노드로 이동 ! 
            node.next = Node(data) # 다음 노드가 없으면(None)이면 새로운 노드객체 생성
    
    def desc(self):
        node = self.head # node는 head 노드
        while node: # 
            print(node.data)
            node = node.next # 마지막 노드에서 node.next가 None이 되면서 반복문 탈출
            
    def delete(self, data):
        if self.head == '': # head가 없으면
            print('해당 값을 가진 노드가 없습니다.')
            return # 빠져나오고
        
        if self.head.data == data: # head.data가 입력된 data와 같으면
            temp = self.head # temp에 head노드 할당
            self.head = self.head.next # head는 다음 노드로 이동(.next)
            del temp # temp변수는 메모리에서 삭제
        
        else:
            node = self.head # node에 head 노드 할당
            while node.next:
                if node.next.data == data: # 다음 노드의 데이터가 입력된 데이터면 삭제하고, 다다음 노드로 할당
                    temp = node.next
                    node.next = node.next.next
                    del temp
                    return
                else:
                    node = node.next # 반복문이 지속 될 동안 다음 노드로 계속 이동

In [168]:
l_list1 = NodeMgmt(0)
l_list1.desc() 

0


In [169]:
l_list1.head # head가 있음

<__main__.Node at 0x252cefd9a60>

In [170]:
l_list1.delete(0) 
l_list1.desc() # 정상적으로 삭제됨

In [174]:
# 새로운 링크드리스트 생성
l_list1 = NodeMgmt(0)
for data in range(1, 10):
    l_list1.add(data)
l_list1.desc()

0
1
2
3
4
5
6
7
8
9


In [175]:
l_list1.delete(7)

In [177]:
l_list1.desc() # 특정 노드 삭제됨

0
1
2
3
4
5
6
8
9


### 다양한 링크드 리스트 구조
- 더블 링크드 리스트(Doubly linked list) 기본 구조
    - 이중 연결 리스트라고도 함
    - 장점: 양방향으로 연결되어 있어서 노드 탐색이 양쪽으로 모두 가능
![출처: 위키패디아, 링크드리스트](https://upload.wikimedia.org/wikipedia/commons/5/5e/Doubly-linked-list.svg)

In [179]:
class Node:
    def __init__(self, data, prev = None, next = None):
        self.data = data
        self.prev = prev
        self.next = next
        
class NodeMgmt:
    def __init__(self, data):
        self.head = Node(data) # head 노드 지정
        self.tail = self.head # 아직 1개이므로 head == tail
        
    def insert(self, data):
        if self.head == None: # head가 없을경우 head 노드 지정
            self.head = Node(data)
            self.tail = self.head
            
        else: 
            node = self.head   
            while node.next: # node.next가 None이 아닐 때까지 반복 (뭔가 있을 떄만 반복)
                node = node.next # 즉, 맨 마지막 노드로 이동
            new = Node(data) # new에 새로운 노드 할당
            node.next = new # 다음 노드에 새로운 노드(new) 할당
            new.prev = node # 새로운 노드의 prev(None)에 현재 node 할당
            self.tail = new # tail을 new로 할당(맨 마지막)
            
    def desc(self):
        node = self.head
        while node:
            print(node.data)
            node = node.next

In [180]:
d_link = NodeMgmt(0)
for data in range(1, 10):
    d_link.insert(data)
d_link.desc()

0
1
2
3
4
5
6
7
8
9


## 해쉬 테이블(Hash Table)

### 해쉬 구조
- Hash Table: 키(key)에 데이터(value)를 저장하는 데이터 구조
    - key를 통해 바로 데이터를 받을 수 있어, 속도가 획기적으로 빨라짐
    - 보통 배열로 미리 Hash Table 사이즈만큼 생성 후에 사용(공간과 탐색 시간을 맞바꾸는 기법)
    - 파이썬에선 딕셔너리(Dictionaty) 타입

### 알아둘 용어
    - 해쉬(Hash): 임의 값을 고정 길이로 변환하는 것
    - 해쉬 테이블: 키 값의 연산에 의해 직접 접근이 가능한 데이터 구조
    - 해싱 함수: Key에 대해 산술 연산을 이용해 데이터 위치를 찾을 수 있는 함수
    - 해쉬 값(Hash Value) 또는 해쉬 주소(Hash Address): Key를 해싱 함수로 연산해서 해쉬 값을 알아내고, 이를 기반으로 해쉬 테이블에서 해당 Key에 대한 데이터 위치를 일관성 있게 찾을 수 있음
    - 슬롯(slot): 한 개의 데이터를 저장할 수 있는 공간
    - 저장할 데이터에 대해 Key를 추출할 수 있는 별도 함수도 존재할 수 있음

### 간단한 해쉬 예

In [36]:
# hash table 만들기
hash_table = list([0 for i in range(10)])
hash_table

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

In [37]:
# 간단한 해쉬 함수 생성
def hash_func(key):
    return key % 5

In [73]:
# 해쉬 테이블에 저장
d1 = 'Kim'
d2 = 'Lee'
d3 = 'Jung'
d4 = 'Park'

def storage_data(data, value):
    key = ord(data[0]) # ord() : 문자의 아스키코드 리턴
    hash_address = hash_func(key)
    hash_table[hash_address] = value
    
storage_data(d1, '1111')
storage_data(d2, '2222')
storage_data(d3, '3333')
storage_data(d4, '4444')

In [47]:
# 데이터 읽기
def get_data(data):
    key = ord(data[0])
    hash_address = hash_func(key)
    return hash_table[hash_address]

get_data(d1), get_data(d2)

('4444', '2222')

In [48]:
# 해쉬 테이블 출력해보기
for i in hash_table:
    print(i, end = ', ') 
# --> 'A'가 같음 => 충돌

4444, 2222, 0, 0, 3333, 0, 0, 0, 0, 0, 

### 자료구조 해쉬 테이블의 장단점과 주요 용도

- 장점
    - 데이터 저장/읽기 속도가 빠름(검색 속도가 빠름)
    - 키에 대해 중복 확인이 쉬움(중복 불허)
- 단점
    - 일반적으로 저장공간이 좀 더 많이 필요(보통 배열로 미리 Hash Table 사이즈만큼 생성 후에 사용(공간과 탐색 시간을 맞바꾸는 기법)
    - 여러 키에 해당하는 주소가 동일할 경우 충돌을 해결하기 위한 별도 자료구조가 필요
- 주요 용도
    - 검색이 많이 필요한 경우
    - 저장, 삭제, 읽기가 빈번한 경우
    - 캐쉬 구현시(중복 확인이 용이)

### 충돌 해결 알고리즘(좋은 해쉬 함수 사용하기)  
충돌 혹은 해쉬충돌

1. Chaining 기법
    - 개방 해슁 또는 Open Hashing 기법 중 하나: 해쉬 테이블 저장공간 외의 공간을 활용하는 기법
    - 충돌이 일어나면, 링크드 리스트를 사용하여 데이터를 추가로 뒤에 연결시켜서 저장하는 기법

In [137]:
# Chaining예시
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data) # hash(): 해쉬 키 생성

def hash_function(key):
    return key % 8

def save_data(data, value): # 데이터 저장시 else가 먼저오게 됨(처음부터 충돌 x)
    index_key = get_key(data) # 충돌시 구분하기 위한 용도
    hash_address = hash_function(index_key)
    # 2. 충돌이 있다면
    if hash_table[hash_address] != 0:  
        for index in range(len(hash_table[hash_address])): # 2. 해당 key의 value 길이만큼 반복
            # 들어온 데이터와 들어있는 데이터의 key가 같으면, 
            # value를 새로 들어온 데이터로 덮어쓰기, 
            if hash_table[hash_address][index][0] == index_key:
                hash_table[hash_address][index][1] = value # 
                return
        # (다차원 리스트형태)중복 key를 가진 리스트 뒤로 새로운 리스트 추가
        hash_table[hash_address].append([index_key, value])
    else:
        hash_table[hash_address] = [[index_key, value]] # 1. 충돌이 없다면 해당 key 값에 데이터를 다차원 리스트로 저장
                                                        # 이때 충돌시 구분하기 위해 만든 get_key를 key로, value를 value로 저장
        
def read_data(data):
    index_key = get_key(data) 
    hash_address = hash_function(index_key)
    # 
    if hash_table[hash_address] !=0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key:
                return hash_table[hash_address][index][1]
        return None
    else:
        return None
        

In [138]:
save_data('Dd', '123123')
save_data('Dc', '456456')

read_data('Dd'), read_data('Dc')

('123123', '456456')

In [139]:
hash_table

[0,
 0,
 0,
 0,
 0,
 0,
 0,
 [[2898998306947667287, '123123'], [-7245990823696102505, '456456']]]

2. Linear Probing 기법
- 폐쇄 해슁 또는 Close Hashing 기법 중 하나: 해쉬 테이블 저장공간 안에서 충돌 문제를 해결하는 기법
- 춛돌이 일어나면 해당 hash address의 다음 address부터 맨 처음 나오는 빈 공간에 저장하는 기법
    - 저장공간 활용도를 높일 수 있음

In [155]:
# Linear Probing 예시
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data) 

def hash_function(key):
    return key % 8

def save_data(data, value): # 데이터 저장시 else가 먼저오게 됨(처음부터 충돌 x)
    index_key = get_key(data) # 충돌시 구분하기 위한 용도
    hash_address = hash_function(index_key)
    # 충돌이 있다면
    if hash_table[hash_address] != 0:  
        for index in range(hash_address, len(hash_table)): # 현재 ~ 총 길이까지 반복
            # 비어있으면 데이터 저장
            if hash_table[index] == 0: 
                hash_table[index] = [index_key, value]
                return
            # 덮어쓰기
            elif hash_table[index][0] == index_key:
                hash_table[index][1] = value
                return
    # 충돌이 없다면 데이터 저장(2차원)
    else:
        hash_table[hash_address] = [index_key, value]                        
            
def read_data(data):
    index_key = get_key(data) 
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] !=0:
         for index in range(hash_address, len(hash_table)):
            if hash_table[index] == 0:
                return None
            elif hash_table[index][0] == index_key:
                return hash_table[index][1]
    else:
        return None

In [156]:
save_data('a', '123123')
save_data('ac', '456456')

read_data('a'), read_data('ac')

('123123', '456456')

In [157]:
hash_table

[0,
 0,
 [7529712385726969714, '123123'],
 [8622881162257811426, '456456'],
 0,
 0,
 0,
 0]

3. 빈번한 충돌을 개선하는 방법
    - 해쉬 함수를 재정의 및 해쉬 테이블 저장공간을 확대
    - 참고: 해쉬 함수와 키 생성 함수
        - 파이썬의 hash()함수는 실행할 때마다 값이 달라질 수 있음
        - 유명한 해쉬 함수들: SHA-1(Secure Hash Algorithm)
            - 어떤 데이터도 유일한 고정된 크기의 고정값을 리턴

In [161]:
# SHA-1
import hashlib

data = 'test'.encode() # str객체를 byte객체로 인코딩
hash_object = hashlib.sha1() # 어떤 해쉬 알고리즘?
hash_object.update(data) # 어떤 값을 해슁?
hex_dig = hash_object.hexdigest() # 16진수로 해쉬값을 리턴
hex_dig

'a94a8fe5ccb19ba61c4c0873d391e987982fbbd3'

In [163]:
# SHA-256
import hashlib

data = 'test'.encode() 
hash_object = hashlib.sha256()
hash_object.update(data)
hex_dig = hash_object.hexdigest()
hex_dig

'9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08'

### 시간복잡도

- 일반적인 경우(충돌x): O(1)
- 최악의 경우(충돌이 모두 발생): O(n)
> 해쉬테이블의 경우, 일반적인 경우를 기대하고 만들기 때문에 시간복잡도는 O(1)이라고 말할 수 있음  

검색에서 해쉬 테이블의 시간복잡도 예시
- 16개의 배열에 데이터를 저장하고, 검색 = O(n)
- 16개의 해쉬 테이블에 데이터를 저장하고, 검색 = O(1)

## 트리(Tree)

### 트리 구조
- 트리: Node와 Branch를 이용해서 사이클을 이루지 않도록 구성한 데이터 구조
- 실제로 어디에 많이 사용되나?
    - 트리 중 이진 트리(Binary Tree)형태의 구조로, 탐색(검색) 아고리즘 구현을 위해 많이 사용됨

### 알아둘 용어
- Node: 트리에서 데이터를 저장하는 기본 요소(데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
- Root Node: 트리 맨 위에 있는 노드
- Level: 최상위 노드를 Level 0으로 하였을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄
- Parent Node: 어떤 노드의 다음 레벨에 연결된 노드
- Child Node: 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node(Terminal Node): Chile Node가 하나도 없는 노드
- Sibling(Brother Node): 동일한 Parent Node를 가진 노드
- Depth: 트리에서 Node가 가질 수 있는 최대 Level
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdFGjNw%2Fbtrat1CPn7S%2F1RZDWszc1RfF9FE09V4a7K%2Fimg.png)

### 이진 트리와 이진 탐색 트리(Binary Search Tree)
- 이진 트리: 노드의 최대 Branch가 2인 트리
- 이진 탐색 트리(BST): 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
    - 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음
    ![그림](https://blog.penjee.com/wp-content/uploads/2015/11/binary-search-tree-insertion-animation.gif)

### 자료구조 이진 탐색 트리의 장점과 주요 용도
- 장점: 탐색 속도를 개선할 수 있음
- 주요 용도: 데이터 검색(탐색)  
- 이진트리 vs 배열(sorted)
![그림](https://blog.penjee.com/wp-content/uploads/2015/11/binary-search-tree-sorted-array-animation.gif)

### 파이썬 트리 구현

In [168]:
# 노드 클래스
class Node:
    def __init__(self, value):
        self.value = value
        self.left, self.right = None, None


In [172]:
# 이진 탐색 트리에 데이터 넣기
class NodeMgmt:
    def __init__(self, head):
        self.head = head # head 노드를 인수로 받아 저장
    
    def insert(self, value):
        self.current_node = self.head # Root 부터 시작
        while True:
            # 입력된 value가 현재 value보다 클 떄(오른쪽 노드로 갈 때)
            if value < self.current_node.value: 
                # 현재 left가 있으면, 해당 노드로 이동
                # 없으면, left에 새로운 노드 생성(인수로 받음 value가 들어간.)
                if self.current_node.left != None: 
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            # 왼쪽을 갈 때
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

In [173]:
# 노드 만들고
head = Node(1)
binary_tree = NodeMgmt(head)

In [171]:
# 데이터 넣자
binary_tree.insert(2)

In [175]:
# 이진 탐색 트리 탐색하기
# 이진 탐색 트리에 데이터 넣기
class NodeMgmt:
    def __init__(self, head):
        self.head = head # head 노드를 인수로 받아 저장
    
    def insert(self, value):
        self.current_node = self.head # Root 부터 시작
        while True:
            # 입력된 value가 현재 value보다 클 떄(오른쪽 노드로 갈 때)
            if value < self.current_node.value: 
                # 현재 left가 있으면, 해당 노드로 이동
                # 없으면, left에 새로운 노드 생성(인수로 받음 value가 들어간.)
                if self.current_node.left != None: 
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            # 왼쪽을 갈 때
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
                    
    def search(self, value):
        self.current_node = self.head # Root부터 시작
        while self.current_node:
            # 현재 value가 입력된 value면 True 리턴
            # 현재 value가 더 크면 오른쪽 노드로 이동
            # 현재 value가 더 작으면 왼쪽 노드로 이동
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False # 없으면 False 리턴

In [176]:
# 노드 만들고
head = Node(1)
binary_tree = NodeMgmt(head)
# 데이터 넣자
binary_tree.insert(2)
binary_tree.insert(1)
binary_tree.insert(5)
binary_tree.insert(-3)
binary_tree.insert(9)

In [177]:
binary_tree.search(-3)

True

#### 이진 탐색 트리 삭제
- 매우 복잡함. 경우를 나눠서 이해해보자

1. Leaf Node 삭제
- Leaf Node: Child Node가 없는 Node
- 삭제할 Node의 Parent Node가 삭제할 Node를 가르키지 않도록 한다.
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fef7U05%2Fbtq9kRgo73D%2FkofVkv1BketHB79L73I7BK%2Fimg.png)

2. Chile Node가 하나인 Node 삭제
- 삭제할 Node의 Parent Node가 삭제할 Node의 Child Node를 가리키도록 한다.
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F2Mg7N%2Fbtrax8g5FvJ%2FdHUltRUr28qJoZALoVkvbk%2Fimg.png)

3. Chile Node가 두 개인 Node 삭제
    1. 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
    2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
    ![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FYHihi%2FbtraBd92t9C%2FBuB1vJ3peadd9em20qQxv0%2Fimg.png)

#### 파이썬 트리 삭제 구현

In [183]:
# NodeMgmt
# 참고만
class NodeMgmt:
    def __init__(self, head):
        self.head = head # head 노드를 인수로 받아 저장
    
    def insert(self, value):
        self.current_node = self.head # Root 부터 시작
        while True:
            # 입력된 value가 현재 value보다 클 떄(오른쪽 노드로 갈 때)
            if value < self.current_node.value: 
                # 현재 left가 있으면, 해당 노드로 이동
                # 없으면, left에 새로운 노드 생성(인수로 받음 value가 들어간.)
                if self.current_node.left != None: 
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            # 왼쪽을 갈 때
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
                    
    def search(self, value):
        self.current_node = self.head # Root부터 시작
        while self.current_node:
            # 현재 value가 입력된 value면 True 리턴
            # 현재 value가 더 크면 오른쪽 노드로 이동
            # 현재 value가 더 작으면 왼쪽 노드로 이동
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False # 없으면 False 리턴
    
    
    def delete(self, value):
        # 0. 삭제할 Node가 없는 경우 False를 리턴 후 함수 종료
        searched = False
        self.current_node, self.parent = self.head, self.head

        while self.current_node:
            if self.current_node.value == value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left # 왼쪽 노드로 이동
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right # 오른쪽 노드로 이동
        
        if searched == False:
            return False
        
        # case1. 삭제할 Node가 Leaf Node인 경우
        if self.current_node.left == None & self.current_node.right == None:
            # 현재 value가 parent 노드의 value보다 작으면 parent 노드의 left 를 삭제
            if value < self.parent.value:
                self.parent.left = None
            else:
                self.parent.right = None
                
        # case2. 삭제할 Node가 Child Node를 한 개 가지고 있을 경우
        # left
        elif self.current_node.left != None & self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = self.cuurent_node.left
            else: 
                self.parent.right = self.cuurent_node.left
        # right
        elif self.current_node.left == None & self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.cuurent_node.right
            else: 
                self.parent.right = self.cuurent_node.right
                
        # case3. 삭제할 Node가 Child Node를 두 개 가지고 있을 경우
        elif self.current_node.left != None & self.current_node.right != None:
        
        # case3.1: 삭제할 Node의 오른쪽 자식 중 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다
            if value < self.parent.value: 
                self.change_node = self.current_node.right 
                self.change_node_parent = self.current_node.right 
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node 
                    self.change_node = self.change_node.left 
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right 
                else:
                    self.change_node_parent.left = None
                self.parent.left = self.change_node
                self.change_node.right = self.current_node.right
                self.change_node.left = self.change_node.left
        
        # case3.2: 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
            else: 
                self.change_node = self.current_node.right 
                self.change_node_parent = self.current_node.right 
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node 
                    self.change_node = self.change_node.left 
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None
                    self.parent.right = self.change_node 
                    self.change_node.right = self.current_node.right 
                    self.change_node.left = self.current_node.left 
                    
        return True            

### 이진 탐색 트리의 시간복잡도와 단점

1. 시간복잡도(탐색시)
- depth를 h라고 표기한다면, O(h)
- n개의 노드를 가진다면 h = log<sub>2</sub>n에 개까우므로, 시간 복잡도는 O(logn)
    - 참고: 빅오 표기법에서 logn에서의 log 밑은 10이 아니라 2임 -> 한번 실행시 50%의 실행할 수도 있는 명령을 제거한다는 의미(50%의 실행시간을 단축)

2. 단점
- 평균 시간 복잡도는 O(logn) 이지만 ,
- 이는 트리가 균형잡혀 있을 때의 평균 시간 복잡도이며, 
- 다음 사진과 같이 구성되어 있을 경우, 최악의 경우 링크드 리스트 등과 동일한 성능을 보여줌(O(n))  
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FHLi3D%2FbtraEfeW7PE%2FQmpZJ0WvDxluonwKwqvbR0%2Fimg.png)

## 힙(Heap)

### 힙 이란?
- 힙: 데이터에서 최대값과 치소값을 빠르게 찾기 위해 고안된 완전 이진 트리(Complete Binary Tree)
    - 완전 이진 트리: 노드를 삽입할 때 최하단 왼쪽 노드부터 차례대로 삽입하는 트리
    ![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcJ9BMD%2Fbtrat3giOBN%2FnPJDhzEvxeBLGxnPxNxrC0%2Fimg.png)
    - 힙을 사용하는 이유
        - 배열에 데이터를 넣고, 최대값과 최소값을 찾으려면 O(n)이 걸림
        - 이에 반해, 힙에 데이터를 넣고, 최대값과 최소값을 찾으면 O(logn)이 걸림
        - 우선순위 큐와 같이 최대값 또는 최소값을 빠르게 찾아야 하는 자료구조 및 알고리즘 구현 등에 활용됨

### 힙 구조
- 힙은 최대값을 구하기 위한 구조(최대 힙, Max Heap)와, 최소값을 구하기 위한 구조(최소 힙, Min Heap)로 분류할 수 있음
- 힙은 다름과 같이 두 가지 조건을 가지고 있는 자료구조임
    1. 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 크거나 같다(최대 힙의 경우) <-> 최소 힙
    2. 완전 이진 트리 형태를 가짐
- 힙과 이진 탐색 트리의 공통점과 차이점
    - 공통점: 힙과 이진 탐색 트리 모두 이진 트리임
    - 차이점:
        - 힙은 각 노드의 값이 자식 노드보다 크거나 같음(최대 힙의 경우) <-> 최소 힙
        - 이진 탐색 트리는 왼쪽 자식 노드의 값이 가장 작고, 그 다음 부모 노드, 그 다음 오른쪽 자식 노드 값 순서
        - 힙은 이진 탐색 트리의 조건인 자식 노드에서 작은 값은 왼쪽, 큰 값은 오른쪾이라는 조건은 없음
            - 힙의 왼쪽 및 오른쪽 자식 노드의 값은 오른쪽이 클 수도 있고, 왼쪽이 클 수도 있음
        - **이진 탐색 트리는 탐색을 위한 구조, 힙은 최대/최소값 검색을 위한 구조라고 이해하면 됨**
        ![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FtQ8iu%2FbtraEe8bu5I%2FwnbrrmSXLeS8gmJBgEMKM1%2Fimg.png)

### 힙 동작
- 다음 그림들은 데이터를 힙 구조에 삽입, 삭제하는 과정임

힘에 데이터 삽입하기 - 기본 동작
- 힙은 완전 이진 트리이므로, 삽일할 노드는 기본적으로 왼쪽 최하단부 노드부터 채워지는 형태로 삽입
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FkKXcI%2Fbtrat2BHFYC%2FesFhpr8EYEsqTIfyZCL5EK%2Fimg.png)

힙에 데이터 삽입 - 삽입할 데이터가 힙의 데이터보다 클 경우(Max Heap)
- 먼저 삽입된 데이터는 완전 이진 트리의 구조에 맞추어 최하단부 왼쪽 노드부터 채워짐
- 채워진 노드 위치에서 부모 노드보다 값이 클 경우, 부모 노드와 위치를 바꿔주는 작업을 반복
![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbMlYCy%2FbtrawCoL2zN%2FgTeOAEtje3wg3Flrn0XsU1%2Fimg.png)

힙의 데이터 삭제 - (Max Heap)
- 보통 삭제는 Root 노드를 삭제하는 것이 일반적임
    - 힙의 용도는 최대값 or 최소값을 Root 노드에 놓아서, 최대값과 최소값을 바로 꺼내 쓸 수 있도록 하는 것
- 상단의 데이터 삭제 후, 가장 최하단부 왼쪽에 위치한 노드(일반적으로 가장 마지막에 추가한 노드)를 Root노드로 이동
- Root 노드의 값이 Child 노드보다 작을 경우, Root 노드와 Child 노드 중 가장 큰 값을 가진 노드와 Root 노드 위치를 바꿔주는 작업을 반복함(swap)
![그림](https://www.fun-coding.org/00_Images/heap_remove.png)

### 힙 구현
- 일반적으로 힙 구현시 배열 자료구조를 활용함
- 배열은 인덱스가 0번부터 시작하지만, 힙 구현의 편의를 위해 Root 노드 인덱스 번호를 1로 지정하면 좀 더 편함
    - 부모 노드 인덱스 번화 = 자식 노드 인덱스 번호 // 2
    - 왼쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2
    - 오른쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2 + 1
    ![그림](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FnbMcj%2FbtraqruzgOd%2F4qKQKOZaYWSjFXJBoSM6YK%2Fimg.png)

In [186]:
# 힙 클래스 구현1
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 0번째 인덱스 비워줌
        self.heap_array.append(data)

In [187]:
heap = Heap(1)
heap.heap_array

[None, 1]

In [188]:
# 힙 클래스 구현2 - insert1
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 0번째 인덱스 비워줌
        self.heap_array.append(data)
        
    def insert(self, data):
        if len(self.heap_array) == 1:
            self.heap_array.append(data)
            return True
        
        self.heap.array.append(data)
        return True

힙 클래스 구현3 - insert2  
- 삽입한 노드가 부모 노드의 값보다 클 경우, 부모 노드와 삽입한 노드의 위치를 바꿈
- 삽입한 노드가 루트 노드가 되거나 부모 노드보다 값이 작거나 같을 경우까지 반복

In [195]:
# 힙 클래스 구현3 - insert2
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 0번째 인덱스 비워줌
        self.heap_array.append(data)
    
    def move_up(self, inserted_idx):
        if inserted_idx <= 1:
            return False
        parent_idx = inserted_idx // 2
        # 인수로 받은 인덱스의 값이 부모 인덱스 값보다 클 경우, True 반환(위치 바꿀 대상)
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False
    
    def insert(self, data):
        if len(self.heap_array) == 1:
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data) # 맨 뒤에(맨 왼쪽 아래)데이터 추가
        inserted_idx = len(self.heap_array) - 1 
        
        # inserted_idx가 부모 인덱스 값보다 클경우 스왑 반복
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            # 바꿔주기(스왑)
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        return True

In [196]:
heap = Heap(15)
heap.insert(8)
heap.insert(5)
heap.insert(3)
heap.insert(2)
heap.insert(7)
heap.heap_array

[None, 15, 8, 7, 3, 2, 5]

힙 클래스 구현4 - delete1

In [197]:
# 힙 클래스 구현4 - delete1
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 0번째 인덱스 비워줌
        self.heap_array.append(data)
        
    # 일반적으로 Root를 삭제함    
    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        returned_data = self.heap_array[1]
        return returned_data

힙 클래스 구현5 - delete2

In [211]:
# 힙 클래스 구현5 - delete2
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 0번째 인덱스 비워줌
        self.heap_array.append(data)
    
    ### 추가된 코드 ###
    def move_down(self, popped_idx):
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1
        if left_child_popped_idx >= len(self.heap_array):
            return False
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                return True
            else:
                return False
        else:
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            else:
                if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                    return True
                else:
                    return False
    
    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        returned_data = self.heap_array[1]
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1]
        popped_idx = 1
        
        while self.move_down(popped_idx):
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1
            if right_child_popped_idx >= len(self.heap_array):
                self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                popped_idx = left_child_popped_idx
            else:
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                else:
                    self.heap_array[popped_idx], self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                    popped_idx = right_child_popped_idx
                    
        return returned_data
    
    
    ### 기존 코드 ###
    def move_up(self, inserted_idx):
        if inserted_idx <= 1:
            return False
        parent_idx = inserted_idx // 2
        # 인수로 받은 인덱스의 값이 부모 인덱스 값보다 클 경우, True 반환(위치 바꿀 대상)
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False
    
    def insert(self, data):
        if len(self.heap_array) == 1:
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data) # 맨 뒤에(맨 왼쪽 아래)데이터 추가
        inserted_idx = len(self.heap_array) - 1 
        
        # inserted_idx가 부모 인덱스 값보다 클경우 스왑 반복
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            # 바꿔주기(스왑)
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        return True

In [212]:
heap = Heap(15)
heap.insert(8)
heap.insert(5)
heap.insert(3)
heap.insert(2)
heap.insert(7)
heap.heap_array

[None, 15, 8, 7, 3, 2, 5]

In [213]:
heap.pop()

15

In [214]:
heap.heap_array

[None, 8, 5, 7, 3, 2]

### 힙 시간복잡도
- depth를 h라고 표기한다면,
- n개의 노드를 가지는 heap에 데이터 삽입 또는 삭제시, 최악의 경우 Root 노드에서 leaf 노드까지 비교해야 하므로 h = log<sub>2</sub>n에 가까움. 시간복잡도는 O(logn)
     - 참고: 빅오 표기법에서 logn에서의 log 밑은 10이 아니라 2임 -> 한번 실행시 50%의 실행할 수도 있는 명령을 제거한다는 의미(50%의 실행시간을 단축)

## 알고리즘 복잡도(공간 복잡도)

- 알고리즘 계산 복잡도는 다음 두 가지 척도로 표현됨
    - 시간 복잡도: 얼마나 빠르게 실행되는지
    - 공간 복잡도: 얼마나 많은 저장 공간이 필요한지
> 좋은 알고리즘은 실행 시간도 짧고, 저장 공간도 적게 쓰는 알고리즘

- 그러나 통상 둘 다를 만족시키기는 어려움
    - 시간과 공간은 반비례적 경향이 있음
    - 최근 대용량 시스템이 보편화되면서, 공간 복잡도보다는 시간 복잡도가 우선
    - 따라서 알고리즘은 시간 복잡도가 중심

- 공간 복잡도 대략적인 계산은 필요함
    - 기존 알고리즘 문제는 예전에 공간 복잡도도 고려되어야 할 때 만들어진 경우가 많음
        - 공간 복잡도 제약 사항이 있는 경우가 있음
    - 면접시에도 공간 복잡도를 묻는 경우가 있음

- Complexity:
    - expected worst-case time complexity: O(N)
    - expected worst-case space complexity: O(N)
>.현업에서 최근 빅데이터를 다룰 떈 저장 공간을 고려해서 구현하는 경우도 있음

#### 공간 복잡도
- 프로그램을 실행 및 완료하는 데 필요한 저장공간의 양
- 총 필요 저장공간
    - 고정 공간(알고리즘과 무관): 코드 저장 공간, 단순 변수 및 상수
    - 가변 공간: 실행 중 동적으로 핑효한 공간
    - S(P) = c + S<sub>p</sub>(n)
        - c: 고정공간
        - S<sub>p</sub>(n): 가변공간