# Recursion 

## What is Recursion

**재귀(Recursion)**은 어떠한 것을 정의할 때 자기 자신을 참조하는 것을 뜻한다. 컴퓨터 과학에 있어서 재귀는 자신을 정의할 때 자기 자신을 재참조하는 방법을 뜻하며, 이를 프로그래밍에 적용한 **재귀 호출(Recursive call)**의 형태로 많이 사용된다.

**재귀함수(Recursive algorithm)**는 자신을 무한히 참조할 수 있기 때문에, 무한히 참조하는 상황을 방지하기 위해 **base case** 조건을 사용해서 문제가 간단해졌다고 생각되는 지점에서 함수를 종료하게 된다.

파이썬 인터프리터를 실행하게 되면 **call stack**이라고 불리는 인메모리를 함수를 실행하고 불러오는데 사용한다. base case 없이 재귀함수를 작성하게 되면 무한히 call stack에 push 하기 때문에 모든 메모리를 소진하게 된다. 이 현상을 **stack overflow**라고 한다.

stack overflow가 발생하면 파이썬은 **Recursion Error**를 출력한다. 

## Recursive Sum 

```Python
def recursive_sum(values) : 
    if not values : 
        return 0
    return values[0] + recursive_sum(values[1:])
```

recursive_sum 함수 내부의 if statement는 base case로 재귀함수를 종료하는 조건을 의미한다. recursive_sum 내부에서는 더이상 추가로 더할 수 없는 원소가 없는 리스트에 대해서 재귀함수를 종료하게 된다.

recursive_sum 함수는 리스트 내부에 원소가 존재할 경우 return statement에서 자기 자신을 계속 참조하게 된다. 이때 다시 불러오는 리스트의 원소는 하나씩 줄어들기 때문에 문제가 간단해지는 효과가 있다. 

```Python
def list_sum(lst) : 
    if not lst :
        return 0
    retirm 1 + list_sum(lst) 
```

## Towers of Hanoi

하노이 타워 문제는 재귀함수의 대표적인 예시이다. 모든 디스크는 가장 큰 디스크부더 낮은 디스크 순으로 쌓여있고, 문제의 목표는 같은 순서대로 A막대에서 C막대로 디스크를 옮기는 것이다. 문제에는 두 가지 규칙이 존재한다.

1. 디스크는 한번에 하나씩만 움직일 수 있다.
2. 작은 디스크위에 큰 디스크를 올릴 수 없다.

문제를 해결하기 위해 문제를 작은 단위로 분해하면 다음의 단계를 적용할 수 있다.

1. 첫번째 하위 문제는 가장 밑에 있는 디스크를 제외한 모든 디스크를 중간 막대로 옮긴다. 
2. 두번째 하위 문제는 가장 밑에 있는 디스크를 제외한 모든 디스크를 마지막 막대 옮긴다. 
3. 세번째 하위 문제는 중간 막대에 있는 모든 디스크를 마지막 막대로 옮긴다. 
4. 첫번째, 세번째 단계를 각각 재귀적으로 적용하여 가장 밑에 있는 디스크를 마지막 막대로 옮긴다. 

```Python
def solve_hanoi(num_disks, first_peg, middle_peg, last_peg) : 
    if num_disks == 1 :
        print(f"Move the top disk from peg {first_peg} to peg {lasg_peg}.")
    else : 
        solve_hanoi(num_disks-1, first_peg, last_peg, middle_peg)
        solve_hanoi(1, first_peg, middle_peg, last_peg)
        solve_hanoi(num_disks-1, middle_peg, first_peg, last_peg)
        
solve_hanoi(4, 'A', 'B', 'C')
```

## Listing All Files in a Directory

다음 코드는 주어진 폴더 내부를 재귀적으로 조회하여 모든 파일을 조회하는 코드이다. list_files 재귀 함수 내부에서 사용할 메소드는 다음과 같다. 

- os.listdir(current_path) : 주어진 경로 내부의 모든 컨텐츠를 리스트로 return 한다. 
- os.path.isdir(current_path) : 주어진 경로가 디렉토리일 경우 True를, 파일일 경우 False를 return하여 base case에 사용한다. 
- os.path.join(current_path) : 두 경로를 합쳐 하나의 경로로 return 한다. 

```Python
import os 

def list_files(current_path) : 
    if not(os.path.isdir(current_path)) : 
        print(current_path)
    else : 
        for name in os.listdir(current_path) : 
            list_files(os.path.join(current_path, name)
```

## Merge Sort 

**Merge sort**알고리즘은 정렬 알고리즘의 하나로, 리스트의 인덱스를 재귀적으로 절반으로 나눈 뒤 각각의 리스트를 정렬하고 하나의 정렬된 리스트로 병합하는 알고리즘이다. 정렬된 두 리스트를 하나의 정렬된 리스트로 병합하는 과정은 다음과 같다. 

```Python
def merged_sorted_lists(list1, list2) : 
    index1 = 0
    index2 = 0
    merged_list = []
    
    while (index1 < len(list1)) and (index2 < len(list2)) : 
        if list1[index1] <= list2[index2] : 
            merged_list.append(list1[index1])
            index1 += 1
        else : 
            merged_list.append(list2[index2])
            index2 += 1
    merged_list += list1[index1:]
    merged_list += list2[index2:]
    return merged_list 
```

단일 리스트를 받았을 때, 두개의 리스트로 나누어 정렬하는 알고리즘은 다음과 같다. 완성된 알고리즘은 $O(N*log(N))$의 시간복잡도를 갖게 된다. 

```Python
def merge_sort(values) : 
    if len(values) < 2 : 
        return values 
    midpoint = len(values) //2 
    sorted_first_half = merge_sort(values[:midpoint])
    sorted_second_half = merge_sort(values[midpoint:])
    return merged_sorted_lists(sorted_first_half, sorted_second_half)

```

# Introduction to Binary Trees

## What is Tree Structure

기존에 학습했던 Linked List, Stack, Queues, Dictionary의 자료구조는 선형 구조로 되어있어, 자료를 검색할 때 모든 값을 순환해야 했다. **트리 구조(Tree)**는 하나 이상의 계승자로 이루어져 계층적으로 데이터를 검색할 수 있다. 즉, **이진 트리(Binary Tree)**의 경우 계승자의 수가 대부분 2개라는 의미이다.

트리 구조의 각각의 요소를 **노드(Node)**라고 하고, 노드의 계승자를 **자식(Children)**이라고 한다. 최상위 노드는 **루트(Root)**라고 하며 자식을 가지고 있지 않는 노드를 **잎(Leaves)**라고 한다. 또한 모든 부모, 자식 노드를 **내부 노드(Internals)**라고 한다. 

## Node 

이진 트리 구조는 리스트를 사용해서 데이터를 저장한다. 리스트의 각 원소는 Linked List 처럼 서로 참조 관계를 통해 정의 된다. 관례상 left_child, right_child로 정의하여 참조한다. 

```Python
class Node 
    def __init__(self, value) : 
        self.value = value 
        self.left_child = None
        self.right_child = None 
```

## Binary Search Tree 

자동으로 이진 트리 구조를 만들고 값을 검색하기 위해 **이진 검색 트리(Binary Search Tree)** 클래스를 생성한다. 일반적으로 부모의 값을 기존으로 작으면 left_child, 크면 right_child에 노드를 재귀적으로 할당한다. 이 속성을 가진 트리 구조를 이진 검색 트리라고 한다. 

### BST Inserting Value 

BST에 값을 할당하는 메소드를 생성하기 위해선 다음의 Workflow가 필요하다. 

1. root에 노드가 존재하지 않는 경우 root에 생성한 노드를 넣는다.
2. root에 노드가 존재하는 경우,
    1. 입력된 값이 노드의 값보다 작거나 같은 경우 왼쪽으로 이동한다.
        1. 현재 노드의 left_child가 None이라면 새로운 노드를 생성해서 현재 노드의 left_child로 설정한다.
        2. 현재 노드의 left_chlid가 None이 아니면 재귀적으로 현재 노드의 left_child로 이동해서 2-1을 수행한다.
    2. 입력된 값이 노드의 값보다 큰 경우 오른쪽으로 이동한다.
        1. 현재 노드의 right_child가 None이라면 새로운 노드를 생성해서 현재 노드의 right_child로 설정한다.
        2. 현재 노드의 right_child가 None이 아니면 재귀적으로 현재 노드의 right_child로 이동해서 2-2를 수행한다.
    3. 이동은 프로세스의 현재 노드에 값이 없을경우 종료한다.

```Python
class BST : 
    def __init__(self) : 
        self.root = None 
    
    def add(self, value) : 
        if self.root is None : 
            self.root = Node(value)
        else : 
            self.add_recursive(self.root, value) 
    
    def add_recursive(self, current_node, value) :
        if value <= current_node.value :
            if current_node.left_child is None :
                current_node.left_child = Node(value)
            else : 
                self.add_recursive(current_node.left_child, value) 
        else : 
            if current_node.right_child is None : 
                current_node.right_child = Node(value) 
            else : 
                self.add_recursive(current_node.right_child, value)      
```

### BST Contains 

이진 트리에 해당 값이 있는지 확인하는 메소드는 add 메소드의 방식과 동일하다. 값을 재귀적으로 비교하면서 노드를 이동하여 해당 값이 있을 경우 True를, 없다면 False를 리턴한다. Workflow는 다음과 같다. 

1. BST에 노드가 없다면 False를 리턴한다.
2. BST에 노드가 있다면 노드를 재귀적으로 이동한다. 
    1. 값이 같을 경우 True를 리턴한다.
    2. 값이 현재 노드의 값보다 작거나 같을 경우 left_chlid로 이동한다. 
    3. 값이 현재 노드보다 클 경우 right_child로 이동한다. 
    
```Python
class BST:
    
    def __init__(self):
        self.root = None
        
    def add(self, value):
        if self.root is None:
            # The root does exist yet, create it
            self.root = Node(value)
        else:
            # Find the right place and insert new value
            self.add_recursive(self.root, value)
            
    def add_recursive(self, current_node, value):
        if value <= current_node.value:
            # Go to the left
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self.add_recursive(current_node.left_child, value)
        else:
            # Go to the right
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self.add_recursive(current_node.right_child, value)
            
    def contains(self, current_node, value) : 
        if current_node is None : 
            return False 
        else : 
            if value == current_node.value : 
                return True 
            elif value <= current_node.value : 
                return self.contains(current_node.left_child, value)
            else : 
                return self.contains(current_node.right_child, value)
```

## Polishing the Implementation

add_recursive() 메소드는 BST 클래스 내부에서만 사용되는 메소드이기 때문에 클래스 외부에서 사용될 필요가 없으므로 앞에 \_를 붙여 사용되는 것을 방지한다. contains() 메소드 또한 current_node를 BST.root로 고정하기 위해 추가적인 메소드를 사용한다. 

```Python
class BST:
    
    def __init__(self):
        self.root = None
        
    def add(self, value):
        if self.root is None:
            # The root does exist yet, create it
            self.root = Node(value)
        else:
            # Find the right place and insert new value
            self._add_recursive(self.root, value)
            
    def _add_recursive(self, current_node, value):
        if value <= current_node.value:
            # Go to the left
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self._add_recursive(current_node.left_child, value)
        else:
            # Go to the right
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self._add_recursive(current_node.right_child, value)
                
    def _contains(self, current_node, value):
        if current_node is None:
            return False
        if current_node.value == value:
            return True
        if value < current_node.value:
            return self._contains(current_node.left_child, value)
        return self._contains(current_node.right_child, value)
    
    def contains(self, value) : 
        return self._contains(self.root, value)
```

## Advantages of using BST 

값을 삽입하고 검색한다고 할 때 최악 시간 복잡도는 O(N)으로 트리 구조의 높이가 가장 높을 때를 기준으로 한다. 가장 높이가 낮은 트리의 경우 2번의 검색으로 값을 찾을 수 있다. 

이상적인 나무구조는 계층이 증가할 때마다 자식 노드의 개수가 이전 노드에 비해 두개씩 분할되는 구조이다. 이때 전체 노드의 개수는 각각의 계층에 있는 전체 노드 수의 합이다. 예를 들어 h개의 계층이 존재한다고 할때 저장하고 있는 모든 노드의 수는 다음과 같다.

$$ n = 2^h - 1$$

따라서 최선의 경우에 값을 검색하는 시간 복잡도는 로그 복잡도를 따르고 있음을 알 수 있다.

# Working with Binary Search Trees

## What is AVL Trees 

이진 검색 트리는 데이터의 입력 순서에 따라 트리의 구조가 결정되게 된다. 따라서 로그 시간복잡도에서부터 선형 시간복잡도 까지 다양한 시간 복잡도가 존재하게 된다. AVL Tree 알고리즘은 기존의 BST에서 확장하여 항상 로그 시간복잡도를 갖는 이진 트리 구조를 설계한다.

클래스를 정의할 때 다른 클래스로부터 불러올 경우 super()를 사용한다. 즉 super()은 parent self를 의미한다. AVL Tree를 정의하기 위해 Node를 확장한 AVLNODE 클래스를 정의한다.

```Python
from bst import Node, BST

class AVLNode(Node) : 
    def __init__(self, value) : 
        super().__init__(value)  
        self.height = 1 
        self.imbalance = 0
```

## Node Height and Imbalance 

### Node Height 

**Height of node**는 트리 구조의 높이로 작동하게 된다. 기존의 높이와의 차이점은, 루트가 아닌 특정 노드에서 잎까지의 가장 긴 높이를 가진 노드의 수를 측정하는 것이다. 따라서 한 노드의 왼쪽 오른쪽 자식 노드의 높이를 알고 있다면 그 두 높이중 더 큰 길이를 1에 더함으로써 해당 노드의 높이를 계산할 수 있다.

$$height(node) = 1 + max(height(node.left - chlid), height(node.right - child))$$

### Node Imbalance 

**Node Imbalance**는 왼쪽 하위 나무와 오른쪽 하위 나무의 높이의 차이를 의미한다.

$$imbalance(node) = height(node.left - child) - height(node.right - child)$$

```Python
class AVLNode(Node):
    
    def __init__(self, value):
        super().__init__(value)
        self.height = 1
        self.imbalance = 0
        
    def calculate_height_and_imbalance(self) :
        if self.left_child is None : 
            left_height = 0 
        else : 
            left_height = self.left_child.height
            
        if self.right_child is None : 
            right_height = 0 
        else : 
            right_height = self.right_child.height 
            
        self.height = 1 + max(left_height, right_height) 
        self.imbalance = left_height - right_height
```

## AVL Trees 

### Keeping Height and Imbalance updated 

노드의 높이는 새로운 값을 추가할때마다 변해야한다. 따라서 BST 내부의 self.\_add\_recursive() 메소드를 변경해서 hieght와 imbalance가 업데이트 되도록 해야 한다. Node 클래스를 확장시켜 AVLNode를 생성한 것과 같이 BST클래스를 확장시켜 AVLTree 클래스를 생성한다. 자식 클래스에 부모 클래스를 불러와 작성하면 부모클래스의 메소드위에 덮어 씌워 사용할 수 있다. 

```Python
class AVLTree(BST) : 
    def __init__(self) : 
        super().__init__() 
    
    def _add_recursive(self, current_node, value) : 
        if current_node is None : 
            return AVLNode(value) 
        if value <= current_node.value : 
            current_node.left_child = self._add_recursive(current_node.left_child, value) 
        else : 
            current_node.right_child = self._add_recursive(current_node.right_child, value) 
            
        current_node.calculate_height_and_imbalance()
        return current_node 
    
    def get_height(self) : 
        return self.root.height
```

### Imbalance and Height Relation

AVLNode의 imbalance는 하위 트리의 왼쪽 오른쪽으로 편향을 확인할 수 있다. imbalance가 0일 경우, 왼쪽 오른쪽의 하위 트리는 동일한 높이를 가지고 있다는 뜻이다. 음수와 양수의 경우 각각 왼쪽과 오른쪽으로의 편향을 의미하게 된다. AVLTree의 전략은 모든 노드의 imbalance 값이 -1, 0, 1 중 하나만 가지도록 실행계획을 짜는 것이다. 

### Left Rotation

자동으로 균형적인 트리를 구조하기 위해, **Left Rotation**라는 방법을 사용한다. Left Rotation 방법에서 내부에서 회전하는 오른쪽 노드를 pivot이라고 한다. Left Rotation을 적용하면 회전하는 노드는 pivot 노드의 왼쪽 자식이 되고, pivot 노드의 왼쪽 자식은 node의 오른쪽 자식이 된다. Left Rotation을 적용하기 위해 AVLTree는 다음을 만족해야 한다. 

- Pivot 노드의 value는 node의 value 보다 항상 크다. 따라서 node는 pivot 노드의 왼쪽 자식이 될 수 있다.
- node.left의 값은 node보다 항상 작다.
- pivot.left의 값은 미리 node의 오른쪽 자식에 위치한다.
- pivot.left의 값은 pivot 노드의 값보다 항상 작다. 

```Python
class AVLTree(BST):
    
    def __init__(self):
        super().__init__()
        
    def _add_recursive(self, current_node, value):
        if current_node is None:
            return AVLNode(value)
        if value <= current_node.value:
            current_node.left_child = self._add_recursive(current_node.left_child, value)
        else:
            current_node.right_child = self._add_recursive(current_node.right_child, value)
        current_node.calculate_height_and_imbalance() 
        return current_node
        
    def get_height(self):
        return self.root.height
    
    def _rotate_left(self, node) : 
        pivot = node.right_child
        node.right_child = pivot.left_child
        pivot.left_child = node 
        
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
```

### Right Rotation

Right Rotation은 Left Rotation과 유사하게 작동하며 차이점은 회전하는 노드의 왼쪽 자식에 pivot 노드가 위치하고 있다는 것이다. Right Rotation 내부에서 node의 왼쪽 자식이 pivot이 되며, pivot의 오른쪽 자식이 node의 왼쪽 자식이 된다. 

```Python
class AVLTree(BST):
    
    def __init__(self):
        super().__init__()
        
    def _add_recursive(self, current_node, value):
        if current_node is None:
            return AVLNode(value)
        if value <= current_node.value:
            current_node.left_child = self._add_recursive(current_node.left_child, value)
        else:
            current_node.right_child = self._add_recursive(current_node.right_child, value)
        current_node.calculate_height_and_imbalance() 
        return current_node
        
    def get_height(self):
        return self.root.height
    
    def _rotate_left(self, node):
        pivot = node.right_child
        node.right_child = pivot.left_child
        pivot.left_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
    
    def _rotate_right(self, node):
        pivot = node.left_child
        node.left_child = pivot.right_child
        pivot.right_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
```

## Balancing the Tree 

앞서 Left, Right Rotation을 적용하기 위해 사용했던 트리 구조에서 조건에 따라 적절한 Rotation을 사용하는 메소드를 작성한다고 한다. node의 imbalace값이 2이고, pivot의 imbalance 값이 1이라면, Rotation을 적용하기 위한 imbalance 값의 방정식은 다음과 같다. 

$$height(pivot) = 2 + height(node.right)$$
$$height(pivot.left) = 1 + height(pivot.right)$$

이때, pivot.left의 상위 노드는 pivot이기 떄문에 다음과 같은 방정식을 생성할 수 있다. 

$$ height(pivot) = 1 + height(pivot.left) = 2 + height(pivot.right)$$
$$ height(pivot.right) = height(node.right)$$

따라서 Right Rotation이후에 pivot.right와 node.right의 imbalance 값은 0 임을 알 수 있다. Roation이후의 pivot의 imblance 값은 다음과 같다.

$$ height(node) = 1 + height(pivot.right)$$
$$height(pivot.left) = 1 + height(pivot.rithg)$$
$$height(node) = height(pivot.left)$$

따라서 pivot의 imblance는 0이 되어 밸런싱 된 트리를 생성할 수 있다. 

추가적으로 node의 imbalance가 2이고, pivot의 imblance가 -1인 경우에는 바로 Right Rotation을 적용하면 안된다. 이전과 같이 높이를 기준으로 계산을 해봤을 때, 고정되어 있어야 할 pivot.left의 height가 nod.right와 같기 때문이다. 따라서 이 경우에는 pivot에 대해서 left rotation을 적용해서 새로운 pivot의 imbalance를 1로 변경하고 right rotation을 적용해야 한다. 

```Python
class AVLTree(BST):
    
    def __init__(self):
        super().__init__()
        
    def _add_recursive(self, current_node, value):
        if current_node is None:
            return AVLNode(value)
        if value <= current_node.value:
            current_node.left_child = self._add_recursive(current_node.left_child, value)
        else:
            current_node.right_child = self._add_recursive(current_node.right_child, value)
        current_node.calculate_height_and_imbalance() 
        return current_node
        
    def get_height(self):
        return self.root.height
    
    def _rotate_left(self, node):
        pivot = node.right_child
        node.right_child = pivot.left_child
        pivot.left_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
    
    def _rotate_right(self, node):
        pivot = node.left_child
        node.left_child = pivot.right_child
        pivot.right_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
    
    # Add method here
    def _balance(self, node):
        if node.imbalance == 2:
            pivot = node.left_child
            if pivot.imbalance == 1:
                return self._rotate_right(node)
            else : 
                node.left_child = self._rotate_left(pivot) 
                return self._rotate_right(node)

 

반대로 node의 imbalance가 -2 일때는 앞서 작성했던 코드와 비슷하게 작성을 한다. 다만 self.rotate_left(node)를 적용하고 -2, 1로 imbalance의 값이 일정하지 않을 경우 pviot에 대해 self._rotate_right(pivot)을 적용하고 left rotation을 시행한다.

 

class AVLTree(BST):
    
    def __init__(self):
        super().__init__()
        
    def _add_recursive(self, current_node, value):
        if current_node is None:
            return AVLNode(value)
        if value <= current_node.value:
            current_node.left_child = self._add_recursive(current_node.left_child, value)
        else:
            current_node.right_child = self._add_recursive(current_node.right_child, value)
        current_node.calculate_height_and_imbalance() 
        return current_node
        
    def get_height(self):
        return self.root.height
    
    def _rotate_left(self, node):
        pivot = node.right_child
        node.right_child = pivot.left_child
        pivot.left_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
    
    def _rotate_right(self, node):
        pivot = node.left_child
        node.left_child = pivot.right_child
        pivot.right_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot

    def _balance(self, node):
        if node.imbalance == 2:
            pivot = node.left_child
            if pivot.imbalance == 1:
                return self._rotate_right(node)
            else:
                node.left_child = self._rotate_left(pivot)
                return self._rotate_right(node)
        elif node.imbalance == -2: 
            pivot = node.right_child 
            if pivot.imbalance == -1:
                return self._rotate_left(node)
            else : 
                node.right_child = self._rotate_right(pivot)
                return self._rotate_left(node)
```

## Balancing on Insertion 

값을 삽입했을 때 AVLNode의 height와 imbalance 속성을 자동으로 업데이트 한 것처럼, 자동으로 밸런싱을 진행하도록 AVLTree.\_add\_recursive()메소드 내부에 imblance가 2 이상이 되면 AVLTree.\_balance() 메소드를 통해 imbalance가 -1, 1만을 갖도록 rotation을 진행하도록 한다. 

```Python
class AVLTree(BST):
    
    def __init__(self):
        super().__init__()
        
    def _add_recursive(self, current_node, value):
        if current_node is None:
            return AVLNode(value)
        if value <= current_node.value:
            current_node.left_child = self._add_recursive(current_node.left_child, value)
        else:
            current_node.right_child = self._add_recursive(current_node.right_child, value)
        current_node.calculate_height_and_imbalance() 
        
        if abs(current_node.imbalance) == 2 : 
            current_node = self._balance(current_node)         
        return current_node
        
    def get_height(self):
        return self.root.height
    
    def _rotate_left(self, node):
        pivot = node.right_child
        node.right_child = pivot.left_child
        pivot.left_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot
    
    def _rotate_right(self, node):
        pivot = node.left_child
        node.left_child = pivot.right_child
        pivot.right_child = node
        node.calculate_height_and_imbalance()
        pivot.calculate_height_and_imbalance()
        return pivot

    def _balance(self, node):
        if node.imbalance == 2:
            pivot = node.left_child
            if pivot.imbalance == 1:
                return self._rotate_right(node)
            else:
                node.left_child = self._rotate_left(pivot)
                return self._rotate_right(node)
        else:
            pivot = node.right_child
            if pivot.imbalance == -1:
                return self._rotate_left(node)
            else:
                node.right_child = self._rotate_right(pivot)
                return self._rotate_left(node)

# The AVLTree class is available
import random
test_values = [random.randrange(10000) for _ in range(1000)]

avl = AVLTree()
for value in test_values : 
    avl.add(value)
print(f"Totl height of root node is : {avl.get_height()}")

# Output : Total height of root node is : 12
```

# Implementing Binary Heap 

## What is Binary Heap 

이즌 트리 구조는 O(log(N))의 시간복잡도를 가지고 있기 때문에, 데이터를 삭제하고 검색하는데에 있어 효율적으로 작업을 할 수 있다. **Heap** 자료구조는 O(1)의 시간복잡도로 데이터 셋의 최솟값과 최댓값을 보유하고 있다. 데이터 엔지니어링에서 heap 자료구조는 우선순위를 가지고 있는 작업을 스케듈링하는데 사용된다.

**Min-heap** 구조는 각각의 노드가 왼쪽 자식과 오른쪽 자식의 노드값보다 작거나 같은 값으로 구성되어 있다. 반대로 **Max-heap**의 경우, 각각의 노드가 왼쪽 자식과 오른쪽 자식의 노드값보다 크거나 같은 값으로 구성되어 있다. 

## Min Heap 

Min heap의 경우 노드에 값을 저장하는 대신에 단계별로 배열되어 있는 리스트들에 값을 저장하는 형태로 존재한다. 만일 값을 추가하게 되면, 노드의 값이 10인 노드에 왼쪽 자식부터 값을 넣게 된다. 값은 왼쪽부터 차기때문에 중간에 비어있는 노드가 존재할 수 없게 된다. 

```Python
class MinHeap :
    def __init__(self) : 
        self.values = []      
```

## Indexes of child node

Binary min heap를 list를 사용해서 표현하기 위해, 각각의 노드는 list의 인덱스로 추상화할 수 있다. 예를들어, root 노드의 경우에는 인덱스 0을, root 노드의 left child 노드의 경우 인덱스 1로 매핑할 수 있다. 따라서 노드가 i의 인덱스를 가지고 있다면, 노드의 왼쪽 자식은 2i + 1의 인덱스에, 오른쪽 자식은 2i + 2의 인덱스를 갖게 된다.

```Python
class MinHeap:
    
    def __init__(self):
        self.values = []
        
    def _left_child(self, node):
        return 2 * node + 1

    def _right_child(self, node):
        return 2 * node + 2
```

## Indexes of parent node 

자식 노드가 2i + 1의 인덱스를 갖고 있을 때, 역으로 부모의 인덱스를 계산하려고 한다. 이때 부모의 인덱스는 자식 인덱스 i를 기준으로 [(i - 1)/2]의 인덱를 갖게 된다. 위 notation은 math.floor() 메소드나 // 연산자를 통해 구현할 수 있다. 

```Python
class MinHeap:
    
    def __init__(self):
        self.values = []
        
    def _left_child(self, node):
        return 2 * node + 1

    def _right_child(self, node):
        return 2 * node + 2

    def _parent(self, node) :
        return (node - 1) // 2
```

## Adding Values

Min heap의 부모 노드는 자식 노드들보다 반드시 작아야 한다는 규칙이 존재한다. 따라서 값을 추가할 때 이 규칙을 만족하는 구조를 유지하며 값을 추가해야 한다. 따라서 값을 추가할 때 값이 부모 노드의 값보다 작다면 부모 노드로 재귀적으로 바꾸는 메소드를 추가해야 한다. MinHeap.add() 클래스는 해당 기능을 구현하기 위해 추가적인 내장 메소드들이 필요하다. 

- _swap() : 주어진 두 인덱스에 대해서 리스트 내부의 값을 변경한다.
- _heapify_up() : 마지막 노드에서부터 _swap()메소드를 사용해서 순서를 올바르게 변경한다.
- add() : 리스트 마지막에 입력되는 값에 대해서 _heapify_up() 메소드를 재귀적으로 수행한다.

```Python
class MinHeap:
    
    def __init__(self):
        self.values = []
        
    def _left_child(self, node):
        return 2 * node + 1

    def _right_child(self, node):
        return 2 * node + 2
    
    def _parent(self, node):
        return (node - 1) // 2

    def _swap(self, node1, node2):
        tmp = self.values[node1]
        self.values[node1] = self.values[node2]
        self.values[node2] = tmp

    def add(self, value):
        self.values.append(value)
        self._heapify_up(len(self.values) - 1)
    
    def _heapify_up(self, node): 
        parent = self._parent(node) 
        if (node != 0) and self.values[parent] > self.values[node]:
            self._swap(node, parent) 
```

## Getting the Minimum value 

```Python
class MinHeap:
    
    def __init__(self):
        self.values = []
        
    def _left_child(self, node):
        return 2 * node + 1

    def _right_child(self, node):
        return 2 * node + 2
    
    def _parent(self, node):
        return (node - 1) // 2

    def _swap(self, node1, node2):
        tmp = self.values[node1]
        self.values[node1] = self.values[node2]
        self.values[node2] = tmp

    def add(self, value):
        self.values.append(value)
        self._heapify_up(len(self.values) - 1)
    
    def _heapify_up(self, node):
        parent = self._parent(node)
        if node > 0 and self.values[parent] > self.values[node]:
            self._swap(node, parent)
            self._heapify_up(parent)
    
    def min_value(self): 
        return self.values[0] 
    
heap = MinHeap()
for value in [5, 3, 1, 7, 2, 6] : 
    heap.add(value)
minimum = heap.min_value()
```

## Removing the Mimimum 

Min Heap의 최속값은 self.\_heapify_up() 메소드에 의해 자동으로 루트 노드에 위치하게 된다. 하지만 최솟값을 제거했을 때 새로운 값으로 업데이트해야 한다. 이때 가장 뒤에있는 값과 앞에있는 값을 바꾸는 방식으로 새로운 값을 업데이트 한다. 이때, Min heap의 노드값의 규칙은 자동으로 깨지게 되기 때문에 루트 노드부터 아래로 진행해 구조를 새롭게 업데이트 해야한다. 

self.\_heapify_down() 메소드는 현재 루트 값을 변수에 저장하고 마지막 노드와 값을 바꾼뒤에 리스트의 마지막 원소를 제거하고 적절한 순서로 재배열 한다. 

```Python
class MinHeap:
    
    def __init__(self):
        self.values = []
        
    def _left_child(self, node):
        return 2 * node + 1

    def _right_child(self, node):
        return 2 * node + 2
    
    def _parent(self, node):
        return (node - 1) // 2

    def _swap(self, node1, node2):
        tmp = self.values[node1]
        self.values[node1] = self.values[node2]
        self.values[node2] = tmp

    def add(self, value):
        self.values.append(value)
        self._heapify_up(len(self.values) - 1)
    
    def _heapify_up(self, node):
        parent = self._parent(node)
        if node > 0 and self.values[parent] > self.values[node]:
            self._swap(node, parent)
            self._heapify_up(parent)
            
    def min_value(self):
        return self.values[0]
    
    def pop(self):
        self._swap(0, len(self.values) - 1)
        ret_value = self.values.pop()
        self._heapify_down(0)
        return ret_value
    
    def _heapify_down(self, node): 
        left_child = self._left_child(node)
        right_child = self._right_child(node) 
        min_node = node 
        if left_child < len(self.values) and self.values[left_child] < self.values[node] : 
            min_node = left_child
        if right_child < len(self.values) and self.values[right_child] < self.values[min_node] : 
            min_node = right_child
        if min_node != node : 
            self._swap(node, min_node)
            self._heapify_down(min_node)
```

# Performance Boosts of Using a B-Tree

# Implement a B-Tree data structure

# Implementing a CSV Index with a B-Tree 