# Recursion 

## What is Recursion

**재귀(Recursion)**은 어떠한 것을 정의할 때 자기 자신을 참조하는 것을 뜻한다. 컴퓨터 과학에 있어서 재귀는 자신을 정의할 때 자기 자신을 재참조하는 방법을 뜻하며, 이를 프로그래밍에 적용한 **재귀 호출(Recursive call)**의 형태로 많이 사용된다.

**재귀함수(Recursive algorithm)**는 자신을 무한히 참조할 수 있기 때문에, 무한히 참조하는 상황을 방지하기 위해 **base case** 조건을 사용해서 문제가 간단해졌다고 생각되는 지점에서 함수를 종료하게 된다.

파이썬 인터프리터를 실행하게 되면 **call stack**이라고 불리는 인메모리를 함수를 실행하고 불러오는데 사용한다. base case 없이 재귀함수를 작성하게 되면 무한히 call stack에 push 하기 때문에 모든 메모리를 소진하게 된다. 이 현상을 **stack overflow**라고 한다.

stack overflow가 발생하면 파이썬은 **Recursion Error**를 출력한다. 

## Recursive Sum 

```Python
def recursive_sum(values) : 
    if not values : 
        return 0
    return values[0] + recursive_sum(values[1:])
```

recursive_sum 함수 내부의 if statement는 base case로 재귀함수를 종료하는 조건을 의미한다. recursive_sum 내부에서는 더이상 추가로 더할 수 없는 원소가 없는 리스트에 대해서 재귀함수를 종료하게 된다.

recursive_sum 함수는 리스트 내부에 원소가 존재할 경우 return statement에서 자기 자신을 계속 참조하게 된다. 이때 다시 불러오는 리스트의 원소는 하나씩 줄어들기 때문에 문제가 간단해지는 효과가 있다. 

```Python
def list_sum(lst) : 
    if not lst :
        return 0
    retirm 1 + list_sum(lst) 
```

## Towers of Hanoi

하노이 타워 문제는 재귀함수의 대표적인 예시이다. 모든 디스크는 가장 큰 디스크부더 낮은 디스크 순으로 쌓여있고, 문제의 목표는 같은 순서대로 A막대에서 C막대로 디스크를 옮기는 것이다. 문제에는 두 가지 규칙이 존재한다.

1. 디스크는 한번에 하나씩만 움직일 수 있다.
2. 작은 디스크위에 큰 디스크를 올릴 수 없다.

문제를 해결하기 위해 문제를 작은 단위로 분해하면 다음의 단계를 적용할 수 있다.

1. 첫번째 하위 문제는 가장 밑에 있는 디스크를 제외한 모든 디스크를 중간 막대로 옮긴다. 
2. 두번째 하위 문제는 가장 밑에 있는 디스크를 제외한 모든 디스크를 마지막 막대 옮긴다. 
3. 세번째 하위 문제는 중간 막대에 있는 모든 디스크를 마지막 막대로 옮긴다. 
4. 첫번째, 세번째 단계를 각각 재귀적으로 적용하여 가장 밑에 있는 디스크를 마지막 막대로 옮긴다. 

```Python
def solve_hanoi(num_disks, first_peg, middle_peg, last_peg) : 
    if num_disks == 1 :
        print(f"Move the top disk from peg {first_peg} to peg {lasg_peg}.")
    else : 
        solve_hanoi(num_disks-1, first_peg, last_peg, middle_peg)
        solve_hanoi(1, first_peg, middle_peg, last_peg)
        solve_hanoi(num_disks-1, middle_peg, first_peg, last_peg)
        
solve_hanoi(4, 'A', 'B', 'C')
```

## Listing All Files in a Directory

다음 코드는 주어진 폴더 내부를 재귀적으로 조회하여 모든 파일을 조회하는 코드이다. list_files 재귀 함수 내부에서 사용할 메소드는 다음과 같다. 

- os.listdir(current_path) : 주어진 경로 내부의 모든 컨텐츠를 리스트로 return 한다. 
- os.path.isdir(current_path) : 주어진 경로가 디렉토리일 경우 True를, 파일일 경우 False를 return하여 base case에 사용한다. 
- os.path.join(current_path) : 두 경로를 합쳐 하나의 경로로 return 한다. 

```Python
import os 

def list_files(current_path) : 
    if not(os.path.isdir(current_path)) : 
        print(current_path)
    else : 
        for name in os.listdir(current_path) : 
            list_files(os.path.join(current_path, name)
```

## Merge Sort 

**Merge sort**알고리즘은 정렬 알고리즘의 하나로, 리스트의 인덱스를 재귀적으로 절반으로 나눈 뒤 각각의 리스트를 정렬하고 하나의 정렬된 리스트로 병합하는 알고리즘이다. 정렬된 두 리스트를 하나의 정렬된 리스트로 병합하는 과정은 다음과 같다. 

```Python
def merged_sorted_lists(list1, list2) : 
    index1 = 0
    index2 = 0
    merged_list = []
    
    while (index1 < len(list1)) and (index2 < len(list2)) : 
        if list1[index1] <= list2[index2] : 
            merged_list.append(list1[index1])
            index1 += 1
        else : 
            merged_list.append(list2[index2])
            index2 += 1
    merged_list += list1[index1:]
    merged_list += list2[index2:]
    return merged_list 
```

단일 리스트를 받았을 때, 두개의 리스트로 나누어 정렬하는 알고리즘은 다음과 같다. 완성된 알고리즘은 $O(N*log(N))$의 시간복잡도를 갖게 된다. 

```Python
def merge_sort(values) : 
    if len(values) < 2 : 
        return values 
    midpoint = len(values) //2 
    sorted_first_half = merge_sort(values[:midpoint])
    sorted_second_half = merge_sort(values[midpoint:])
    return merged_sorted_lists(sorted_first_half, sorted_second_half)

```

# Introduction to Binary Trees

## What is Tree Structure

기존에 학습했던 Linked List, Stack, Queues, Dictionary의 자료구조는 선형 구조로 되어있어, 자료를 검색할 때 모든 값을 순환해야 했다. **트리 구조(Tree)**는 하나 이상의 계승자로 이루어져 계층적으로 데이터를 검색할 수 있다. 즉, **이진 트리(Binary Tree)**의 경우 계승자의 수가 대부분 2개라는 의미이다.

트리 구조의 각각의 요소를 **노드(Node)**라고 하고, 노드의 계승자를 **자식(Children)**이라고 한다. 최상위 노드는 **루트(Root)**라고 하며 자식을 가지고 있지 않는 노드를 **잎(Leaves)**라고 한다. 또한 모든 부모, 자식 노드를 **내부 노드(Internals)**라고 한다. 

## Node 

이진 트리 구조는 리스트를 사용해서 데이터를 저장한다. 리스트의 각 원소는 Linked List 처럼 서로 참조 관계를 통해 정의 된다. 관례상 left_child, right_child로 정의하여 참조한다. 

```Python
class Node 
    def __init__(self, value) : 
        self.value = value 
        self.left_child = None
        self.right_child = None 
```

## Binary Search Tree 

자동으로 이진 트리 구조를 만들고 값을 검색하기 위해 **이진 검색 트리(Binary Search Tree)** 클래스를 생성한다. 일반적으로 부모의 값을 기존으로 작으면 left_child, 크면 right_child에 노드를 재귀적으로 할당한다. 이 속성을 가진 트리 구조를 이진 검색 트리라고 한다. 

### BST Inserting Value 

BST에 값을 할당하는 메소드를 생성하기 위해선 다음의 Workflow가 필요하다. 

1. root에 노드가 존재하지 않는 경우 root에 생성한 노드를 넣는다.
2. root에 노드가 존재하는 경우,
    1. 입력된 값이 노드의 값보다 작거나 같은 경우 왼쪽으로 이동한다.
        1. 현재 노드의 left_child가 None이라면 새로운 노드를 생성해서 현재 노드의 left_child로 설정한다.
        2. 현재 노드의 left_chlid가 None이 아니면 재귀적으로 현재 노드의 left_child로 이동해서 2-1을 수행한다.
    2. 입력된 값이 노드의 값보다 큰 경우 오른쪽으로 이동한다.
        1. 현재 노드의 right_child가 None이라면 새로운 노드를 생성해서 현재 노드의 right_child로 설정한다.
        2. 현재 노드의 right_child가 None이 아니면 재귀적으로 현재 노드의 right_child로 이동해서 2-2를 수행한다.
    3. 이동은 프로세스의 현재 노드에 값이 없을경우 종료한다.

```Python
class BST : 
    def __init__(self) : 
        self.root = None 
    
    def add(self, value) : 
        if self.root is None : 
            self.root = Node(value)
        else : 
            self.add_recursive(self.root, value) 
    
    def add_recursive(self, current_node, value) :
        if value <= current_node.value :
            if current_node.left_child is None :
                current_node.left_child = Node(value)
            else : 
                self.add_recursive(current_node.left_child, value) 
        else : 
            if current_node.right_child is None : 
                current_node.right_child = Node(value) 
            else : 
                self.add_recursive(current_node.right_child, value)      
```

### BST Contains 

이진 트리에 해당 값이 있는지 확인하는 메소드는 add 메소드의 방식과 동일하다. 값을 재귀적으로 비교하면서 노드를 이동하여 해당 값이 있을 경우 True를, 없다면 False를 리턴한다. Workflow는 다음과 같다. 

1. BST에 노드가 없다면 False를 리턴한다.
2. BST에 노드가 있다면 노드를 재귀적으로 이동한다. 
    1. 값이 같을 경우 True를 리턴한다.
    2. 값이 현재 노드의 값보다 작거나 같을 경우 left_chlid로 이동한다. 
    3. 값이 현재 노드보다 클 경우 right_child로 이동한다. 
    
```Python
class BST:
    
    def __init__(self):
        self.root = None
        
    def add(self, value):
        if self.root is None:
            # The root does exist yet, create it
            self.root = Node(value)
        else:
            # Find the right place and insert new value
            self.add_recursive(self.root, value)
            
    def add_recursive(self, current_node, value):
        if value <= current_node.value:
            # Go to the left
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self.add_recursive(current_node.left_child, value)
        else:
            # Go to the right
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self.add_recursive(current_node.right_child, value)
            
    def contains(self, current_node, value) : 
        if current_node is None : 
            return False 
        else : 
            if value == current_node.value : 
                return True 
            elif value <= current_node.value : 
                return self.contains(current_node.left_child, value)
            else : 
                return self.contains(current_node.right_child, value)
```

## Polishing the Implementation

add_recursive() 메소드는 BST 클래스 내부에서만 사용되는 메소드이기 때문에 클래스 외부에서 사용될 필요가 없으므로 앞에 \_를 붙여 사용되는 것을 방지한다. contains() 메소드 또한 current_node를 BST.root로 고정하기 위해 추가적인 메소드를 사용한다. 

```Python
class BST:
    
    def __init__(self):
        self.root = None
        
    def add(self, value):
        if self.root is None:
            # The root does exist yet, create it
            self.root = Node(value)
        else:
            # Find the right place and insert new value
            self._add_recursive(self.root, value)
            
    def _add_recursive(self, current_node, value):
        if value <= current_node.value:
            # Go to the left
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self._add_recursive(current_node.left_child, value)
        else:
            # Go to the right
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self._add_recursive(current_node.right_child, value)
                
    def _contains(self, current_node, value):
        if current_node is None:
            return False
        if current_node.value == value:
            return True
        if value < current_node.value:
            return self._contains(current_node.left_child, value)
        return self._contains(current_node.right_child, value)
    
    def contains(self, value) : 
        return self._contains(self.root, value)
```

## Advantages of using BST 

값을 삽입하고 검색한다고 할 때 최악 시간 복잡도는 O(N)으로 트리 구조의 높이가 가장 높을 때를 기준으로 한다. 가장 높이가 낮은 트리의 경우 2번의 검색으로 값을 찾을 수 있다. 

이상적인 나무구조는 계층이 증가할 때마다 자식 노드의 개수가 이전 노드에 비해 두개씩 분할되는 구조이다. 이때 전체 노드의 개수는 각각의 계층에 있는 전체 노드 수의 합이다. 예를 들어 h개의 계층이 존재한다고 할때 저장하고 있는 모든 노드의 수는 다음과 같다.

$$ n = 2^h - 1$$

따라서 최선의 경우에 값을 검색하는 시간 복잡도는 로그 복잡도를 따르고 있음을 알 수 있다.

# Working with Binary Search Trees

## What is AVL Trees 

이진 검색 트리는 데이터의 입력 순서에 따라 트리의 구조가 결정되게 된다. 따라서 로그 시간복잡도에서부터 선형 시간복잡도 까지 다양한 시간 복잡도가 존재하게 된다. AVL Tree 알고리즘은 기존의 BST에서 확장하여 항상 로그 시간복잡도를 갖는 이진 트리 구조를 설계한다.

클래스를 정의할 때 다른 클래스로부터 불러올 경우 super()를 사용한다. 즉 super()은 parent self를 의미한다. AVL Tree를 정의하기 위해 Node를 확장한 AVLNODE 클래스를 정의한다.

```Python
from bst import Node, BST

class AVLNode(Node) : 
    def __init__(self, value) : 
        super().__init__(value)  
        self.height = 1 
        self.imbalance = 0
```

## Node Height and Imbalance 

### Node Height 

**Height of node**는 트리 구조의 높이로 작동하게 된다. 기존의 높이와의 차이점은, 루트가 아닌 특정 노드에서 잎까지의 가장 긴 높이를 가진 노드의 수를 측정하는 것이다. 따라서 한 노드의 왼쪽 오른쪽 자식 노드의 높이를 알고 있다면 그 두 높이중 더 큰 길이를 1에 더함으로써 해당 노드의 높이를 계산할 수 있다.

$$height(node) = 1 + max(height(node.left - chlid), height(node.right - child))$$

### Node Imbalance 

**Node Imbalance**는 왼쪽 하위 나무와 오른쪽 하위 나무의 높이의 차이를 의미한다.

$$imbalance(node) = height(node.left - child) - height(node.right - child)$$

## AVL Trees 

### Keeping Height and Imbalance updated 
