***

## 트리구조

***

- 자료구조는 선형, 비선형(또는 계층적) 구조로 나뉜다.

- 선형 구조는 배열, 연결리스트와 같은 것이고, 트리구조는 비선형 자료구조에 속한다.

- 대표적 예시: 파일시스템, 회사구조, HTML 의 DOM(태그 요소의 계층적 구조)

## 트리구조의 특징

***


### 1. 각 노드의 자식 수가 **2개** 이하인 트리
    - 이진트리는 1. 비어있거나 2. 비어있지 않다면 루트와 2개의 이진트리인 왼쪽(오른쪽) 서브트리로 구성
    
    
### 2. 이진트리의 형태
    - 포화이진트리, 완전이진트리(또는 불완전한 이진트리)
    
    
### 3. 리스트에 저장해야 할 효율적인 이진트리와 그렇지 않은 이진트리
    - 완전이진트리(또는 포화이진트리)는 리스트에 꽉꽉 채워져있어 효율적
        - 메모리에 순서대로 채워져있기 때문이다.
        
    - 편향이진트리는 리스트에 듬성듬성 값이 채워져있어 비효율적이다


### 4. 재귀함수로 호출
    1. 재귀함수로 호출하면 현재의 값은 스택 프레임에 쌓인다.
    2. 그리고 그 위에 새로운 재귀함수가 호출되어 스택 프레임에 쌓이는 것이 반복
    3. 조건이 성립되면 가장 위에 스택 프레임에 쌓인 값부터 차례대로 값을 처리
    
    
### 5. 이진트리에서 부모와 자식노드를 찾는 공식
    - a[i] 의 부모는 a[i//2] 에 있다. 단, i > 1 이다.
        - a[11] 의 부모는?
            - a[11//2] == 5, 즉 a[5] 가 부모노드
    - a[i] 의 왼쪽자식은 a[2i] 에 있다. 단 2i <= N 이다.
        - a[5] 의 왼쪽자식은?
            - a[2*5] == 10, 즉 a[10]이 왼쪽 자식 노드
    - a[i] 의 오른쪽자식은 a[2i +1] 에 있다. 단, 2i + 1 <= N 이다.
        - a[5] 의 오른쪽자식은?
            - a[2*5+1] == 11, 즉 a[11] 이 오른쪽 자식노드
         
         
### 6. 이진트리 형태의 한계
    - 이진트리 형태의 자료구조는 대용량의 데이터 처리에 효율적이지 못하다
    - B 트리 구조가 효율적
        - 동일한 노드 위치에 수백개에서 수천개의 키를 저장하여 트리의 높이를 낮춤

In [1]:
class Node:
    def __init__(self, item, left=None, right=None):
        self.item = item
        self.left = left
        self.right = right

class BinaryTree:
    def __init__(self):
        self.root = None
        
    def preorder(self, n):
        """전위순회"""
        # 재귀함수로 root 를 기준으로 계속해서 하위 레벨의 노드를 호출
        # 최하위의 레벨의 노드가 종료되면, 그 부모 레벨의 노드에 대한 방문, print()
        # 즉, 1레벨, 2레벨, 3레벨의 순서로 스택프레임이 쌓였기 때문에 최상위 스택프레임부터 호출됨
        if n != None: # 조건 설정
            print(str(n.item), ' ', end='')
            if n.left:
                self.preorder(n.left)
            if n.right:
                self.preorder(n.right)

    def inorder(self, n):
        """중위순회"""
        if n != None:
            if n.left:
                self.inorder(n.left)
            print(str(n.item), ' ', end='')
            if n.right:
                self.inorder(n.right)
                
    def postorder(self, n):
        """후위순회"""
        if n != None:
            if n.left:
                self.postorder(n.left)
            if n.right:
                self.postorder(n.right)
            print(str(n.item), ' ', end=' ')
            
    def levelorder(self, root):
        """레벨순회"""
        q = []
        q.append(root)
        while len(q) != 0:
            t = q.pop(0)
            print(str(t.item), ' ', end=' ')
            if t.left:
                q.append(t.left)
            if t.right:
                q.append(t.right)
            
    def height(self, root):
        if root == None:
            return 0
        return max(self.height(root.left), self.height(root.right)) + 1

In [2]:
t = BinaryTree()
n1 = Node(100)
n2 = Node(200)
n3 = Node(300)
n4 = Node(400)
n5 = Node(500)
n6 = Node(600)
n7 = Node(700)
n8 = Node(800)
n1.left = n2
n1.right = n3
n2.left = n4
n2.right = n5
n3.left = n6
n3.right = n7
n4.left = n8
t.root = n1 # t.root 에 n1 을 할당함으로써 노드가 생성

print('트리 높이', t.height(t.root))
print('전위 순회 \t', end=' ')
print(t.preorder(t.root))
print('중위 순회 \t', end=' ')
print(t.inorder(t.root))
print('후위 순회 \t', end=' ')
print(t.postorder(t.root))
print('레벨 순회 \t', end=' ')
print(t.levelorder(t.root))

트리 높이 4
전위 순회 	 100  200  400  800  500  300  600  700  None
중위 순회 	 800  400  200  500  100  600  300  700  None
후위 순회 	 800   400   500   200   600   700   300   100   None
레벨 순회 	 100   200   300   400   500   600   700   800   None


***

## 이진힙

***

- 이진힙(최소힙/최대힙)은 최소값/최대값을 검색하는데 O(1) 시간이 소요되는 알고리즘

- 병원에서 각 진료의 우선순위를 두어 현재 치료해야 할 환자가 누구인지 확인
    - 감기(3), 눈병(7), 탈골(12), ... 응급(25)

### 1. 최소힙과 최대힙으로 구분

- **최소힙**에서 최대값의 삭제는 루트 노드를 삭제 -> 최하위(최대값)을 루트노드에 삽입하여 자식 노드와 비교하여 결과값을 리턴(다운힙)

### 2. 이진힙의 사용

- 우선순위를 가진 데이터를 처리하는 자료구조로서 관공서, 은행, 병원, 우체국, 대형마켓, 공항 등에서 이루어지는 업무와 관련된 이벤트 처리, 컴퓨터 운영체제의 프로세스 처리, 네트워크 라우터에서의 패킷 처리 등에 적합한 자료구조

- **실시간 급상승 검색어(데이터 스트림에서 Top k 항목을 유지) 제공을 위한 적절한 자료구조**

### 3. 검색어 구현

- real_time_rank = [[76, '파이썬'], [[42, '자바']], [32, '고']]
    - 여기서 갑자기 [[120, '인공지능']] 검색어가 급상승한다면? 최대힙으로 구현
    
### 4. upheap, downheap

- 삽입할 때는 upheap() 이 사용된다. 즉, 노드 추가는 최하위에 삽입되고 해당 부모노드와 비교하여 본인 노드가 작으면 올라가고, 작으면 올라가는 구조

- 삭제할 때는 downheap() 이 사용된다. 최상위 노드를 삭제하고, 그 자리에 최하위 노드를 추가하여 결국 최하위 노드가 가장 아래로 내려가게 됨

## 최소힙 구현하기

In [3]:
class BHeap:
    def __init__(self, a):
        self.a = a # a = [None]n*1 // 크기를 동적으로 생성
        self.N = len(a) - 1
        
    def create_heap(self):
        # 항목 개수 -1 로 역순 이진힙 순회
        for i in range(self.N//2, 0, -1):
            self.downheap(i)
            
    def insert(self, key_value):
        self.N += 1
        self.a.append(key_value)
        self.upheap(self.N)
    
    def delete_min(self):
        if self.N == 0:
            print('힙이 비어있음')
            return None
        minimum = a[1]
        # 힙 구조에서 가장 작은값과 가장 큰 값을 스와핑
        self.a[1], self.a[-1] = self.a[-1], self.a[1]
        # 바꿔줬으니 가장 작은 값으로 된 a[-1] 인덱스 값을 삭제
        del self.a[-1]
        self.N -= 1
        self.downheap(1)
        # 모든 작업이 끝났으니 바꾸기 전 minimum 에 저장했던
        # 최소값을 return 시켜줌
        return minimum
    
    def downheap(self, i):
        while 2 * i <= self.N:
            k = 2 * i
            # k 인덱스가 크다면 k+1 인덱스가 최소값으로 지정
            if k < self.N and self.a[k][0] > self.a[k+1][0]:
                k += 1
            if self.a[i][0] < self.a[k][0]:
                break
            self.a[i], self.a[k] = self.a[k], self.a[i]
            i = k
            
    def upheap(self, j):
        while j > 1 and self.a[j//2][0] > self.a[j][0]:
            self.a[j], self.a[j//2] = self.a[j//2], self.a[j]
            j = j//2 # 노드가 한 층 올라감
            
    def print_heap(self):
        for i in range(1, self.N+1):
            print('[%2d' % self.a[i][0], self.a[i][1], ']', end=' ')
        print('\n힙 크기 = ', self.N)

In [4]:
a = [None] * 1
a.append([90, 'watermelon'])
a.append([80, 'pear'])
a.append([70, 'melon'])
a.append([60, 'lime'])
a.append([50, 'mango'])
a.append([40, 'cherry'])
a.append([30, 'grape'])
a.append([20, 'orange'])
a.append([10, 'apricot'])
a.append([15, 'banana'])
a.append([45, 'lemon'])
a.append([40, 'kiwi'])
b = BHeap(a)
print('힙 만들기 전:')
b.print_heap()
b.create_heap()
print('최소힙:')
b.print_heap()
print('최솟값 삭제 후')
print(b.delete_min())
b.print_heap()
b.insert([5,'apple'])
print('5 삽입 후')
b.print_heap()

힙 만들기 전:
[90 watermelon ] [80 pear ] [70 melon ] [60 lime ] [50 mango ] [40 cherry ] [30 grape ] [20 orange ] [10 apricot ] [15 banana ] [45 lemon ] [40 kiwi ] 
힙 크기 =  12
최소힙:
[10 apricot ] [15 banana ] [30 grape ] [20 orange ] [45 lemon ] [40 kiwi ] [70 melon ] [80 pear ] [60 lime ] [50 mango ] [90 watermelon ] [40 cherry ] 
힙 크기 =  12
최솟값 삭제 후
[10, 'apricot']
[15 banana ] [20 orange ] [30 grape ] [40 cherry ] [45 lemon ] [40 kiwi ] [70 melon ] [80 pear ] [60 lime ] [50 mango ] [90 watermelon ] 
힙 크기 =  11
5 삽입 후
[ 5 apple ] [20 orange ] [15 banana ] [40 cherry ] [45 lemon ] [30 grape ] [70 melon ] [80 pear ] [60 lime ] [50 mango ] [90 watermelon ] [40 kiwi ] 
힙 크기 =  12


**2차원 리스트**

In [5]:
surgery = [[3, '감기',], [7, '눈병'], [12, '탈골'], [25, '응급']]

In [6]:
surgery

[[3, '감기'], [7, '눈병'], [12, '탈골'], [25, '응급']]

In [7]:
surgery[1]

[7, '눈병']

In [8]:
surgery[1][1] # 인덱스 첫번째에 인덱스 첫번째 값 # 입체적으로 생각하기!!

'눈병'

***

### 이진탐색

***

- 1차원 구조로 되어있고, mid 를 잡고 그 인덱스를 기준으로 반으로 자르고 비교를 해나가는 구조

- 각 노드는 바로 양 옆에만 참조하고 있기 때문에 운이 없을 경우에는 많은 시간이 소요된다

1. 기본 전제는 **a 리스트의 N 개 값은 정렬이 되어있다**
2. mid 로 범위를 좁혀나간다
3. 최악의 경우에는 리스트에 거의 대부분을 검색하여 return mid 가 된다
    - 삽입과 삭제가 빈번하면 정렬을 유지하기 위해 시간이 오래 걸린다.
    - O(N): 선형시간 소요

- binary_search(인덱스 첫번째, 인덱스 마지막, 원하는 검색값)
- binary_search(mid, 인덱스 마지막, 원하는 검색값)
- mid 를 +- 하면서 최종적으로 binary_search(10, 10, 66) # 2개의 범위 일치
- 조건에 만족하지 않으면 재귀함수로 호출하여 범위를 좁혀 나가는 것
- mid(중간)를 잡고 검색하기 때문에 최악의 경우에는 target 이 처음/끝에 있어 오래걸림

**책에 나와있는 이진탐색 코드**

In [9]:
def binary_search(left, right, t):
    if left > right:
        return None # 탐색 실패(즉, t가 리스트에 없음)
    mid = (left + right) // 2 # 리스트에서 탐색할 부분의 중간 항목의 인덱스 계산
    if a[mid] == t:
        print(f'a 리스트의 [{mid}]번째에 [{a[mid]}]값을 찾았습니다.')
        return mid # 탐색 성공
    if a[mid] > t:
        binary_search(left, mid-1, t) # 앞부분 탐색
    else:
        binary_search(mid+1, right, t) #뒷부분 탐색

In [30]:
def binary_search(left, right, t):
    if left > right:
        return None
    mid = (left + right) // 2
    if a[mid] == t:
        return mid
    if a[mid] > t:
        # 책에서는 mid-1 이라고 하지만 난 right 가 편함
        binary_search(left, right-1, t)
    else:
        a[mid] < t
        # 책에서는 mid-1 이라고 하지만 난 left 가 편함
        binary_search(left+1, right, t)

In [31]:
a = [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
right = len(a) -1
target = 25

In [32]:
binary_search(0, right, target)

4

**초보몽키님의 블로그**

In [13]:
def binary_search(target, data):
    data.sort()
    start = 0
    end = len(data) - 1
    # start +1 // end -1 하면서 mid 포인터를 이동시킴
    while start <= end:
        mid = (start + end) // 2

        if data[mid] == target:
            return mid # 함수를 끝내버린다.
        elif data[mid] < target:
            start = mid + 1
        else:
            end = mid -1

    return None


In [14]:
li = [i**2 for i in range(11)]
target = 9
idx = binary_search(target, li)

if idx:
    print(li[idx])
else:
    print("찾으시는 타겟 {}가 없습니다".format(target))

9


**.sort(reverse=False(optional))함수 **

In [15]:
li =[5, 7, 3, 1, 2, 101, 12, 67]

In [16]:
li

[5, 7, 3, 1, 2, 101, 12, 67]

In [17]:
li.sort()

In [18]:
li

[1, 2, 3, 5, 7, 12, 67, 101]

In [19]:
(0 + 10) // 2

5

In [20]:
5 // 2

2