In [3]:
# 데이터 처리 모듈
import pandas as pd
# 행렬 등 통계 연산 모듈
import numpy as np
# 지수형 표기법 e를 연속형 변환
# pd.options.display.float_format = '{:.4f}'.format
# 타입 어노테이션(Any, Sequence 등의 메서드 활용)
from typing import *

# 구글 드라이브 마운트
# from google.colab import drive
# drive.mount("/content/drive")
import os
import time

### 클래스 연산자 오버로딩 메서드

> Point Class
> * `__add__`, `__sub__`, `__mul__`, `__mod__`(%), `__truediv__`(/), `__floordiv__`(//)
> * `__iadd__`, `__isub__`, `__imul__`, `__imod__`, `__itruediv__`, `__ifloordiv__`
> * `__lt__`(<), `__le__`(<=), `__gt__`(>), `__ge__`(>=), `__eq__`(==), `__ne__`(!=)
> * dot(p, q) = 두 벡터 p, q의 내적 = p*x * q*x + p*y * q*y
> * dist(p, q) = 두 점 p, q의 길이
> * length(p) = 벡터 p의 길이
> * move(p, dx, dy) = 점 p를 x축으로 dx만큼, y축으로 dy만큼 더해 이동

> Vector Class
> self._x와 같이 nonpublic 멤버변수는 import되지 않고 감춰지므로 좌표값을 참조하기 위해 magic method `__getitem__`, `__setitem__`을 사용
> * `__getitem__`
  self의 k번째 값을 리턴하는 매직 메서드
> * `__setitem__`
  self의 k번째 값에 value값을 대입하는 매직 메서드

### 알고리즘의 시간복잡도
* 모든 입력에 대해 기본연산 횟수를 더한 후 평균 측정 : 현실적으로 불가능함
* 가장 안 좋은(worst case input)에 대한 기본연산 횟수를 측정 : worst case time complexity

```
# Pseudo Code
# 중첩 루프

algorithm Sum(A, n):
  sum = 0
  for i = 0 to n-1 do:
    for j = i to n-1 do:
      sum += A[i] * A[j]
  return sum
```

* 최악의 경우의 입력에 대하여 알고리즘의 기본연산, **복사, 산술, 비교, 논리, 비트논리**의 횟수를 센다

| i | j | sum += A[i]*A[j] |
| --- | --- | --- |
| 0 | n | 1 + 2 + … + n |
| 1 | n - 1 | = n(n+1)/2 * 3 |
| 2 | n - 2 |  |
| … | … |  |
| n - 1 | 1 |  |

* BigO Asymptotic Notation(근사적 표기법)
  * n이 증가할 때 가장 빨리 증가하는 최고차항만 남기고 다른 항은 모두 생략
  * 가장 빨리 증가하는 항에 곱해진 상수 역시 생략
  * 남은 항을 O()안에 넣어 표기


In [None]:
# O(1) 시간 알고리즘
# constant time algorithm
# 값을 1 증가시킨 후 리턴
def increment_one(n):
  return n+1

# O(log2n) 시간 알고리즘
# logarithmic time algorithm
# n을 이진수로 표현했을 때의 비트 수 계산 알고리즘
# 몇번이 반복되는지 아는 것이 중요하다! n / 2^count = 1(count = log2n)
def number_of_bits(n):
  count = 0
  while n > 0:
    n = n // 2
    count += 1
  return count

In [None]:
increment_one(n = 100)

101

In [None]:
number_of_bits(n = 100)

7

In [None]:
# O(n)
# linear time algorithm
# n개의 수 중 최댓값을 찾는 알고리즘

# O(n^2) 시간 알고리즘
# quadratic time algorithm
# 두 배열 A, B의 모든 정수쌍의 곱의 합을 계산하는 알고리즘

# Pseduo code
def algorithm_array_sum(A, B, n):
  sum = 0
  for i in range(0, n, 1):
    for j in range(0, n, 1):
      sum += A[i] * B[j]
  return sum

# O(n^3) 시간 알고리즘
# cubic time algorithm
# n by n 2차원 행렬 A, B의 곱(행렬곱)을 계산한 결과 행렬 C를 리턴하는 알고리즘

# Pseduo code
def algorithm_mult_matrixs(A, B, n):
  # A = np.array(n, n)
  # B = np.array(m, m)
    # input: n x n 2d matrixs A, B

  C = np.array()
  for i in range(1, n+1, 1):
	  for j in range(1, n+1, 1):
	    C[i][j] = 0
  for i in range(1, n+1, 1):
	  for j in range(1, n+1, 1):
	    for k in range(1, n+1, 1):
		    C[i][j] += A[i][k] * B[k][j]

  return C
    # output: C = A x B

In [None]:
# O(n^2) 시간 알고리즘
# exponential time algorithm
# k번째 피보나치 수 계산하는 알고리즘
def fibonacci(k):
    if k <= 1:
      return k
    return fibonacci(k-1) + fibonacci(k-2)

```
# 실행시간 측정 코드

before = time.process_time()
f()
after = time.process_time()
print(after - before)
```

### 파이썬 제공 기본 자료구조

| 연번 | 자료구조 | 특성 |
| --- | --- | --- |
| 0 | 단순 배열 | 컴파일 단계에서 **크기가 지정되어 변경되지 않는** 크기의 배열 |
| 1 | 동적 배열 | 프로그램 실행 단계에서 지정되며, **프로그램 실행 중에 크기를 변경할 수 있는** 배열 |
| 2 | 구조체 배열 | 구조체로 배열 원소가 지정되는 배열 |
| 3 | 연결형 리스트(linked list) | 확장성이 있으며, 단일연결형 또는 이중연결형으로 구성 가능함. 다양한 컨테이너 자료구조의 내부적인 자료구조로도 활용가능함. |
| 4 | Stack | Last In First Out, 직전에 하려고한 행동을 기록해둠으로서 다음의 행동을 무엇을 해야할지 알려주는 자료구조. 명령간의 의존하는 순서(선행관계)가 있으면 사용함. 배열 또는 연결형 리스트로 구현가능함 |
| 5 | Queue | First In First Out, 명령(상태)의 의존관계가 없어 병렬화에 사용함. 배열 또는 연결형 리스트로 구현가능함. |
| 6 | 우선순위 큐(Priority Queue) | 컨테이너 내부에 가장 우선순위가 높은 데이터 항목을 추출할 수 있도록 관리함. 배열 또는 자기참조 구조체로 구현할 수 있음.(self-reference struct) |
| 7 | 이진 탐색 트리 | 컨테이너 내부에 포함된 데이터 항목들을 정렬된 상태로 관리할 때 매우 효율적임. 단순 이진 탐색 트리의 경우 편중될 수 있으며, 편중된 경우 검색 기능이 저하되기 때문에 밸런싱이 필요함. |
| 8 | 해시테이블(hash table) | 컨테이너 자료구조에 포함된 항목들을 문자열 또는 긴 숫자를 키로 사용하여 관리하여야 하며,** key로부터 해시값((hash value)을 구함. 이 해시값을 배열의 인덱스로** 사용함. |
| 9 | Map | key와 항목 간에 **1:1관계가 유지**되어야 하는 경우에 사용되며, 해시테이블을 기반으로 구현가능함. |
| 10 | Dictionary | key와 항목 간에 **1:N관계가 유지**되어야 하는 경우에 사용되며, 해시테이블을 기반으로 구현가능함. |
| 11 | trie | 텍스트 검색을 신속하게 처리하며, 예측 구문 제시, longest prefix matching 등에 활용함. |
| 12 | Graph | 정점(vertex) 노드로 개체(object)가 표현되고, 간선(edge) 링크들을 사용하여 개체 간의 관계를 표현하는 경우 적합함. 그래프를 기반으로 경로 탐색, 최단거리 경로 탐색 신장트리(spanning tree) 탐색 등에 활용함. |

* 자료구조 : 컴퓨터에서 다루는 데이터 형

  1. 단순구조

    2진수, 정수 및 실수, 문자 및 문자열

    실제 사용에는 기본 자료형을 모아서 배열, 구조체, 클래스를 선언하여 사용
  
  2. 선형구조

    리스트, 연결리스트(단순연결리스트, 이중연결리스트, 원형연결리스트), 데크, 스택, 큐
  
  3. 비선형구조

    트리(일반트리, 이진트리), 그래프(방향그래프, 무방향그래프)
  
  4. 파일구조 : 자료를 저장하는 형태

    순차 파일, 색인파일, 직접파일

### 연결리스트 자료구조 구현

  컴퓨터 내부에서 활용할 수 있는 자료구조는 리스트와 연결리스트 방식 외에는 없음

  연결리스트를 이용한 스택 구현 : 3개의 데이터를 가진 스택에 1개의 데이터를 추가하는 개념

In [None]:
class Node:
  # 연결리스트를 구성하는 단위 데이터의 모습은 데이터 + 다음 데이터
  def __init__(self, data = None, next = None):
    self.data = data
    self.next = next

  def init():
    # 연결리스트를 만든다. Node1 ~ Node4 그리고 연결 포인터 구성
    global node1
    node1 = Node(1)
    node2 = Node(2)
    node3 = Node(3)
    node4 = Node(4)
    node1.next = node2
    node2.next = node3
    node3.next = node4

  def delete(del_data):
    # 구성된 리스트에서 데이터를 지우고, 나머지를 연결한다.
    global node1
    pre_node = node1
    next_node = pre_node.next

    if pre_node.data == del_data:
      node1 = next_node
      del pre_node
      return

    while next_node:
      if next_node.data == del_data:
        pre_node.next = next_node.next
        del next_node
        break

      pre_node = next_node
      next_node = next_node.next

  def insert(ins_data):
    # 연결리스트에 데이터를 추가한다.
    global node1
    new_node = Node(ins_data)
    new_node.next = node1
    node1 = new_node

  def print_list():
    # 연결리스트 데이터를 반환한다.
    global node1
    node = node1
    while node:
      print(node.data)
      node = node.next
    print()

In [None]:
# LinkedList.py 실행
"""
def LinkedList():
  init();
  delete(2)
  insert("9")
  print_list()

LinkedList()
"""

### 파이썬으로 구현한 스택 자료구조

  사람이 사용하는 수식[중위 표기법]을 컴퓨터가 사용하는 수식(후위 표기법)으로 바꾸고, 이것을 연산하는 과정

* 중위 표기법을 후위 표기법으로 변환하는 과정
```
K = ( (A * B) - (C / D) )
K = ["(", "(", "A", "*", "B", "-", "(", "C", "/", "D", ")", ")"]

  1. 처음 괄호 2개 "(("를 무시하고 "A"를 출력한다.
  2. "*" 연산자를 PUSH하고 "B"를 출력한다.
  3. ")"를 만나게 되면(우선순위가 가장 높은 닫힌 괄호), "*"를 출력으로 이동한다.
  4. "-" 연산자를 만나면 스택으로 이동한다. "("를 만나면 무시하고, "C"를 만나면 출력한다.
  5. "/" 연산자를 만나면 스택으로 이동한다. "D"를 만나면 출력한다.
  6. ")"를 만나면 스택의 값("/")을 출력으로 이동한다. 또한, ")"을 만나면 스택의 값("*")을 출력으로 이동한다.
```

* 후위 표기법 표기 수식의 연산 과정 : 대부분의 프로그램들이 컴파일 과정을 통해 컴퓨터가 처리할 수 있는 형태로 바꾸게 된다.
```
K = AB*CD/-

  1. "A"를 스택에 PUSH하고, "B"를 스택에 PUSH한다.
  2. "*"를 스택에서 POP하고, "A"를 스택에서 POP한 다음에 "*" 연산한 결과(X)를 다시 스택에 넣는다.
  3. "C", "D"를 만나면 이 값을 스택에 PUSH한다.
  4. "/"을 만나면 "C", "D"를 POP한 후에 "C/D"연산을 수행한다.
  5. "-"을 만나면 "X", "Y"를 POP한 후에 "X-Y"연산을 수행한다. 그리고 결과(Z)를 스택에 넣는다.
```


In [None]:
class Stack:
	def __init__(self):
		self.items: List = []

	def push(self, values):
		self.items.append(values)

	def pop(self):
		try:
			return self.items.pop()
		except IndexError:
			print("Stack is empty.")

	def top(self):
		"""stack의 가장 위에 있는 정수를 return"""
		try:
			return self.items[-1]
		except IndexError:
			print("Stack is empty.")
		"""
		if self.empty() == 1:
			return
		else:
			return self.items[-1]
		"""

	def __len__(self):
		return len(self.items)

	"""
	def empty(self):
			if len(self.items) == 0:
				return 1
			else:
				return 0
	"""

In [None]:
S = Stack()
parenthesesSequence: List = input()

for p in parenthesesSequence:
	if p == "(":
		S.push(p)
	elif p == ")":
		S.pop()
		# 오른쪽 괄호가 더 많음
	else:
		print("Not Allowed Symbol")

if len(S) > 0:
	# 왼쪽 괄호(열린 괄호)가 더 많은 것
	# 스택에 남은 원소가 있는 것
	print(False)
	# return False
else:
	print(True)
	# return True

### 파이썬으로 구현한 큐 자료구조(입력, 인덱싱(양방향 위치반환), 출력)

* 큐의 용도

  컴퓨터 안에 여러 개의 프로세스(프로그램의 실행흐름)가 수행 중인데, 새로운 프로세스가 수행되어야 하는 경우 **기존에 수행되던 프로세슷 중에 가장 먼저 메모리에 올라온 프로세스가 아웃되고, 새로운 프로세스를 메모리에 올리게 된다. 이 경우에 운영체제는 현재 수행 중인 프로세스를 큐의 형태로 관리**한다.

  윈도우 운영체제를 사용하는 컴퓨터에서 수행 중인 프로그램에 이벤트(버튼 누르기, 윈도우 크기 조정, 메뉴 선택하기 등)가 발생하면, **발생한 이벤트가 큐에 저장되고, 수행중인 프로그램이 큐에 저장된 것을 앞에서부터 읽어와서 처리**한다. (선입선출)

In [None]:
# from queue import Queue
# from collections import deque

class Queue:
	def __init__(self):
		self.items: List = []
		self.front_index = 0

	def enqueue(self, values):
		self.items.append(values)

	def dequeue(self):
		if self.front_index == len(self.items):
			print("Queue is empty.")
		else:
			x = self.items[front_index]
			self.front_index += 1
				# 그 다음에 있는 원소
			return x
				# 큐의 가장 앞에 있는 자료를 반환

	def front(self):
		"""Queue의 가장 앞에 있는 정수를 return"""
		try:
			return self.items[0]
		except IndexError:
			print("Queue is empty.")

	def back(self):
		"""Queue의 가장 뒤에 있는 정수를 return"""
		try:
			return self.items[-1]
		except IndexError:
			print("Queue is empty.")

	def __len__(self):
		return len(self.items)

	"""
	def empty(self):
			if len(self.items) == 0:
				return 1
			else:
				return 0
	"""

### 파이썬으로 구현한 이진트리 자료구조(입력, 검색, 삭제)

* 트리란 임의의 노드에서 다른 노드로의 경로가 단 하나밖에 없는 자료구조

  노드 중 단 하나의 루트 노드가 있고, 루트 노드에서 하위 노드들이 연결된 비선형 계층 구조, 운영체제의 파일 시스템에서 활용한다.

* 이진 검색 트리 : 최대 2개의 자식 노드를 가질 수 있는 자료구조

  왼쪽 서브 트리의 값은 루트의 값보다 작고, 오른쪽 서브 트리의 값은 루트보다 큰 값을 가지도록 구성하며, 주로 검색이 필요한 곳에 사용한다.

### 파이썬으로 구현한 힙 : 트리 자료구조의 응용

* 이진트리의 일종으로, 여러 개의 값 중에서 가장 큰 값이나 가장 작은 값을 빠르게 찾을 수 있도록 컴퓨터에서 프로세스가 만들어졌을 때 메모리를 할당하는 방법

  최소 힙 : 부모 노드의 값이 항상 하위 노드의 값보다 작은 경우

  최대 힙 : 부모 노드의 값이 항상 하위 노드의 값보다 큰 경우

### 파이썬 제공 기본 알고리즘 선택 기준

문제를 해결하기에 가장 적절한 자료구조와 알고리즘을 구상

| 연번 | 알고리즘 | 상황 |
| --- | --- | --- |
| 0 | 삽입 정렬 알고리즘 | 항목이 몇개 되지 않는다 |
| 1 | 삽입 정렬 알고리즘 | 항목이 대부분 정렬되어 있다 |
| 2 | 힙 정렬 알고리즘 | 최저 상황을 고려하여야 한다 |
| 3 | 퀵 정렬 알고리즘 | 평균 정렬 결과가 필요하다 |
| 4 | 버킷 정렬 알고리즘 | 항목을 조밀한 모집단에서 가져왔다 |
| 5 | 삽입 정렬 알고리즘 | 가능한 짧은 코드를 선호한다 |

### 파이썬으로 구현한 그래프 자료구조

  1. 그래프에 있는 데이터를 찾는 방법으로 "깊이 우선 탐색"과 "너비 우선 탐색:이 사용된다.

    * Depth First Search[깊이우선탐색] 시작 정점에서 한 방향으로 갈 수 있는 가장 먼 경로까지 탐색하다가 갈 곳이 없으면, 가장 마지막 만났던 부모 노드로 돌아와서 다른 방향으로 탐색하는 방법
    * Breadth First Search(너비우선탐색] 시작 정점에서 인접한 모든 정점들을 우선 방문한 후 더 이상 방문하지 않은 정점이 없을 때까지 다시 시작점으로 해서 모든 정점들을 차례로 방문하는 방법
  
  2. 신장 트리

    그래프 안의 모든 정점을 포함하는 트리이며, 모든 정점들이 연결되어 있어야 하고 사이클을 포함하지 않는다.

  3. 최소 비용 신장 트리

    가중치가 부여된 무방향 그래프에서 신장 트리 비용의 최소화를 구하는 방법

    예를 들어, 최단 경로의 문제에서 그래프를 사용한다. 그래프에서 정점 a,b를 연결하는 경로 중 가중치의 합이 최소가 되는 경로를 찾는 방법을 말한다. 데이크스트라[Dijkstra] 알고리즘이 대표적이다.

    * PRIM방법
      - 시작하는 노드에 연결된 것 중 **가중치가 최소인 노드 선정**
      - 선정된 노드에 연결된 것 중에 **가중치가 최소인 것을 선정**
      - 이어진 노드에서 **최솟값을 계속 선정하는 방법**

    * Kruskal방법
      - **전체 그래프에서 최소 가중치를 선정**
      - 그 다음 **최소 가중치를 가지는 것을 선정**
      - 선정할 때 사이클을 구성하는 것이 있으면 제외하고 작업을 진행. 동일한 것이 여러 개 있으면 임의로 하나를 선정하여 진행

In [None]:
# 노드의 형식을 정의하는 부분
class Node(object):
  # object *arg, *kwarg
  def __init__(self, data = None):
    self.data = data
    self.left = self.right = None

class BinarySearchTree(object):
  def __init__(self):
    self.root = None

# 이진트리에 데이터를 넣는 부분
  def insert(self, data: Any):
    self.root = self._insert_value(self.root, data)
    return self.root is not None

  def _insert_value(self, node: Any, data: Any):
    if node is None:
      node = Node(data)

    else:
      if data <= node.data:
        node.left = self._insert_value(node.left, data)
      else: # data > node.data
        node.right = self._insert_value(node.right, data)

    return node

# 이진트리에서 데이터를 찾는 부분
  def find(self, key):
    return self._find_value(self.root, key)

  def _find_value(self, root: Any, key: Any):
    if root is None or root.data == key:
      return root is not None
    elif key < root.data:
      return self._find_value(root.left, key)
    else:
      return self._find_value(root.right, key)

# 이진트리에서 데이터를 지우는 부분
  def delete(self, key):
    self.root, deleted = self._delete_value(self.root, key)

  def _delete_value(self, node, key):
    if node is None:
      return node, False

    deleted = False

    if key == node.data:
      deleted = True
      if node.left and node.right :
        parent, child = node, node.right
        while child.left is not None :
          parent, child = child, child.left
				child.left = node.left
				if parent != node:
					parent.left=child.right
					child.right = node.right
				node = child
			elif node.left or node.right :
				node = node.left or node.right
			else:
				node = None
		elif key < node.data:
			node.left, deleted = self._delete_value(node.left, key)
		else :
			node.right, deleted = self._delete_value(node.right, key)
		return node, deleted

# 데이터를 출력하는 부분
  def DFTravel(self):
    def _DFTravel(root):
			if root is None:
				pass
			else :
				print(root.data, end=' ')
				_DFTravel(root.left)
				_DFTravel(root.right)
			_DFTravel(self.root)

# 데이터를 출력하는 부분
	def LFTravel(self):
   def _LFTravel(root) :
			if root is None :
				pass
			else:
				_LFTravel(root.left)
				print(root.data, end=' ')
				_LFTravel(root.right)

		_LFTravel(self.root)

# 데이터를 출력하는 부분
  def LRTravel(self):
    def _LRTravel(root) :
			if root is None:
				pass
			else :
				_LRTravel(root.left)
				_LRTravel(root.right)
				print(root.data, end=' ')

		_LRTravel(self.root)

# 데이터를 출력하는 부분
  def layerTravel(self):
    def _layerTravel(root) :
			queue = [root]
			while queue :
				root = queue.pop(0)
				if root is not None :
					print(root.data, end=' ')
					if root.left :
						queue.append(root.left)
					if root.right:
						queue.append(root.right)

		_layerTravel(self.root)

In [None]:
# 데이터의 선언
data = [20,6,8,12,78,32,65,32,7,9]
tree = BinarySearchTree()

# 트리 구조의 완성
for x in data:
	tree.insert(x)

# 트리 안의 데이터 존재에 대한 확인 및 조작
print(tree.find(9))
print(tree.find(3))

print(tree.delete(78))
print(tree.delete(6))
print(tree.delete(11))

# 트리 구조의 데이터 출력
print("\n@@@@@@@")
tree.DFTravel() # 깊이 우선 탐색 중 전위 순회 : 뿌리 > 왼쪽 트리 > 오른쪽 트리
print("\n=====")
tree.LFTravel() # 깊이 우선 탐색 중 중위 순회 : 왼쪽 트리 > 뿌리 > 오른쪽 트리
print("\n*****")
tree.LRTravel() # 깊이 우선 탐색 중 후위 순회 : 왼쪽 트리 > 오른쪽 트리 > 뿌리 노드
print("\n&&&&&")
tree.layerTravel() # 너비 우선 탐색 : 뿌리 노드부터 깊이순으로 방문