In [62]:
class node:
	def __init__(self,value=None):
		self.value=value
		self.left_child=None
		self.right_child=None
		self.parent=None # pointer to parent node in tree

class binary_search_tree:
	def __init__(self):
		self.root=None

	def insert(self,value):
		if self.root==None:
			self.root=node(value)
		else:
			self._insert(value,self.root)

	def _insert(self,value,cur_node):
		if value<cur_node.value:
			if cur_node.left_child==None:
				cur_node.left_child=node(value)
				cur_node.left_child.parent=cur_node # set parent
			else:
				self._insert(value,cur_node.left_child)
		elif value>cur_node.value:
			if cur_node.right_child==None:
				cur_node.right_child=node(value)
				cur_node.right_child.parent=cur_node # set parent
			else:
				self._insert(value,cur_node.right_child)
		#else:
			##print("Value already in tree!")

	def print_tree(self):
		if self.root!=None:
			self._print_tree(self.root)

	def _print_tree(self,cur_node):
		if cur_node!=None:
			self._print_tree(cur_node.left_child)
			print (str(cur_node.value))
			self._print_tree(cur_node.right_child)

	def height(self):
		if self.root!=None:
			return self._height(self.root,0)
		else:
			return 0

	def _height(self,cur_node,cur_height):
		if cur_node==None: return cur_height
		left_height=self._height(cur_node.left_child,cur_height+1)
		right_height=self._height(cur_node.right_child,cur_height+1)
		return max(left_height,right_height)

	def find(self,value):
		if self.root!=None:
			return self._find(value,self.root)
		else:
			return None

	def _find(self,value,cur_node):
		if value==cur_node.value:
			return cur_node
		elif value<cur_node.value and cur_node.left_child!=None:
			return self._find(value,cur_node.left_child)
		elif value>cur_node.value and cur_node.right_child!=None:
			return self._find(value,cur_node.right_child)

	def delete_value(self,value):
		return self.delete_node(self.find(value))

	def delete_node(self,node):

		## -----
		# Improvements since prior lesson

		# Protect against deleting a node not found in the tree
		if node==None or self.find(node.value)==None:
			print("Node to be deleted not found in the tree!")
			return None 
		## -----

		# returns the node with min value in tree rooted at input node
		def min_value_node(n):
			current=n
			while current.left_child!=None:
				current=current.left_child
			return current

		# returns the number of children for the specified node
		def num_children(n):
			num_children=0
			if n.left_child!=None: num_children+=1
			if n.right_child!=None: num_children+=1
			return num_children

		# get the parent of the node to be deleted
		node_parent=node.parent

		# get the number of children of the node to be deleted
		node_children=num_children(node)

		# break operation into different cases based on the
		# structure of the tree & node to be deleted

		# CASE 1 (node has no children)
		if node_children==0:

			# Added this if statement post-video, previously if you 
			# deleted the root node it would delete entire tree.
			if node_parent!=None:
				# remove reference to the node from the parent
				if node_parent.left_child==node:
					node_parent.left_child=None
				else:
					node_parent.right_child=None
			else:
				self.root=None

		# CASE 2 (node has a single child)
		if node_children==1:

			# get the single child node
			if node.left_child!=None:
				child=node.left_child
			else:
				child=node.right_child

			# Added this if statement post-video, previously if you 
			# deleted the root node it would delete entire tree.
			if node_parent!=None:
				# replace the node to be deleted with its child
				if node_parent.left_child==node:
					node_parent.left_child=child
				else:
					node_parent.right_child=child
			else:
				self.root=child

			# correct the parent pointer in node
			child.parent=node_parent

		# CASE 3 (node has two children)
		if node_children==2:

			# get the inorder successor of the deleted node
			successor=min_value_node(node.right_child)

			# copy the inorder successor's value to the node formerly
			# holding the value we wished to delete
			node.value=successor.value

			# delete the inorder successor now that it's value was
			# copied into the other node
			self.delete_node(successor)

	def search(self,value):
		if self.root!=None:
			return self._search(value,self.root)
		else:
			return False

	def _search(self,value,cur_node):
		if value==cur_node.value:
			return True
		elif value<cur_node.value and cur_node.left_child!=None:
			return self._search(value,cur_node.left_child)
		elif value>cur_node.value and cur_node.right_child!=None:
			return self._search(value,cur_node.right_child)
		return False 

In [58]:
import time
import numpy as np

NUM = 1000

for i in range(10):
    t = binary_search_tree()
    f = open(str(NUM)+"_"+str(i)+".txt",'r')
    nums = []
    lines = f.readlines()
    for line in lines:
        nums.append(int(line))

    start = time.time()
    for num in nums:
        t.insert(num)
    print(i+1,"번째 트리 생성 시간: ",time.time() - start)
    print(i+1,"번째 트리 높이: ",t.height())
    
    for j in range(5):
        start = time.time()
        randNum = nums[np.random.randint(NUM)]
        t.delete_value(randNum)
        print(i+1,"-",j+1,"번째 탐색, 찾는 숫자",randNum,"탐색+삭제 시간:",time.time() - start)
    
    print()
    
    f.close()

1 번째 트리 생성 시간:  0.005984306335449219
1 번째 트리 높이:  19
1 - 1 번째 탐색, 찾는 숫자 7431752 탐색+삭제 시간: 0.0
1 - 2 번째 탐색, 찾는 숫자 4666120 탐색+삭제 시간: 0.0
1 - 3 번째 탐색, 찾는 숫자 3928095 탐색+삭제 시간: 0.0
1 - 4 번째 탐색, 찾는 숫자 1818495 탐색+삭제 시간: 0.0
1 - 5 번째 탐색, 찾는 숫자 394677 탐색+삭제 시간: 0.0

2 번째 트리 생성 시간:  0.003989696502685547
2 번째 트리 높이:  20
2 - 1 번째 탐색, 찾는 숫자 1456997 탐색+삭제 시간: 0.0
2 - 2 번째 탐색, 찾는 숫자 5736368 탐색+삭제 시간: 0.0
2 - 3 번째 탐색, 찾는 숫자 562736 탐색+삭제 시간: 0.0
2 - 4 번째 탐색, 찾는 숫자 1623268 탐색+삭제 시간: 0.0
2 - 5 번째 탐색, 찾는 숫자 3819147 탐색+삭제 시간: 0.0

3 번째 트리 생성 시간:  0.004978179931640625
3 번째 트리 높이:  20
3 - 1 번째 탐색, 찾는 숫자 3418039 탐색+삭제 시간: 0.0
3 - 2 번째 탐색, 찾는 숫자 6093025 탐색+삭제 시간: 0.0
3 - 3 번째 탐색, 찾는 숫자 2211348 탐색+삭제 시간: 0.0
3 - 4 번째 탐색, 찾는 숫자 7072295 탐색+삭제 시간: 0.0
3 - 5 번째 탐색, 찾는 숫자 1055822 탐색+삭제 시간: 0.0

4 번째 트리 생성 시간:  0.002991914749145508
4 번째 트리 높이:  24
4 - 1 번째 탐색, 찾는 숫자 6963168 탐색+삭제 시간: 0.0
4 - 2 번째 탐색, 찾는 숫자 3940199 탐색+삭제 시간: 0.0
4 - 3 번째 탐색, 찾는 숫자 2225540 탐색+삭제 시간: 0.0
4 - 4 번째 탐색, 찾는 숫자 7492883 탐색+삭제 시간: 0.0
4 - 5 번째

In [59]:
import time
import numpy as np

NUM = 10000

for i in range(10):
    t = binary_search_tree()
    f = open(str(NUM)+"_"+str(i)+".txt",'r')
    nums = []
    lines = f.readlines()
    for line in lines:
        nums.append(int(line))

    start = time.time()
    for num in nums:
        t.insert(num)
    print(i+1,"번째 트리 생성 시간: ",time.time() - start)
    print(i+1,"번째 트리 높이: ",t.height())
    
    for j in range(5):
        start = time.time()
        randNum = nums[np.random.randint(NUM)]
        t.delete_value(randNum)
        print(i+1,"-",j+1,"번째 탐색, 찾는 숫자",randNum,"탐색+삭제 시간:",time.time() - start)
    
    print()
    
    f.close()

1 번째 트리 생성 시간:  0.07383275032043457
1 번째 트리 높이:  31
1 - 1 번째 탐색, 찾는 숫자 4956688 탐색+삭제 시간: 0.0
1 - 2 번째 탐색, 찾는 숫자 4491766 탐색+삭제 시간: 0.0
1 - 3 번째 탐색, 찾는 숫자 414756 탐색+삭제 시간: 0.0
1 - 4 번째 탐색, 찾는 숫자 4079595 탐색+삭제 시간: 0.0
1 - 5 번째 탐색, 찾는 숫자 1676693 탐색+삭제 시간: 0.0

2 번째 트리 생성 시간:  0.10771012306213379
2 번째 트리 높이:  29
2 - 1 번째 탐색, 찾는 숫자 2873641 탐색+삭제 시간: 0.0
2 - 2 번째 탐색, 찾는 숫자 4020575 탐색+삭제 시간: 0.0
2 - 3 번째 탐색, 찾는 숫자 2130626 탐색+삭제 시간: 0.0
2 - 4 번째 탐색, 찾는 숫자 7767525 탐색+삭제 시간: 0.0
2 - 5 번째 탐색, 찾는 숫자 2454500 탐색+삭제 시간: 0.0

3 번째 트리 생성 시간:  0.058829545974731445
3 번째 트리 높이:  28
3 - 1 번째 탐색, 찾는 숫자 214279 탐색+삭제 시간: 0.0
3 - 2 번째 탐색, 찾는 숫자 3466761 탐색+삭제 시간: 0.0
3 - 3 번째 탐색, 찾는 숫자 630061 탐색+삭제 시간: 0.0
3 - 4 번째 탐색, 찾는 숫자 822990 탐색+삭제 시간: 0.0
3 - 5 번째 탐색, 찾는 숫자 3235682 탐색+삭제 시간: 0.0

4 번째 트리 생성 시간:  0.06716513633728027
4 번째 트리 높이:  30
4 - 1 번째 탐색, 찾는 숫자 5928591 탐색+삭제 시간: 0.0
4 - 2 번째 탐색, 찾는 숫자 1382540 탐색+삭제 시간: 0.0
4 - 3 번째 탐색, 찾는 숫자 1981348 탐색+삭제 시간: 0.0
4 - 4 번째 탐색, 찾는 숫자 9270563 탐색+삭제 시간: 0.0
4 - 5 번째 탐색, 

In [64]:
import time
import numpy as np


NUM = 100000
timeSum = []
heightSum = []
for i in range(10):
    t = binary_search_tree()
    f = open(str(NUM)+"_"+str(i)+".txt",'r')
    nums = []
    lines = f.readlines()
    for line in lines:
        nums.append(int(line))

    start = time.time()
    for num in nums:
        t.insert(num)
    timeSum.append(time.time() - start)
    heightSum.append(t.height())
    print(i+1,"번째 트리 생성 시간: ",time.time() - start)
    print(i+1,"번째 트리 높이: ",t.height())
    
    for j in range(5):
        start = time.time()
        randNum = nums[np.random.randint(NUM)]
        t.delete_value(randNum)
        print(i+1,"-",j+1,"번째 탐색, 찾는 숫자",randNum,"탐색+삭제 시간:",time.time() - start)
    
    print()
    
    f.close()


print(np.mean(timeSum))
print(np.mean(heightSum))

1 번째 트리 생성 시간:  2.6376733779907227
1 번째 트리 높이:  44
1 - 1 번째 탐색, 찾는 숫자 8715432 탐색+삭제 시간: 0.0
1 - 2 번째 탐색, 찾는 숫자 8076607 탐색+삭제 시간: 0.0
1 - 3 번째 탐색, 찾는 숫자 3728503 탐색+삭제 시간: 0.0
1 - 4 번째 탐색, 찾는 숫자 7238464 탐색+삭제 시간: 0.0
1 - 5 번째 탐색, 찾는 숫자 7341089 탐색+삭제 시간: 0.0

2 번째 트리 생성 시간:  1.0030176639556885
2 번째 트리 높이:  44
2 - 1 번째 탐색, 찾는 숫자 8707809 탐색+삭제 시간: 0.0
2 - 2 번째 탐색, 찾는 숫자 1145187 탐색+삭제 시간: 0.0
2 - 3 번째 탐색, 찾는 숫자 5703798 탐색+삭제 시간: 0.0
2 - 4 번째 탐색, 찾는 숫자 2311977 탐색+삭제 시간: 0.0
2 - 5 번째 탐색, 찾는 숫자 8916626 탐색+삭제 시간: 0.0

3 번째 트리 생성 시간:  0.9826045036315918
3 번째 트리 높이:  40
3 - 1 번째 탐색, 찾는 숫자 4111658 탐색+삭제 시간: 0.0
3 - 2 번째 탐색, 찾는 숫자 9654463 탐색+삭제 시간: 0.0
3 - 3 번째 탐색, 찾는 숫자 3264673 탐색+삭제 시간: 0.0
3 - 4 번째 탐색, 찾는 숫자 5551378 탐색+삭제 시간: 0.0
3 - 5 번째 탐색, 찾는 숫자 294924 탐색+삭제 시간: 0.0

4 번째 트리 생성 시간:  0.9505670070648193
4 번째 트리 높이:  48
4 - 1 번째 탐색, 찾는 숫자 8065880 탐색+삭제 시간: 0.0
4 - 2 번째 탐색, 찾는 숫자 4607059 탐색+삭제 시간: 0.0
4 - 3 번째 탐색, 찾는 숫자 6946294 탐색+삭제 시간: 0.0
4 - 4 번째 탐색, 찾는 숫자 4056225 탐색+삭제 시간: 0.0
4 - 5 번째 탐색, 찾는

In [66]:
import time
import numpy as np

NUM = 1000000
timeSum = []
heightSum = []

for i in range(10):
    t = binary_search_tree()
    f = open(str(NUM)+"_"+str(i)+".txt",'r')
    nums = []
    lines = f.readlines()
    for line in lines:
        nums.append(int(line))

    start = time.time()
    for num in nums:
        t.insert(num)
    timeSum.append(time.time() - start)
    heightSum.append(t.height())
    print(i+1,"번째 트리 생성 시간: ",time.time() - start)
    print(i+1,"번째 트리 높이: ",t.height())
    
    for j in range(5):
        start = time.time()
        randNum = nums[np.random.randint(NUM)]
        t.delete_value(randNum)
        print(i+1,"-",j+1,"번째 탐색, 찾는 숫자",randNum,"탐색+삭제 시간:",time.time() - start)
    
    print()
    
    f.close()
    

print(np.mean(timeSum))
print(np.mean(heightSum))

nan
nan
1 번째 트리 생성 시간:  17.704874277114868
1 번째 트리 높이:  55
1 - 1 번째 탐색, 찾는 숫자 9677558 탐색+삭제 시간: 0.0
1 - 2 번째 탐색, 찾는 숫자 3266211 탐색+삭제 시간: 0.0
1 - 3 번째 탐색, 찾는 숫자 3793027 탐색+삭제 시간: 0.0
1 - 4 번째 탐색, 찾는 숫자 5870278 탐색+삭제 시간: 0.0
1 - 5 번째 탐색, 찾는 숫자 3243118 탐색+삭제 시간: 0.0

2 번째 트리 생성 시간:  17.447664260864258
2 번째 트리 높이:  47
2 - 1 번째 탐색, 찾는 숫자 2694336 탐색+삭제 시간: 0.0
2 - 2 번째 탐색, 찾는 숫자 2015008 탐색+삭제 시간: 0.0
2 - 3 번째 탐색, 찾는 숫자 8902071 탐색+삭제 시간: 0.0
2 - 4 번째 탐색, 찾는 숫자 2107447 탐색+삭제 시간: 0.0
2 - 5 번째 탐색, 찾는 숫자 9292115 탐색+삭제 시간: 0.0

3 번째 트리 생성 시간:  15.824125051498413
3 번째 트리 높이:  48
3 - 1 번째 탐색, 찾는 숫자 5540230 탐색+삭제 시간: 0.0
3 - 2 번째 탐색, 찾는 숫자 8049454 탐색+삭제 시간: 0.0
3 - 3 번째 탐색, 찾는 숫자 686967 탐색+삭제 시간: 0.0
3 - 4 번째 탐색, 찾는 숫자 6982358 탐색+삭제 시간: 0.0
3 - 5 번째 탐색, 찾는 숫자 6115005 탐색+삭제 시간: 0.0

4 번째 트리 생성 시간:  19.49443221092224
4 번째 트리 높이:  48
4 - 1 번째 탐색, 찾는 숫자 6369822 탐색+삭제 시간: 0.0
4 - 2 번째 탐색, 찾는 숫자 1494805 탐색+삭제 시간: 0.0
4 - 3 번째 탐색, 찾는 숫자 6951919 탐색+삭제 시간: 0.0
4 - 4 번째 탐색, 찾는 숫자 6387744 탐색+삭제 시간: 0.0
4 - 5 번째