### [쿼리 최적화하기]

##### [도서관에서 책찾기]

1. 듀이 십진분류법의 도움을 받아 책의 위치를 특정
2. 청구기호 검색 (책이 가진 고유 기호를 받는다. ex> 325-23.44.55)
3. 책장 찾기 - 300번 320번 등
4. 해당하는 책장에서 책 찾기  
	< 트리 자료 구조 >
	- 국립중앙도서관 - 3xx - 32x - 325

##### brute force
- 000번 책장부터 999책장까지
	- 책장의 모든 책 훑기  
		-> 1000 + 12,000,000번의 탐색(비효율적
- 듀이 십진분류법
	- 3xx
	- 32x
	- 325
		- 책장에서 책 찾기  
		-> 3 * (1 ~ 10) + (1 ~ 100) 번의 탐색 (최소 4번 ~ 최대 400번)

### [책 제목으로 도서검색]
1. brute force -> 책 제목, 저자 등에 index가 걸려있지 않은 경우
	- 일일이 모든 책장을 뒤져가며 모든 책을 비교해야 하기에 비효율적

2. 인덱스 (= 듀이 십진분류법)
- 트리 형태로 데이터를 분류함
	1. 청구번호 대신 제목
		- 책 제목들에 인덱스를 생성해서 DB상에 트리형태로 걸려있다고 가정
	2. 트리 구조
		- 'title'을 사전순 정렬
		- '개': a시간 / '개발': b시간 / '개발자': c시간  
			-> a + b + c 번의 탐색
	3. 비효율적인 트리 모양
		- 개발자 전문 서점
			- '개발의'로 시작하는 장서까지 검색해야 되기 때문에 브루트 포스랑 성능상 차이가 크지 않음.
		- 항상 균현 상태 유지가 필요
			- 자가 균형 트리
			- 임의의 기준에 따라 나뉘게 되는데, 그 기준에 따라 노드가 항상 균형을 이룰 수 있도록 유지하는 트리
			- AVL tree
			- red-black tree (조금 더 효율적이기에 많이 사용되는 트리 형태)


### [인덱스의 종류]

1. B tree 인덱스
	- 자가 균형 트리의 일종이다.
2. hash 인덱스
	- B tree 인덱스보다 처리 속도가 빠르다
3. 공간 인덱스
	- 쿼리 값에 공간 값이 들어갈 때 사용한다.
	- 주로 altree라는 구조를 많이 쓴다.

### [추가적인 인덱스 종류]

1. 단일 컬럼 인덱스
	```
	SELECT *
	FROM books
	WHERE title = '개발자가 되고 싶습니다';
	```
2. 복수 컬럼 인덱스
	```
	SELECT *
	FROM books
	WHERE title = '개발자가 되고 싶습니다'
	AND publication_data = '2024';
	```

In [1]:
import timeit
from sortedcontainers import SortedList

# list에 index가 없는 상황에서 brute force방식으로 탐색
# 데이터 삽입(DB에서는 INSERT와 동일)

print("리스트 생성 시작")
start_time_list = timeit.default_timer()	# 시간 측정하는 방법 내장 패키지 라이브러리
data_list = list(range(1, 320_000_001))		# range는 첫번째 인자부터 두번째 인자까지 사이의 숫자를 반환해준다. 첫 번재 인자는 포함되고 두번째 인자는 포함되지 않는다.
end_time_list = timeit.default_timer()
time_setup_list = end_time_list - start_time_list	# 최종 리스트 생성 시간을 확인하기 위해 끝난 시간에서 시작 시간을 빼준다.
print(f'리스트 생성 소요 시간: {time_setup_list:.6f} sec')


# tree(자가 균형 트리)로 index가 있는 상황에서 tree search를 통해 탐색
# 데이터 삽입(DB에서는 INSERT와 동일)
print("리스트 생성 시작")
start_time_tree = timeit.default_timer()
data_tree = SortedList(list(range(1, 320_000_001)))	
end_time_tree = timeit.default_timer()
time_setup_tree = end_time_tree - start_time_tree
print(f'트리 생성 소요 시간: {time_setup_tree:.6f} sec')


# 데이터 조회 (DB상 SELECT)
# list를 통한 탐색
def fetch_from_list(target):	# target : 찾고자 하는 책
    for data in data_list:		# brute force방식이라서 for문을 사용하여 리스트 안의 값을 하나하나 조회하도록 사용
        if data == target:
            return data_list[target]	# target과 data(list)가 일치하면 값을 반환
        

#tree를 통한 탐색
def fetch_from_tree(target):
    return data_tree[target]	# tree search 방식


# 함수를 호출하여 조회
# target 할당
target = 160_000_000

# List 조회
print("리스트 조회 시작")
time_list = timeit.default_timer()
fetch_from_list(target)		# target을 list조회용 함수에 호출
end_time_list = timeit.default_timer()	# 호출이 완료되면 조회에 사용한 시간 표시
time_fetch_list = end_time_list - start_time_list
print(f'리스트 조회 소요 시간: {time_fetch_list:.6f} sec')


# tree 조회
print("트리 조회 시작")
start_time_tree = timeit.default_timer()
fetch_from_tree(target)
end_time_tree = timeit.default_timer()
time_fetch_tree = end_time_list - start_time_list
print(f'트리 조회 소요 시간: {time_fetch_tree:.6f} sec')

리스트 생성 시작


KeyboardInterrupt: 

In [None]:
()