## 주요 라이브러리

### itertools
- 파이썬에서 반복되는 형태의 데이터를 처리하는 기능을 제공하는 라이브러리(순열, 조합)
<br>
-permutations, combinations -> 순열, 조합 + 중복x <br>
-product, combinations_with_replacement -> 순열, 조합 + 중복

In [7]:
# permutations() - 순열
# : 리스트와 같은 iterable 객체에서 r개의 데이터를 뽑아 일렬로 나열하는 모든 경우
# 리스트로 변환해 사용

from itertools import permutations

data = ['a', 'b','c']
result = list(permutations(data, 2))
print(result)

[('a', 'b'), ('a', 'c'), ('b', 'a'), ('b', 'c'), ('c', 'a'), ('c', 'b')]


In [6]:
# combinations() - 조합
# : 리스트와 같은 iterable 객체에서 r개의 데이터를 뽑아 순서를 고려하지 않고 나열하는 모든 경우

from itertools import combinations

result2 = list(combinations(data, 2))
print(result2)

[('a', 'b'), ('a', 'c'), ('b', 'c')]


In [10]:
# product() : 순열 + 중복
# repeat = 뽑고자 하는 수

from itertools import product

result3 = list(product(data, repeat=2))
print(result3)

[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'a'), ('b', 'b'), ('b', 'c'), ('c', 'a'), ('c', 'b'), ('c', 'c')]


In [12]:
# combinations_with_replacement() : 조합 + 중복

from itertools import combinations_with_replacement

result4 = list(combinations_with_replacement(data, 2))
print(result4)


[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'b'), ('b', 'c'), ('c', 'c')]


### heapq
- 힙의 기능을 제공하는 라이브러리 -> 우선순위 큐 구현을 위함
- 우선순위 큐 : 우선순위를 가진 트리구조
- 파이썬의 힙 : min heap으로 구성 -> max heap의 경우 부호를 반대로 넣었다가 빼고나서 부호를 다시 반대로
- 단순히 원소를 힙에 넣었다 빼는 것만으로도 시간 복잡도 O(NlongN) 오름차순 정렬<br>
heapq.heappush(), heapq.heappop()

In [13]:
# heap sort를 heapq로 구현하는 예제
# heap은 중복 원소 가능
import heapq

def heapsort(iterable):
    h = []
    result = []

    for i in iterable:  # 트리에 오름차순으로 push - O(NlogN)
        heapq.heappush(h, i)
        # heapq.heappush(h, -i) -> max heap의 경우

    for _ in range(len(h)):
        result.append(heapq.heappop(h))
        # result.append(-heapq.heappop(h))

    return result

data = heapsort([1,3,5,7,9,2,4,6,8,0,5])
print(data)    

[0, 1, 2, 3, 4, 5, 5, 6, 7, 8, 9]


## bisect
- 이진 탐색(Binary Search) 기능을 제공하는 라이브러리
- <u>정렬된 배열</u>에서 특정한 원소를 찾아야 할 때 매우 효과적
<br>bisect_left(a,x) : 리스트 a에 데이터 x를 삽입할 가장 왼쪽 인덱스
<br>bisect_right(a,x) : 리스트 a에 데이터 x를 삽입할 가장 오른쪽 인덱스<br>

In [15]:
from bisect import bisect_left, bisect_right

a = [1,2,4,4,8]
x = 4

print(bisect_right(a,4))    # 4를 넣을 가장 오른쪽 인덱스
print(bisect_left(a,4))

4
2


In [16]:
# 값의 범위가 [left_value, right_value]인 데이터의 개수 반환
def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index

a = [1,2,3,3,3,3,4,4,8,9]
print(count_by_range(a,4,4,))
print(count_by_range(a,-1,3))

2
6


### collections
- 덱(deque), 카운터(Counter) 등의 유용한 자료구조를 포함하고 있는 라이브러리
- 보통 deque를 사용해 큐를 표현
<br>list의 경우 append, pop은 가장 뒤쪽 원소를 기준으로 수행
<br> deque는 가장 앞 또는 가장 뒤 모두 O(1)
<br>- popleft(), appendleft(x)

In [19]:
from collections import deque

data = deque([2,3,4])
data.appendleft(1)
data.append(5)

print(data)
print(list(data))

deque([1, 2, 3, 4, 5])
[1, 2, 3, 4, 5]


In [22]:
# 등장 횟수를 세는 기능 - iterable 객체 가능
from collections import Counter

counter = Counter(['red','blue', 'red', 'green', 'blue', 'blue'])
print(counter['blue'])
print(dict(counter))

3
{'red': 2, 'blue': 3, 'green': 1}


### math

In [24]:
import math

print(math.factorial(5))
print(math.gcd(21,14))
print(math.pi)
print(math.e)

120
7
3.141592653589793
2.718281828459045


## 알고리즘

### 소수의 판별

In [25]:
# (1) 가장 간단한 방법
def is_prime_number(x):
    for i in range(2,x):
        if x%i==0:
            return False
    return True

print(is_prime_number(7))

True


In [26]:
# (2) 약수의 특징을 이용 - sqrt(x)
def is_prime_number2(x):
    for i in range(2, int(x**0.5)+1):
        if x%i==0:
            return False
    return True

print(is_prime_number2(7))

True


In [27]:
# (3) 에라토스테네스의 체
# 여러 개의 수가 소수인지 아닌지를 판별할 때 사용하는 대표적인 알고리즘
# N보다 작거나 같은 모든 소수를 찾을 때 사용

# i부터 N까지의 모든 소수 출력
n = 1000    # 2~1000까지의 모든 수에 대해 소수 판별
array = [True for i in range(n+1)]      # 모든 수가 소수(True)로 초기화

# 에라토스테네스 알고리즘
for i in range(2, int(n**0.5)+1):
    if array[i] == True:
        j = 2
        while i * j <= n:
            array[i*j] = False
            j+=1

# 출력
for i in range(2,n+1):
    if array[i]:
        print(i,end=' ')

2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 101 103 107 109 113 127 131 137 139 149 151 157 163 167 173 179 181 191 193 197 199 211 223 227 229 233 239 241 251 257 263 269 271 277 281 283 293 307 311 313 317 331 337 347 349 353 359 367 373 379 383 389 397 401 409 419 421 431 433 439 443 449 457 461 463 467 479 487 491 499 503 509 521 523 541 547 557 563 569 571 577 587 593 599 601 607 613 617 619 631 641 643 647 653 659 661 673 677 683 691 701 709 719 727 733 739 743 751 757 761 769 773 787 797 809 811 821 823 827 829 839 853 857 859 863 877 881 883 887 907 911 919 929 937 941 947 953 967 971 977 983 991 997 

### 투 포인터
- 리스트에 순차적으로 접근해야 할 때 2개의 점의 위치를 기록하면서 처리하는 알고리즘<br>
- 한 리스트 내에서 특정한 합<br><br>
ex) 한 반에 학생이 40명이 있을 때, 모든 학생을 번호 순서대로 일렬로 세운 뒤, 학생들을 순차적으로 지목해야할 경우, 2,3,4,5,6,7 이라고 부르기 보다는 2번부터 7번까지의 학생이라고 부를 수 있다. 리스트에 담긴 데이터에 순차적으로 접근해야할 때는 '시작점'과 '끝'점 2개의 점으로 접근할 데이터의 범위를 표현할 수 있다.

In [28]:
# 양의 정수로만 구성된 리스트가 주어졌을 때, 그 부분 연속 수열 중에서
# '특정한 합'을 갖는 수열의 개수를 출력하는 문제
# (1) 시작점(start), 끝점(end) -> index 0
# (2) 현재 부분합이 M과 같다면 count+=1
# (3) 현재 부분합이 M보다 작다면 end+=1
# (4) 현재 부분합이 M보다 크거나 같다면 start+=1
# (5) 모든 경우에 대하여 (2)~(4) 반복

n = 5   # 데이터의 개수
m = 5   # 찾고자 하는 부분 합
data = [1,2,3,2,5]

count = 0
interval_sum = 0
end = 0

# start를 차례대로 증가시키며 반복
for start in range(n):
    # end를 가능한 만큼 이동시키기
    while interval_sum < m and end < n:
        interval_sum += data[end]
        end += 1
    # 부분합이 n일 때 카운트 증가
    if interval_sum == m:
        count +=1
    interval_sum -= data[start]

print(count)


3


In [31]:
# 정렬되어 있는 두 리스트의 합집합
# 2개의 포인터를 이용해 각 리스트에서 처리되지 않은 워소 중 가장 작은 원소를 가리키면 된다.
# (1) 정렬된 리스트 A와 B를 입력받는다.
# (2) 리스트 A에서 처리되지 않은 원소 중 가장 작은 원소를 i가 가리키도록 한다.
# (3) 리스트 B에서 처리되지 않은원소 중 가장 작은 원소가 j가 가리키도록 한다.
# (4) A[i]와 B[j] 중에서 더 작은 원소를 결과 리스트에 담는다.
# (5) 리스트 A와 B에서 더 이상 처리할 원소가 없을 때까지 (2)~(4)번의 과정을 반복한다.

# 정렬된 리스트 A와 B의 데이터 개수가 각각 N, M이라고 할 때, 이 알고리즘의 시간 복잡도 : O(N+M)

# 사전에 정렬된 리스트 A와 B
n,m = 3, 4
a = [1,3,5]
b = [2,4,6,8]

# 리스트 A와 B의 모든 원소를 담을 수 있는 크기의 결과 리스트 초기화
result = [0] * (n+m)
i,j,k = 0,0,0

# 모든 원소가 결과 리스트에 담길 때까지 반복
while i < n or j < m:
    # 리스트 B의 모든 원소가 처리되었거나, 리스트 A의 원소가 더 작을 때
    if j >= m or (i < n and a[i] <= b[j]):
        result[k]=a[i]
        i+=1
    else:
        result[k] = b[j]
        j+=1
    k+=1

print(result)


[1, 2, 3, 4, 5, 6, 8]


### 구간 합
: 연속적으로 나열된 N개의 수가 있을 때, 특정 구간의 모든 수를 합한 값을 구하는 문제
- 만약 M개의 쿼리 각각, 매번 합을 계산한다면 이 알고리즘은 O(NM)의 시간 복잡도를 가진다.<br>
왜냐하면 M개의 쿼리가 수행될 때마다 전체 리스트의 구간 합을 모두 계산하라고 할 수도 있기 때문
<br>
-> 여러번 사용될 만한 정보는 미리 구해 저장해 놓을수록 유리하다. 쿼리는 M개지만, N개의 수는 한 번 주어진 뒤에 변경되지 않는다.<br>
-> N개의 수에 대해서 어떠한 처리를 수행한 뒤에 나중에 M개의 쿼리가 각각 주어질 때마다 빠르게 구간합을 도출할 수 있도록 하자.
<br>
-> 구간합 계산을 위해 가장 많이 사용되는 기법 : 접두사 합(Prefix Sum)<br>
-> 각 쿼리에 대해 구간 합을 빠르게 계산하기 위해서는 N개의 수의 위치 각각에 대하여 접두사 합을 미리 구해 놓으면 된다.<br>
<br>
** 접두사 합 : 리스트의 맨 앞부터 특정 위치까지의 합을 구해 놓은 것


In [32]:
# 구간 합 빠르게 계산하기 알고리즘
# (1) N개의 수에 대하여 접두사 합(Prefix Sum)을 계산해 배열 P에 저장
# (2) 매 M개의 쿼리 정보 [L,R]을 확인할 때, 구간 합은 P[R] - P[L-1]

# 데이터의 개수 N과 전체 데이터 선언
n = 5
data = [10,20,30,40,50]

# 접두사 합(Prefix Sum) 배열 계산
sum_value = 0
prefix_sum = [0]
for i in data:
    sum_value +=i
    prefix_sum.append(sum_value)

# 구간 합 계산  (3 ~ 4번째)
left = 3
right = 4
print(prefix_sum[right]-prefix_sum[left-1])

70


### 재귀 함수 Recursive Function
: 내부 구조는 스택구조와 동일, 가장 마지막에 호출한 함수가 먼저 수행을 끝내야 그 앞의 함수 호출이 종료된다.


In [35]:
# 간단한 재귀함수
def recursive_function(i):
    if i== 10:
        print('--------------')
        return
    print(i,'번째 재귀함수 호출')
    recursive_function(i+1)
    print(i,'번째 재귀함수 종료')

recursive_function(1)

1 번째 재귀함수 호출
2 번째 재귀함수 호출
3 번째 재귀함수 호출
4 번째 재귀함수 호출
5 번째 재귀함수 호출
6 번째 재귀함수 호출
7 번째 재귀함수 호출
8 번째 재귀함수 호출
9 번째 재귀함수 호출
--------------
9 번째 재귀함수 종료
8 번째 재귀함수 종료
7 번째 재귀함수 종료
6 번째 재귀함수 종료
5 번째 재귀함수 종료
4 번째 재귀함수 종료
3 번째 재귀함수 종료
2 번째 재귀함수 종료
1 번째 재귀함수 종료


In [None]:
# 반복적으로 구현한 n!
def factorial_iterative(n):
    sum = 0
    for i in range(2,n+1):
        sum *= i

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n <= 1:
        return 1
    return n * factorial_recursive(n-1)

## 자료구조 기초

### 탐색 Search
: 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정<br>
-> 그래프, 트리 등의 자료구조 안에서 탐색하는 문제<br>
-> 대표적인 탐색 문제 : DFS, BFS 꼴

### 자료구조 Data Structure
: 데이터를 표현하고 관리하고 처리하기 위한 구조<br>
-> 삽입(Push)<br>
-> 삭제(Pop)<br>
-> 오버플로 : 특정한 자료구조가 수용할 수 있는 데이터의 크기를 가득 찬 상태에서 삽입 연산을 수행할 때<br>
-> 언더플로 : 데이터가 없는 상태에서 삭제 연산을 수행할 때<br>

### 스택 Stack
: 박스 쌓기, 아래에서 위로 차곡차곡 쌓는다. 아래 박스를 치우기 위해서는 위의 박스를 치워야 한다.<br>
-> 선입후출<br>
기본 리스트에서 append(), pop()

### 큐 Queue
: 대기 줄, 놀이공원에 입장하기 위해 줄을 설 때, 먼저 온 사람이 먼저 들어가게 된다. 공정한 자료구조<br>
-> 선입선출<br>
-> 일자로 뚫린 터널<br>
-> collections 의 deque 자료구조를 활용<br>
: 스택과 큐의 장점을 모두 채택한 것. 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적