# 더 알아두면 좋은 기타 알고리즘

## 1. 소수의 판별
- 소수 : 2보다 큰 자연수 중에서 1과 자기 자신을 제외한 자연수로는 나누어 떨어지지 않는 자연수
- 어떠한 수 X가 소수인지 아닌지 판별하는 가장 간단한 방법은 2부터 X - 1까지 모든 수로 나누어보아 나누어 떨어지는 수가 하나라도 존재하면 소수가 아닌 것 -> 시간 복잡도가 O(X)로 매우 비효율적

### 1) 간단한 소수 판별 함수

In [1]:
def is_prime_number(x):
    for i in range(2, x):
        # x가 해당 수로 나누어떨어진다면
        if x % i == 0:
            return False # 소수가 아님
    return True # 소수임

print(is_prime_number(4))
print(is_prime_number(7))

False
True


### 2) 개선된 알고리즘 
- 어떠한 수의 모든 약수에 대하여 가운데 약수를 기준으로 하여 대칭적으로 2개씩 앞뒤로 묶어서 곱하면 해당 수를 만들 수 있음
- 즉, 특정한 자연수 X가 소수인지 확인하기 위해 바로 가운데 약수(제곱근)까지만 '나누어 떨어지는지' 확인하면 됨
- 개선된 소수 판별 알고리즘의 시간 복잡도는 O(X^1/2)

In [2]:
import math

# 소수 판별 함수
def is_prime_number(x):
    # 2부터 x의 제곱근까지의 모든 수를 확인하여 
    for i in range(2, int(math.sqrt(x)) + 1):
        # x가 해당 수로 나누어떨어진다면
        if x % i == 0:
            return False
    return True

print(is_prime_number(4))
print(is_prime_number(7))

False
True


### 3) 에라토스테네스의 체
- 여러 개의 수가 소수인지 아닌지 판별할 때 사용하는 대표적인 알고리즘
- N보다 작거나 같은 모든 소수를 찾음
    1. 2부터 N까지 모든 자연수를 나열
    2. 남은 수 중에서 아직 처리하지 않은 가장 작은 수 i를 찾음
    3. 남은 수 중에서 i의 배수를 모두 제거(i는 제거하지 않음)
    4. 더 이상 반복할 수 없을 때까지 2번과 3번 반복
- 매 스텝의 남은 수 중에서 아직 처리하지 않은 가장 작은 수 i를 찾을 때는 N의 제곱근(가운데 약수)까지만 증가시키면 됨
- 1은 소수가 아니므로 array[1]의 값으로 False 처리
- 시간 복잡도는 선형 시간에 동작할 정도로 빠르지만 메모리가 많이 필요하므로 N이 1,000,000 이내로 주어지는 경우가 많음

In [None]:
import math

n = 1000 # 2부터 1000까지 모든 수에 대해 소수 판별
array = [True for i in range(n + 1)]
array[1] = False

# 에라토스테네스의 체 알고리즘
for i in range(2, int(math.sqrt(n)) + 1): # 2부터 n의 제곱근까지의 모든 수를 확인하여
    if array[i] == True: # i가 소수인 경우(남은 수인 경우)
        # i를 제외한 모든 배수를 지우기
        j = 2
        while i * j <= n:
            array[i * j] = False
            j += 1
            
# 모든 소수 출력
for i in range(2, n + 1):
    if array[i]:
        print(i, end=' ')

## 2. 투 포인터
- 리스트에 순차적으로 접근해야 할 때 2개의 점의 위치를 기록하면서 처리하는 알고리즘
- '시작점'과 '끝점' 2개의 점으로 접근할 데이터의 범위를 표현할 수 있음

### 1) 특정한 합을 가지는 부분 연속 수열 찾기
- 양의 정수로만 구성된 리스트가 주어졌을 때, 그 부분 연속 수열 중에서 '특정한 합'을 갖는 수열의 개수를 출력하라
- 특정 부분합을 M이라고 할 때 알고리즘의 동작 방식
    1. 시작점(start)과 끝점(end)이 첫 번째 원소의 인덱스(0)를 가리키도록 함
    2. 현재 부분합이 M과 같다면 카운트
    3. 현재 부분합이 M보다 작으면 end를 1 증가
    4. 현재 부분합이 M보다 크거나 같으면 start를 1 증가
    5. 모든 경우를 확인할 때까지 2번부터 4번까지의 과정 반복
- 양수 데이터에서 시작점을 오른쪽으로 이동시키면 항상 값이 감소하고, 끝점을 오른쪽으로 이동시키면 항상 값이 증가

In [3]:
n = 5 # 데이터의 개수 N
m = 5 # 찾고자 하는 부분합 M
data = [1, 2, 3, 2, 5] # 전체 수열

count = 0
interval_sum = 0
end = 0

# start를 차례대로 증가시키며 반복
for start in range(n):
    # end를 가능한 만큼 이동시키기
    while interval_sum < m and end < n:
        interval_sum += data[end]
        end += 1
    # 부분합이 m일 때 카운트 증가
    if interval_sum == m:
        count += 1
    interval_sum -= data[start]
    
print(count)

3


### 2) 정렬되어 있는 두 리스트의 합집합
- 이미 정렬되어 있는 2개의 리스트가 입력으로 주어질 때 두 리스트이 모든 원소를 합쳐서 정렬한 결과를 계산
- 2개 리스트 A, B가 주어졌을 때 2개의 포인터를 이용하여 각 리스트에서 처리되지 않은 원소 중 가장 작은 원소를 가리키면 됨
    1. 정렬된 리스트 A와 B를 입력받음
    2. 리스트 A에서 처리되지 않은 원소 중 가장 작은 원소를 i가 가리키도록 함
    3. 리스트 B에서 처리되지 않은 원소 중 가장 작은 원소를 j가 가리키도록 함
    4. A[i]와 B[j]중 더 작은 원소를 결과 리스트에 담음
    5. 리스트 A와 B에서 더 이상 처리할 원소가 없을 때까지 2 ~ 4번 과정 반복
- 리스트 A와 B의 데이터 개수가 각각 N, M이라고 할 때 시간 복잡도는 O(N + M)

In [4]:
# 사전에 정렬된 리스트 A와 B 선언
n, m = 3, 4
a = [1, 3, 5]
b = [2, 4, 6, 8]

# 리스트 A와 B의 모든 원소를 담을 수 있는 크기의 결과 리스트 초기화
result = [0] * (n + m)
i = 0
j = 0
k = 0

# 모든 원소가 결과 리스트에 담길 때까지 반복
while i < n or j < m:
    # 리스트 B의 모든 원소가 처리되었거나, 리스트 A의 원소가 더 작을 떄
    if j >= m or (i < n and a[i] <= b[j]):
        # 리스트 A의 원소를 결과 리스트로 옮기기
        result[k] = a[i]
        i += 1
    # 리스트 A의 모든 원소가 처리되었거나, 리스트 B의 원소가 더 작을 때
    else:
        # 리스트 B의 원소를 결과 리스트로 옮기기
        result[k] = b[j]
        j += 1
    k += 1
    
# 결과 리스트 출력
for i in result:
    print(i, end=' ')

1 2 3 4 5 6 8 

## 3. 구간 합 계산
- 연속적으로 나열된 N개 수가 있을 때, 특정 구간의 모든 수를 합한 값을 구하는 문제
- [Left, Right] 구간으로 주어진 M개 쿼리가 주어질 때 모든 쿼리에 대해 구간 합을 출력하는 문제가 많음
- 매 쿼리마다 구간 합을 다시 계산한다면 시간 복잡도는 O(NM)
- N개 수의 위치 각각에 대하여 접두사 합, '리스트의 맨 앞부터 특정 위치까지의 합'을 미리 구해 놓자 

<구간 합 빠르게 계산하기 알고리즘>
    1. N개 수에 대해 접두사 합을 계산하여 배열 P에 저장
    2. 매 M개의 쿼리 정보 [L, R]을 확인할 때, 구간 합은 P[R] - P[L - 1]이 됨
    
- 매 쿼리당 계산 시간은 O(1)이 되므로 전체 시간 복잡도는 O(N + M)

In [5]:
# 데이터의 개수 N과 전체 데이터 선언
n = 5
data = [10, 20, 30, 40, 50]

# 접두사 합 배열 계산
sum_value = 0
prefix_sum = [0]
for i in data:
    sum_value += i
    prefix_sum.append(sum_value)
    
# 구간 합 계산(세 번째 수부터 네 번째 수까지)
left = 3
right = 4
print(prefix_sum[right] - prefix_sum[left - 1])

70


## 4. 순열과 조합
- 경우의 수 : 한 번의 시행에서 '일어날 수 있는 사건의 가지 수'

### 1) 순열
- 서로 다른 n개에서 r개를 선택하여 일렬로 나열하는 것
- nPr = n! / (n - r)!

In [6]:
# 1부터 4까지의 수 중 2개를 뽑아 일렬로 나열
import itertools

data = [1, 2, 3, 4]

for x in itertools.permutations(data, 2):
    print(list(x))

[1, 2]
[1, 3]
[1, 4]
[2, 1]
[2, 3]
[2, 4]
[3, 1]
[3, 2]
[3, 4]
[4, 1]
[4, 2]
[4, 3]


### 2) 조합
- 서로 다른 n개에서 순서에 상관 없이 서로 다른 r개를 선택하는 것
- nCr = n! / r! * (n - r)!

In [8]:
# 1부터 4까지의 수 중 서로 다른 2개 선택
import itertools

data = [1, 2, 3, 4]

for x in itertools.combinations(data, 2):
    print(list(x), end=' ')

[1, 2] [1, 3] [1, 4] [2, 3] [2, 4] [3, 4] 

## 예제 B - 1 : 소수 구하기
M 이상 N 이하의 소수를 모두 출력하는 프로그램을 작성하라

### 정답 코드
- 에라토스테네스의 체 알고리즘으로 1부터 1,000,000까지의 모든 소수를 계산한 후 M과 N이 주어졌을 때 판별

In [9]:
# 첫째 줄에 자연수 M과 N이 빈칸으로 구분되어 주어짐(1,000,000이하)
m, n = map(int, input().split())
# 단, M 이상 N 이하의 소수가 하나 이상 있는 입력만 주어짐

import math

array = [True for i in range(1000001)] # 처음에는 모든 수가 소수인 것으로 초기화
array[1] = False

# 에라토스테네스의 체 알고리즘
for i in range(2, int(math.sqrt(n)) + 1):
    if array[i] == True: # i가 소수인 경우(남은 수인 경우)
        # i를 제외한 i의 모든 배수 제거
        j = 2
        while i * j <= n:
            array[i * j] = False
            j += 1
            
# M부터 N까지의 모든 소수 출력
for i in range(m, n + 1):
    if array[i]:
        print(i)

5 56
5
7
11
13
17
19
23
29
31
37
41
43
47
53


## 예제 B - 2 : 암호 만들기
암호는 서로 다른 L개의 알파벳 소문자들로 구성되며 최소 한 개의 모음과 최소 두 개의 자음으로 구성되어 있다.  
암호를 이루는 알파벳이 증가하는 순으로 배열되었을 것으로 추측된다.  
문자의 종류 C가지가 주어졌을 때, 가능성 있는 암호들을 모두 구하는 프로그램을 작성하라.

In [10]:
from itertools import combinations

# 첫째 줄에 두 정수 L, C가 주어짐 (3 이상 15 이하)
l, c = map(int, input().split())
# 다음 줄에 C개의 문자들이 공백으로 구분되어 주어짐
# 모두 알파벳 소문자이며, 중복은 없음
array = input().split(' ')
array.sort()

vowels = ['a', 'e', 'i', 'o', 'u']

# 길이가 l인 모든 암호 조합을 확인
for password in combinations(array, l):
    # 패스워드에 포함된 각 문자를 확인하여 모음 개수 세기
    count = 0
    for i in password:
        if i in vowels:
            count += 1
    # 최소 1개의 모음과 최소 2개의 자음이 있는 경우 출력
    if count >= 1 and count <= l - 2:
        print(''.join(password))


4 6
a t c i s w
acis
acit
aciw
acst
acsw
actw
aist
aisw
aitw
astw
cist
cisw
citw
istw
