## Chapter 1. 문제 해결
- 문제를 해결하는 여러 알고리즘
- 크기가 N인 문제 인스턴스에서 알고리즘의 성능을 고려하는 방법
- 주어진 문제 인스턴스를 해결할 때, 주요 작업이 수행된 횟수를 세는 방법
- 문제 인스턴스를 두 배씩 늘리며 증가 기준을 결정하는 방법
- 크기가 N인 문제 인스턴스에서 알고리즘이 주요 작업을 수행한 횟수를 세어 시간 복잡도를 측정하는 방법
- 크기가 N인 문제 인스턴스에서 알고리즘이 요구하는 메모리 양을 결정해 공간 복잡도를 측정하는 방법

### 1.1 알고리즘이란

알고리즘: 예측 가능한 시간에 정확한 결과를 반환하는, 컴퓨터 프로그램으로 구현된 단계별 문제 해결 방법. 정확성과 성능을 모두 고려하여 작성되어야 한다.

In [11]:
# Python 내장 함수 max() 파헤치기
import random

n = [random.randint(1,100_000) for num in range(100_000)]
N = [random.randint(1,1_000_000) for num in range(1_000_000)]

sorted_n = sorted(n)
sorted_N = sorted(N)

reversed_n = reversed(n)
reversed_N = reversed(N)

In [12]:
# 무작위순에 대해 max 추출
%time max(n)
%time max(N)

# 오름차순에 대해 max 추출

%time max(sorted_n)
%time max(sorted_N)

# 내림차순에 대해 max 추출

%time max(reversed_n)
%time max(reversed_N)

CPU times: user 1.45 ms, sys: 12 µs, total: 1.47 ms
Wall time: 1.47 ms
CPU times: user 11.2 ms, sys: 966 µs, total: 12.1 ms
Wall time: 12.1 ms
CPU times: user 2.44 ms, sys: 0 ns, total: 2.44 ms
Wall time: 2.44 ms
CPU times: user 25 ms, sys: 491 µs, total: 25.5 ms
Wall time: 25.4 ms
CPU times: user 1.01 ms, sys: 319 µs, total: 1.33 ms
Wall time: 1 ms
CPU times: user 7.82 ms, sys: 21 µs, total: 7.84 ms
Wall time: 7.82 ms


1000000

위 결과를 통해 우리는 다음을 알 수 있다.

**- 충분히 큰 N에 대해 파이썬 max 함수를 통해 정렬을 수행할 경우, max()의 수행 시간은 오름차순에 대해서 수행할 때가 내림차순에 대해서 수행할 때보다 항상 크다.**

**- 약간의 편차는 있으나, 리스트의 크기에 비례하여 max 함수의 수행 시간이 늘어난다.**

max() 알고리즘의 동작을 살펴보고, 이와 같은 결과가 발생한 이유를 알아보도록 하자.

### 1.2 리스트에서 가장 큰 값 찾기

In [13]:
# 리스트에서 가장 큰 값을 찾는 코드 - 결함 존재
def flawed(N):
    cur_max = 0
    for num in N:
        if cur_max < num:
            cur_max = num
    return cur_max

위 함수는 비교 연산자 '<'를 이용하여 모든 수에 대한 크기를 비교한다. 따라서 N의 크기만큼의 연산을 수행하게 된다.

다만 위 함수는 N 내 모든 수가 0보다 큰 수라는 가정을 하고 있으므로 결함이 존재한다. (ex: N = [-3, -5, -1, -11]인 경우 잘못된 값 0 반환)

`cur_max`의 값을 0 대신 -inf와 같은 매우 작은 음수값으로 설정할 수도 있지만, 이 경우에도 N이 빈 리스트일 경우 정상적으로 작동하지 않게 된다.

### 1.3 주요 연산 횟수 계산하기

In [14]:
# 리스트에서 가장 큰 값을 찾는 코드 - 수정된 코드
def largest(N):
    cur_max = N[0]
    for idx in range(1, len(N)):
        if cur_max < N[idx]:
            cur_max = N[idx]
    return cur_max

`cur_max`를 N의 인덱스 0 값인 `N[0]`으로 설정하여 리스트 내 값만을 반환할 수 있도록 하였으며, 연산 수행 횟수를 1회 줄였다.

다만, 여전히 빈 리스트에 대해서는 정상적으로 작동하지 않는다.

In [15]:
A = []
largest(A)

IndexError: list index out of range

### 1.4 모델로 알고리즘 성능 예측하기

In [20]:
# N에서 가장 큰 값의 위치를 찾는 다른 접근법
def alternate(N):
    for num in N:
        is_largest = True
        for x in N:
            if num < x:
                is_largest = False
                break
        if is_largest:
            return num
    return None

alternate() 함수는 이중 for문을 활용해 N에서 모든 `x` 값보다 작지 않은 `num` 값을 찾는다. 위와 같은 경우 `num` 보다 큰 `x`가 발견되면 break를 통해 중지하므로 상당수의 경우 기존 방식보다 연산 횟수가 적을 것이다.

하지만, 만약 N이 오름차순 정렬이 되어 있다면 N개 값에 대하여 $(N^2 + 3N -2)/2$번의 비교 연산을 수행하게 되므로 오히려 더 큰 연산 시간을 필요로 하게 된다.

In [25]:
N = [random.randint(1,1_000_000) for num in range(1_000_000)]
sorted_N = sorted(N)

%time largest(N)
%time alternate(N)