# 선택 정렬의 효율성
- #### 선택 정렬은 비교와 교환, 두 종류의 단계를 포함한다
    - 즉, 각 패스스루 내에서 각 원소를 현재까지 찾은 최솟값과 비교하고, 최솟값을 올바른 위치에 있는 수와 교환한다

#### 5개의 원소를 포함하는 배열 예제로 패스스루와 비교 횟수를 나눠서 살펴보자

- 패스스루 번호 : 1 , 비교 횟수 : 4번
- 패스스루 번호 : 2 , 비교 횟수 : 3번
- 패스스루 번호 : 3 , 비교 횟수 : 2번
- 패스스루 번호 : 4 , 비교 횟수 : 1번
- #### 따라서 총 4 + 3 + 2 + 1 = 10번의 비교다
- #### 보다 일반적으로 설명하면 원소 N개가 있을 때 (N - 1) + (N - 2) + (N - 3) + .... + 1번의 비교다

- #### 이와 달리 교환은 한 패스스루 당 최대 한 번 일어난다
    - 각 패스스루마다 최솟값이 이미 올바른 위치에 있느냐애 따라 교환을 안 하거나 교환을 한 번 하기 때문이다
    - 배열이 역순으로 정렬된 최악의 시나리오에서는 버블 정렬과 달리 비교할 때마다 "빠짐없이" 교환을 한 번 해야 한다.

#### 버블 정렬과 선택 정렬을 나란히 비교한 것이다
- N개의 원소 : 5 , 버블 정렬에서 최대 단계 수 : 20 , 선택 정렬에서 최대 단계 수 : 14 (10번의 비교 + 4번의 교환)
- N개의 원소 : 10 , 버블 정렬에서 최대 단계 수 : 90 , 선택 정렬에서 최대 단계 수 : 54 (45번의 비교 + 9번의 교환)
- N개의 원소 : 20 , 버블 정렬에서 최대 단계 수 : 380 , 선택 정렬에서 최대 단계 수 : 199 (180번의 비교 + 19번의 교환)
- N개의 원소 : 40 , 버블 정렬에서 최대 단계 수 : 1560 , 선택 정렬에서 최대 단계 수 : 819 (780번의 비교 + 39번의 교환)
- N개의 원소 : 80 , 버블 정렬에서 최대 단계 수 : 6320 , 선택 정렬에서 최대 단계 수 : 3239 (3160번의 비교 + 79번의 교환)
- #### 위에서 비교한 바에 따르면 선택 정렬은 분명 버블 정렬보다 단계 수가 반정도 적다. 즉, 선택 정렬이 두 배 더 빠르다

# 상수 무시하기
- #### 빅 오 표기법에서는 선택 정렬과 버블 정렬을 정확히 같은 방식으로 설명한다
- #### 다시 강조하지만 빅 오 표기법은 데이터 원소 수에 비례해 얼마나 많은 단계 수가 필요한가를 기술한 것이다
    - 이런 관점에서 언뜻 보기에는 선택 정렬의 단계 수가 대략 "$N^2$의 반" 정도로 보인다
    - 따라서 선택 정렬의 효율성을 $O(N^2/2)$로 설명하면 적당할 듯하다
        - 즉, 데이터 원소 N개가 있을 때 $N^2/2$단계가 필요하다

#### 데이터 원소 N개가 있을 때 $N^2/2$단계와 선택 정렬에서 최대 단계 수
- N개의 원소 : 5 , $N^2/2$ : $5^2/2 = 12.5$ , 선택 정렬에서 최대 단계 수 : 14
- N개의 원소 : 10 , $N^2/2$ : $10^2/2 = 50$ , 선택 정렬에서 최대 단계 수 : 54
- N개의 원소 : 20 , $N^2/2$ : $20^2/2 = 200$ , 선택 정렬에서 최대 단계 수 : 199
- N개의 원소 : 40 , $N^2/2$ : $40^2/2 = 800$ , 선택 정렬에서 최대 단계 수 : 819
- N개의 원소 : 80 , $N^2/2$ : $80^2/2 = 3200$ , 선택 정렬에서 최대 단계 수 : 3239

- #### 하지만 선택 정렬을 빅 오로 표현하면 버블 정렬과 똑같이 $O(N^2)$이다
    - #### 빅 오의 규칙 때문이다
#### 빅 오 표기법은 상수를 무시한다
- 빅 오 표기법은 지수가 아닌 수는 포함하지 않는다는 것을 수학적으로 표현한 문장이다
- 앞선 예제는 엄밀히 말해 $O(N^2/2)$여야 하지만 단순히 $O(N^2)$이다
- 비슷하게 O(2N)도 O(N)이고, O(N/2)도 O(N)이다
- O(N)보다 "100배나 느린 O(100N)"이라 해도 마찬가지로 O(N)이다.

- 빅 오로는 정확히 같은 방법으로 표현되는 두 알고리즘이 있을 때, 한쪽이 다른 한쪽보다 "100배나 빠를 수 있다"는 점 때문에 이 규칙은 빅 오 표기법을 완전히 쓸모없게 만들어 버리는 것처럼 보인다
- 선택 정렬과 버블 정렬에서도 정확히 마찬가지다.
    - 두 알고리즘 모두 빅 오로는 $O(N^2)$이지만 선택 정렬은 사실 버블 정렬보다 두 배나 빠르다
    - 정말로 두 알고리즘 중 하나를 골라야 한다면 선택 정렬이 더 나은 선택이다

# 빅 오의 역활
- 빅 오는 버블 정렬과 선택 정렬 간에 차이를 두지 않지만, 알고리즘의 장기적인 증가율을 분류하는 훌륭한 방법이기에 여전히 매우 중요하다
- "어느 정도 크기의" 데이터에 대해서는 O(N)이 항상 $O(N^2)$보다 빠르다
    - O(N)이 실제로 O(2N)이든 심지어 O(100N)이든 결과적으로 항상 그렇다
    - O(100N)이 $O(N^2)$보다 빨라지는 어느 정도 크기의 데이터가 꼭 있기 마련이다

- #### "어떤" 데이터 크기에서든 $O(N)$이 $O(N^2)$보다 빠르다
- #### 어떤 크기의 데이터에 대해서는 $O(N^2)$이 $O(100N)$보다 빠르지만 특정 시점을 지나면서 $O(100N)$이 더 빨라지고 이후로도 계속 더 빠르다
#### 이게 바로 빅 오가 상수를 무시하는 이유다
- 빅 오는 "특정 시점"부터 어떤 유형이 다른 유형보다 속도가 빨라지고 이후로도 계속해서 더 빠른 경우 두 유형을 다르게 분류하고자 한다
    - 하지만 정확한 시점은 빅 오에서 중요하지 않다
    - #### 따라서 O(100N)같은 유형은 사실 없다. O(N)이라고 쓸 뿐이다.
- 마찬가지로 데이터가 많을 때 한 알고리즘이 어떤 시점부터 다른 알고리즘보다 더 빠름을 보장하므로 빅 오에서 서로 다른 분류에 속하는 두 알고리즘이라면 어떤 알고리즘을 써야 할지 대체로 알 수 있으며, 따라서 빅 오는 매우 유용한 도구다

- #### 하지만 중점적으로 이해해야 할 내용은 두 알고리즘이 같은 분류에 속하더라도 반드시 두 알고리즘의 처리 속도가 같지 않다는 점이다
- #### 버블 정렬과 선택 정렬은 둘 다 $O(N^2)$이지만 어쨌든 버블 정렬은 선택 정렬보다 두 배 느리다
    - 따라서 빅 오에서 다른 분류에 속하는 알고리즘을 대조할 때는 빅 오가 완벽한 도구지만 "같은" 분류에 속하는 두 알고리즘이라면 어떤 알고리즘이 더 빠를 지를 알기 위해 더 분석해야 한다
    

# 실제 예제
- 배열을 입력으로 받아서 "두 원소마다 하나 걸러 하나를" 뽑아 새 배열을 생성하는 예제 (Ruby언어)
- each_with_index 메서드를 사용해 입력받은 배열을 순회할 수 있다

```
def every_other(array)
    new_array = []
    
    array.each_with_index do |element, index|
        new_array << element if index.even?
    end
    
    return new_array
end
```

- 위 구현은 입력받은 배열의 각 원소를 순회하며 그 원소릐 인덱스가 짝수인 경우에만 새 배열에 원소를 추가한다
- 필요한 단계 수를 분석해보면 두 종류의 단계만 있음을 알 수 있다.
    - 배열의 각 원소를 찾아보는 종류의 단계
    - 새 배열에 원소를 추가하는 종류의 단계
- 배열의 모든 원소를 하나씩 살펴보므로 배열 룩업(LookUp)은 N번이다
- 반면 새 배열에는 두 원소마다 하나씩의 원소만 삽입 N/2번의 삽입만 수행 (짝수인 경우에만 새 배열에 원소를 추가하므로)
- N번의 LookUp과 N/2번의 삽입이므로 엄밀하게 알고리즘의 효율성을 O(N + (N/2)), 바꿔말해 O(1.5N)이라 할 수 있디ㅏ
- #### 하지만 빅 오 표기법은 상수를 무시하므로 이 알고리즘은 단순히 O(N)이다.

- 위 알고리즘이 잘 동작하긴 하지만 항상 최적화의 기회가 있을지 알아봐야 한다
    - 배열의 각 원소를 순회하며 인덱스가 짝수인지 확인하는 대신 처음부터 배열의 짝수 인덱스만 룩업할 수 있다.

```
def every_other(array)
    new_array = []
    index = 0
    
    while index < array.length
        new_array << array[index]
        index += 2
    end
    
    return new_array
end
```

- 두 번째 구현인 위의 구현은 각 원소를 하나씩 확인하는 대신 while 루프를 사용해 건너뛰며 읽는다
- 이로써 원소가 N개일 때 N/2번의 룩업과 N/2번의 새로운 배열로의 삽입을 수행하게 됐다
- #### 첫 번째 구현처럼 이 알고리즘도 O(N)이다.
- 하지만 첫 번째 구현이 엄밀히 말해 1.5N 단계를 수행하는 반면 두 번째 구현은 N단계만 수행하므로 두 번째 구현이 훨씬 빠르다
    - 루비 프로그래머가 코드를 작성하기에는 첫 번째 구현이 더 자연스럽지만 대량의 데이터를 처리할 때는 의미 있는 성능 향상을 위해 두 번째 구현을 고려할 만한다.