# Data Structure review
## from chapter 1 to 5

## Chapter 4

# 4. 빅 오로 코드 속도 올리기
- 빅 오 표기법은 알고리즘을 객관적인 방법으로 측정할 수 있어서 경쟁 알고리즘을 비교할 때 훌륭한 도구가 된다
- 일살적으로 작성하는 코드에서도 항상 두 가지의 대안이 명확하게 떠오르는 것은 아니다
- 대부분의 프로그래머가 그러하듯이 아마 머릿속에 가장 먼저 떠오른 방법을 시도할 가능성이 높다
    - 빅 오를 사용하면 내가 만든 알고리즘과 세상에 존재하는 범용 알고리즘을 비교할 기회가 생긴다
- 내가 만든 알고리즘을 "느린" 알고리즘이라고 꼬리표를 붙였다면 더 빠른 빅 오 카테고리에 들어갈 수 있게 최적화하는 방법을 찾아볼 수 있다

## 4.1 버블 정렬
- #### "정렬 알고리즘"은 컴퓨터 과학 분야에서 폭넓게 연구된 주제, 지난 수년간 수십 개의 정렬 알고리즘이 개발돼 왔다.
    - 이러한 알고리즘 모두 "정렬되지 않은 배열이 주어졌을 때, 어떻게 오름차순으로 정렬할 수 있을까?"의 문제를 해결한다.
- #### "단순 정렬(simple sort)"이라 알려진 알고리즘 분류는 정렬 알고리즘보다 비효율적이다
- #### 매우 기본적인 정렬 알고리즘인 버블 정렬(bubble sort)
    - 버블 정렬 단계
        - 1. 배열 내에서 연속된 두 항목을 가리킨다 (처음에는 배열의 첫 번째 원소부터 시작해서 처음 두 항목을 가리킨다). 첫 번째 항목과 두 번째 항목을 비교한다.
        - 2. 두 항목의 순서가 뒤바뀌어 있으면 (즉, 왼쪽 값이 오른쪽 값보다 크면) 두 항목을 교환(Swap)한다
            - 순서가 올바르다면 2단계에서는 아무것도 하지 않는다
        - 3. "포인터"를 오른쪽으로 한 셀씩 옮긴다. 배열의 끝까지 또는 이미 정렬된 어떤 항목까지 1단계와 2단계를 반복한다
        - 4. 더 이상 교환하지 않을 때까지 1단계부터 3단계를 반복한다. 더는 교환을 하지 않는다는 것은 배열이 정렬된 상태라는 뜻이다
- #### 1 ~ 3단계까지를 반복하는 것을 "패스스루(passthrough)"라고 부른다
    - 알고리즘의 주요 단계들을 "통과" 했다는 의미
- #### 이 알고리즘을 버블 정렬이라 부르는 까닭은 각 패스스루마다 정렬되지 않은 값 중 가장 큰 값. "버블"이 올바른 위치로 가게 된다

## 4.4 버블 정렬의 효율성
- #### 버블 정렬 알고리즘에 포함된 단계는 두 종류다
    - 비교 : 어느 쪽이 터 큰지 두 수를 비교한다
    - 교환(swap) : 정렬하기 위해 두 수를 교환한다
- #### 원소 N개가 있을 때, (N-1) + (N-2) + (N-3) + ... + 1번의 "비교"를 수행한다
- #### 배열이 단순히 무작위로 섞여 있지 않고 내림차순으로 (우리가 원하는 것과 완전히 정반대) 정렬된 최악의 시나리오라면 비교할 때마다 "교환"을 해야 한다.
    - 즉, 이러한 시나리오에서는 비교 10번, 교환 10번이 일어나 총 20단계가 필요하다
    - 예를 들어 원소 10개가 역순으로 된 배열에서는
        - 9 + 8 + 7 + 6 + 5 + 4 + 3 + 2 + 1 = 45 번의 교환이 일어난다. 총 90단계.
- 원소 수가 증가할수록 단계 수가 기하급수적으로 늘어난다.
- #### 데이터 원소를 N 이라고 할때, 데이터 원소 N이 증가할 때마다 단계 수가 얼마씩 늘어나는지 정확히 살펴보면 대략 $N^2$만큼 늘어남을 알게 된다.
- #### 따라서 빅 오 표기법에서는 버블 정렬의 효율성을 $O(N^2)$이라 부른다
    - 보다 형식적으로 표현하면, $O(N^2)$ 알고리즘은 데이터 원소가 N개일 때 대략 $N^2$단계가 걸린다.
    - $O(N^2)$은 데이터가 증가할 떄 단계 수가 급격히 늘어나므로 비교적 비효율적인 알고리즘으로 간주된다.
- #### $O(N^2)$을 이차 시간 (quadratic time)라고도 부른다

## 4.5 이차 문제
- $O(N^2)$은 중첩 루프를 사용하는 알고리즘의 효율성이다
- 중첩 루프가 보이면 $O(N^2)$ 알람이 머릿속에 울리기 시작해야 한다
- $O(N^2)$은 상대적으로 느린 알고리즘으로 간주된다
    - 느린 알고리즘을 마주할 때는 항상 더 빠른 대안은 없을지 생각하는데 시간을 투자하는 게 좋다

## 4.6 선형 해결법
- 빅 오 관점에서 새로운 알고리즘의 효율성을 알아내려면 한 번 더 최악의 시나리오일 때 알고리즘에 필요한 단계 수를 알아내야 한다
- 알고리즘에 포함된 단계 중 주요 유형은 비교다
- 데이터 원소가 N개가 있을 때 비교를 N번
    - 단 하나의 루프에서 단지 배열에 있는 원소 수만큼 순회한다
    - 빅 오 표기법으로 표현하면 O(N)이다.
- #### O(N)은 $O(N^2)$보다 훨씬 빠르다

## 4.7 마무리
- 빅 오 표기법을 명확히 이해하면 느린 코드를 식별해 내고 두 경쟁 알고리즘 중 더 빠른 알고리즘을 분명하게 골라낼 수 잇다.