# 코드 최적화 기법

## 코드 최적화 하는 방법
### 1. 현재 빅 오 파악
- 현재 작성한 코드의 빅 오를 파악하여 전제 조건(preequisite, preeq) 찾기

### 2. 상상할 수 있는 최상의 빅 오 예상
- 해결할 문제에 대한 최상의 빅 오(가능한 최상의 실행 시간) 생각하여 시작점으로 파악
- 결코 불가능은 아니리라 여겨지는 가장 빠른 빅 오를 최상의 빅 오로 삼을 것
### 3. 최상의 빅 오에 가깝게 코드 최적화
- 최상의 빅 오에 가깝게 코드 최적화 수행
- 예를들어 현재 코드의 빅 오가 O(N^2)고 최상의 빅 오가 O(1)라고 상상될 때, O(logN)이 될 수 있게끔 최대한 최적화
- 비록 O(1)은 힘들겠지만, O(N)으로 올리기만 해도 상당한 성과임.

----------------

## 최적화 방법들

### case1: lock-up
- Hash table 등 필요한 정보를 바로 접근할 수 있게 새로운 자료구조를 추가할 것

In [9]:
authors = [
    {"author_id": 1, "name": "A"},
    {"author_id": 2, "name": "B"},
    {"author_id": 3, "name": "C"},
    {"author_id": 4, "name": "D"}    
]

books = [
    {"author_id": 1, "title": "AA"},
    {"author_id": 3, "title": "CC"},
    {"author_id": 2, "title": "BB"},
    {"author_id": 4, "title": "DD"},
    {"author_id": 3, "title": "CCC"},
    {"author_id": 2, "title": "BBB"},
    {"author_id": 4, "title": "DDD"},
    {"author_id": 1, "title": "AAA"},
    {"author_id": 4, "title": "DDDD"},
    {"author_id": 1, "title": "AAAA"},
    {"author_id": 3, "title": "CCCC"},
    {"author_id": 2, "title": "BBBB"}
    
]

#### Example 1
- authors, books list를 이용하여 아래와 같은 배열을 만들어야 됨

```python
books_with_authors = [
    {"title": "AA", "author": "A"}
]
```

In [6]:
# 기존 코드: 이중 반복문, O(N^2)

def connect_books_with_authors(books, authors):
    books_with_authors = []

    for book in books:
        for author in authors:
            if book["author_id"] == author["author_id"]:
                books_with_authors.append({"title": book["title"], "author": author["name"]})
    
    return books_with_authors

In [None]:
connect_books_with_authors(books, authors)

[{'title': 'AA', 'author': 'A'},
 {'title': 'CC', 'author': 'C'},
 {'title': 'BB', 'author': 'B'},
 {'title': 'DD', 'author': 'D'},
 {'title': 'CCC', 'author': 'C'},
 {'title': 'BBB', 'author': 'B'},
 {'title': 'DDD', 'author': 'D'},
 {'title': 'AAA', 'author': 'A'},
 {'title': 'DDDD', 'author': 'D'},
 {'title': 'AAAA', 'author': 'A'},
 {'title': 'CCCC', 'author': 'C'},
 {'title': 'BBBB', 'author': 'B'}]

In [None]:
# 개선 코드: hash table로 lock-up, O(N + M) = O(N)

def connect_books_with_authors(books, authors):
    lock_up_talbe = {}
    books_with_authors = []

    for author in authors:
        lock_up_talbe[author["author_id"]] = author["name"]
    
    for book in books:
        books_with_authors.append({"title": book["title"], 
                                   "author": lock_up_talbe[book["author_id"]]}
                                  )

    return books_with_authors

In [13]:
connect_books_with_authors(books, authors)

[{'title': 'AA', 'author': 'A'},
 {'title': 'CC', 'author': 'C'},
 {'title': 'BB', 'author': 'B'},
 {'title': 'DD', 'author': 'D'},
 {'title': 'CCC', 'author': 'C'},
 {'title': 'BBB', 'author': 'B'},
 {'title': 'DDD', 'author': 'D'},
 {'title': 'AAA', 'author': 'A'},
 {'title': 'DDDD', 'author': 'D'},
 {'title': 'AAAA', 'author': 'A'},
 {'title': 'CCCC', 'author': 'C'},
 {'title': 'BBBB', 'author': 'B'}]

#### Example 2
- 두 수의 합(two-sum) 문제
- 숫자 배열을 입력받아 두 수를 합해 10이 되는 두 수가 배열에 있는지 True나 False 반환

```
[2, 0, 4, 1, 2, 9]
True

[2, 0, 4, 5, 3, 9]
False
```

In [14]:
# 기존 코드: 이중 반복문, O(N^2)

def two_sum(num_list):
    for i in range(0, len(num_list)):
        for j in range(0, len(num_list)):
            if i != j and num_list[i] + num_list[j] == 10:
                return True
    
    return False

In [15]:
num1 = [2, 0, 4, 1, 2, 9]
num2 = [2, 0, 4, 5, 3, 9]

print(two_sum(num1))
print(two_sum(num2))

True
False


In [None]:
# 개선 코드: 해쉬 테이블로 lock-up, O(N)

def two_sum(num_list):
    hash_table = {}

    for num in num_list:
        if hash_table.get(10-num, False):
            return True

        hash_table[num] = True
    
    return False

In [18]:
num1 = [2, 0, 4, 1, 2, 9]
num2 = [2, 0, 4, 5, 3, 9]

print(two_sum(num1))
print(two_sum(num2))

True
False


### case 2: 패턴 인식
- 단순히 재귀나 반복문 등 알고리즘 접근법이 아닌 해당 문제의 여러 예제를 기반으로 패턴을 찾아 공략하는 방법

#### Example 1
- 동전 게임(coin game)
- 두 플레이어가 동전 더미를 차례대로 가져가는 게임으로 아래 규칙을 적용한다.
  + 플레이어 `H`와 `T` 두 명이며, 항상 `H`가 먼저 동전을 가져간다.
  + 한 차례에 동전 1개 또는 2개를 가져갈 수 있다.
  + 마지막에 동전을 가져가 동전 더미를 없애는 사람이 패배한다.

In [None]:
# 기존 코드: 재귀로 접근, O(2^n)
# 해당 재귀 접근법을 동적 프로그래밍으로 O(N)까지 개선 가능함

def coin_game_winner(number_of_coiins, current_player="H"):
    if number_of_coiins <= 0:
        return current_player

    if current_player == "H":
        next_player = "T"
    elif current_player == "T":
        next_player = "H"
    
    if coin_game_winner(number_of_coiins - 1, next_player) == current_player or coin_game_winner(number_of_coiins - 2, next_player) == current_player:
        return current_player
    else:
        return next_player

In [10]:
print(coin_game_winner(10, "H"))

T


##### 패턴 인식 접근법
- 동전 게임의 여러 예제를 생성하여 패턴을 찾는다.

| 동전 개수 | 승자 |
|:--------:|:----:|
| 1 | T |
| 2 | H |
| 3 | H |
| 4 | T |
| 5 | H |
| 6 | H |
| 7 | T |
| 8 | H |
| 9 | H |
| 10 | T |

- T가 우승한 경우는 동전 개수가 1, 4, 7, 10으로 각각 3의 배수(3x + 1, x=0, 1, 2, ...)에 1을 더한 값이다.
- 따라서 `동전 개수-1`의 값이 3의 배수이면 T가 우승하고 아니면 H가 우승한다

In [None]:
# 개선 코드, O(1)

def coin_game_winner(number_of_coiins):
    if (number_of_coiins - 1) % 3 == 0:
        return "T"
    else:
        return "H"

In [14]:
print(coin_game_winner(10))

T


#### Example 2
- 합 교환(sum swap) 문제
- 자연수를 인자로 가지는 두 배열에서 서로 교환했을 때 두 배열의 합이 똑같아지는 숫자를 각 별에서 하나씩 찾아야하며, 아래 규칙을 따른다.
  + 배열 내에 중복되는 숫자는 없다.
  + 해당되는 숫자가 있을 경우, ['index of target number in array 1', 'index of target number in array 2'] 이다
  + 해당되는 숫자가 없을 경우, None을 반환한다.


```python
array_1 = [5, 3, 2, 9, 1] # 합 20
array_2 = [1, 12, 5] # 합 18

# array_1의 숫자 2와 array_2의 숫자 1을 교환
array_1 = [5, 3, 1, 9, 1] # index 2, 합 19
array_2 = [2, 12, 5] # index 0, 합 19

# [2, 0]
```

#### 패턴 인식 접근법
- 두 배열 사이에 숫자를 교환하여 합을 맞출 경우 교환하기 이전의 두 배열의 합 사이의 중간에 정확히 떨어진다.

In [None]:
# 개선 코드, O(N+M); 만약 이중 반복문으로 접근했을 경우 O(N*M)

def sum_swap(array_1, array_2):
    sum_1 = sum(array_1)
    sum_2 =sum(array_2)
    diff_value = (sum_1 - sum_2) / 2

    table_1 = {n: i for i, n in enumerate(array_1)}

    for i, n in enumerate(array_2):
        if table_1.get(n+diff_value, None):
            return [table_1.get(n+diff_value), i]
    else:
        return None

In [22]:
array_1 = [5, 3, 2, 9, 1] # 합 20
array_2 = [1, 12, 5] # 합 18

sum_swap(array_1, array_2)

[2, 0]

In [None]:
array_1 = [6, 3, 2, 9, 1] # 합 21
array_2 = [1, 12, 5] # 합 18

sum_swap(array_1, array_2)

### case 3: 탐욕 알고리즘(Greedy algorithm)
- `매 단계마다 그 순간에` 최선처럼 보이는 방법이나 값을 고른다.

#### Example 1
- 배열 내 최댓값 찾기

In [25]:
def max(array):
    greatest_num = array[0]

    for num in array:
        if greatest_num < num:
            greatest_num = num
    
    return greatest_num

In [26]:
array = [6, 3, 2, 9, 1]
max(array)

9

#### Example 2
- 최대 부분 합
- 숫자로 된 배열을 받아 배열 내 숫자로 구성할 수 있는 배열 들 중 가장 큰 합을 반환해야 해며, 아래 규칙을 따른다.
  + 주어진 배열 안엔 적어도 하나 이상의 양수가  포함된다.
  + 주어진 배열로 구성되는 배열은 연속된 부분으로 이루어진 배열이어야한다.

```python
array = [3, -4, 4, -3, 5, -9]

answer_array = [4, -3, 5] # index 2 ~ 4 까지
answer = 6
```

#### 탐욕 알고리즘 접근법
- 배열의 첫 번째 부터 시작하여 연속된 배열을 구하지만 아래 경우들을 고려해야한다
  - 문제의 답은 항상 배열의 첫번째 부분으로 시작하진 않는다.
    + [1, 1, 0, -3, 5] 의 답은 [5]
    + [5, -2, 3, -8, 4] 의 답은 [5, -2, 3]
    + [2, -3, 1, 2, -1] 의 답은 [1, 2, -1]
    + [5, -8, 2, 1, 0] 의 답은 [5]
  - 배열의 첫번째 부분에서 시작하지 경우는 중간에 `음수`가 방해한다.
    + [2, -3, 1, 2, -1] 처럼 `-3`이 중간에 방해한다.
  - 허나, 최대 부분이 음수를 포함하는데도 음수가 방해되지 않는 경우가 있다.
    + [5, -2, 3, -8, 4] 경우, [5, -2, 3]에서 -2가 포함되였지만 최대합이다.
- 위 경우들을 비교했을 때 차이 점은 최대합을 구성하는 과정에서 음수가 방해하는 경우는 `음수가 포함 되면서 배열합이 음수로 떨어질 때다`
- 따라서 배열을 순회하다가 현재 부분의 합이 0보다 작아지면 `차라리 현재 합을 0으로 되돌리는 것이 낫다`

In [None]:
# 탐욕 알고리즘 접근 기반 코드, O(N)
# 만약 모든 경우를 고려할 경우, O(N^2/2)

def max_sum(array):
    current_sum = 0
    greatest_sum = 0

    for num in array:
        current_sum += num

        if current_sum < 0:
            current_sum = 0
        elif current_sum > greatest_sum:
            greatest_sum = current_sum
    
    return greatest_sum

In [28]:
array = [ 3, -4, 4, -3, 5, -9]

max_sum(array)

6

#### Example 3
- 주가 상승세 예측
- 주가 배열을 받아 상승세를 이루는 주가 3개 있는지 없는지 판별해라.
  + 상승세 주가 3개가 있으면 True, 아니면 False를 반환해야한다

```python
array_1 = [22, 25, 21, 18, 19.6, 17, 16, 20.5] # 18, 19.6, 20.5 이렇게 3개가 있으므로 True
array_2 = [50, 51.25, 48.4, 49, 47.2, 48, 46.9] # 이 경우엔 False
```

#### 탐욕 알고리즘 접근법
- 위 True 경우의 [18, 19.6, 20.5] 3개 주가 처럼, 왼쪽에서 오른쪽으로 가면서 오른편 가격이 중간 가격보다 크고, 중간 가격이 다시 왼편 가격보다 큰 주가 3개가 있는 경우를 찾아야한다.
- 따라서 알고리즘 단계는 다음과 같다.
  - 현재 주가가 지금가지의 최저가보다 작으면 현재 주자가 새로운 처저가가 된다.
  - 현재 주가가 최저가보다 크지만 중간 주가보다 작으면 중간 주가를 현재 주가로 업데이트한다.
  - 현재 주가가 최저가와 중간 주가보다 크면 상승세를 이루는 주 3개를 찾았다고 볼 수 있다.

In [29]:
# 탐욕 알고리즘 접근 코드. O(N)

def increasing_treplet(array):
    lowest_price = array[0]
    middle_price = float('inf')

    for price in array:
        if price <= lowest_price:
            lowest_price = price
        elif price <= middle_price:
            middle_price = price
        else: # 현재 주가가 중간 주가보다 크면
            return True
    else:
        return False

In [30]:
array_1 = [22, 25, 21, 18, 19.6, 17, 16, 20.5] # 18, 19.6, 20.5 이렇게 3개가 있으므로 True
array_2 = [50, 51.25, 48.4, 49, 47.2, 48, 46.9] # 이 경우엔 False

print(increasing_treplet(array_1))
print(increasing_treplet(array_2))

True
False


### case 4: 자료구조 변경
- 주어진 값이나 입력을 다른 형태의 자료구조로 변환하여 접근하는것
- 룩업 문제에서 해시 테이블을 도입한 것도 같은 방법이다.

#### Example 1
- 애너그램 검사기
- 두 문자열이 주어졌을 때 서로 애너그램(anagram)인지 알아내는 함수를 작성해라

In [31]:
# 기존 코드, O(N * M)
# 이렇게 직접적으로 값을 삭제하는 식으로 접근할 경우 오류가 발생하기 쉬움

def are_anagrams(string_1, string_2):
    array_string_2 = list(string_2)

    for i in range(0, len(string_1)):
        if len(array_string_2) == 0:
            return False
    
        for j in range(0, len(array_string_2)):
            if string_1[i] == array_string_2[j]:
                del array_string_2[j]
                break

    return len(array_string_2) == 0

In [33]:
# 자료구조 변경 기반 개선 코드, O(N + M)

def are_anagrams(first_string, second_string):
    first_word_hash_table = {}
    second_word_hash_table = {}

    for char in first_string:
        if first_word_hash_table.get(char):
            first_word_hash_table[char] += 1
        else:
            first_word_hash_table[char] = 1
    
    for char in second_string:
        if second_word_hash_table.get(char):
            second_word_hash_table[char] += 1
        else:
            second_word_hash_table[char] = 1

    return first_word_hash_table == second_word_hash_table

#### Example 2
- 그룹 정렬
- 값을 여러 개 포함하는 배열이 있을 때 같은 ㄱ밧끼리 묶어 테이터를 다시 정렬하고 싶다.
  - 단 그룹의 순서는 중요하지 않다.

```python
array = ["a", "c", "d", "b", "c", "a", "d", "c", "b", "a", "d"] 
# => ["c", "c", "c", "a", "a", "a", "d", "d", "d", "b", "b", "b"] == ["a", "a", "a", "b", "b", "b", "c", "c", "c", "d", "d", "d"]
```

In [39]:
# 자료구조 변경 기반 코드, O(N)

def group_array(array):
    hash_table = {}
    new_array = []

    for value in array:
        if hash_table.get(value):
            hash_table[value] += 1
        else:
            hash_table[value] = 1
    
    for value, count in hash_table.items():
        new_array.extend(value * count)
    
    return new_array

In [40]:
array = ["a", "c", "d", "b", "c", "a", "d", "c", "b", "a", "d"] 
group_array(array)

['a', 'a', 'a', 'c', 'c', 'c', 'd', 'd', 'd', 'b', 'b']