# Chapter 4. Counting element

- **수열**은 다양한 방법으로 배열에 저장될 수 있습니다.
- 가장 기본적인 접근 방법은 연속되는 수를 **각 위치에 해당하는 인덱스**에 저장하는 것입니다.
- 혹은 우리는 아래 그림과 같이 숫자가 **등장한 횟수**를 해당 숫자 번째 인덱스에 기록하는 식으로 수열을 저장할 수도 있습니다.

![](imgs/array.png)

- 위 그림과 같은 방식으로 수열을 저장하기 위해서는 숫자가 등장할 횟수를 기록할 배열이 **충분히 커야** 합니다.
- 만약 우리가 수열 내 모든 원소의 값을 알고 있다면, 등장 횟수를 기록할 배열은 수열의 최대 값보다 **1 더 큰 크기**여야 합니다.

In [None]:
# O(n + m)
def counting(lst, m):
    n = len(lst)
    count = [0] * (m + 1)
    for k in range(n):
        count[lst[k]] += 1
    return count

lst = [0, 0, 4, 2, 4, 5]
counting(lst, max(lst))

- 위같은 방식의 한계는 **메모리**에 있습니다. 대개, 우리는 _10^9_ 개의 정수를 지닐 수 있는 배열을 만들 수는 없습니다. 이는 **1GB**의 메모리를 필요로 하기 때문입니다.
- 음의 정수를 세는 것은 두 가지 방법으로 해결할 수 있습니다.
    1. 모든 수에 **충분히 큰 수**를 더해줘, 모든 수가 0 이상이 되도록 합니다.
    2. 단순히 음수를 카운트하기 위한 **새로운 배열**을 만들어줍니다.

## 4.1. Exercise
**문제**: 여러분은 1 이상 1,000,000 이하의 정수 _m_ 과 _n_ 개의 원소를 지니는 두 배열 _A_, _B_ 를 지니고 있습니다. 문제의 목표는 _A_와 _B_ 배열에서 **하나의 원소만을 교환해** 두 배열의 합이 같아지도록 할 수 있는가를 확인하는 것입니다.


**해결** *O(n^2)*: 가장 단순한 방법은 _A_와 _B_의 모든 원소를 교환해보는 것입니다. 그러나 이는 *O(n^3)* 의 시간 복잡도를 지닙니다. 보다 좋은 접근법은 **사전에 _A_와 _B_의 원소의 합을 계산**해둔 후, 원소 변경이 이루어졌을 때 원소의 합이 어떻게 변하는지만을 확인하는 것입니다.

In [None]:
# O(n^2)
def slow_solution(A, B):
    n = len(A)
    sum_a = sum(A)
    sum_b = sum(B)
    for i in range(n):
        for j in range(n):
            change = B[j] - A[i]
            sum_a += change
            sum_b -= change
            if sum_a == sum_b:
                return True
            sum_a -= change
            sum_b += change
    return False

In [None]:
lst_a = list(range(100000))
lst_b = list(range(100000))
lst_a[-2] = 99999
lst_b[-1] = 99998

**해결** *O(n + m)*: 가장 좋은 접근법은 _A_의 원소들을 카운팅 한 후, _A_의 합과 _B_의 합의 차이인 _d_를 계산하는 것입니다.

배열 _B_ 의 모든 원소에 대해 우리는 배열 _A_ 내 **어떤** 원소와 교환을 하게 될 것입니다. 두 배열의 합에 대한 차이 _d_ 는 우리가 교환에 대해 관심 있는 _A_ 내 원소에 대한 정보를 나타냅니다.

In [None]:
# O(n + m)
def fast_solution(A, B):
    n, m = len(A), max(A)
    sum_a = sum(A)
    sum_b = sum(B)
    d = sum_b - sum_a
    if d % 2 == 1:
        return False
    d //= 2
    count = counting(A, m)
    for i in range(n):
        if 0 <= B[i] - d and B[i] - d <= m and count[B[i] - d] > 0:
            return True
    return False

In [None]:
A = [5, 5, 3]  # 13
B = [3, 3, 3]  #  9

d = 4
d // 2 = 2

count = [0, 0, 0, 1, 0, 2]

# 1st Iteration
B[0] = 3
3 - d = 1
count[1] = 5

In [None]:
%%time
slow_solution(lst_a, lst_b)

In [None]:
%%time
fast_solution(lst_a, lst_b)