# F. Broadcasting
Numpy Array를 다룰 때 차원의 크기가 서로 다른 배열에서도 산술 연산을 해야할 때가 존재합니다.  
예를들어 두 배열 간 차원의 크기가 (4, 2), (2, )일 때 두 배열을 산술 연산한다면 (2, )의 배열이 (4, 2) 행렬의 각 행에 대해 원소별 연산을 실행할 수 있습니다.  
이번 Section에서는 이러한 Broadcasting원리를 이해하고 학습하겠습니다.


### _Objective_
1. **Broadcasting** : 차원의 크기가 서로 다른 배열을 연산하기 위한 Broadcasting를 학습

## 1. Broadcasting
브로드캐스팅이란 Numpy 배열에서 차원의 크기가 서로 다른 배열에서도 산술 연산을 가능하게 하는 원리입니다.

브로드캐스팅 기능:
- 두 배열의 차원(ndim)이 같지 않다면 차원이 **더 낮은 배열이** 차원이 더 높은 배열과 **같은 차원의 배열로 인식**됩니다.
- 크기가 다른 두 배열의 **연산 결과는 배열 중 차원의 수(ndim)가 큰 배열**이 됩니다.

In [1]:
import numpy as np

### (1) Broadcasting 예제

<Example 1> <img src='https://imgur.com/Q5DLh1m.jpg' align=left />

위 그림은 `[0, 1, 2]`로 구성된 Numpy Array와 Scalar값 5와의 연산을 보여줍니다.  
브로드캐스팅에 의해 scalar값 `5`를 마치 `[5, 5, 5]`인 것처럼 변환되어 연산 결과를 반환하게 됩니다.

In [2]:
A = np.arange(3)
A

array([0, 1, 2])

In [3]:
A + 5

array([5, 6, 7])

A array에 각각 스칼라값 5가 덧셈 연산된 것을 확인할 수 있습니다.

<Example 2> <img src='https://imgur.com/vRwGp0E.jpg' align=left />

두 번째 예시는 `[0, 1, 2]`를 크기가 더 큰 
> `[[1, 1, 1],` <br>
&nbsp;&nbsp;`[1, 1, 1],` <br>
&nbsp;&nbsp;`[1, 1, 1]]` 

의 **형태에 맞춰**  
> `[[0, 1, 2],` <br>
&nbsp;&nbsp;`[0, 1, 2],` <br>
&nbsp;&nbsp;`[0, 1, 2]]` 

로 변환되어 연산이 진행됩니다.

In [4]:
A = np.ones((3,3))
print(A.shape)
A

(3, 3)


array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [5]:
B = np.arange(3)
print(B.shape)
B

(3,)


array([0, 1, 2])

In [6]:
A + B

array([[1., 2., 3.],
       [1., 2., 3.],
       [1., 2., 3.]])

크기가 작은 B가 A의 형태에 맞춰 연산된 것을 확인할 수 있습니다.

<Example 3> <img src='https://imgur.com/Uy0BPLN.jpg' align=left />

세 번째 예시는 `[[0], [1], [2]]`에 `[0,1,2]`를 더하는 경우입니다. 각각을 Numpy Array로 만들면 아래와 같습니다. 

np.arange(3)의 A array는 1차원 행렬입니다.  

In [7]:
A = np.arange(3).reshape((3,1))
B = np.arange(3)

In [8]:
print(A.shape)
A

(3, 1)


array([[0],
       [1],
       [2]])

In [9]:
print(B.shape)
B

(3,)


array([0, 1, 2])

In [10]:
print('A.ndim', A.ndim)
print('B.ndim', B.ndim)

A.ndim 2
B.ndim 1


`A`의 shape은 `(3,1)`이고 `B`의 shape은 `(3,)`입니다. 여기서는 A의 차원이 2차원으로 더 높으므로 A에 맞춰서 B의 차원을 늘립니다.

그럼 B의 shape은 `(3,)`에서 무엇으로 변환될까요?  
차원을 늘려야 하는 Array는 shape의 축 별 원소 수를 오른쪽으로 하나씩 밀어내고, 축을 추가합니다.  
즉 `(3,)`에서 옆으로 한 칸 밀려 `(1,3)`형태로 확장됩니다.   
이제 각 축의 원소 수를 비교하여 **큰 값으로 최종 결과물의 shape이 결정**됩니다.  
B는 `(3, 1)`이고 A는 `(1,3)`의 형태가 되었으므로, 결과는 `(3,3)`의 형태가 될 것입니다.
확인해보겠습니다.

In [11]:
result = A + B
result

array([[0, 1, 2],
       [1, 2, 3],
       [2, 3, 4]])

In [12]:
result.shape

(3, 3)

### (2) Rules of Broadcasting

이처럼 Numpy는 입력하는 데이터의 크기나 차원이 서로 달라도 정해진 규칙에 따라 Array를 확장하여 연산을 실행합니다.  
Numpy의 Braodcasting 원칙을 정리하면 아래와 같습니다. 

**[Rules of Broadcasting](https://jakevdp.github.io/PythonDataScienceHandbook/02.05-computation-on-arrays-broadcasting.html#Rules-of-Broadcasting)**

- 원칙 1. 두 Array의 차원이 다르면, **차원이 낮은 쪽의 shape을 오른쪽으로 밀어 왼쪽에 축을 추가**한다. 
>  예: `(3,)`인 B의 shape을 `(1,3)`으로 변환

- 원칙 2. 어떤 축에서도 두 Array의 원소 수가 맞지 않으면, 차원의 **원소 수가 1인 Array의 shape을 확장**한다. 
>  예:`(1,3)`인 A와 `(3,1)`인 B는 어떤 축에서도 원소 수가 같지 않음.  
A와 B **각각 원소 수가 1인 축의 원소 수를 확장**하여 `(3,3)`shape의 결과를 반환. 

- 원칙 3. 어떤 축에서도 원소 수가 맞지 않고 1도 아니라면 오류를 반환한다. 
> 예: `(2,3)`과 `(3,2)`의 Array를 합치고자 하면 배열들의 길이가 axis=0에서는 각각 2와 3, axis=1에서는 3과 2로써 일치하지 않고 1이 아니기 때문에 오류를 반환한다. 


브로드캐스팅에 대해 더 알아보고 싶다면 아래 링크를 방문하십시오.<br><br>
**[Rules of Broadcasting](https://jakevdp.github.io/PythonDataScienceHandbook/02.05-computation-on-arrays-broadcasting.html#Rules-of-Broadcasting)**

원칙1과 원칙2는 앞서 살펴본 예시가 있었으니, 끝으로 원칙3이 적용되는 예시를 살펴봅시다. 

In [13]:
A = np.arange(6)

In [14]:
A.reshape(2,3) + A.reshape(3,2)

ValueError: operands could not be broadcast together with shapes (2,3) (3,2) 

위와 같이 어떤 축에서도 원소 수가 같지 않고, 1도 아니라면 오류를 반환합니다. 

### (3) for 순회문과 비교하기
문제를 보면서 브로드캐스팅을 `for`순회문과 비교해 봅시다.

#### 예제1) 각 원소별 전체 평균과의 차이 구하기

<img src='./img/5_29.jpg' align=left/>

<img src='./img/2_44.jpg' align=left width=600 height=300/>

In [15]:
ary = np.random.randint(0, 20, size=20).reshape(4, 5)
ary

array([[ 5,  6,  7,  2,  4],
       [15,  3,  4,  9,  0],
       [ 3,  6,  0,  9,  7],
       [ 0, 13, 11, 17,  1]])

In [16]:
# for 순회문을 사용할 경우
mean_of_ary = np.mean(ary)

diff_ary = ary.copy().astype(np.float)
for row_idx, row_val in enumerate(ary):
    for col_idx, element in enumerate(row_val):
        diff_ary[row_idx, col_idx] = diff_ary[row_idx, col_idx] - mean_of_ary
    
diff_ary

array([[-1.1, -0.1,  0.9, -4.1, -2.1],
       [ 8.9, -3.1, -2.1,  2.9, -6.1],
       [-3.1, -0.1, -6.1,  2.9,  0.9],
       [-6.1,  6.9,  4.9, 10.9, -5.1]])

In [17]:
# numpy 브로드캐스팅을 사용했을 경우
diff_ary = ary - np.mean(ary)
diff_ary

array([[-1.1, -0.1,  0.9, -4.1, -2.1],
       [ 8.9, -3.1, -2.1,  2.9, -6.1],
       [-3.1, -0.1, -6.1,  2.9,  0.9],
       [-6.1,  6.9,  4.9, 10.9, -5.1]])

#### 예제2) 1번째 행의 원소값과 다른 행의 원소값 비교하기

<img src='./img/5_28.jpg' align=left width=800 height=400/>

<img src='./img/2_43.jpg' align=left width=350 height=200/>

In [18]:
ary = np.random.randint(0, 20, size=40).reshape(8, 5)
ary

array([[17, 19, 14,  1,  6],
       [11,  6, 18, 16, 17],
       [ 3,  5,  7, 18, 11],
       [ 5,  5,  7, 11, 19],
       [16, 17,  1,  4,  6],
       [ 8,  4, 19,  4, 18],
       [ 4,  6, 16, 13, 12],
       [ 5,  9,  0,  6, 10]])

In [19]:
# for 순회문을 사용할 경우
target_vec = ary[1] # 1번째 행

diff_ary = ary.copy()
for row_idx in range(ary.shape[0]):
    # for구문을 통해 직접 순회하며 하나씩 연산을 적용
    diff_ary[row_idx] = diff_ary[row_idx] - target_vec
    
diff_ary

array([[  6,  13,  -4, -15, -11],
       [  0,   0,   0,   0,   0],
       [ -8,  -1, -11,   2,  -6],
       [ -6,  -1, -11,  -5,   2],
       [  5,  11, -17, -12, -11],
       [ -3,  -2,   1, -12,   1],
       [ -7,   0,  -2,  -3,  -5],
       [ -6,   3, -18, -10,  -7]])

In [20]:
# Numpy의 브로드캐스팅
ary - ary[1]

array([[  6,  13,  -4, -15, -11],
       [  0,   0,   0,   0,   0],
       [ -8,  -1, -11,   2,  -6],
       [ -6,  -1, -11,  -5,   2],
       [  5,  11, -17, -12, -11],
       [ -3,  -2,   1, -12,   1],
       [ -7,   0,  -2,  -3,  -5],
       [ -6,   3, -18, -10,  -7]])

#### 예제3) 1부터 5까지의 정수에서 0.1,0.5,2를 각각 곱한 모든 수 구하기

<img src='./img/5_30.jpg' align=left width=800 height=400/>

<img src='./img/2_45.jpg' align=left width=800 height=400/>

In [21]:
arr_1 = np.array([1, 2, 3, 4, 5])
arr_2 = np.array([0.1, 0.5, 2])

In [22]:
# for 순회문을 사용했을 경우

results = []
for r_v in arr_1:
    row = []
    for c_v in arr_2:
        row.append(r_v * c_v)
    results.append(row)
np.array(results)

array([[ 0.1,  0.5,  2. ],
       [ 0.2,  1. ,  4. ],
       [ 0.3,  1.5,  6. ],
       [ 0.4,  2. ,  8. ],
       [ 0.5,  2.5, 10. ]])

In [23]:
# numpy 브로드캐스팅을 사용했을 경우

arr_1.reshape(-1,1) * arr_2

array([[ 0.1,  0.5,  2. ],
       [ 0.2,  1. ,  4. ],
       [ 0.3,  1.5,  6. ],
       [ 0.4,  2. ,  8. ],
       [ 0.5,  2.5, 10. ]])

이처럼 브로드캐스팅을 활용하면 `for`순회문 보다 훨씬 간결하게 array를 연산할 수 있습니다.