## Broadcasting이란?
- 여러분의 공간 지각 능력이 필요합니다.
- 교과 과정에서 행렬을 배웠을 수도 안 배웠을 수도 있습니다.
- numpy에선 Array, Pandas에서는 DataFrame또는 Series의 모양이 다른 경우에 연산이 가능하도록 모양을 처리하는 방법을 말합니다.

### 참고 - Numpy의 Broadcasting
- [Numpy의 Broadcasting 공식문서](https://numpy.org/doc/stable/user/basics.broadcasting.html)
- 이런 느낌이구나! 정도만 숙지합시다!
- 오해하지맙시다. Numpy와 Pandas의 Broadcasting의 진행 방식은 다릅니다.
    - Numpy Broadcasting 방식 != Pandas Broadcasting
    - Broadcasting == 크기나 모양이 다를 때의 처리 방식을 정하는 것

In [None]:
# 참조
import pandas as pd
import numpy as np

# BroadCasting 비교 - Numpy vs Pandas
### 아래 그림은 numpy의 예시
![image.png](attachment:image.png)

In [None]:
# numpy Array로 할 때
a = np.array([1.0, 2.0, 3.0])
b = np.array([2.0])

In [None]:
a, b

In [None]:
# * 연산
a * b

In [None]:
# + 연산
a + b

In [None]:
# pandas Series로 할 때
a = pd.Series(data = [1, 2, 3])
b = pd.Series(data = [2])

In [None]:
# * 연산
a * b

In [None]:
# + 연산
a + b

- numpy는 Stretch(스케일 변환, 뻗다. 스트레칭하다)는 방식이고
- pandas는 각각 처리하고 반영이 어려운 곳은 결측치(NA)로 처리하는 방식

## Pandas의 Matching / Broadcasting behavior
- Pandas의 Broadcasting을 설명하려면 Matching도 함께 해야함.
- https://pandas.pydata.org/docs/user_guide/basics.html#matching-broadcasting-behavior

## 행렬의 크기가 같을 때

In [None]:
a = pd.Series(data = [1, 2, 3])
b = pd.Series(data = [3, 5, 7])

In [None]:
a + b

In [None]:
a - b

In [None]:
a * b

In [None]:
a / b

In [None]:
a // b

In [None]:
a % b

In [None]:
a ** b

In [None]:
# 여담 : 비트 연산자 &(AND) |(OR) ^(XOR) 등도 된다. 공학도라면 참고.
a ^ b

## 행렬 크기가 다를 때

In [None]:
# Case1. 크기가 다른 Series를 DataFrame시킬 때
s1 = pd.Series(data = [1, 2, 3], index=['a', 'b', 'c'])
s2 = pd.Series(data = [4, 5, 6, 7], index=['a', 'b', 'c', 'd'])
s3 = pd.Series(data = [8, 9, 10], index=['a', 'b', 'd'])

In [None]:
df1 = pd.DataFrame(
    data = {
        '1열': s1, '2열': s2, '3열': s3
    }
)
df2 = pd.DataFrame(
    data = {
        '2열': s2
    }
)

In [None]:
# 매칭이 안되는 곳은 결측치로 처리한다.
df1

In [None]:
df2

In [None]:
# Case2. 모두 DataFrame이고 행렬 크기가 다르나 동일한 열이름이 있는 경우 사칙 연산은?
df1 - df2

동일한 label만 가진 열만 계산되고 나머지는 모두 결측치가 되었다.

In [None]:
# Case3. DataFrame과 Series의 연산이라면?
s4 = df2.squeeze()
s4

In [None]:
# 위의 df2는 df1의 2열 조회와 동일


In [None]:
# - 연산


In [None]:
# sub 함수로 축을 변경해주면, Stretch가 일어났다!


In [None]:
# 비교를 위한 df1 확인


numpy에서의 Strech랑 같은 상황
![image.png](attachment:image.png)

In [None]:
# Case4, 그러면 행을 연산시키면 어떻게 될까?


In [None]:
# 여기서도 Stretch가 발생했다.


축을 이용할 때는 다음 메소드를 써야한다.
| 연산자 | 메소드 | 사용 예시 |
| - | - | - |
| + | add() | df.add(row, axis='columns'), df.add(column, axis='index') |
| - | sub() | df.sub(row, axis='columns'), df.sub(column, axis='index') |
| * | mul() | df.mul(row, axis='columns'), df.mul(column, axis='index') |
| / | div() | df.div(row, axis='columns'), df.div(column, axis='index') |


## 실습 활용

In [None]:
# 출항이 늦어져서 30% Discount 해주기로 했다면?


In [None]:
# 할인가를 DataFrame에 열 추가


In [None]:
# 반올림처리
