### 산술연산
판다스 객체의 산술연산은 내부적으로 3단계 프로세스를 거친다. 
행/열 인덱스를 기준으로 모든 원소를 정렬한다. 동일한 위치에 있는 원소끼리 일대일로 대응시킨다. 일대일 대응이되는 원소끼리 연산을 처리한다. 단, 이때 대응되는 원소가 없으면 NaN으로 처리한다.  

#### 시리즈 연산
> 시리즈 vs 숫자  
시리즈 객체에 어떤 숫자를 더하면 시리즈의 개별 원소에 각각 숫자를 더하고 계산한 결과를 시리즈 객체로 변환한다. 덧셈, 뺄셈, 곱셈, 나눗셈 모두 가능하다.  
시리즈와 숫자 연산: Series객체 + 연산자(+, -, *, /) + 숫자  


In [1]:
import pandas as pd

student1 = pd.Series({'국어':100, '영어':80, '수학':90})
print(student1)
print('\n')

percentage = student1 / 200
print('\n')
print(type(percentage))

국어    100
영어     80
수학     90
dtype: int64




<class 'pandas.core.series.Series'>


> 시리즈 vs 시리즈
시리즈와 시리즈 사이에 사칙연산을 처리하는 방법이다. 시리즈의 모든 인덱스에 대하여 같은 인덱스를 가진 원소끼리 계산한다. 인덱스에 연산 결과를 매칭하여 새 시리즈를 반환한다. 
시리즈와 시리즈 연산: Series1 + 연산자(+,-,*,/) + Series2

In [2]:
student1 = pd.Series({'국어':100, '영어':80, '수학':90})
student2 = pd.Series({'수학': 80, '국어':90, '영어':80})
print(student1)
print('\n')
print(student2)
print('\n')

addition = student1 + student2
substraction = student1 - student2
multiplication = student1 * student2
division = student1/student2
print(type(division))
print('\n')

result = pd.DataFrame([addition, substraction, multiplication, division], index=['덧셈','뺄셈','곱셈','나눗셈'])
print(result)

국어    100
영어     80
수학     90
dtype: int64


수학    80
국어    90
영어    80
dtype: int64


<class 'pandas.core.series.Series'>


              국어        수학      영어
덧셈    190.000000   170.000   160.0
뺄셈     10.000000    10.000     0.0
곱셈   9000.000000  7200.000  6400.0
나눗셈     1.111111     1.125     1.0


In [3]:
# NaN 값이 있는 시리즈 연산
import pandas as pd
import numpy as np

student1 = pd.Series({'국어':np.nan, '영어':80, '수학':90})
student2 = pd.Series({'수학':80, '국어':90})

print(student1)
print('\n')
print(student2)
print('\n')

addition = student1 + student2
substraction = student1 - student2
multiplication = student1 * student2
division = student1 / student2 
print(type(division))
print('\n')

result = pd.DataFrame([addition, substraction, multiplication, division], index=['덧셈','뺄셈','곱셈','나눗셈'])
# NaN을 포함한 연산 결과는 NaN으로 처리하므로, result의 '국어' 열에 있는 원소값은 모두 NaN이다. 
print(result)

국어     NaN
영어    80.0
수학    90.0
dtype: float64


수학    80
국어    90
dtype: int64


<class 'pandas.core.series.Series'>


     국어        수학  영어
덧셈  NaN   170.000 NaN
뺄셈  NaN    10.000 NaN
곱셈  NaN  7200.000 NaN
나눗셈 NaN     1.125 NaN


In [4]:
sr_add = student1.add(student2, fill_value=0)
sr_sub = student1.sub(student2, fill_value=0)
sr_mul = student1.mul(student2, fill_value=0)
sr_div = student1.div(student2, fill_value=0)

result2 = pd.DataFrame([sr_add, sr_sub, sr_mul, sr_div], index=['덧셈', '뺄셈', '곱셈', '나눗셈'])
#inf -> infinite 80/0 -> infinite
print(result2)

       국어        수학    영어
덧셈   90.0   170.000  80.0
뺄셈  -90.0    10.000  80.0
곱셈    0.0  7200.000   0.0
나눗셈   0.0     1.125   inf


### 데이터프레임 연산
데이터프레임은 여러 시리즈가 한데 모인 것이므로 시리즈 연산을 확장하는 개념으로 이해하는 것이 좋다. 먼저 행/열 인덱스를 기준으로 정렬하고 일대일 대응되는 원소끼리 연산을 처리한다. 
> 데이터프레임 vs 숫자
데이터프레임에 어떤 숫자를 더하면 모든 원소에 숫자를 더한다. 덧셈, 뺄셈, 곱셈, 나눗셈 모두 가능하다. 기존 데이터프레임의 형태를 그대로 유지한 채 원소 값만 새로운 계산값으로 바뀐다. 새로운 데이터프레임 객체로 반환되는 점에 유의한다. 
데이터프레임과 숫자 연산: DataFrame 객체 + 연산자(+,-,*,/) + 숫자

In [1]:
!python --version

Python 3.7.6


In [None]:
import seaborn as sns