# pandas 산술연산

pandas의 가장 중요한 기능 중 하나는 다른 색인을 가지고 있는 객체들 사이의 산술 연산이다.

## Series의 통합연산(+)

In [None]:
import numpy as np
import pandas as pd
obj1 = pd.Series([4.8, -3.9, 9.5, 8.7], index = ['c', 'a', 'b', 'd'])
obj2 = pd.Series([5.2, 6.3, 2.6, -7.4, 9], index = ['c', 'a', 'e', 'f', 'g'])
obj1

In [None]:
obj2

In [None]:
obj3 = obj1 + obj2
obj3

결과 : 서로 일치하는 색인이 없는 경우에는 결측치(NaN)가 된다. 

## DataFrame의 통합연산(+)

In [None]:
df1 = pd.DataFrame(np.arange(9.).reshape(3,3), columns = list('acd'), index=['서울', '대구', '인천'])
df2 = pd.DataFrame(np.arange(12.).reshape(4,3), columns = list('bcd'), index=['부산', '대구', '인천', '서울'])
df1

In [None]:
df2

In [None]:
df3 = df1 + df2
df3

### 통합된 데이터 프레임에서 결측치를 특정한 값(예:0)으로 채워넣기

In [None]:
df1 = df1.reindex(columns=list('abcd'), fill_value=0)
df1

In [None]:
df2 = df2.reindex(columns=list('abcd'), fill_value=0)
df2

In [None]:
df1 = df1.add(df2, fill_value=0)
big_df = df1 + df2
big_df

## pandas 객체에 numpy 유니버설 함수(배열의 각 원소에 적용되는 함수)를 적용

In [None]:
dframe = pd.DataFrame(np.random.randn(4, 4), columns=list('abcd'), 
                      index=['서울', '부산', '대구', '인천'])
dframe

In [None]:
# 데이터 프레임 원소에 절댓값 적용
dframe = np.abs(dframe)
dframe

In [None]:
f = lambda x: x.max() - x.min()
diff = list(dframe.apply(f))
dframe.loc['편차'] = diff
dframe

### 출력 양식 지정 : 소수 두 자리까지만 출력

In [None]:
format = lambda x : '%.2f' % x
dframe.applymap(format)

### 행과 열의 합과 평균 계산

In [None]:
dframe.drop('편차', inplace=True)
dframe

In [None]:
dframe.loc['합계'] = dframe.sum()
dframe

In [None]:
dframe.loc['평균'] = dframe.mean()
dframe

In [None]:
dframe1 = dframe[:4]
dframe1

In [None]:
dframe1 = df2.reindex(columns=['a', 'b', 'c', 'd', '지역합계', '지역평균'], 
                      fill_value=0.0)
dframe1.loc[:, '지역합계'] = dframe.iloc[:, :4].sum(axis=1)
dframe1.loc[:, '지역평균'] = dframe.iloc[:, :4].mean(axis=1)
dframe1

In [None]:
dframe1