# __핵심 기능__

### __재색인__

- reindex: 새로운 색인에 맞도록 객체를 새로 생성하는 기능

In [None]:
from pandas import Series
obj = Series([4.5, -5.3, 3.6], index=['d', 'b', 'c'])

In [None]:
obj

__Series 객체에 대해 reindex를 호출하면 데이터를 새로운 색인에 맞게 재배열하고, 없는 색인 값이 있다면 비어있는 값을 새로 추가__

In [None]:
obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'])

In [None]:
obj2

__NaN을 특정한 값으로 채우는 파라미터 fill_value__

In [None]:
# fill_value는 데이터 이가 빠진걸 채워넣을 수 있기 때문에 매우 좋은 기능이다.
obj.reindex(['a', 'b', 'c', 'd', 'e'], fill_value=0)

#### reindex 메서드(보간) 옵션

인자 | 설명
--- | ---
ffill 또는 pad | 앞의 값으로 채워 넣는다.
bfill 또는 backfill | 뒤의 값으로 채워 넣는다.

In [None]:
obj3 = Series(['blue', 'purple', 'yellow'], index=[0, 2, 3])

In [None]:
obj3

In [None]:
obj3.reindex(range(6), method='ffill')

__reindex는 index뿐만 아니라 column도 변경이 가능하다__

In [None]:
from pandas import DataFrame
import numpy as np
frame = DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'],
                  columns=['Ohio', 'Texas', 'California'])

In [None]:
frame

In [None]:
frame2 = frame.reindex(['a', 'b', 'c', 'd'])

In [None]:
frame2

In [None]:
states = ['Texas', 'Utah', 'California']

In [None]:
frame.reindex(columns=states)

### __로우와 컬럼 삭제하기__
    - drop()을 사용하자
    - 기본 축은 행으로 지정되어 있다

In [None]:
obj = Series(np.arange(5.), index=['a', 'b', 'c', 'd', 'e'])

In [None]:
obj

In [None]:
new_obj = obj.drop('c')

In [None]:
new_obj

In [None]:
obj.drop(['d', 'c'])

In [None]:
data = DataFrame(np.arange(16).reshape((4, 4)),
                 index=['Ohio', 'Colorado', 'Utah', 'New York'],
                 columns=['one', 'two', 'three', 'four'])

In [None]:
data

In [None]:
data.drop(['Colorado', 'Ohio'])

In [None]:
data.drop('two', axis=1)

In [None]:
data.drop(['two', 'four'], axis=1)

### __산술연산과 데이터 정렬__

#### 산술연산 메서드

메서드 | 설명
--- | ---
add | 덧셈(+)을 위한 메서드
sub | 뺄셈(-)을 위한 메서드
div | 나눗셈(/)을 위한 메서드
mul | 곱셈(*)을 위한 메서드

__Series 연산__

In [None]:
s1 = Series([7.3, -2.5, 3.4, 1.5], index=['a', 'c', 'd', 'e'])

In [None]:
s2 = Series([-2.1, 3.6, -1.5, 4, 3.1], index=['a', 'c', 'e', 'f', 'g'])

In [None]:
s1

In [None]:
s2

In [None]:
s1 + s2

__중복되지 않은 index의 연산 결과는 NaN이다__

- 산술연산 시 누락된 값은 전파
- DataFrame에서는 로우와 칼럼 모두에 적용

__DataFrame연산__

In [None]:
df1 = DataFrame(np.arange(9.).reshape((3, 3)), columns=list('bcd'),
                index=['Ohio', 'Texas', 'Colorado'])

In [None]:
df2 = DataFrame(np.arange(12.).reshape((4, 3)), columns=list('bde'),
                index=['Utah', 'Ohio', 'Texas', 'Oregon'])

In [None]:
df1

In [None]:
df2

In [None]:
df1 + df2

__산술연산 메서드에 채워 넣을 값 지정하기__
- add() 메서드를 이용하자
- fill_value 인자가 사용가능 하다

In [None]:
df1 = DataFrame(np.arange(12.).reshape((3, 4)), columns=list('abcd'))

In [None]:
df2 = DataFrame(np.arange(20.).reshape((4, 5)), columns=list('abcde'))

In [None]:
df1

In [None]:
df2

In [None]:
df1 + df2

In [None]:
df1.add(df2)

In [None]:
df1.add(df2, fill_value=0)

In [None]:
df1.add(df2, fill_value=1)

In [None]:
df1.add(df2, fill_value=2)

__DataFrame과 Series 간의 연산__

In [None]:
df = DataFrame(np.arange(12.).reshape((4, 3)), columns=list('bde'),
                  index=['Utah', 'Ohio', 'Texas', 'Oregon'])
df

In [None]:
series = df.iloc[1]
series

In [None]:
df - series

각 행에 대하여 루프 형태로 연산 진행

In [None]:
series2 = Series(range(3), index=['b', 'e', 'f']) 
series2

In [None]:
df + series2

어느 한 쪽이라도 가지고 있지 않은 index에 대해서는 연산 결과가 NaN이 된다

- 연산을 하는 축을 변경하고 싶다면 제공하는 연산 메서드를 사용한다

In [None]:
series3 = df['d']
series3

In [None]:
df

In [None]:
# 인자로 넘기는 axis 값은 연산을 적용할 축 번호
# axis=0은 DataFrame의 로우를 따라 연산을 수행
df.sub(series3, axis=0)

__DataFrame을 Numpy로 변환하기__
- values
- numpy 연산을 지유롭게 구사할수 있다

In [None]:
df

In [None]:
type(df)

In [None]:
df.values

In [None]:
type(df.values)

In [None]:
df['b']

In [None]:
type(df['b'])

Series도 변환이 가능하다

In [None]:
df['b'].values

In [None]:
df[['b']]

In [None]:
df[['b']].values

In [None]:
df[['b']].values.T