# <span style = "color : black"> **Import**

In [2]:
import numpy as np
import pandas as pd

# <span style = "color : black"> **pd.Series.map**

- map은 **Series**의 method로 mapping(또는 function)을 통해 Series에 있는 **각각의 값**을 **다른 값으로** 바꾼다.
- **Note** : Series에 있는 각각의 값이 **elementwise로 함수(mapping)에 입력**이 되어 **여러번 계산**된다고 생각하면 편하다.
- Parameters<br>
  - arg : function,dict,Series...
  - ...
- Returns<br>
  - Series 


## <span style = "color : black"> **Data**

In [3]:
s = pd.Series(["cat","dog",np.nan,"rabbit"])

## <span style = "color : black"> **arg가 dict인 경우**

In [4]:
s.map({"cat":"kitten","dog":"puppy"})

0    kitten
1     puppy
2       NaN
3       NaN
dtype: object

- Series의 값 중 dict의 key와 일치하는 값이 없으면 NaN으로 바뀜.

## <span style = "color : black"> **arg가 Series인 경우**

In [5]:
s2 = pd.Series(["lion","elephant","dog",np.nan])
s.map(s2)

0    NaN
1    NaN
2    NaN
3    NaN
dtype: object

## <span style = "color : black"> **arg가 function인 경우**

In [6]:
s.map(lambda x : "I am a {}".format(x))

0       I am a cat
1       I am a dog
2       I am a nan
3    I am a rabbit
dtype: object

## <span style = "color : black"> **잘못된 사용 예시**
```python
s = pd.Series([0.1,3,2,0.4])
s.map(lambda x : sum(x))
>>> TypeError: 'float' object is not iterable
```


- 각각의 값(여기선 float)이 **따로따로 함수(mapping)이 입력**된다. 하지만 sum함수는 float형을 input으로 할 수 없으므로 오류 발생함.(float형은 iterable하지 않음)

In [69]:
s = pd.Series([0.3,2,0.4,5])
s.map(np.var)

0    0.0
1    0.0
2    0.0
3    0.0
dtype: float64

- 오류가 뜨지 않으나 원하던 동작이 아니다. 각각의 변수에 대해서 평균값을 구하려 했겠지만 각각의 값에 mean이 되므로 그 값 자체이다.

# <span style = "color : black"> **pd.DataFrame.apply**

- apply는 DataFrame의 method로 DataFrame의 **축을 따라서 함수를 적용**한다.
- Note : DataFrame의 apply는 vector(column,row)단위로 함수에 입력된다.(map이나 applymap은 element들이 함수의 입력이 된다.)
- Parameters<br>
  - func : 각각의 column,row(vector)에 적용되는 함수
  - axis : 0이면 row에 1이면 column애 적용
- Returns<br>
  - Series or DataFrame


## <span style = "color : black"> **Data**

In [31]:
n1 = pd.Series([0.1,4,0.35,2])
n2 = pd.Series([0.3,0.4,3,-5])
df = pd.DataFrame({"n1":n1,"n2":n2})
df

Unnamed: 0,n1,n2
0,0.1,0.3
1,4.0,0.4
2,0.35,3.0
3,2.0,-5.0


## <span style = "color : black"> **column에 function 적용**
- column vector에 함수 적용한다고 생각하자.

In [32]:
df.apply(func = lambda x : sum(x)/len(x),axis=0)

n1    1.6125
n2   -0.3250
dtype: float64

In [33]:
df.apply(np.mean,axis=0)

n1    1.6125
n2   -0.3250
dtype: float64

In [34]:
#vector에 elementwise**2
#np.array를 **2하면 모든 원소가 제곱되는 것과 같다.
df.apply(func = lambda x : x ** 2,axis=0)

Unnamed: 0,n1,n2
0,0.01,0.09
1,16.0,0.16
2,0.1225,9.0
3,4.0,25.0


In [35]:
#vector에 elementwise로 sin취함.
df.apply(func = lambda x : np.sin(x),axis=0)

Unnamed: 0,n1,n2
0,0.099833,0.29552
1,-0.756802,0.389418
2,0.342898,0.14112
3,0.909297,0.958924


## <span style = "color : black"> **row에 function 적용**
- row vector에 함수 적용.

In [36]:
df.apply(sum,axis=1)

0    0.40
1    4.40
2    3.35
3   -3.00
dtype: float64

In [37]:
df.apply(np.sin,axis=1)

Unnamed: 0,n1,n2
0,0.099833,0.29552
1,-0.756802,0.389418
2,0.342898,0.14112
3,0.909297,0.958924


In [38]:
#vector에 elementwise**2
#np.array를 **2하면 모든 원소가 제곱되는 것과 같다.
df.apply(func = lambda x : x ** 2,axis=1)

Unnamed: 0,n1,n2
0,0.01,0.09
1,16.0,0.16
2,0.1225,9.0
3,4.0,25.0


# <span style = "color : black"> **pd.DataFrame.applymap**
- applymap은 **DataFrame**의 method로 mapping(또는 function)을 통해 DataFrame에 있는 **각각의 값**을 **다른 값으로** 바꾼다.
- **Note** : DataFrame에 있는 각각의 값이 **elementwise로 함수(mapping)에 입력되어** **여러번 계산**된다고 생각하면 편하다.
- Parameters<br>
  - func
  - ...
- Returns<br>
  - DataFrame



## <span style = "color : black"> **Data**

In [39]:
n1 = pd.Series([0.1,4,0.35,2])
n2 = pd.Series([0.3,0.4,3,-5])
df = pd.DataFrame({"n1":n1,"n2":n2})
df

Unnamed: 0,n1,n2
0,0.1,0.3
1,4.0,0.4
2,0.35,3.0
3,2.0,-5.0


## <span style = "color : black"> **올바른 사용**

In [40]:
df.applymap(lambda x : "값은 {}".format(x))

Unnamed: 0,n1,n2
0,값은 0.1,값은 0.3
1,값은 4.0,값은 0.4
2,값은 0.35,값은 3.0
3,값은 2.0,값은 -5.0


In [41]:
df.applymap(lambda x : len(str(x)))

Unnamed: 0,n1,n2
0,3,3
1,3,3
2,4,3
3,3,4


In [55]:
df.applymap(lambda x : x ** 2)

Unnamed: 0,n1,n2
0,0.01,0.09
1,16.0,0.16
2,0.1225,9.0
3,4.0,25.0


## <span style = "color : black"> **잘못된 사용**

```python
df.applymap(lambda x : sum(x))
>>> TypeError: 'float' object is not iterable
```

- Series의 map method와 마찬가지로 DataFrame의 applymap method도 각각의 값(여기선 float)이 **따로따로 함수(mapping)에 입력**된다. 그러므로 sum함수에서 오류가 발생한다.

In [64]:
df.applymap(lambda x : np.mean(x))

Unnamed: 0,n1,n2
0,0.1,0.3
1,4.0,0.4
2,0.35,3.0
3,2.0,-5.0


- 오류가 뜨지 않으나 원하던 동작이 아니다. 각각의 변수에 대해서 평균값을 구하려 했겠지만 각각의 값에 mean이 되므로 그 값 자체이다.