<img src="https://image.aladin.co.kr/product/16902/16/cover500/k202534274_1.jpg" width="200" height="200"><br>

# Chapter 10 apply 메서드 활용 

apply 메서드는 사용자가 작성한 함수를 한 번에 데이터프레임의 각 행과 열에 적용하여 실행할수 있게 해주는 메서드이다. 즉, 함수를 브로드캐스팅 해야 하는 경우에 apply 메서드를 사용한다. 물론 apply외에도 for문을 사용하면 각 데이터에 함수를 적용할수 있으나, 대용량의 경우에는 apply가 for문보다 훨씬 빠르기 때문에 apply 메서드의 사용법은 반드시 알아두어야 한다. 목차는 다음과 같다. 
 

 - 10-1 간단한 함수 만들기
 - 10-2 apply 메서드 사용하기 - 기초
 - 10-3 apply 메서드 사용하기 - 고급
 
 ## 10-1 간단한 함수 만들기 
 
 제곱 함수와 n 제곱함수를 직접 만들어 보자. 제곱 함수와 n 제곱 함수는 다음과 같이 생성한다. 
 
 ### 제곱 함수와 n 제곱 함수 만들기 
 
 #### 1. 
 제곱 함수는 다음과 같다, 

In [5]:
def my_sq(x):
    return x **2

#### 2. 
n 제곱 함수 my_exp는 다음과 같다.

In [6]:
def my_exp(x,n):
    return x ** n

#### 3. 
각각 만든 함수를 사용해보자.

In [7]:
print(my_sq(4))

print(my_exp(2,4))

16
16


## 10-2 apply 메서드 사용하기 - 기초

### 시리즈와 데이터프레임에 apply 메서드 사용 

#### 1. 시리즈와 apply 메서드 

먼저 실습에 사용할 데이터프레임을 준비하자. 

In [15]:
import pandas as pd

df = pd.DataFrame({'a': [10,20,30], 'b': [20,30,40]})

df

Unnamed: 0,a,b
0,10,20
1,20,30
2,30,40


 #### 2. 
 다음은 제곱함스를 사용하기전에 a 열을 제곱하여 얻은 결과이다. 이 결과값과 apply 메서드를 사용한 결과갑을 비교해보자.

In [16]:
print(df['a'] ** 2)

0    100
1    400
2    900
Name: a, dtype: int64


#### 3. 
다음은 apply 메서드에 제곱 함수의 이름을 전달하여 시리즈의 모든 데이터에 제곱 함수를 적용한 것이다. 이때 apply 메서드에 전달하는 함수가 1개의 인자를 받도록 구성되어 있다면 인자값을 생략해야 한다. 다음을 보자.

In [17]:
sq = df['a'].apply(my_sq)
sq

0    100
1    400
2    900
Name: a, dtype: int64

#### 4. 
이제 2개의 인자를 전달받아야 하는 n 제곱 함수와 apply 메서드를 함께 사용해보자. apply 메서드의 첫 번째 인자에는 n 제곱 함수의 이름을 전달하고 두 번째 인자에는 n 제곱 함수의 두 번째 인자를 전달 한다.

In [18]:
ex = df['a'].apply(my_exp, n=2)
print(ex)

ex = df['a'].apply(my_exp, n=3)
print(ex)

0    100
1    400
2    900
Name: a, dtype: int64
0     1000
1     8000
2    27000
Name: a, dtype: int64


#### 5. 데이터프레임과 apply 메서드 
이번에는 시리즈가 아니라 데이터프레임에 apply 메서드를 사용하는 방법을 알아보자. 먼저 다음과 같이 데이터프레임을 준비하자.

In [20]:
df = pd.DataFrame({'a': [10,20,30], 'b': [20,30,40]})

print(df)

    a   b
0  10  20
1  20  30
2  30  40


#### 6. 
새로운 함수를 만들어보자. 이번에 사용할 함수는 1개의 값을 전달받아 출력하는 함수이다. 

In [21]:
def print_me(x):
    print(x)

#### 7. 
이번에는 데이터프레임에 함수를 적용해야 하기 때문에 함수를 열 방향으로 적용할지 행 방향으로 적용할지 정해야 한다. axis 인자값을 10 또는 1로 지정하면 함수를 열 또는 행 방향으로 적용이 가능하다.

In [22]:
print(df.apply(print_me, axis=0))

0    10
1    20
2    30
Name: a, dtype: int64
0    20
1    30
2    40
Name: b, dtype: int64
a    None
b    None
dtype: object


#### 8. 
이번에는 3개의 인자를 입력받아 평균을 계산하는 함수를 사용해보자.

In [23]:
def avg_3(x,y,z):
    return (x + y + z) / 3

#### 9. 
그런데 avg_3 함수를 apply 메서드에 전달하면 **'avg_3 함수는 3개의 인자값을 필요로 하는 함수인데 1개의 인자값만 입력받았다'** 는 오류 메시지가 출력된다. 즉, avg_3 함수에 열 단위 데이터가 전달되었고 이 값을 avg_3 함수에서 1개의 인자로 인식한 것이다. 따라서 avg_3 함수가 열 단위로 데이터를 처리할 수 있도록 수정해야 한다.

In [None]:
print