# <span style="color:blue"> 스페셜 성능 향상시키기 </span>

## 코드의 성능을 향상시켜 실행 시간 측정하기 ― timeit

In [12]:
import pandas as pd
import numpy as np

df = pd.DataFrame({'a': [10, 20, 30], 'b': [20, 30, 40]})

def avg_2_apply(row):
    x = row[0]
    y = row[1]
    if (x == 20):
        return np.nan
    else:
        return (x + y) / 2

### 2. 판다스 데이터프레임 ― 실행 시간 측정

In [14]:
%%timeit
df.apply(avg_2_apply, axis=1)

  x = row[0]
  y = row[1]


250 μs ± 2.61 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


### 3. 넘파이로 벡터화한 함수 사용하기 ― 실행 시간 측정

In [16]:
@np.vectorize
def v_avg_2_mod(x, y):
    if (x == 20):
        return(np.NaN)
    else:
        return (x + y) / 2

In [18]:
%%timeit
v_avg_2_mod(df['a'], df['b'])

63.9 μs ± 397 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


### 5. numba 라이브러리로 벡터화한 함수 사용하기 ― 실행 시간 측정

In [20]:
import numba

@numba.vectorize
def v_avg_2_numba(x, y):
    if (int(x) == 20):
        return(np.NaN)
    else:
        return (x + y) / 2

In [22]:
%%timeit
v_avg_2_numba(df['a'].values, df['b'].values)

The slowest run took 8.52 times longer than the fastest. This could mean that an intermediate result is being cached.
18.4 μs ± 22.1 μs per loop (mean ± std. dev. of 7 runs, 1 loop each)
