# 성능향상 - cython, numba 라이브러리

### 코드 성능 향상시켜 실행시간측정 - timeit
    timeit - 실행시간 측정에 사용하는 파이썬 문장
    실행시간 측정코드 앞에 %%timeit 이라고 씀
    주로 성능저하시키는 부분 확인을 위해 사용

In [1]:
import pandas as pd
import numpy as np

##### 판다스 데이터프레임 - 실행시간 측정

In [None]:
df = pd.DataFrame({'a':[10, 20, 30], 'b':[20, 30, 40]})

def avg_2_apply(row):
    x = row[0]
    y = row[1]
    if (x == 20):
        return np.nan
    else:
        return (x + y) / 2

In [2]:
#판다스 데이터 프레임 실행시간 측정
%%timeit
df.apply(avg_2_apply, axis=1)

'''
319 µs ± 2.63 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
1바퀴 돌릴때 319마이크로초 +- 오차범위 2.63 마이크로 초

총 1000번 돌려서 나온 수치
'''

319 µs ± 2.63 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


##### 넘파이로 벡터화한 함수 사용 - 실행시간 측정


In [None]:
@np.vectorize
def v_avg_2_mod(x, y):
    if (x==20):
        return(np.NaN)
    else:
        return (x + y) / 2

In [4]:
%%timeit
v_avg_2_mod(df['a'], df['b'])

43.4 µs ± 1.14 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


##### numba 라이브러리로 벡터화한 함수 사용 - 실행시간 측정

In [8]:
import numba

@numba.vectorize
def v_avg_2_numba(x,y):
    if (int(x) == 20):
        return(np.NaN)
    else:
        return (x + y) / 2

In [9]:
%%timeit
v_avg_2_numba(df['a'].values, df['b'].values)

7.16 µs ± 95.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


numba 라이브러리로 벡터화한 함수가 가장 빠른 연산속도를 보여줌

# 파이썬 콘퍼런스 소개
    최신 기술 동향 파악

### 파이콘
    규모가 큰 파이썬 콘퍼런스 중 하나
    https://www.youtube.com/channel/UC26x6D5xpKx6io4ShfXa_Ow

### 사이파이(SciPy), 유로 사이파이(EuroSciPy)
    과학 및 분석 주제에 파이썬 결합한 내용을 주로 다룸
    https://www.youtube.com/c/enthought/featured
    https://www.youtube.com/watch?v=ZlJ4NZoj1Lk
