# 쥘리아 함수로 프로파일링
- 프로파일링(profiling, 프로그램 프로파일링/소프트웨어 프로파일링) 또는 성능 분석은 프로그램의 시간 복잡도 및 공간(메모리), 특정 명령어 이용, 함수 호출의 주기와 빈도 등을 측정하는 동적 프로그램 분석의 한 형태이다. 프로파일링 정보는 대개가 프로그램 최적화를 보조하기 위해 사용된다. 프로파일링은 프로파일러(profiler)라는 도구를 사용하여 프로그램 소스 코드나 이진 실행 파일을 계측 분석함으로써 수행한다.
- 쥘리아 함수는 테스트를 위한 함수이다. 나도 잘 모른다..

In [36]:
import time

# 계산할 복소평면 영역
x1, x2, y1, y2 = -1.8, 1.8, -1.8, 1.8
c_real, c_imag = -0.62772, -.42193

In [43]:
def calc_pure_python(desired_width, max_iterations):
    """
    복소 좌표(zs)와 복소 인자(cs) 리스트를 만들고,
    쥘리아 집합을 생성한 뒤 출력한다.
    """
    x_step = (float(x2-x1) / float(desired_width))
    y_step = (float(y1-y2) / float(desired_width))
    
    x = []
    y = []
    ycoord= y2
    while ycoord > y1:
        y.append(ycoord)
        ycoord += y_step
    
    xcoord = x1
    while xcoord < x2:
        x.append(xcoord)
        xcoord += x_step

#     좌표 리스트와 각 셀에 대한 초기 조건을 만든다.
#     초기 조건은 상수이며 쉽게 제거할 수 있는 점을 주목하자
#     우리가 만든 함수의 몇몇 입력을 사용한 실제 시나리오를 시뮬레이션할 때 사용한다.
    
    zs = []
    cs = []
    for ycoord in y:
        for xcoord in x:
            zs.append(complex(xcoord, ycoord))
            cs.append(complex(c_real, c_imag))

    print ("Length of x:", len(x))
    print ("Total elements:", len(zs))
    
    start_time = time.time()
    output = calculate_z_serial_purepython(max_iterations, zs, cs)
    end_time = time.time()
    secs = end_time - start_time

    print ("calculate_z_serial_purepython" + " took", secs, "seconds")

    # 1000^2 grid에서 300번의 반복을 가정한 값
    # 제한된 입력으로 작업할 경우 발생할 수 있는 사소한 에러를 잡기 위함
    assert sum(output) == 33219980 # 같은지 검사히기

In [44]:
def calculate_z_serial_purepython(maxiter, zs, cs):
    """쥘리아 갱신 규칙을 사용해서 output 리스트 계산하기"""
    output = [0] * len(zs) # 미리 선언
    for i in range(len(zs)):
        n = 0
        z = zs[i]
        c = cs[i]
        while abs(z) < 2 and n < maxiter:
            z = z * z + c
            n += 1
        output[i] = n
    return output

In [45]:
if __name__ == "__main__":
    print("실행 결과")
    calc_pure_python(desired_width=1000, max_iterations=300)

실행 결과
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.506437063217163 seconds


# 여기까지 기본함수로 쥘리아 함수의 수행시간을 print문으로 출력해서 확인해봄
# 다음 부터는 다양한 방법으로 프로파일링 시도

In [55]:
# @timefn
def calc_pure_python(desired_width, max_iterations):
    """
    복소 좌표(zs)와 복소 인자(cs) 리스트를 만들고,
    쥘리아 집합을 생성한 뒤 출력한다.
    """
    x_step = (float(x2-x1) / float(desired_width))
    y_step = (float(y1-y2) / float(desired_width))
    
    x = []
    y = []
    ycoord= y2
    while ycoord > y1:
        y.append(ycoord)
        ycoord += y_step
    
    xcoord = x1
    while xcoord < x2:
        x.append(xcoord)
        xcoord += x_step

#     좌표 리스트와 각 셀에 대한 초기 조건을 만든다.
#     초기 조건은 상수이며 쉽게 제거할 수 있는 점을 주목하자
#     우리가 만든 함수의 몇몇 입력을 사용한 실제 시나리오를 시뮬레이션할 때 사용한다.
    
    zs = []
    cs = []
    for ycoord in y:
        for xcoord in x:
            zs.append(complex(xcoord, ycoord))
            cs.append(complex(c_real, c_imag))

    print ("Length of x:", len(x))
    print ("Total elements:", len(zs))
    
    start_time = time.time()
    output = calculate_z_serial_purepython(max_iterations, zs, cs)
    end_time = time.time()
    secs = end_time - start_time

    print ("calculate_z_serial_purepython" + " took", secs, "seconds")

    # 1000^2 grid에서 300번의 반복을 가정한 값
    # 제한된 입력으로 작업할 경우 발생할 수 있는 사소한 에러를 잡기 위함
    assert sum(output) == 33219980 # 같은지 검사히기

In [47]:
# 시간 측정을 자동화 하기위한 decorater
# decorater 함수를 만들고 실행하고자 하는 함수 위에 @함수 써주면 된다.
from functools import wraps
def timefn(fn):
    @wraps(fn)
    def measure_time(*args, **kwargs):
        t1 = time.time()
        result = fn(*args, **kwargs)
        t2 = time.time()
        print("@timefn: {} took {} seconds".format(fn.__name__, t2-t1))
    return measure_time

In [48]:
calc_pure_python(desired_width=1000, max_iterations=300)

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.503308057785034 seconds
@timefn: calc_pure_python took 5.9068310260772705 seconds


In [56]:
# 위에 데코레이터(@timefn) 제외하고 실행 
# python -m timeit으로도 실행 가능

%timeit calc_pure_python(desired_width=1000, max_iterations=300)

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.164790153503418 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.076498985290527 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.100964069366455 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.077287197113037 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.083536148071289 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.10014796257019 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.1143958568573 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.098169803619385 seconds
5.5 s ± 10.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [57]:
# unix time 명령어를 통한 시간측정
'''
real: 경과된 시간
user: CPU가 커널 함수 외 작업 처리 시간
sys: 커널 함수 수행 시간
나머지: I/O 를 기다리는 시간
'''
! /usr/bin/time -p python 2Julia\ Set.py

실행 결과
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.076694965362549 seconds
@timefn: calc_pure_python took 5.495759010314941 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 5.097292900085449 seconds
@timefn: calc_pure_python took 5.511453151702881 seconds
real        11.03
user        10.94
sys          0.08


In [58]:
# cProfile 모듈 사용하기
!python -m cProfile -s cumulative 2Julia\ Set.py
# 누적 소비 시간으로 정렬 되어 주로 소비하는 곳이 어디인지 쉽게 찾을 수 있음
# append, abs가 매번호출돼서 호출횟수가 엄청 많았음
# calculate_z_serial_purepython에서 시간이 많이 소요됨

실행 결과
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 8.293734788894653 seconds
@timefn: calc_pure_python took 8.913086891174316 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 8.27128791809082 seconds
@timefn: calc_pure_python took 8.890289306640625 seconds
         72444016 function calls in 17.804 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000   17.804   17.804 {built-in method builtins.exec}
        1    0.000    0.000   17.804   17.804 2Julia Set.py:9(<module>)
        2    0.056    0.028   17.803    8.902 2Julia Set.py:20(measure_time)
        2    0.951    0.476   17.747    8.874 2Julia Set.py:29(calc_pure_python)
        2   12.899    6.449   16.565    8.283 2Julia Set.py:79(calculate_z_serial_purepython)
 68439960    3.666    0.000    3.666    0.000 {built-in method builtins.abs}
  4004000    0.223    0.000    0.223    

In [61]:
# line_profiler 한 줄씩 측정하기
# !pip install line_profiler
# 현재 pip install이 되지 않는다.
'''
git clone https://github.com/rkern/line_profiler.git
find line_profiler -name '*.pyx' -exec cython {} \;
cd line_profiler
pip install . --user
pip install line_profiler
이 방식으로 하도록한다.

cython이 설치되지 않았다면 pip install cython후 실행하도록 한다!

출처: https://github.com/rkern/line_profiler
'''

from line_profiler import LineProfiler

lp = LineProfiler()
lp_wrapper = lp(calc_pure_python)
lp_wrapper(desired_width=1000, max_iterations=300)
lp.print_stats()

'''
출처 : https://stackoverflow.com/questions/23885147/how-do-i-use-line-profiler-from-robert-kern

오래 걸리지만 각 라인의 수행 결과를 알기 편하다.
calculate_z_serial_purepython 에서 90퍼센트 이상의 시간을 쏟아부었고 그안에서도 다시 프로파일링 해나가는 과정이 필요하다.

여태까지 한과정은 어느 코드에 문제가 있는지 살펴보기 위함이였다! 코드를 수정하는 방법은 차근차근 업데이트 해나갈 예정이다!
'''

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 16.57469916343689 seconds
Timer unit: 1e-06 s

Total time: 18.0771 s
File: <ipython-input-55-23c61e89ea41>
Function: calc_pure_python at line 2

Line #      Hits         Time  Per Hit   % Time  Line Contents
     2                                           def calc_pure_python(desired_width, max_iterations):
     3                                               """
     4                                               복소 좌표(zs)와 복소 인자(cs) 리스트를 만들고,
     5                                               쥘리아 집합을 생성한 뒤 출력한다.
     6                                               """
     7         1          3.0      3.0      0.0      x_step = (float(x2-x1) / float(desired_width))
     8         1          1.0      1.0      0.0      y_step = (float(y1-y2) / float(desired_width))
     9                                               
    10         1          1.0      1.0      0.0      x = []
    11         1          1.

'\n출처 : https://stackoverflow.com/questions/23885147/how-do-i-use-line-profiler-from-robert-kern\n\n오래 걸리지만 \n\n'