### **<u>Item 70: Profile Before Optimizing</u>**
- Python 프로그램에서 성능 저하의 실제 원인을 파악하는 것은 매우 어렵다
- 성능 최적화를 시도하기 전에 프로그램의 성능을 직접 측정하는 것이 가장 좋은 접근 방식이다

#### <span style="color: yellowgreen">**_(예시 1) 삽입 정렬 알고리즘의 성능 분석_**</span>

In [1]:
# 리스트를 삽입 정렬 알고리즘으로 정렬하는 함수

def insertion_sort(data):
    result = []
    for value in data:
        insert_value(result, value)
    return result

In [2]:
# 입력 배열을 선형 검색(linear scan)하여 삽입 지점을 찾는 함수

def insert_value(array, value):
    for i, existing in enumerate(array):
        if existing > value:
            array.insert(i, value)
            return
    array.append(value)

In [3]:
# insertion_sort와 insert_value의 성능을 프로파일링하기 위함
# 무작위 숫자로 구성된 데이터 세트를 생성하고, 프로파일러에 전달할 테스트 함수

from random import randint

max_size = 10**4
data = [randint(0, max_size) for _ in range(max_size)]
test = lambda: insertion_sort(data)

In [4]:
# cProfile 모듈의 Profile 객체를 생성하고, runcall 메서드를 사용해 테스트 함수를 실행

from cProfile import Profile

profiler1 = Profile()
profiler1.runcall(test)

[0,
 0,
 0,
 4,
 5,
 5,
 6,
 8,
 8,
 11,
 12,
 14,
 15,
 15,
 15,
 15,
 15,
 19,
 22,
 22,
 22,
 25,
 26,
 26,
 27,
 28,
 28,
 29,
 31,
 31,
 31,
 32,
 32,
 33,
 33,
 34,
 35,
 36,
 36,
 37,
 38,
 38,
 39,
 40,
 45,
 45,
 45,
 45,
 46,
 46,
 47,
 49,
 49,
 49,
 50,
 51,
 52,
 53,
 54,
 56,
 57,
 57,
 58,
 59,
 60,
 60,
 61,
 61,
 61,
 62,
 62,
 62,
 63,
 64,
 65,
 65,
 67,
 68,
 69,
 70,
 70,
 70,
 70,
 71,
 73,
 76,
 76,
 76,
 78,
 78,
 79,
 80,
 80,
 81,
 82,
 82,
 83,
 84,
 86,
 86,
 89,
 89,
 89,
 90,
 93,
 98,
 99,
 101,
 102,
 102,
 103,
 107,
 108,
 108,
 109,
 109,
 109,
 110,
 110,
 111,
 111,
 113,
 113,
 113,
 115,
 116,
 117,
 117,
 120,
 123,
 124,
 125,
 125,
 128,
 129,
 129,
 129,
 131,
 131,
 132,
 133,
 137,
 138,
 140,
 141,
 141,
 142,
 142,
 143,
 143,
 143,
 144,
 145,
 146,
 147,
 149,
 149,
 151,
 152,
 156,
 156,
 157,
 157,
 157,
 157,
 158,
 159,
 161,
 161,
 162,
 163,
 164,
 166,
 167,
 167,
 167,
 168,
 169,
 169,
 170,
 170,
 170,
 171,
 172,
 174,
 174,


In [5]:
# pstats 모듈의 Stats 클래스를 사용하여 성능에 대한 통계를 추출

from pstats import Stats

stats = Stats(profiler1)
stats.strip_dirs()
stats.sort_stats('cumulative')
stats.print_stats()

         20003 function calls in 1.242 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    1.242    1.242 1991204898.py:8(<lambda>)
        1    0.002    0.002    1.242    1.242 1573872389.py:3(insertion_sort)
    10000    1.230    0.000    1.239    0.000 741425977.py:3(insert_value)
     9986    0.010    0.000    0.010    0.000 {method 'insert' of 'list' objects}
       14    0.000    0.000    0.000    0.000 {method 'append' of 'list' objects}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




<pstats.Stats at 0x1c56a973be0>

[출력 결과 참고]
- **ncalls** : 프로파일링 기간동안 함수가 호출된 횟수 <br><br>
- **tottime** : 다른 함수 실행 시간 제외하고 해당 함수를 실행하는데 소요된 시간<br><br>
- **tottime percall** : 함수가 호출될 때마다 평균적으로 소요된 시간<br><br>
- **cumtime** : 해당 함수와 해당 함수가 호출하는 모든 함수를 실행하는데 소요되는 누적시간<br><br>
- **cumtime percall** : cumtime을 ncalls로 나눈 값

In [6]:
# bisect 모듈을 사용하여 효율적으로 재정의

from bisect import bisect_left

def insert_value(array, value):
    i = bisect_left(array, value)
    array.insert(i, value)

In [7]:
# pstats 모듈의 Stats 클래스를 사용하여 성능에 대한 통계를 추출

from pstats import Stats

profiler2 = Profile()
profiler2.runcall(test)

stats = Stats(profiler2)
stats.strip_dirs()
stats.sort_stats('cumulative')
stats.print_stats()

         30003 function calls in 0.016 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.016    0.016 1991204898.py:8(<lambda>)
        1    0.002    0.002    0.016    0.016 1573872389.py:3(insertion_sort)
    10000    0.002    0.000    0.014    0.000 2052340900.py:5(insert_value)
    10000    0.008    0.000    0.008    0.000 {method 'insert' of 'list' objects}
    10000    0.003    0.000    0.003    0.000 {built-in method _bisect.bisect_left}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




<pstats.Stats at 0x1c56a915c40>

#### <span style="color: yellowgreen">**_(예시 2) 프로그램 전체를 프로파일링_**</span>

In [8]:
def my_utility(a, b):
    c = 1
    for i in range(100):
        c += a * b

def first_func():
    for _ in range(1000):
        my_utility(4, 5)

def second_func():
    for _ in range(10):
        my_utility(1, 3)

def my_program():
    for _ in range(20):
        first_func()
        second_func()

from cProfile import Profile
from pstats import Stats

profiler3 = Profile()
profiler3.runcall(my_program)

stats = Stats(profiler3)
stats.strip_dirs()
stats.sort_stats('cumulative')
stats.print_stats()

         20242 function calls in 0.101 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.101    0.101 4205113249.py:14(my_program)
       20    0.003    0.000    0.101    0.005 4205113249.py:6(first_func)
    20200    0.098    0.000    0.098    0.000 4205113249.py:1(my_utility)
       20    0.000    0.000    0.001    0.000 4205113249.py:10(second_func)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




<pstats.Stats at 0x1c56a905e50>

In [9]:
stats.print_callers()

   Ordered by: cumulative time

Function                                          was called by...
                                                      ncalls  tottime  cumtime
4205113249.py:14(my_program)                      <- 
4205113249.py:6(first_func)                       <-      20    0.003    0.101  4205113249.py:14(my_program)
4205113249.py:1(my_utility)                       <-   20000    0.097    0.097  4205113249.py:6(first_func)
                                                         200    0.001    0.001  4205113249.py:10(second_func)
4205113249.py:10(second_func)                     <-      20    0.000    0.001  4205113249.py:14(my_program)
{method 'disable' of '_lsprof.Profiler' objects}  <- 




<pstats.Stats at 0x1c56a905e50>

#### <span style="color: yellowgreen">**_Summary_**</span>

&emsp; &#9312; 속도 저하의 원인은 모호하므로 최적화 전 프로파일링이 중요<br><br>
&emsp; &#9313; profile 모듈 대비 cProfile 모듈을 사용하면 더 정확한 프로파일링 정보 제공