# How to optimize python code

- cProfile
- line_profile


## cProfile

1. 如何运行

In [None]:
if __name__ == "__main__":
	import cProfile
	*# 直接把分析结果打印到控制台*
	cProfile.run("test()")
	*# 把分析结果保存到文件中*
	cProfile.run("test()", filename="result.out")
	*# 增加排序方式*
	cProfile.run("test()", filename="result.out", sort="cumulative")

2. 如何分析结果

In [None]:
import pstats

# 创建Stats对象
p = pstats.Stats("result.out")

# strip_dirs(): 去掉无关的路径信息
# sort_stats(): 排序，支持的方式和上述的一致
# print_stats(): 打印分析结果，可以指定打印前几行

# 和直接运行cProfile.run("test()")的结果是一样的
p.strip_dirs().sort_stats(-1).print_stats()

# 按照函数名排序，只打印前3行函数的信息, 参数还可为小数,表示前百分之几的函数信息 
p.strip_dirs().sort_stats("name").print_stats(3)

# 按照运行时间和函数名进行排序
p.strip_dirs().sort_stats("cumulative", "name").print_stats(0.5)

# 如果想知道有哪些函数调用了sum_num
p.print_callers(0.5, "sum_num")

# 查看test()函数中调用了哪些函数
p.print_callees("test")

结果

In [None]:
8 function calls in 0.042 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.042    0.042 test.py:5(<module>)
        1    0.002    0.002    0.042    0.042 test.py:12(test)
        2    0.035    0.018    0.039    0.020 test.py:5(sum_num)
        3    0.004    0.001    0.004    0.001 {range}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

ncalls：表示函数调用的次数；  
tottime：表示指定函数的总的运行时间，除掉函数中调用子函数的运行时间；  
percall：（第一个percall）等于 tottime/ncalls；  
cumtime：表示该函数及其所有子函数的调用运行的时间，即函数开始调用到返回的时间；  
percall：（第二个percall）即函数运行一次的平均时间，等于 cumtime/ncalls；  
filename:lineno(function)：每个函数调用的具体信息；  

## line_profile

In [4]:
import line_profiler
@Profile
def function(x):
    x = x + 1
profile = LineProfiler(f, g)
profile.add_function(h)

ModuleNotFoundError: No module named 'line_profiler'

## Time-it
cell magic

In [3]:
%%timeit 
for i in range(100):
    pass

1.56 µs ± 38.5 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
