python的标准库中有一个可以实现性能瓶颈定位的模块叫profile(2.7中是cProfile)
我们看看他是咋用的

In [6]:
%%writefile profile_test.py
def foo():
    sum = 0
    for i in range(10000):
        sum += i
    return sum
if __name__=="__main__":
    foo()


Overwriting profile_test.py


要用profile只要这样:

In [7]:
%%writefile profile_test.py
def foo():
    sum = 0
    for i in range(10000):
        sum += i
    return sum
if __name__=="__main__":
    try :
        import profile
    except:
        import cProfile as profile
        
    profile.run("foo()")

Overwriting profile_test.py


In [8]:
!python profile_test.py

         5 function calls in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 :0(range)
        1    0.000    0.000    0.000    0.000 :0(setprofile)
        1    0.000    0.000    0.001    0.001 <string>:1(<module>)
        1    0.000    0.000    0.001    0.001 profile:0(foo())
        0    0.000             0.000          profile:0(profiler)
        1    0.001    0.001    0.001    0.001 profile_test.py:1(foo)




也可以用profile命令来解析

In [29]:
%%writefile profile_test.py
#coding:utf-8
def foo():
    sum = 0
    for i in range(10000):
        sum += i
    return sum
if __name__=="__main__":
    foo()



Overwriting profile_test.py


In [30]:
!python -m cProfile profile_test.py

         4 function calls in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.001    0.001 profile_test.py:2(<module>)
        1    0.001    0.001    0.001    0.001 profile_test.py:2(foo)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
        1    0.000    0.000    0.000    0.000 {range}




> 统计项说明

统计项|说明
---|---
ncalls| 函数被调用次数
tottime|函数总计运行时间,不含调用函数运行时间
cumtime|函数总计运行时间,含调用的函数运行时间
percall|函数运行一次平均时间,等于tottime(cumtime)/ncalls
`filename:lineno`|函数所在文件名,函数的行号,函数名

如果要把结果输出到文件,则这样用

In [33]:
%%writefile profile_test.py
def foo():
    sum = 0
    for i in range(10000):
        sum += i
    return sum
if __name__=="__main__":
    try :
        import profile
    except:
        import cProfile as profile
        
    profile.run("foo()","foo.txt")

Overwriting profile_test.py


In [34]:
!python profile_test.py

In [35]:
!cat foo.txt

{(   s   profile_test.pyi   t   foo(   i   i   g��ꭁ�B?g����J?{(   s   <string>i   t   <module>i   0(   t    i    s
   setprofile(   i   i   g $D��"?g $D��"?{(   t   profilei    s   foo()i   0(   R   i    s   foo()(   i   i   g L�g�?g �>V��P?{(   R   i    t   profileri   0(   s   <string>i   R   (   i   i   g �㈵��>g�o�
��J?{(   R   i    s   foo()i   0(   R   i    R   (   i    i    i    i    {0(   R   i    s   range(   i   i   g >��@0?g >��@0?{(   s   profile_test.pyi   R    i   00

遗憾的是貌似不管咋样都有乱码

## 与pstats结合提供多种形式的报表

In [38]:
%%writefile profile_test.py
def foo():
    sum = 0
    for i in range(10000):
        sum += i
    return sum
if __name__=="__main__":
    try :
        import profile
    except:
        import cProfile as profile
        
    profile.run("foo()","foo.txt")
    import pstats
    p = pstats.Stats("foo.txt")
    p.sort_stats("time").print_stats()

Overwriting profile_test.py


这样他就按时间排序了

In [39]:
!python profile_test.py

Sun Feb 28 14:30:55 2016    foo.txt

         5 function calls in 0.001 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.001    0.001    0.001    0.001 profile_test.py:1(foo)
        1    0.000    0.000    0.000    0.000 :0(range)
        1    0.000    0.000    0.001    0.001 profile:0(foo())
        1    0.000    0.000    0.000    0.000 :0(setprofile)
        1    0.000    0.000    0.001    0.001 <string>:1(<module>)
        0    0.000             0.000          profile:0(profiler)




stats有许多函数,可以提供不同的报表

> stats函数说明

函数|说明
---|---
strip_dirs()|除去文件名前名的路径信息
add(filename,[...])|把profile输出的文件加入stats实例中统计
dump_stats(filename)|把stats统计结果保存到文件
sort_stats(key,[...])|最重要的,可以给profile统计结果排序
reverse_order()|数据反排序
print_stats([restriction,...])|把报表输出到stdout
print_callers([restriction,...])|输出调用指定函数的相关信息
print_callees([restriction,...])|输出指定函数调用过的函数的相关信息

> sort_stats可接受的参数

参数|说明
---|---
ncalls|被调次数
cumulative|函数运行总时间
file|文件名
module|模块名
pcalls|简单统计
line|行号
name|函数名
nfl|name,file,line
stdname|标准函数名
time|函数内部运行时间