# 1.1. Измерение времени выполнения.

Делать это из ipython мы уже умеем:

In [1]:
%timeit [i**2 for i in xrange(1000)]

10000 loops, best of 3: 72.6 µs per loop


In [2]:
%%timeit def cube(x): return x**3
[cube(x) for x in xrange(1000)]

10000 loops, best of 3: 170 µs per loop


Если мы хотим измерить время выполнения какого-либо скрипта, то можем пойти несколькими путями:

-- N: пример из книги Gorelick, High Perfomance Python.

In [3]:
%%timeit
%run gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.85650491714 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.88900995255 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.74493312836 seconds
Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.79333400726 seconds
1 loops, best of 3: 7.41 s per loop


In [4]:
%run -t gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.80224919319 seconds

IPython CPU timings (estimated):
  User   :       7.36 s.
  System :       0.09 s.
Wall time:       7.49 s.


--N: brew install gnu-time

In [5]:
!gtime -p --verbose python gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 6.87575483322 seconds
	Command being timed: "python gorelick.py"
	User time (seconds): 7.41
	System time (seconds): 0.13
	Percent of CPU this job got: 99%
	Elapsed (wall clock) time (h:mm:ss or m:ss): 0:07.61
	Average shared text size (kbytes): 0
	Average unshared data size (kbytes): 0
	Average stack size (kbytes): 0
	Average total size (kbytes): 0
	Maximum resident set size (kbytes): 520011776
	Average resident set size (kbytes): 0
	Major (requiring I/O) page faults: 0
	Minor (reclaiming a frame) page faults: 35862
	Voluntary context switches: 0
	Involuntary context switches: 6087
	Swaps: 0
	File system inputs: 0
	File system outputs: 0
	Socket messages sent: 0
	Socket messages received: 0
	Signals delivered: 0
	Page size (bytes): 4096
	Exit status: 0


-- N: https://developer.apple.com/library/content/documentation/Performance/Conceptual/ManagingMemory/Articles/AboutMemory.html

Относительно дорогой (относительно прочих) является "Major (requiring I/O) page faults" - обмен данными между RAM и диском.

# 1.2. cProfile.

https://docs.python.org/2/library/profile.html#module-cProfile

cProfile может использоваться как внутри модуля для оценки времени выполнения отдельной функции, так же как и средство измерения всего скрипта в целом.

In [6]:
!python -m cProfile -s cumulative gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 11.4670190811 seconds
         36221992 function calls in 12.405 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.036    0.036   12.405   12.405 gorelick.py:1(<module>)
        1    0.752    0.752   12.368   12.368 gorelick.py:7(calc_pure_python)
        1    8.903    8.903   11.467   11.467 gorelick.py:40(calculate_z_serial_purepython)
 34219980    2.537    0.000    2.537    0.000 {abs}
  2002000    0.143    0.000    0.143    0.000 {method 'append' of 'list' objects}
        1    0.027    0.027    0.027    0.027 {range}
        1    0.006    0.006    0.006    0.006 {sum}
        2    0.000    0.000    0.000    0.000 {time.time}
        4    0.000    0.000    0.000    0.000 {len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




-- N:
gorelick.py:1(<module>) - точка входа;
calc_pure_python - основная функция модуля;
calculate_z_serial_purepython - один вызов внутри calc_pure_python.

Можно увидеть, что cProfile позволет достаточно удобно разобрать время выполнения каждой функции в отдельности, но о происходящим внтури каждой функции догадаться тяжело.

# 1.3. line_profiler: использование CPU.

https://github.com/rkern/line_profiler

-- N: pip install line_profiler

In [12]:
!kernprof -l -v gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 84.5487709045 seconds
Wrote profile results to gorelick.py.lprof
Timer unit: 1e-06 s

Total time: 46.9797 s
File: gorelick.py
Function: calculate_z_serial_purepython at line 40

Line #      Hits         Time  Per Hit   % Time  Line Contents
    40                                           @profile
    41                                           def calculate_z_serial_purepython(maxiter, zs, cs):
    42                                               """Calculate output list using Julia update rule"""
    43         1         5323   5323.0      0.0      output = [0] * len(zs)
    44   1000001       399176      0.4      0.8      for i in range(len(zs)):
    45   1000000       358128      0.4      0.8          n=0
    46   1000000       407067      0.4      0.9          z = zs[i]
    47   1000000       390832      0.4      0.8          c = cs[i]
    48  34219980     17009800      0.5     36.2          while abs(z)

-- N: hits - количество вызовов данной строчки.

Можно заметить, что недостатки cProfile устранены. Можно увидеть подробный разбор времени выполнения каждой строчки в интересующей нас функции.

--N: для дальнейшего анализа цикл while следует переписать как while True: ... if (cond): break else: continue

# 1.4. memory_profiler: использование RAM.

https://pypi.python.org/pypi/memory_profiler

-- N: используйте аккуратно (на меньшей проблеме), так как время выполнения увеличивается минимум на порядок.

In [41]:
!python -m memory_profiler gorelick.py

Length of x: 1000
Total elements: 1000000
calculate_z_serial_purepython took 2354.08766103 seconds
Filename: gorelick.py

Line #    Mem usage    Increment   Line Contents
     7   21.469 MiB    0.000 MiB   @profile
     8                             def calc_pure_python(desired_width, max_iterations):
     9   21.469 MiB    0.000 MiB       x_step = (float(x2 - x1) / float(desired_width))
    10   21.469 MiB    0.000 MiB       y_step = (float(y1 - y2) / float(desired_width))
    11   21.469 MiB    0.000 MiB       x=[]
    12   21.469 MiB    0.000 MiB       y=[]
    13   21.469 MiB    0.000 MiB       ycoord = y2
    14   21.488 MiB    0.020 MiB       while ycoord > y1:
    15   21.488 MiB    0.000 MiB           y.append(ycoord)
    16   21.488 MiB    0.000 MiB           ycoord += y_step
    17   21.488 MiB    0.000 MiB           xcoord = x1
    18   21.520 MiB    0.031 MiB       while xcoord < x2:
    19   21.520 MiB    0.000 MiB           x.append(xcoord)
    20   21.520 MiB    0.000 Mi

# 1.5. dis: для самых крутых.

Позволяет изучить байткод для Python Virtual Machine. 

In [14]:
def fn_expressive(upper = 1000000):
    total = 0
    for n in xrange(upper):
        total += n
    return total

def fn_terse(upper = 1000000):
    return sum(xrange(upper))

In [15]:
import dis
dis.dis(fn_expressive)

  2           0 LOAD_CONST               1 (0)
              3 STORE_FAST               1 (total)

  3           6 SETUP_LOOP              30 (to 39)
              9 LOAD_GLOBAL              0 (xrange)
             12 LOAD_FAST                0 (upper)
             15 CALL_FUNCTION            1
             18 GET_ITER            
        >>   19 FOR_ITER                16 (to 38)
             22 STORE_FAST               2 (n)

  4          25 LOAD_FAST                1 (total)
             28 LOAD_FAST                2 (n)
             31 INPLACE_ADD         
             32 STORE_FAST               1 (total)
             35 JUMP_ABSOLUTE           19
        >>   38 POP_BLOCK           

  5     >>   39 LOAD_FAST                1 (total)
             42 RETURN_VALUE        


In [16]:
dis.dis(fn_terse)

  8           0 LOAD_GLOBAL              0 (sum)
              3 LOAD_GLOBAL              1 (xrange)
              6 LOAD_FAST                0 (upper)
              9 CALL_FUNCTION            1
             12 CALL_FUNCTION            1
             15 RETURN_VALUE        


# Дополнительный материал 1: Декораторы

Как вы заметили, во многих местах для профилирования мы использовали т.н. декоратор вида "@decorator_name". Декоратор, по сути, это т.н. "синтаксический сахар" (syntactic sugar), введенный в PEP 318 (https://www.python.org/dev/peps/pep-0318/). 

Для понимания декораторов у нас уже все есть:
* правило LEGB для разрешения имен;
* понимание функций как "объектов первого класса".

Хороший пример композиции функций (http://thecodeship.com/patterns/guide-to-python-function-decorators/):

In [17]:
def get_text(name):
   return "lorem ipsum, {0} dolor sit amet".format(name)

def p_decorate(func):
   def func_wrapper(name):
       return "<p>{0}</p>".format(func(name))
   return func_wrapper

my_get_text = p_decorate(get_text)

print my_get_text("John")

# <p>Outputs lorem ipsum, John dolor sit amet</p>

<p>lorem ipsum, John dolor sit amet</p>


Для удобства можно переписать так:

In [18]:
def p_decorate(func):
   def func_wrapper(name):
       return "<p>{0}</p>".format(func(name))
   return func_wrapper

@p_decorate
def get_text(name):
   return "lorem ipsum, {0} dolor sit amet".format(name)

print get_text("John")

# Outputs <p>lorem ipsum, John dolor sit amet</p>

<p>lorem ipsum, John dolor sit amet</p>


-- В: может ли p_decorate изменить параметр name?

Никто не запрещает использовать композицию декораторов:

In [19]:
def p_decorate(func):
   def func_wrapper(name):
       return "<p>{0}</p>".format(func(name))
   return func_wrapper

def strong_decorate(func):
    def func_wrapper(name):
        return "<strong>{0}</strong>".format(func(name))
    return func_wrapper

def div_decorate(func):
    def func_wrapper(name):
        return "<div>{0}</div>".format(func(name))
    return func_wrapper

Еще раз о том, что здесь происходит:
- p_decorate принимает в качестве параметра функцию и возвращаемый ей результат оборачивает ("декорирует") в функцию func_wrapper (которая, в свою очередь, просто вставляет результат исполнения в строку с тегами).

In [21]:
@div_decorate
@p_decorate
@strong_decorate
def get_text(name):
   return "lorem ipsum, {0} dolor sit amet".format(name)

print get_text("John")

# аналог get_text = div_decorate(p_decorate(strong_decorate(get_text)))

<div><p><strong>lorem ipsum, John dolor sit amet</strong></p></div>


Декораторы могут также принимать параметры:

In [35]:
def tags(tag_name):
    def tags_decorator(func):
        def func_wrapper(name):
            return "<{0}>{1}</{0}>".format(tag_name, func(name))
        return func_wrapper
    return tags_decorator

@tags("p")
def get_text(name):
    return "Hello "+name

print get_text("John")

# Outputs <p>Hello John</p>

<p>Hello John</p>


In [36]:
print get_text.__name__ # get_text
print get_text.__doc__ # returns some text
print get_text.__module__ # __main__

func_wrapper
None
__main__


Для того, чтобы не иметь проблем с разбором кода при использовании декораторов рекомендуется использовать декоратор wraps из модуля functools.

In [37]:
from functools import wraps

def tags(tag_name):
    def tags_decorator(func):
        @wraps(func)
        def func_wrapper(name):
            return "<{0}>{1}</{0}>".format(tag_name, func(name))
        return func_wrapper
    return tags_decorator

@tags("p")
def get_text(name):
    """returns some text"""
    return "Hello "+name

print get_text.__name__ # get_text
print get_text.__doc__ # returns some text
print get_text.__module__ # __main__

get_text
returns some text
__main__


Достаточно удобно использовать декораторы в рамках парадигмы ООП. Как мы помним, методы - это те же функции, у которых первый параметр -  ссылка на исполняющий объект.

In [22]:
def p_decorate(func):
   def func_wrapper(self):
       return "<p>{0}</p>".format(func(self))
   return func_wrapper

class Person(object):
    def __init__(self):
        self.name = "John"
        self.family = "Doe"

    @p_decorate
    def get_fullname(self):
        return self.name+" "+self.family

my_person = Person()
print my_person.get_fullname()

<p>John Doe</p>


Очень удобны в таком случае декораторы @getter и @setter:

In [26]:
class Person(object):
    def __init__(self):
        self._name = "John"
        self._family = "Doe"

    @property
    def name(self):
        print "getter of name called"
        return self._name

    @name.setter
    def name(self, value):
        print "setter of name called"
        self._name = value

    @name.deleter
    def name(self):
        print "deleter of name called"
        del self._name

In [28]:
p = Person()
p.name

getter of name called


'John'

In [29]:
p.name = 'Sam'

setter of name called


In [30]:
p.name

getter of name called


'Sam'

In [31]:
del p.name

deleter of name called


Подробнее об этом декораторе можно прочитать тут - https://docs.python.org/3/library/functions.html#property .

# Дополнительный материал 2: Дебаггеры

https://pymotw.com/2/pdb/

Для использования в IPython рекомендуется ipdb.

--N : ipdb

Список комманд находится тут: http://frid.github.io/blog/2014/06/05/python-ipdb-cheatsheet/ .

Описание того, как использовать ipdb в ячейках IPython - тут: http://devmartin.com/blog/2014/10/trigger-ipdb-within-ipython-notebook/

In [43]:
from IPython.core.debugger import Tracer
def fobar(n):
    x = 1337
    y = x + n
    Tracer()() #this one triggers the debugger
    return y

fobar(3)

> [0;32m<ipython-input-43-19f589c6ab38>[0m(6)[0;36mfobar[0;34m()[0m
[0;32m      5 [0;31m    [0mTracer[0m[0;34m([0m[0;34m)[0m[0;34m([0m[0;34m)[0m [0;31m#this one triggers the debugger[0m[0;34m[0m[0m
[0m[0;32m----> 6 [0;31m    [0;32mreturn[0m [0my[0m[0;34m[0m[0m
[0m[0;32m      7 [0;31m[0;34m[0m[0m
[0m
ipdb> н
*** SyntaxError: invalid syntax (<stdin>, line 1)
ipdb> y
1340
ipdb> exit
Exiting Debugger.


# Дополнительный материал 3: requests

requests - это т.н. "user-friendly" модуль для обмена запросами через интернет. Сетевое программирование мы в рамках данного курса не рассматриваем, однако часто может встретиться ситуация, когда вам нужно получить ответ от API стороннего сервиса или скачать файл, который расположен на удаленном сервере.

In [44]:
import requests

http://stackoverflow.com/questions/16694907/how-to-download-large-file-in-python-with-requests-py

In [45]:
def download_file(url):
    local_filename = url.split('/')[-1]
    # NOTE the stream=True parameter
    r = requests.get(url, stream=True)
    with open(local_filename, 'wb') as f:
        for chunk in r.iter_content(chunk_size=1024): 
            if chunk: # filter out keep-alive new chunks
                f.write(chunk)
                #f.flush() commented by recommendation from J.F.Sebastian
    return local_filename

In [46]:
r = requests.get('https://api.github.com/events')

In [47]:
r.json()

[{u'actor': {u'avatar_url': u'https://avatars.githubusercontent.com/u/8655789?',
   u'display_login': u'codecov-io',
   u'gravatar_id': u'',
   u'id': 8655789,
   u'login': u'codecov-io',
   u'url': u'https://api.github.com/users/codecov-io'},
  u'created_at': u'2016-09-26T11:20:46Z',
  u'id': u'4617188995',
  u'org': {u'avatar_url': u'https://avatars.githubusercontent.com/u/7815877?',
   u'gravatar_id': u'',
   u'id': 7815877,
   u'login': u'spring-cloud',
   u'url': u'https://api.github.com/orgs/spring-cloud'},
  u'payload': {u'action': u'created',
    u'created_at': u'2016-09-26T11:20:46Z',
    u'html_url': u'https://github.com/spring-cloud/spring-cloud-config/pull/513#issuecomment-249543803',
    u'id': 249543803,
    u'issue_url': u'https://api.github.com/repos/spring-cloud/spring-cloud-config/issues/513',
    u'updated_at': u'2016-09-26T11:20:46Z',
    u'url': u'https://api.github.com/repos/spring-cloud/spring-cloud-config/issues/comments/249543803',
    u'user': {u'avatar_url': 

In [48]:
r = requests.post('http://httpbin.org/post', data = {'key':'value'})

In [49]:
r.json()

{u'args': {},
 u'data': u'',
 u'files': {},
 u'form': {u'key': u'value'},
 u'headers': {u'Accept': u'*/*',
  u'Accept-Encoding': u'gzip, deflate',
  u'Content-Length': u'9',
  u'Content-Type': u'application/x-www-form-urlencoded',
  u'Host': u'httpbin.org',
  u'User-Agent': u'python-requests/2.7.0 CPython/2.7.10 Darwin/15.5.0'},
 u'json': None,
 u'origin': u'185.6.245.156',
 u'url': u'http://httpbin.org/post'}

In [50]:
r.text

u'{\n  "args": {}, \n  "data": "", \n  "files": {}, \n  "form": {\n    "key": "value"\n  }, \n  "headers": {\n    "Accept": "*/*", \n    "Accept-Encoding": "gzip, deflate", \n    "Content-Length": "9", \n    "Content-Type": "application/x-www-form-urlencoded", \n    "Host": "httpbin.org", \n    "User-Agent": "python-requests/2.7.0 CPython/2.7.10 Darwin/15.5.0"\n  }, \n  "json": null, \n  "origin": "185.6.245.156", \n  "url": "http://httpbin.org/post"\n}\n'

In [51]:
r.url

u'http://httpbin.org/post'