<h1>Класс Stats</h1>

Анализ данных профилировщика выполняется с использованием класса Stats.

Созданный экземпляр класса pstats.Stats имеет множество методов для обработки и вывода статистических данных. Перед выводом отчета функция profile.run() сортирует данные в соответствии со строкой, содержащей имя модуля, номер строки и имя функции. Вы можете воспользоваться другим критерием. Например, следующий код выведет данные, отсортированные по имени функции:

In [21]:
import pstats
import profile


m = profile.run('foo()')
profile.run('foo()', 'fooprof')
p = pstats.Stats('fooprof')

p.sort_stats('name')
p.print_stats()

         4 function calls in 0.016 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.016    0.016    0.016    0.016 :0(exec)
        1    0.000    0.000    0.000    0.000 :0(setprofile)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.016    0.016 profile:0(foo())
        0    0.000             0.000          profile:0(profiler)




NameError: name 'foo' is not defined

Для обработки статистических данных профиля большой программы могут быть полезны средства модуля pstats. Чтобы загрузить профиль из файла, воспользуйтесь следующим кодом:


In [15]:
import pstats 
p = pstats.Stats('fooprof')

А следующий пример выведет 10 наиболее важных строк, отсортированных по совокупному затраченному времени (методы экземпляров класса pstats.Stats возвращают ссылку на экземпляр, что позволяет вызывать последовательно несколько методов в одной инструкции):

In [16]:
p.sort_stats('cumulative').print_stats(10)

Wed Dec  2 23:38:31 2020    fooprof

         4 function calls in 0.000 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        0    0.000             0.000          profile:0(profiler)
        1    0.000    0.000    0.000    0.000 profile:0(foo())
        1    0.000    0.000    0.000    0.000 :0(exec)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 :0(setprofile)




<pstats.Stats at 0x27643adcb20>

Именно эти данные позволят Вам понять, на выполнение каких действий уходит больше всего времени.


Вы можете ограничить вывод с помощью регулярного выражения, например, вывести статистику для конструкторов классов:

In [17]:
p.print_stats('__init__')

Wed Dec  2 23:38:31 2020    fooprof

         4 function calls in 0.000 seconds



<pstats.Stats at 0x27643adcb20>

Если же Вас интересует, из каких функций вызываются конструкторы, или наоборот, какие функции используются в конструкторах, воспользуйтесь следующими инструкциями соответственно:

In [18]:
p.print_callers('__init__')
p.print_callees('__init__')

<pstats.Stats at 0x27643adcb20>

<h1> модуль pstats — обработка статистических данных и вывод отчетов</h1>

<b>Stats([filename ...])</b>

Создает и возвращает объект, реализующий обработку статистических данных о производительности из файла (или нескольких файлов, в этом случае данные объединяются) filename. Файлы должны быть созданы модулем profile, имеющим соответствующую версию (совместимость формата файлов для различных версий не гарантируется). После создания объекта дополнительные файлы могут быть прочитаны с помощью метода add().

Экземпляры класса Stats имеют следующие методы:

<b>strip_dirs()</b>

Удаляет начало пути для всех имен файлов (оставляет только основные имена). Эта операция может быть полезна для того, чтобы уменьшить размер вывода, но может привести (редко) к неразличимости имен функций.

<b>add([filename ...])</b>

Считывает статистическую информацию из указанных файлов и объединяет ее с ранее считанной.

<b>sort_stats([key ...])</b>

Сортирует статистические данные объекта в соответствии с указанными критериями. Если указано более одного ключа, дополнительные ключи используются в качестве вторичного и т. д. критериев. Например, ‘sort_stats('name', 'file')’ сортирует данные по имени функции и данные для функций с одинаковыми именами по имени файла, в которой функция определена.

В качестве ключей можно использовать неполные строки, если сокращение может быть разрешено однозначно. Метод воспринимает следующие ключи (если не указано иного, сортировка производится по возрастанию или в алфавитном порядке):


’calls’ - число вызовов (по убыванию);

’cumulative’ - суммарное время, затраченное на выполнение функции, исключая время, затраченное на вызовы из нее других функций (по убыванию);

'cumtime' - совокупное время;

’file’ - имя файла;

’module’ - имя модуля;

’pcalls’ - число примитивных вызовов (по убыванию);

’line’ - номер строки;

’name’ - имя функции;

’nfl’ - имя функции, имя файла, номер строки (вызовы ‘sort_stats('nfl')’ и ‘sort_stats('name', 'file', 'line')’ эквивалентны);

’stdname’ - стандартное имя, содержащее имя файла, номер строки и имя функции;

’time’ - суммарное время, затраченное на выполнение функции, исключая время, затраченное на вызовы из нее других функций (по убыванию).

'tottime' - внутреннее время.

<b>reverse_order()</b>

Меняет порядок следования данный на обратный.

<b>print_stats([restriction ...])</b>

Выводит отчет (аналогично функции profile.run()). Порядок следования данных определяется последним вызовом метода sort_stats(). Аргументы могут быть использованы для ограничения вывода информации. Каждый аргумент может быть целым числом (максимальное количество строк с данными), вещественное число от 0.0 до 1.0 (доля выводимой информации) или строка с регулярным выражением (выводятся только строки, ему удовлетворяющие). Если указано несколько ограничений, они применяются последовательно.

<b>print_callers([restriction ...])</b>

Для каждой записи выводит имя функции, которая вызвала данную. Для удобства в скобках указывается число таких вызовов и, затем, совокупное время. В остальном поведение этого метода идентично поведению метода print_stats().

<b>print_callees([restriction ...])</b>

Для каждой записи выводит имя функций, которые данная функция вызывает. В остальном поведение этого метода идентично поведению метода print_stats().

Все описанные здесь методы возвращают ссылку на экземпляр, поэтому несколько операций могут быть записаны одной инструкцией.

Когда задан больше чем один ключ, дополнительные ключи - используются, как вторичные критерии, при условии, что есть равенство во всех ключах, отобранных перед ними.

Например, sort_stats(SortKey.NAME, SortKey.FILE) будет сортировать все записи в соответствии с их именем функции и позволяет сортировать все связи (идентичные имена функций) путем сортировки по имени файла.


Следует отметить, что все данные stats сортруются в порядке убывания (при этом наиболее трудоемкие элементы помещаются в первую очередь), где поиск по имени, файлу и номеру строки выполняется в порядке возрастания (алфавитном). 

Тонкое различие между SortKey.NFL и SortKey.STDNAME заключается в том, что стандартное имя является представлением выводимого названия, что означает, что номера встроенных строк сравниваются по старшему разряду. 

Например, строки 3, 20 и 40 (если имена файлов одинаковы) будут отображаться в порядке 20, 3 и 40 строка. В отличие от этого, SortKey.NFL выполняет числовое сравнение номеров строк. 

На самом деле, sort_stats(SortKey.NFL) то же самое, что и sort_stats(SortKey.NAME, SortKey.FILENAME, SortKey.LINE).

По причинам обратной совместимости разрешены числовые аргументы -1, 0, 1 и 2. Они интерпретируются как 'stdname', 'calls', 'time' и 'cumulative' соответственно. 
Если этот старый формат стиля (числовой) используется, будет использован только один ключ сортировки (числовой ключ), и дополнительные аргументы будут игнорироваться молча.

<h1>Задание:</h1>

Произвести профилирование любой написанной Вами ранее программы. Вывести отчет по по профилированию отсортиованный по алфавиту, используя методы pstats. По желанию оптимизировать программу.