In [None]:
Профилирование в Python — это процесс измерения времени выполнения и использования 
ресурсов для каждой части кода, что помогает выявить узкие места и оптимизировать 
производительность. В этом руководстве мы рассмотрим различные методы профилирования, 
такие как использование модуля cProfile, визуализацию данных профилирования с помощью SnakeViz, 
и профилирование памяти с memory_profiler.
1. Основы профилирования с cProfile
Установка
cProfile — встроенный в Python модуль, поэтому дополнительная установка не требуется.
Пример использования cProfile


In [None]:
пример

In [None]:
import cProfile

def my_function():
    pass

profiler = cProfile.Profile()
profiler.enable()
my_function()
profiler.disable()
profile.print_stats(sort="time")



In [3]:
import cProfile

def slow_function():
    total=0
    for i in range(1, 10000):
        for j in range(1, 10000):
            total += i*j
    return total

def fast_function():
    return sum(i*j for i in range(1,10000) for j in range(1,10000))

def main():
    slow_function()
    fast_function()

if __name__ == "__main__":
    cProfile.run('main()')


         99980009 function calls in 107.397 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000   72.061   72.061 1366441703.py:10(fast_function)
 99980002   39.425    0.000   39.425    0.000 1366441703.py:11(<genexpr>)
        1    0.000    0.000  107.397  107.397 1366441703.py:13(main)
        1   35.335   35.335   35.335   35.335 1366441703.py:3(slow_function)
        1    0.000    0.000  107.397  107.397 <string>:1(<module>)
        1    0.000    0.000  107.397  107.397 {built-in method builtins.exec}
        1   32.636   32.636   72.061   72.061 {built-in method builtins.sum}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [None]:
pip install line_profiler

python3 -m pip install line_profiler


In [None]:
@profile
def m_function():
    pass

In [None]:
kernprof -l -v my_script.py

In [None]:
pip install memory_profiler

from memory_profiler import profile

@profile
def m_function():
    mylist = [1] * (10**6)
    mylist = mylist *2
    return mylist

python -m memory_profiler my_script.py

pip install objgraph

import objgraph
objgraph.show_most+common_types()

mylist = [1,2,3]
objgraph.show_refs([mylist], filesname='refs.png')



In [None]:
pip install memray



In [None]:
linux

perf
sudo ap install linux-tools-common linux-tools-$(uname -r)

perf record -g python3 script.py


strace c python3 script.py


linux memory
valgrinf

sudo apt install valgrind

valgrind --tool=massif python3 script.py

ms_print massif.out.<id>

IO
iostat iotop

iostat -x 1

sudo iotop
sudo apt install iotop





In [None]:
Понимание отчета cProfile
Вывод cProfile содержит несколько колонок:
•	ncalls: количество вызовов функции.
•	tottime: общее время, затраченное внутри функции, исключая время вызова других функций.
•	percall: среднее время на один вызов функции.
•	cumtime: общее время, затраченное на выполнение функции, включая время всех вызовов других функций.


In [None]:
пример

In [2]:
import cProfile
import random
import numpy as np


import cProfile
import random
import numpy as np


def recursive_fibonacci(n):
    """Рекурсивная функция вычисления чисел Фибоначчи (неэффективная версия)."""
    if n <= 1:
        return n
    return recursive_fibonacci(n - 1) + recursive_fibonacci(n - 2)


def generate_random_matrix(size):
    """Создаёт случайную матрицу и вычисляет её определитель."""
    matrix = np.random.rand(size, size)
    return np.linalg.det(matrix)


def process_large_list():
    """Генерирует и сортирует большой список случайных чисел."""
    data = [random.randint(1, 10**6) for _ in range(10**6)]
    data.sort()
    return sum(data)


def run_profiled_code():
    """Запускает несколько функций для профилирования."""
    fib_result = recursive_fibonacci(10)  # Рекурсивный вызов
    matrix_det = generate_random_matrix(200)  # Работа с NumPy
    list_sum = process_large_list()  # Работа со списками

    return fib_result, matrix_det, list_sum


if __name__ == "__main__":
    cProfile.run("run_profiled_code()", sort="cumulative")
    """Рекурсивная функция вычисления чисел Фибоначчи (неэффективная версия)."""
    if n <= 1:
        return n
    return recursive_fibonacci(n - 1) + recursive_fibonacci(n - 2)


def generate_random_matrix(size):
    """Создаёт случайную матрицу и вычисляет её определитель."""
    matrix = np.random.rand(size, size)
    return np.linalg.det(matrix)


def process_large_list():
    """Генерирует и сортирует большой список случайных чисел."""
    data = [random.randint(1, 10**6) for _ in range(10**6)]
    data.sort()
    return sum(data)


def run_profiled_code():
    """Запускает несколько функций для профилирования."""
    fib_result = recursive_fibonacci(10)  # Рекурсивный вызов
    matrix_det = generate_random_matrix(200)  # Работа с NumPy
    list_sum = process_large_list()  # Работа со списками

    return fib_result, matrix_det, list_sum


if __name__ == "__main__":
    cProfile.run("run_profiled_code()", sort="cumulative")



SyntaxError: 'return' outside function (3881441252.py, line 44)

In [None]:
Визуализация данных профилирования с помощью SnakeViz
Для визуализации результатов профилирования можно использовать SnakeViz. Это помогает лучше понять структуру кода и
выявить узкие места.
Установка SnakeViz


In [None]:
pip install snakeviz

In [None]:
Использование SnakeViz
После того как вы сохранили данные профилирования в файл, запустите SnakeViz:


In [None]:
snakeviz profiling_results

In [None]:
Использование SnakeViz
После того как вы сохранили данные профилирования в файл, запустите SnakeViz:


In [None]:
Пример использования memory_profiler
Для профилирования памяти используется декоратор @profile.


In [3]:
from memory_profiler import profile
import numpy as np
import random


@profile
def create_large_list():
    """Создаёт большой список случайных чисел."""
    large_list = [random.randint(1, 10**6) for _ in range(10**6)]
    return sum(large_list)


@profile
def create_large_numpy_array():
    """Создаёт большой массив NumPy и вычисляет его сумму."""
    large_array = np.random.randint(1, 10**6, size=10**6)
    return large_array.sum()


@profile
def generator_approach():
    """Использует генератор вместо списка для экономии памяти."""
    return sum(random.randint(1, 10**6) for _ in range(10**6))


if __name__ == "__main__":
    create_large_list()
    create_large_numpy_array()
    generator_approach()



ERROR: Could not find file C:\Users\Win10\AppData\Local\Temp\ipykernel_16052\4042255389.py
ERROR: Could not find file C:\Users\Win10\AppData\Local\Temp\ipykernel_16052\4042255389.py
ERROR: Could not find file C:\Users\Win10\AppData\Local\Temp\ipykernel_16052\4042255389.py


In [None]:
Использование line_profiler для детального профилирования
line_profiler позволяет детально профилировать отдельные строки кода.
Установка


In [None]:
pip install line_profiler


In [None]:
Пример использования line_profiler

In [None]:
import numpy as np
import random
from line_profiler import LineProfiler


def slow_function():
    """Функция с различными вычислительными операциями."""
    total = 0
    for i in range(10**5):  # Итерации в цикле
        total += i ** 2  # Возведение в квадрат
    return total


def compute_matrix_product():
    """Перемножает две случайные матрицы 300x300."""
    A = np.random.rand(300, 300)
    B = np.random.rand(300, 300)
    return np.dot(A, B)  # Матричное произведение


def process_large_list():
    """Создаёт, сортирует и суммирует список."""
    data = [random.randint(1, 10**6) for _ in range(10**5)]
    data.sort()
    return sum(data)


# Создаём профилировщик
lp = LineProfiler()
lp.add_function(slow_function)
lp.add_function(compute_matrix_product)
lp.add_function(process_large_list)

# Запускаем профилирование
lp.enable()
slow_function()
compute_matrix_product()
process_large_list()
lp.disable()

# Выводим результат
lp.print_stats()



In [None]:
Профилирование многопоточных приложений
Для профилирования многопоточных приложений в Python можно использовать cProfile в
сочетании с библиотеками для работы с потоками, такими как threading или concurrent.futures.
Пример многопоточного профилирования:


In [3]:
import cProfile
from concurrent.futures import ThreadPoolExecutor

def worker(n):
    return sum(i*j for i in range(1,n) for j in range(1,n))

def main():
    with ThreadPoolExecutor(max_workers=4) as executor:
        results = executor.map(worker,[1000,2000,3000,4000])
if __name__ == "__main__":
    cProfile.run('main()')


         342 function calls in 8.624 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    8.624    8.624 759271884.py:7(main)
        1    0.000    0.000    8.624    8.624 <string>:1(<module>)
        4    0.000    0.000    0.000    0.000 _base.py:328(__init__)
        1    0.000    0.000    0.217    0.217 _base.py:583(map)
        1    0.000    0.000    0.217    0.217 _base.py:608(<listcomp>)
        1    0.000    0.000    0.000    0.000 _base.py:612(result_iterator)
        1    0.000    0.000    0.000    0.000 _base.py:643(__enter__)
        1    0.000    0.000    8.407    8.407 _base.py:646(__exit__)
        4    0.000    0.000    0.000    0.000 _weakrefset.py:39(_remove)
        4    0.000    0.000    0.000    0.000 _weakrefset.py:85(add)
        1    0.000    0.000    0.000    0.000 thread.py:123(__init__)
        4    0.000    0.000    0.217    0.054 thread.py:161(submit)
        4    0.000 

In [None]:
Антипаттерны профилирования — это распространенные ошибки и неправильные подходы, 
которых следует избегать при оптимизации кода на основе профилирования. Они могут привести к 
неверным выводам, потере времени и даже ухудшению производительности. Рассмотрим некоторые из
наиболее распространенных антипаттернов.
1. Профилирование без ясной цели
Антипаттерн:
Профилирование кода без четкого понимания того, что вы хотите улучшить.
Проблема:
Без четкой цели профилирование может привести к избыточному сбору данных и трате времени на 
анализ частей кода, которые на самом деле не являются проблемными.
Правильный подход:
Перед началом профилирования определите конкретные цели и области, которые необходимо 
оптимизировать (например, медленно работающая функция, избыточное использование памяти).
2. Оптимизация без анализа профиля
Антипаттерн:
Начинать оптимизацию кода до проведения профилирования, полагаясь на интуицию или предположения.
Проблема:
Это часто приводит к оптимизации тривиальных участков кода, которые не оказывают значительного влияния на 
общую производительность.
Правильный подход:
Всегда используйте инструменты профилирования, такие как cProfile, чтобы определить, какие части
    кода требуют оптимизации, и фокусируйтесь именно на них.
3. Игнорирование кумулятивного времени (cumulative time)
Антипаттерн:
Ориентация только на общее время выполнения функции, игнорируя 
кумулятивное время (время, включающее вызовы вложенных функций).
Проблема:
Это может привести к упущению узких мест, которые вызываются часто, но занимают мало времени в каждом отдельном вызове.
Правильный подход:
Анализируйте и учитывайте кумулятивное время функций, чтобы понять, какие функции или участки кода 
оказывают значительное влияние на производительность.
4. Профилирование в неправильных условиях
Антипаттерн:
Профилирование кода в условиях, отличающихся от реальных, например, на тестовых данных или в нерабочем окружении.
Проблема:
Полученные результаты могут не соответствовать реальной производительности приложения, что приведет к неправильным выводам.
Правильный подход:
Старайтесь профилировать код в условиях, максимально приближенных к боевым: на реальных данных и в том окружении,
где код будет выполняться.
5. Игнорирование эффекта кэширования и оптимизаций JIT
Антипаттерн:
Профилирование кода с включенным кэшированием или оптимизациями JIT (Just-In-Time), которые могут искажать результаты.
Проблема:
Кэширование и JIT могут значительно изменять время выполнения функций, делая профилирование нерепрезентативным.
Правильный подход:
Отключайте кэширование и учитывайте эффекты JIT при профилировании, если это возможно и необходимо для точного анализа.
6. Оптимизация мелких участков кода
Антипаттерн:
Фокусировка на оптимизации очень мелких участков кода, которые почти не влияют на общую производительность.
Проблема:
Это может привести к потере времени и незначительным улучшениям, в то время как реальные
    узкие места остаются без внимания.
Правильный подход:
Используйте принцип Парето: 80% проблем производительности обычно приходятся на 20% кода. Сосредоточьтесь на
оптимизации именно этих 20%.
7. Полное игнорирование потребления памяти
Антипаттерн:
Фокусировка исключительно на времени выполнения, игнорируя использование памяти.
Проблема:
Некоторые оптимизации, направленные на ускорение выполнения, могут существенно увеличить потребление памяти, 
    что приведет к проблемам с ресурсами или даже к утечкам памяти.
Правильный подход:
Профилируйте не только время выполнения, но и использование памяти, чтобы сбалансировать производительность и
потребление ресурсов.
8. Одновременное изменение нескольких факторов
Антипаттерн:
Изменение сразу нескольких участков кода или настроек во время оптимизации, без изоляции эффектов каждого изменения.
Проблема:
Это затрудняет понимание, какое изменение действительно улучшило (или ухудшило) производительность.
Правильный подход:
Изменяйте и тестируйте один фактор за раз, чтобы точно понимать влияние каждого изменения.
9. Недостаточное профилирование ввода-вывода (I/O)
Антипаттерн:
Игнорирование профилирования операций ввода-вывода, таких как чтение и запись файлов, работа с базами данных
    и сетевыми операциями.
Проблема:
Операции I/O могут быть основным узким местом в производительности, и их игнорирование может привести к упущению
    ключевых проблем.
Правильный подход:
Включайте операции I/O в процесс профилирования и анализируйте их влияние на общую производительность.
10. Пренебрежение профилированием в многопоточной среде
Антипаттерн:
Игнорирование особенностей многопоточной среды при профилировании.
Проблема:
Многопоточные программы могут страдать от проблем с синхронизацией, которые не видны в однопоточном профилировании.
Правильный подход:
Используйте подходящие инструменты профилирования для многопоточных программ и анализируйте влияние контекста 
переключений и блокировок на производительность.
Заключение
Избегание антипаттернов профилирования поможет вам сосредоточиться на реальных проблемах производительности и
    достичь более значительных улучшений. Профилирование должно быть целенаправленным, репрезентативным и сбалансированным, 
    чтобы результаты были полезны и точны.
методология. cProfile, line_profiler, memory_profiler;


In [None]:
Основные команды и примеры использования
1. Сбор данных профилирования (perf record)
Команда perf record используется для записи событий производительности в ходе выполнения команды.
Пример:


In [None]:
perf record -g ./your_program

In [None]:
2. Анализ собранных данных (perf report)
После выполнения команды perf record, данные сохраняются в файл perf.data. Для анализа этих данных используется 
команда perf report.
Пример:


In [None]:
perf report
perf stat ./your_program

In [None]:
3. Сбор статистики событий (perf stat)
Команда perf stat используется для сбора и отображения общей статистики выполнения программы.
Пример:


In [None]:
perf list

In [None]:
4. Анализ конкретных событий (perf list)
Команда perf list позволяет получить список всех доступных событий, которые можно профилировать.
Пример:


In [None]:
perf trace

In [None]:
5. Профилирование системы в реальном времени (perf top)
Команда perf top аналогична утилите top, но с дополнительной информацией о производительности на уровне функций.
Пример:


In [None]:
perf top

In [None]:
6. Трассировка системных вызовов и событий ядра (perf trace)
Команда perf trace используется для отслеживания системных вызовов и других событий ядра.
Пример:


In [None]:
perf trace

In [None]:
7. Сбор данных для конкретного события (perf record -e)
Вы можете собрать данные для конкретного события, используя опцию -e.
Пример:


In [None]:
perf record -e cache-misses ./your_program

In [None]:
Примеры использования и подходы
1. Определение горячих точек (hotspots)
Горячие точки — это функции или участки кода, которые потребляют наибольшее время выполнения. 
Используйте perf record -g и perf report, чтобы определить такие участки.


In [None]:
perf record -g ./your_program
perf report

In [None]:
2. Анализ использования кэша
Кэш-промахи могут существенно замедлить работу программы. Используйте perf stat для сбора статистики по кэшу.


In [None]:
perf stat -e cache-referebces,cache-misses ./your_pprogram

In [None]:
3. Отладка производительности многопоточных приложений
Многопоточные приложения могут страдать от проблем с синхронизацией и конкурентным доступом к ресурсам. 
Используйте perf record -g для профилирования таких приложений, а затем анализируйте стек вызовов.


In [None]:
perf record -g ./your_program
perf report

<b>flamegraph</b>

In [None]:
pip install py-spy

py-spy record -p 1234 - flame --output.svg