# Performance i debugging

Techniki pomiaru wydajnoÅ›ci, profilowania oraz narzÄ™dzia debuggera.


## Cele
- nauczyÄ‡ siÄ™ Å›wiadomie mierzyÄ‡ wydajnoÅ›Ä‡ (`timeit`, `perf_counter`)
- wykorzystaÄ‡ `cProfile` i `pstats` do analizy
- poznaÄ‡ podstawy debuggera (`pdb`) i narzÄ™dzi wizualnych


## Szybkie pomiary `timeit`
`timeit` uruchamia kod wielokrotnie, by uÅ›redniÄ‡ wyniki.


In [1]:
import timeit

# Tworzymy dane wejÅ›ciowe tylko raz, poza pÄ™tlÄ… pomiarowÄ…
setup = "nums = list(range(1000))"

# Mierzymy moÅ¼liwie krÃ³tki fragment kodu, bez dodatkowych wywoÅ‚aÅ„ funkcji
stmt = "sum(nums)"

# WiÄ™ksza liczba powtÃ³rzeÅ„ zmniejsza wpÅ‚yw szumu i planera
result = timeit.timeit(stmt=stmt, setup=setup, number=1000)
print(f'Åšredni czas: {result * 1e6/1000:.2f} Âµs')

Åšredni czas: 5.67 Âµs


## Profilowanie `cProfile`
`cProfile` to deterministyczny profiler napisany w C. Mierzy czas wykonania kaÅ¼dej funkcji i buduje drzewo wywoÅ‚aÅ„, dziÄ™ki czemu szybko wyÅ‚apiesz sekcje kodu pochÅ‚aniajÄ…ce najwiÄ™cej czasu.

In [2]:
import cProfile
import pstats


def slow_function():
    total = 0
    for _ in range(10_000):
        subtotal = sum(range(100))  # sztuczne obciÄ…Å¼enie CPU
        total += subtotal
    return total


with cProfile.Profile() as profiler:
    slow_function()  # kod, ktÃ³ry chcemy przeanalizowaÄ‡

stats = pstats.Stats(profiler)
stats.strip_dirs()  # usuwa peÅ‚ne Å›cieÅ¼ki plikÃ³w z raportu
stats.sort_stats(pstats.SortKey.CUMULATIVE).print_stats(8)

         10338 function calls (10334 primitive calls) in 0.035 seconds

   Ordered by: cumulative time
   List reduced from 100 to 8 due to restriction <8>

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.034    0.034 events.py:92(_run)
        1    0.000    0.000    0.034    0.034 {method 'run' of '_contextvars.Context' objects}
        1    0.000    0.000    0.034    0.034 asyncio.py:206(_handle_events)
        1    0.000    0.000    0.034    0.034 zmqstream.py:573(_handle_events)
        1    0.000    0.000    0.034    0.034 zmqstream.py:614(_handle_recv)
        1    0.000    0.000    0.034    0.034 zmqstream.py:546(_run_callback)
    10000    0.024    0.000    0.024    0.000 {built-in method builtins.sum}
        1    0.000    0.000    0.021    0.021 threading.py:651(wait)




<pstats.Stats at 0x106c6c910>

## Jak czytaÄ‡ raport `pstats`
Typowe kolumny w raporcie `print_stats` to:
- `ncalls` â€“ liczba wywoÅ‚aÅ„ funkcji (druga liczba w nawiasie to tylko wywoÅ‚ania pierwotne).
- `tottime` â€“ czas spÄ™dzony w funkcji, bez czasu funkcji wywoÅ‚ywanych z jej wnÄ™trza.
- `percall` â€“ `tottime / ncalls`, czyli Å›redni koszt pojedynczego wywoÅ‚ania funkcji.
- `cumtime` â€“ Å‚Ä…czny czas funkcji wraz z funkcjami podrzÄ™dnymi.
- `percall` (druga kolumna) â€“ `cumtime / primitive_calls`, przydatne przy rekurencji.
- `filename:lineno(function)` â€“ miejsce w kodzie, ktÃ³re warto odwiedziÄ‡, aby zoptymalizowaÄ‡ dziaÅ‚anie.

`SortKey.CUMULATIVE` pomaga znaleÅºÄ‡ funkcje, ktÃ³re spowalniajÄ… nasz program poÅ›rednio, a `SortKey.TIME` skupia siÄ™ na samym kodzie funkcji.

In [None]:
# SprawdÅºmy rÃ³wnieÅ¼, kto wywoÅ‚uje najwolniejsze funkcje
stats.sort_stats(pstats.SortKey.TIME).print_callers(5)

## `cProfile` vs `profile` (czasem nazywanym `Profiler`)
- `cProfile` ma minimalny narzut (kod w C) i doskonale nadaje siÄ™ do codziennej pracy.
- `profile` jest napisany w Pythonie, Å‚atwo go rozszerzyÄ‡ lub zmodyfikowaÄ‡, lecz spowalnia profilowany kod nawet kilkanaÅ›cie razy.
- Oba moduÅ‚y zwracajÄ… identyczne statystyki, wiÄ™c moÅ¼esz zaczynaÄ‡ od `cProfile`, a po prototypowaniu przeÅ‚Ä…czyÄ‡ siÄ™ na `profile`, gdy potrzebujesz wÅ‚asnych hakÃ³w.
- CLI: `python -m cProfile -o raport.prof skrypt.py` i pÃ³Åºniej `snakeviz raport.prof` lub `python -m pstats raport.prof` do analizy offline.

In [None]:
import profile

# `profile` dziaÅ‚a identycznie jak `cProfile`, ale dodaje wiÄ™kszy narzut czasowy
profile_profiler = profile.Profile()
profile_profiler.runcall(slow_function)

stats_py = pstats.Stats(profile_profiler)
stats_py.strip_dirs()
stats_py.sort_stats(pstats.SortKey.CUMULATIVE).print_stats(5)

## Debugowanie z `pdb`
Debugger pozwala zatrzymaÄ‡ program, obejrzeÄ‡ stan i kontynuowaÄ‡.


In [None]:
from bdb import BdbQuit


def buggy(numbers):
    total = 0
    for value in numbers:
        if value % 2 == 0:
            total += value
        else:
            import pdb; pdb.set_trace()  # puÅ‚apka na nieparzyste wartoÅ›ci
    return total


try:
    buggy([2, 4, 5])  # debugger zatrzyma siÄ™ na pierwszej liczbie nieparzystej
except BdbQuit:
    pass  # uÅ¼ytkownik zakoÅ„czyÅ‚ sesjÄ™ debuggera

[31m    [... skipping 21 hidden frame(s)][39m
  [32m/var/folders/pd/gsgbf0fd4tv7ntlsxt53r0sh0000gn/T/ipykernel_34263/3958656088.py[39m([92m11[39m)[36m<module>[39m[34m()[39m
[92m      9[39m 
[92m     10[39m [31m[38;5;28;01mtry[39;00m:[39m
[32m---> 11[39m     buggy([[32m2[39m, [32m4[39m, [32m5[39m])
[92m     12[39m [31m[38;5;28;01mexcept[39;00m BdbQuit:[39m
[92m     13[39m [31m    [38;5;28;01mpass[39;00m[39m
> [32m/var/folders/pd/gsgbf0fd4tv7ntlsxt53r0sh0000gn/T/ipykernel_34263/3958656088.py[39m([92m7[39m)[36mbuggy[39m[34m()[39m
[32m      5[39m             total += value
[32m      6[39m         [38;5;28;01melse[39;00m:
[32m----> 7[39m             [38;5;28;01mimport[39;00m pdb; pdb.set_trace()  [38;5;66;03m# puÅ‚apka na nieparzyste wartoÅ›ci[39;00m
[32m      8[39m     [38;5;28;01mreturn[39;00m total
[32m      9[39m 



ipdb>  


**Podsumowanie:** Regularne pomiary i profilowanie pomagajÄ… zlokalizowaÄ‡ wÄ…skie gardÅ‚a.

**Pytanie kontrolne:** Dlaczego `print` nie wystarcza do debugowania zÅ‚oÅ¼onych aplikacji?


### ðŸ§© Zadanie 1
Napisz funkcjÄ™, ktÃ³ra porÃ³wnuje wydajnoÅ›Ä‡ dwÃ³ch implementacji algorytmu i raportuje rÃ³Å¼nicÄ™ procentowÄ….


In [None]:
# RozwiÄ…zanie Zadania 1
import timeit


def benchmark(func_a, func_b, number=1000):
    # Mierzymy obie funkcje w izolacji, aby wynik nie zaleÅ¼aÅ‚ od siebie nawzajem
    time_a = timeit.timeit(func_a, number=number)
    time_b = timeit.timeit(func_b, number=number)
    diff = ((time_b - time_a) / time_a) * 100
    print(f'A: {time_a:.6f}s, B: {time_b:.6f}s, rÃ³Å¼nica: {diff:.2f}%')


benchmark(lambda: sum(range(1000)), lambda: sum([*range(1000)]))

### ðŸ§© Zadanie 2
StwÃ³rz funkcjÄ™, ktÃ³ra profiluje dowolnÄ… funkcjÄ™ i zwraca piÄ™Ä‡ najbardziej czasochÅ‚onnych wpisÃ³w.


In [1]:
# RozwiÄ…zanie Zadania 2
import cProfile
import pstats
from io import StringIO


def profile_top(func, *args, **kwargs):
    with cProfile.Profile() as pr:
        func(*args, **kwargs)
    s = StringIO()
    stats = pstats.Stats(pr, stream=s)
    stats.sort_stats(pstats.SortKey.CUMULATIVE).print_stats(5)
    print(s.getvalue())  # raport jako tekst, gotowy do logÃ³w lub e-maili


def busy_work():
    total = 0
    for _ in range(1000):
        total += sum(range(500))  # intensywna pÄ™tla do profilowania
    return total


profile_top(busy_work)

         1109 function calls in 0.015 seconds

   Ordered by: cumulative time
   List reduced from 46 to 5 due to restriction <5>

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
     1000    0.014    0.000    0.014    0.000 {built-in method builtins.sum}
        1    0.000    0.000    0.011    0.011 /Users/rkorzen/.local/share/uv/python/cpython-3.14.0-macos-x86_64-none/lib/python3.14/threading.py:651(wait)
        1    0.000    0.000    0.011    0.011 /Users/rkorzen/.local/share/uv/python/cpython-3.14.0-macos-x86_64-none/lib/python3.14/threading.py:337(wait)
        1    0.001    0.001    0.011    0.011 /var/folders/pd/gsgbf0fd4tv7ntlsxt53r0sh0000gn/T/ipykernel_7762/4138807054.py:16(busy_work)
        2    0.000    0.000    0.000    0.000 /Users/rkorzen/workspace/.venv/lib/python3.14/site-packages/traitlets/traitlets.py:708(__set__)



