## Perfilamiento del paquete ffmaxflow

La máquina `m4.2xlarge` tiene las siguientes características:

In [1]:
%%bash
lscpu

Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              8
On-line CPU(s) list: 0-7
Thread(s) per core:  2
Core(s) per socket:  4
Socket(s):           1
NUMA node(s):        1
Vendor ID:           GenuineIntel
CPU family:          6
Model:               85
Model name:          Intel(R) Xeon(R) Platinum 8259CL CPU @ 2.50GHz
Stepping:            7
CPU MHz:             3100.008
BogoMIPS:            5000.00
Hypervisor vendor:   KVM
Virtualization type: full
L1d cache:           32K
L1i cache:           32K
L2 cache:            1024K
L3 cache:            36608K
NUMA node0 CPU(s):   0-7
Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand h

In [3]:
%%bash
uname -ar #r for kernel, a for all

Linux jupyterlab-opt-0-1-hostpath-pv-86dff5567f-wztxj 4.19.0-8-amd64 #1 SMP Debian 4.19.98-1 (2020-01-26) x86_64 x86_64 x86_64 GNU/Linux


## Objetivo

In [8]:
import ffmaxflow as ff
import networkx as nx
from pytest import approx
from IPython.display import HTML, display

In [7]:
red = ff.create_flow_network()

red.create_vertex('o', True, False) 
red.create_vertex('t', False, True) 
red.create_vertex('a', False, False)
red.create_vertex('b', False, False)
red.create_vertex('c', False, False)
red.create_vertex('d', False, False)
red.create_vertex('e', False, False)

red.create_edge('o', 'a', 5)
red.create_edge('o', 'b', 7)
red.create_edge('o', 'c', 4)

red.create_edge('a', 'b', 1)
red.create_edge('a', 'd', 3)

red.create_edge('b', 'c', 2)
red.create_edge('b', 'd', 4)
red.create_edge('b', 'e', 5)

red.create_edge('c', 'e', 4)

red.create_edge('d', 't', 9)

red.create_edge('e', 'd', 1)
red.create_edge('e', 't', 9)

red.MaxFlow()

15

## Perfilamiento: medición de tiempo en Python y IPython

Lo más natural que podemos pensar en medir es el tiempo de ejecución de nuestros códigos. Python y IPython tienen herramientas para este propósito.

**Módulo: time**

In [9]:
import time

In [14]:
start_time = time.time()

red = ff.create_flow_network()

red.create_vertex('o', True, False) 
red.create_vertex('t', False, True) 
red.create_vertex('a', False, False)
red.create_vertex('b', False, False)
red.create_vertex('c', False, False)
red.create_vertex('d', False, False)
red.create_vertex('e', False, False)

red.create_edge('o', 'a', 5)
red.create_edge('o', 'b', 7)
red.create_edge('o', 'c', 4)

red.create_edge('a', 'b', 1)
red.create_edge('a', 'd', 3)

red.create_edge('b', 'c', 2)
red.create_edge('b', 'd', 4)
red.create_edge('b', 'e', 5)

red.create_edge('c', 'e', 4)

red.create_edge('d', 't', 9)

red.create_edge('e', 'd', 1)
red.create_edge('e', 't', 9)

max_flow = red.MaxFlow()

end_time = time.time()

In [11]:
secs = end_time-start_time
print("El cálculo del flujo máximo tomó",secs,"segundos" )

El cálculo del flujo máximo tomó 0.0006959438323974609 segundos


Prueba que el paquete resuelve correctamente el problema con la función maximum_flow del paquete networkx

In [12]:
G = nx.DiGraph()

G.add_edge('o', 'a', capacity=5)
G.add_edge('o', 'b', capacity=7)
G.add_edge('o', 'c', capacity=4)

G.add_edge('a', 'b', capacity=1)
G.add_edge('a', 'd', capacity=3)

G.add_edge('b', 'c', capacity=2)
G.add_edge('b', 'd', capacity=4)
G.add_edge('b', 'e', capacity=5)

G.add_edge('c', 'e', capacity=4)

G.add_edge('d', 't', capacity=9)

G.add_edge('e', 'd', capacity=1)
G.add_edge('e', 't', capacity=9)

flow_value, flow_dict = nx.maximum_flow(G, 'o', 't')

In [16]:
print(flow_value == approx(max_flow))

True


**Comando de magic: %time**

Este comando nos regresa las mediciones siguientes:

**CPU times** que contiene:

* user: mide la cantidad de tiempo de los statements que la CPU gastó para funciones que no están relacionadas con el kernel del sistema.

* sys: mide la cantidad de tiempo de los statements que la CPU gastó en funciones a nivel de kernel del sistema.

* total: suma entre el user y sys para todos todos los cores.

**Wall time:** mide el wall clock o elapsed time que se refiere al tiempo desde que inicia la ejecución de los statements hasta su finalización.

**Out:** resultado.


In [17]:
%time 
red = ff.create_flow_network()

red.create_vertex('o', True, False) 
red.create_vertex('t', False, True) 
red.create_vertex('a', False, False)
red.create_vertex('b', False, False)
red.create_vertex('c', False, False)
red.create_vertex('d', False, False)
red.create_vertex('e', False, False)

red.create_edge('o', 'a', 5)
red.create_edge('o', 'b', 7)
red.create_edge('o', 'c', 4)

red.create_edge('a', 'b', 1)
red.create_edge('a', 'd', 3)

red.create_edge('b', 'c', 2)
red.create_edge('b', 'd', 4)
red.create_edge('b', 'e', 5)

red.create_edge('c', 'e', 4)

red.create_edge('d', 't', 9)

red.create_edge('e', 'd', 1)
red.create_edge('e', 't', 9)

red.MaxFlow()


CPU times: user 4 µs, sys: 1 µs, total: 5 µs
Wall time: 9.3 µs


15

* Tardó 4 milisegundos para funciones que no están relacionadas con el kernel del sistema.
* Tadró 1 milisegundos para funciones a nivel kernel del sistema.
* Tentiendo un total de 5 milisegundos unidades de tiempo.
* Tardó 9.3 milisegundos desde el inicio hasta el fin de la ejecución de la función.

**Timeit**

Al medir tiempos de ejecución, siempre hay variación en la medición por lo que se recomienda realizar las mediciones un número repetido de veces. Para este caso Timeit nos ayuda.

Se ejecuta desde la línea de comandos, con el comando de magic `%timeit` o realizando import.

A continuación se mide el tiempo de ejecución de las funciones que conforman el paquete` ffmaxflow`. Se promedian los tiempos de $n=5$
ejecuciones y se calcula su desviación estándar. Se reptite lo anterior $r=10$ veces y se reporta el mejor resultado.

In [23]:
import timeit

In [24]:
start = timeit.timeit()

red = ff.create_flow_network()

red.create_vertex('o', True, False) 
red.create_vertex('t', False, True) 
red.create_vertex('a', False, False)
red.create_vertex('b', False, False)
red.create_vertex('c', False, False)
red.create_vertex('d', False, False)
red.create_vertex('e', False, False)

red.create_edge('o', 'a', 5)
red.create_edge('o', 'b', 7)
red.create_edge('o', 'c', 4)

red.create_edge('a', 'b', 1)
red.create_edge('a', 'd', 3)

red.create_edge('b', 'c', 2)
red.create_edge('b', 'd', 4)
red.create_edge('b', 'e', 5)

red.create_edge('c', 'e', 4)

red.create_edge('d', 't', 9)

red.create_edge('e', 'd', 1)
red.create_edge('e', 't', 9)

red.MaxFlow()

end = timeit.timeit()

In [25]:
secs = end-start
print("El cálculo del flujo máximo tomó",secs,"segundos" )

El cálculo del flujo máximo tomó -0.000471755000489793 segundos


**cProfile**

cProfile está en la standard-library de Python como built-in. Se utiliza con la implementación CPython de Python para medir el tiempo de ejecución de cada función en el programa. Se ejecuta desde la línea de comandos, con un comando de magic o realizando import.

El output de cProfile muestra:

* El tiempo total de ejecución, el cual incluye el tiempo del bloque de código que estamos midiendo y el overhead al usar cProfile. Por esta razón se tiene un mayor tiempo de ejecución que con las mediciones de tiempo anteriores.

* La columna ncalls que como el nombre indica, muestra el número de veces que se llamó a cada función. En este caso las funciones lambda y math.exp son las que se llaman un mayor número de veces: $n=106$ veces.

* La columna tottime muestra el tiempo que tardaron estas funciones en ejecutarse (sin llamar a otras funciones).

* La columna percall es el cociente entre tottime y ncalls.

* La columna cumtime contiene el tiempo gastado en la función y en las demás que llama. 

* La columna de percall es un cociente entre la columna cumtime y el conteo del número de veces que se llamaron a funciones primitivas o también nombradas built in functions.

* La última columna indica información de la función y la línea en la que se encuentra dentro del código. 

In [26]:
import cProfile

In [51]:
cprof = cProfile.Profile()
cprof.enable()

red = ff.create_flow_network()

red.create_vertex('o', True, False) 
red.create_vertex('t', False, True) 
red.create_vertex('a', False, False)
red.create_vertex('b', False, False)
red.create_vertex('c', False, False)
red.create_vertex('d', False, False)
red.create_vertex('e', False, False)

red.create_edge('o', 'a', 5)
red.create_edge('o', 'b', 7)
red.create_edge('o', 'c', 4)

red.create_edge('a', 'b', 1)
red.create_edge('a', 'd', 3)

red.create_edge('b', 'c', 2)
red.create_edge('b', 'd', 4)
red.create_edge('b', 'e', 5)

red.create_edge('c', 'e', 4)

red.create_edge('d', 't', 9)

red.create_edge('e', 'd', 1)
red.create_edge('e', 't', 9)

red.MaxFlow()

cprof.disable()
cprof.print_stats(sort='ncalls')

         1026 function calls (813 primitive calls) in 0.001 seconds

   Ordered by: call count

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
   229/16    0.000    0.000    0.000    0.000 __init__.py:172(get_path)
      128    0.000    0.000    0.000    0.000 __init__.py:217(<genexpr>)
       44    0.000    0.000    0.000    0.000 {built-in method builtins.getattr}
       44    0.000    0.000    0.000    0.000 {built-in method builtins.next}
       44    0.000    0.000    0.000    0.000 compilerop.py:138(extra_flags)
       31    0.000    0.000    0.000    0.000 {method 'append' of 'list' objects}
       31    0.000    0.000    0.000    0.000 __init__.py:80(vertex_in_network)
       24    0.000    0.000    0.000    0.000 __init__.py:66(get_vertex)
       24    0.000    0.000    0.000    0.000 __init__.py:26(__init__)
       22    0.000    0.000    0.000    0.000 {built-in method builtins.compile}
       22    0.000    0.000    0.001    0.000 {built-in method b

* Observamos que la función que fue llamada más veces fue `get_path` y la que menos fue llamada fue `MaxFlow` la cual solo obtiene el flujo máximo de la red
* El tiempo total que tardaron estas funciones en correr insependientemente fueron 0 segundos para todas las funciones.


**line_profiler**

Nos ayuda a perfilar el código línea por línea.

Una buena idea es perfilar el código primero con cProfile para identificar aquellas funciones que gastan un mayor tiempo de ejecución y posteriormente perfilarlas con `line_profiler`.

Se ejecuta desde la línea de comandos, con un comando de magic o realizando import.

El output de `line_profiler` muestra:

* Line #: el número de la línea.

* Hits: el número de veces que la línea fue ejecutada.

* Time el tiempo que tomó la ejecución de la línea. Las unidades en el que se mide el tiempo está en la primer línea: Timer unit.

* Per Hit: el tiempo promedio que toma la ejecución de la línea una vez en timer's units.

* % Time: el porcentaje de tiempo que toma la ejecución de la línea correspondiente al tiempo total de ejecución de la función.

* Line contents: el código a perfilar.


In [35]:
import line_profiler

**Función create_vertex**

In [62]:
red = ff.create_flow_network()

line_prof = line_profiler.LineProfiler()

print(line_prof(red.create_vertex)('o', True, False))

None


In [63]:
print(line_prof.print_stats())

Timer unit: 1e-06 s

Total time: 2.3e-05 s
File: /usr/local/lib/python3.6/dist-packages/ffmaxflow/__init__.py
Function: create_vertex at line 109

Line #      Hits         Time  Per Hit   % Time  Line Contents
   109                                               def create_vertex(self, name, source=False, sink=False):
   110                                                   """
   111                                                   Creates and adds a vertex to the network after it checks various
   112                                                   error cases to ensure that the vertex can be added.
   113                                                   Args:
   114                                                       name (string): name or identifier of vertex_in_network
   115                                                       source (bool): whether the vertex to add is source or not
   116                                                       sink (bool): whether the vert

Para esta función la línea que mas tiempo tarda en correr es la 134, la cual hace referencia a `newVertex = vertex(name, source, sink)`,
toma el 21.7% de tiempo

**Función create_edge**

In [64]:
line_prof = line_profiler.LineProfiler()

print(line_prof(red.create_edge)('o', 'c', 4))

Nodo destino ya ha sido agregado


In [65]:
print(line_prof.print_stats())

Timer unit: 1e-06 s

Total time: 8e-06 s
File: /usr/local/lib/python3.6/dist-packages/ffmaxflow/__init__.py
Function: create_edge at line 138

Line #      Hits         Time  Per Hit   % Time  Line Contents
   138                                               def create_edge(self, start, end, capacity):
   139                                                   """
   140                                                   Creates and adds a new edge to the flow network with capacity of 0
   141                                                   by first checking the start and end vertices of said edge to
   142                                                   verify that the are not the same vertex and that they are both in
   143                                                   the network.
   144                                                   Args:
   145                                                       start (vertex): start vertex of the new edge
   146                         

Como nos sale el mesaje *Nodo destino ya ha sido agregado*, la línea que más tarda en correr es la 152, la cual hace referencia a la impresión de este warning

**Función MaxFlow**

In [66]:
line_prof = line_profiler.LineProfiler()
print(line_prof(red.MaxFlow)())

La red no tiene nodo origen y/o destino 


In [67]:
print(line_prof.print_stats())

Timer unit: 1e-06 s

Total time: 1.3e-05 s
File: /usr/local/lib/python3.6/dist-packages/ffmaxflow/__init__.py
Function: MaxFlow at line 197

Line #      Hits         Time  Per Hit   % Time  Line Contents
   197                                               def MaxFlow(self):
   198                                                   """
   199                                                   Follows the path returned by get_path and gets the maximum flow in the
   200                                                   network. This function implements the Ford Fulkerson method and
   201                                                   calculates the flow while the path is not fully walked. It sums this
   202                                                   flow to the fordward edges and substracts it from the reverse edges.
   203                                                   Then, another path is calculated and we repeat the process.
   204                                       

* Notamos que las líneas 209, 210, 212, 213 fueron ejecutadas 1 vez.

* La línea que tomó más tiempo en ejecutarse fue la 209 que hace referencia al camino `path = self.get_path(source.name, sink.name, [])`, esta misma línea toma el 53.8% de tiempo total de ejecución de la función. 

* La línea 210 `sink = self.get_sink()` toma el 30% de tiempo de ejecución 
* Las líneas 212 y 213 toman el 7.7% de tiempo de ejecución las cuales hacen referencia a un warning que aparece cuando no se han declarado nodos origen y/o destino


## Perfilamiento: medición de uso de memoria en Python

Si bien las computadoras de hoy en día tienen una gran cantidad de RAM es importante que las aplicaciones no utilicen la totalidad pues en ese caso se tendrá una penalización en el performance de la aplicación al utilizar virtual memory.

**memory_profiler**

Se ejecuta desde la línea de comandos, con un comando de magic o realizando import. Al instalar memory_profiler se incluyen dos comandos de magic: %memit y %mprun. %mprun es similar a `line_profiler` al analizar línea por línea el uso de memoria.

En el caso de import regresa una lista de valores de uso de memoria en MiB medidas cada cierto interval (argumento de memory_usage). En lo siguiente se pide que se regrese el máximo uso de memoria de la lista.

In [42]:
from memory_profiler import memory_usage

In [43]:
%load_ext memory_profiler

%memit devuelve el pico de memoria usada en una celda de un jupyter notebook y utiliza las mismas ideas para reportar las mediciones que %timeit:

In [44]:
%memit 

peak memory: 76.80 MiB, increment: 0.14 MiB


In [45]:
%memit -c red.MaxFlow()

peak memory: 138.00 MiB, increment: 61.17 MiB
