## El módulo timeit

El módulo `timeit` permite obtener una medida fiable de los los tiempos
de ejecución de un fragmento de código Python.

En el siguiente código mostramos dos formas diferentes de intercambiar
los valores de dos variables, la primera con una variable auxiliar y la
segunda usando el mecanismo de empaquetado/desempaquetado de tuplas:

In [1]:
# Usando una variable auxiliar
a = 7; b = 12
temp = a
a = b
b = temp

In [2]:
# Usando tuplas
a = 7; b = 12
a, b = b, a

Pero ¿cuál de los dos sistemas es más rápida? Usando el módulo `timeit` podemos salir de
dudas:

In [27]:
# Usando una variable auxiliar

from timeit import Timer
Timer('t=a; a=b; b=t', 'a=7; b=12').timeit(100000)

0.002695795999954953

In [28]:
# Usando tuplas

Timer('a,b = b,a', 'a=7; b=12').timeit(100000)

0.002749662999974589

El intercambio por medio de tuplas parece un poco más lento, pero por una
diferencia tan pequeña que es dificil estar seguros.

El módulo `timeit` usa funciones específicas del sistema operativo para
medir estos tiempos, para intentar conseguir la máxima precisión
posible. Por la misma razón, ejecuta el código muchas veces para reducir
al mínimo el desvío o error causado por el inicio y finalización de la
prueba.

En el ejemplo anterior hemos pedido que repita las operaciones 100.000 veces
para obtener una media lo más libre posible de otros efectos, como la carga
del sistema.

### Clase y funciones del módulo

El módulo solo define una clase, `Timer`. 

- El constructor de la clase espera como primer parámetro el código
a probar, en forma de un *callable* (Algo que se puede llamar, una
función, por ejemplo, pero también podría ser una clase o un
método, por ejemplo), que se pueda invocar sin ningún parámetro, o
una o más líneas de texto con el código para ser medidas.

- Como segundo parámetro, opcional, una o
varias líneas de inicialización o *setup*, usadas para
inicializar valores.

Una vez creado un objeto de la clase `Timer`, podemos medir su tiempo
de ejecución medio usando el método `timeit`, al cual le podemos pasar como parámetro
opcional el número de bucles o iteraciones que queremos repetir para
prevenir errores esstadísticos.

(Aunque generalmente es buena idea dejarle esa decisión al propio módulo).

**Nota**: Se puede usar `timeit` como un *one-liner*, es decir, podemos
invocar `timeit` desde la línea de comando con `python -m timeit "<Code to be timed>".

**Ejercicio**: Queremos generar un texto a partir de una lista
de lineas. Pero queremos saber que es más rápido, si crear
el texto a base de ir concatenando una línea de texto detrás
de otra, o usar el método `join` de las cadenas de texto.

In [40]:
import timeit

textos = ["Toy Story", 
    "A Bug's Life", 
    "Toy Story 2", 
    "Monsters, Inc.", 
    "Buscando a Nemo", 
    "Los Increíbles", 
    "Cars", 
    "Ratatouille	", 
    "WALL·E", 
    "Up", 
    "Toy Story", 
    "Cars 2", 
    "Brave", 
    "Monsters University", 
    "Inside Out", 
    "The Good Dinosaur", 
    "Buscando a Dory", 
    "Cars 3", 
    "Coco", 
    "Los Increíbles 2", 
    "Toy Story 4", 
    "Onward",
]


def concat_strings(textos=textos):
    result = ''
    for line in textos:
        result += line
    return result


t1 = timeit.Timer(concat_strings, globals=globals)
t1.timeit()

1.52661611800022

In [39]:
def using_join(textos=textos):
    return ''.join(textos)

t2 = timeit.Timer(using_join)
t2.timeit()

0.3656882300001598

Aqui la diferencia es claramente a favor de usar join, es unas 4 veces más
rápido con esta muestra de datos.

Usar `timeit` para comprobar que sistema 


En el siguiente ejemplo usamos `timeit` desde la línea de comandos para
comprobar si el método `join` de las cadenas de texto es más rápido
cuando se le pasa una lista de enteros que previamente hemos de
transformar a *strings* usando 1) una expresion generadora, 2) una *list
comprehension* o 3) usando map:

    .. highlight:: shell
    $ python -m timeit '"-".join(str(n) for n in range(100))'
    10000 loops, best of 5: 22.5 usec per loop
    $ python -m timeit '"-".join([str(n) for n in range(100)])'
    10000 loops, best of 5: 20.8 usec per loop
    $ python -m timeit '"-".join(map(str, range(100)))'
    20000 loops, best of 5: 16.3 usec per loop

Los resultados varian para listas de diferentes tamaños:

    .. highlight:: shell
    $ python -m timeit '"-".join(str(n) for n in range(1000))'
    1000 loops, best of 5: 225 usec per loop
    $ python -m timeit '"-".join([str(n) for n in range(1000)])'
    1000 loops, best of 5: 210 usec per loop
    $ python -m timeit '"-".join(map(str, range(1000)))'
    2000 loops, best of 5: 169 usec per loop

`timeit` es lo suficientemente listo como para ajustar el número de
veces que ejecuta el código al tiempo que tarda en ejecutarse una sola
vez. En estas segundas pruebas, como la lista de numeros es 10 veces más
grande, en vez de ejecutar 10.000 iteraciones solo ejecute 1.000.