# Comparação de performance

Nesta aula vamos tentar responder à pergunta: como tornar nosso código em Python mais rápido? Para isso vamos avaliar aplicar dois exemplos, com graus de dificuldade diferentes, e resolve-os aplicando `for`, `comprenhension`, `generators`, `buil-in functions`, e `nuympy arrays`. Em cada exemplo será executado o código `n` vezes para conseguir identificar o tempo máximo, mínimo, médio, a variança do tempo e o desvio padrão.

Os dados foram obtidos:

- Processador Intel® Core™ i7-6500U
- Memória 16 Gb
- CPU @ 2.50GHz × 4
- Arquitetura 64 bits

Os resultados que serão apresentados não consideram o uso de Multithread ou implementações alternativas como PyPy ou Numba.



## Exemplo 1
Vamos trabalhar com um vetor de 1.000.000 de valore e estamos interessados aplicar a seguinte função:
$$f(x) = x^2$$
Para conseguir este resultado vamos aplicar:
  - for
  - list comprenhension
  - set comprenhension
  - generators
  - Numpy
---

In [None]:
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)

### Utilizando `for`

In [None]:
vetor_square_for = []
for valor in vetor:
    vetor_square_for.append(valor**2)
vetor_square_for

In [None]:
import timeit
REPEAT = 1000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
vetor_square_for = []
for valor in vetor:
    vetor_square_for.append(valor**2)'''
tempo_exemplo1_for= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo1_for_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_for)

### Utilizando `list comprenhension`

In [None]:
vetor_square_lc = [valor**2 for valor in vetor]
vetor_square_lc

In [None]:
import timeit
REPEAT = 1_000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avaliar_codigo = '''
vetor_square_lc = [valor**2 for valor in vetor]'''
tempo_exemplo1_lc= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avaliar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
tempo_exemplo1_lc
np.savetxt(f"Dados_exemplo1_lc_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_lc)

### Utilizando `set comprenhension`

In [None]:
vetor_square_sc = {valor**2 for valor in vetor}
vetor_square_sc

In [None]:
import timeit
REPEAT = 1_000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_sc = {valor**2 for valor in vetor}'''
tempo_exemplo1_sc = np.array(timeit.repeat(setup=setup_codigo,
                                           stmt=avalidar_codigo,
                                           repeat=REPEAT,
                                           number=NUMBER))/NUMBER
np.savetxt(f"Dados_exemplo1_sc_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_sc)

In [None]:
tempo_exemplo1_sc

### Utilizando  `generators`

In [None]:
vetor_square_gen = (valor**2 for valor in vetor)
list(vetor_square_gen)

In [None]:
import timeit
REPEAT =  1_000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_gen = (valor**2 for valor in vetor)'''
tempo_exemplo1_gen = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
tempo_exemplo1_gen
np.savetxt(f"Dados_exemplo1_gen_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_gen)

### Utilizando `Numpy` Opção 1

In [None]:
import numpy as np
vetor_square_np1 = np.square(vetor)

In [None]:
import timeit
REPEAT = 1_000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_np1 = np.square(vetor)'''
tempo_exemplo1_np1 = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
tempo_exemplo1_np1
np.savetxt(f"Dados_exemplo1_np1_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_np1)

In [None]:
import numpy as np
vetor_square_np2 = np.array(vetor)**2
vetor_square_np2

In [None]:
import timeit
REPEAT = 1_000 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_np2 = np.array(vetor)**2'''
tempo_exemplo1_np2= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
tempo_exemplo1_np2
np.savetxt(f"Dados_exemplo1_np2_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo1_np2)

In [None]:
"""
Graficando os dados e mostrando as estatísticas dos códigos comparados
"""
import matplotlib.pyplot as plt
import pandas as pd
%matplotlib notebook
pd.options.display.float_format = '{:.5e}'.format
colunas = "Mínimo Máximo Média Variância STD".split(" ")
filas = "For-List\nComprenhension-Set\nComprenhension-Generator-Numpy Opção 1-Numpy Opção 2".split("-")
comparacao = np.c_[np.amin(resultados, axis=0),
                   np.amax(resultados, axis=0),
                   np.mean(resultados, axis=0),
                   np.var(resultados, axis=0),
                   np.std(resultados, axis=0)]
comparacao_df = pd.DataFrame(data=comparacao,
                             index=nomes,
                             columns=colunas)
resultados = np.c_[tempo_exemplo1_for,
                   tempo_exemplo1_lc,
                   tempo_exemplo1_sc,
                   tempo_exemplo1_gen,
                   tempo_exemplo1_np1,
                   tempo_exemplo1_np2]
plt.boxplot(resultados,
            labels=nomes,
            flierprops=dict(markerfacecolor='red', marker='o', markersize=5))
plt.ylabel("Tempo [s]")
plt.grid(True);
comparacao_df


## Exemplo 2
Vamos trabalhar com vetor de 1.000.000 valores aleatórios entre com média 5 e desvio padrão de 4,5 e estamos interessados em aplicar a seguinte função e calcular:
$$f(x) = x^3 + {{5} \over {\pi}}x^{{1}\over{2}} – {{x}\over{x^2 + 1}}$$
  - Aplicar a função seno para cada valor;
  - Calcular a soma do novo vetor.
  
  Para conseguir este resultado vamos aplicar:
  - Loop for opção 1;
  - Loop for opção 2;
  - Loop for opção 3;
  - list comprenhension;
  - generator;
  - numpy;
  - map.
---

In [None]:
import numpy as np
NUMERO_DE_ELEMENTOS = 100_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)

### Utilizando `For` Opção 1

In [None]:
vetor_fun_for1 = []
soma = 0
for valor in vetor:
    vetor_fun_for1.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun[-1]

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for1 = []
soma = 0
for valor in vetor:
    vetor_fun_for1.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for1[-1]'''
tempo_exemplo2_for1= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_for1_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_for1)

In [None]:
np.mean(tempo_exemplo2_for1)
np.std(tempo_exemplo2_for1)

### Utilizando `for` opção 2

In [None]:
vetor_fun_for2 = []
soma = 0.0
for valor in vetor:
    vetor_fun_for2.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for2[-1]

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for2 = []
soma = 0.0
for valor in vetor:
    vetor_fun_for2.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for2[-1]'''
tempo_exemplo2_for2= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_for2_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_for2)
# np.mean(tempo_exemplo2_for2) = 3.1815899256055946
# np.std(tempo_exemplo2_for2) =  0.34918650907524423

### Utilizando `for` opção 3

In [None]:
vetor_fun_for3 = []
for valor in vetor:
    vetor_fun_for3.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
soma = sum(vetor_fun_for3)

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for3 = []
for valor in vetor:
    vetor_fun_for3.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
soma = sum(vetor_fun_for3)'''
tempo_exemplo2_for3= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_for3_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_for3)

In [None]:
np.mean(tempo_exemplo2_for3)

### Utilizando `list comprenhension`

In [None]:
vetor_fun_lc = [valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor]
sum(vetor_fun_lc)

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_lc = [valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor]
sum(vetor_fun_lc)'''
tempo_exemplo2_lc= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_lc_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_lc)

In [None]:
np.mean(tempo_exemplo2_lc)

### Utilizando `generetors`

In [None]:
vetor_fun_gen = (valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor)
sum(vetor_fun_gen)

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_gen = (valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor)
sum(vetor_fun_gen)'''
tempo_exemplo2_gen2= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_gen2_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_gen2)

In [None]:
np.mean(tempo_exemplo2_gen2)

### Utilizando `Numpy`

In [None]:
vetor_fun_np = vetor**3 + 5/3.141516*vetor**1/2 - vetor/(vetor**2 + 1)
vetor_fun_np.sum()

In [1]:
import timeit
REPEAT  = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_np = vetor**3 + 5/3.141516*vetor**1/2 - vetor/(vetor**2 + 1)
vetor_fun_np.sum()'''
tempo_exemplo2_np2= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_np2_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_np2)

### Utilizando `map()`

In [None]:
vetor_fun_map = map(lambda x: x**3 +5/3.141516*x**1/2 - x/(x**2 + 1), vetor)
sum(vetor_fun_map)

In [None]:
import timeit
REPEAT = 250 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_map = map(lambda x: x**3 +5/3.141516*x**1/2 - x/(x**2 + 1), vetor)
sum(vetor_fun_map)'''
tempo_exemplo2_map = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
np.savetxt(f"Dados_exemplo2_map_repeat={REPEAT}_number={NUMBER}.csv",
           tempo_exemplo2_map)