# Comparação de performance

Nesta aula vamos tentar responder à pergunta: como tornar nosso código em Python mais rápido? Para isso vamos aplicar dois exemplos, com graus de dificuldade diferentes, e resolve-os aplicando `for`, `comprehension`, `generators`, `buil-in functions`, e `numpy arrays`. Em cada exemplo será executado o código `n` vezes para conseguir identificar o tempo máximo, mínimo, médio, a variança do tempo e o desvio padrão.

Os dados foram obtidos num computador com as seguintes características:

- Processador Intel® Core™ i7-6500U
- Memória 16 Gb
- CPU @ 2.50GHz × 4
- Arquitetura 64 bits

Os resultados que serão apresentados não consideram o uso de Multithread ou implementações alternativas como PyPy ou Numba.



## Exemplo 1
Vamos trabalhar com um vetor de 1.000.000 de valore e estamos interessados aplicar a seguinte função:
$$f(x) = x^2$$
Para conseguir este resultado vamos aplicar:
  - for
  - list comprehension
  - set comprehension
  - generators
  - Numpy
---

In [2]:
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
vetor

range(1, 1000001)

### Utilizando `for`

In [3]:
vetor_square_for = []
for valor in vetor:
    vetor_square_for.append(valor**2)
vetor_square_for

[1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400,
 441,
 484,
 529,
 576,
 625,
 676,
 729,
 784,
 841,
 900,
 961,
 1024,
 1089,
 1156,
 1225,
 1296,
 1369,
 1444,
 1521,
 1600,
 1681,
 1764,
 1849,
 1936,
 2025,
 2116,
 2209,
 2304,
 2401,
 2500,
 2601,
 2704,
 2809,
 2916,
 3025,
 3136,
 3249,
 3364,
 3481,
 3600,
 3721,
 3844,
 3969,
 4096,
 4225,
 4356,
 4489,
 4624,
 4761,
 4900,
 5041,
 5184,
 5329,
 5476,
 5625,
 5776,
 5929,
 6084,
 6241,
 6400,
 6561,
 6724,
 6889,
 7056,
 7225,
 7396,
 7569,
 7744,
 7921,
 8100,
 8281,
 8464,
 8649,
 8836,
 9025,
 9216,
 9409,
 9604,
 9801,
 10000,
 10201,
 10404,
 10609,
 10816,
 11025,
 11236,
 11449,
 11664,
 11881,
 12100,
 12321,
 12544,
 12769,
 12996,
 13225,
 13456,
 13689,
 13924,
 14161,
 14400,
 14641,
 14884,
 15129,
 15376,
 15625,
 15876,
 16129,
 16384,
 16641,
 16900,
 17161,
 17424,
 17689,
 17956,
 18225,
 18496,
 18769,
 19044,
 19321,
 19600,
 19881,
 20164,
 20449

In [4]:
import timeit
import numpy as np
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
vetor_square_for = []
for valor in vetor:
    vetor_square_for.append(valor**2)'''
tempo_exemplo1_for= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
#  np.savetxt(f"Dados_exemplo1_for_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_for)
tempo_exemplo1_for

array([0.48223856, 0.48332099, 0.47687992, 0.47297045, 0.48217774])

### Utilizando `list comprenhension`

In [5]:
vetor_square_lc = [valor**2 for valor in vetor]
vetor_square_lc

[1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400,
 441,
 484,
 529,
 576,
 625,
 676,
 729,
 784,
 841,
 900,
 961,
 1024,
 1089,
 1156,
 1225,
 1296,
 1369,
 1444,
 1521,
 1600,
 1681,
 1764,
 1849,
 1936,
 2025,
 2116,
 2209,
 2304,
 2401,
 2500,
 2601,
 2704,
 2809,
 2916,
 3025,
 3136,
 3249,
 3364,
 3481,
 3600,
 3721,
 3844,
 3969,
 4096,
 4225,
 4356,
 4489,
 4624,
 4761,
 4900,
 5041,
 5184,
 5329,
 5476,
 5625,
 5776,
 5929,
 6084,
 6241,
 6400,
 6561,
 6724,
 6889,
 7056,
 7225,
 7396,
 7569,
 7744,
 7921,
 8100,
 8281,
 8464,
 8649,
 8836,
 9025,
 9216,
 9409,
 9604,
 9801,
 10000,
 10201,
 10404,
 10609,
 10816,
 11025,
 11236,
 11449,
 11664,
 11881,
 12100,
 12321,
 12544,
 12769,
 12996,
 13225,
 13456,
 13689,
 13924,
 14161,
 14400,
 14641,
 14884,
 15129,
 15376,
 15625,
 15876,
 16129,
 16384,
 16641,
 16900,
 17161,
 17424,
 17689,
 17956,
 18225,
 18496,
 18769,
 19044,
 19321,
 19600,
 19881,
 20164,
 20449

In [6]:
import timeit
import numpy as np
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avaliar_codigo = '''
vetor_square_lc = [valor**2 for valor in vetor]'''
tempo_exemplo1_lc= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avaliar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# np.savetxt(f"Dados_exemplo1_lc_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_lc)
tempo_exemplo1_lc

array([0.41172415, 0.41735688, 0.4006612 , 0.39965798, 0.40606686])

### Utilizando `set comprenhension`

In [7]:
vetor_square_sc = {valor**2 for valor in vetor}
vetor_square_sc

{16777216,
 1,
 67108864,
 268435456,
 4,
 1073741824,
 2415919104,
 4294967296,
 17179869184,
 9,
 9663676416,
 38654705664,
 68719476736,
 274877906944,
 107374182400,
 210453397504,
 16,
 42670751761,
 68721573904,
 68717379600,
 274882101264,
 274873712656,
 618468999184,
 618481582096,
 708975788049,
 25,
 953849129104,
 618475290624,
 28932309025,
 529368064,
 771728867361,
 36,
 274871615524,
 274884198436,
 712096324164,
 55614373929,
 660560937001,
 49,
 117440569,
 64,
 17181966400,
 68723671104,
 68715282496,
 12354322500,
 170683007044,
 154625114176,
 274886295616,
 167379992641,
 16083058761,
 403781451844,
 849635967049,
 878767505476,
 892339061769,
 81,
 34007416921,
 746781147225,
 601781856516,
 937357021584,
 261177213025,
 288928825441,
 100,
 274867421284,
 274888392804,
 8751415401,
 912076570729,
 231408140401,
 322086895729,
 121,
 16663969921,
 2117472256,
 845456343169,
 33892073604,
 115729236100,
 501810724996,
 747322212484,
 23068809,
 565528064256,
 144,

In [19]:
import timeit
import numpy as np
REPEAT = 50 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_sc = {valor**2 for valor in vetor}'''
tempo_exemplo1_sc = np.array(timeit.repeat(setup=setup_codigo,
                                           stmt=avalidar_codigo,
                                           repeat=REPEAT,
                                           number=NUMBER))/NUMBER
# np.savetxt(f"Dados_exemplo1_sc_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_sc)
tempo_exemplo1_sc

array([0.75631745, 0.74599302, 0.68960723, 0.67494969, 0.67276741,
       0.71018676, 0.67787776, 0.70099263, 0.65934973, 0.68635779,
       0.7072689 , 0.70301011, 0.70836827, 0.6915111 , 0.68943903,
       0.70553174, 0.70216271, 0.70878678, 0.71121942, 0.7003445 ,
       0.71360619, 0.70650824, 0.69085518, 0.70159592, 0.72257052,
       0.70067036, 0.70734929, 0.70169735, 0.72120199, 0.69260981,
       0.68344802, 0.69624001, 0.71953608, 0.71412649, 0.71654812,
       0.69162411, 0.729102  , 0.75097115, 0.73016661, 0.69018731,
       0.7873465 , 0.76184767, 1.03290751, 0.79092988, 0.70251215,
       0.70103967, 0.71670988, 0.69379161, 0.72327115, 0.6923777 ])

### Utilizando  `generators`

In [11]:
vetor_square_gen = (valor**2 for valor in vetor)
vetor_square_gen
list(vetor_square_gen)

[1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400,
 441,
 484,
 529,
 576,
 625,
 676,
 729,
 784,
 841,
 900,
 961,
 1024,
 1089,
 1156,
 1225,
 1296,
 1369,
 1444,
 1521,
 1600,
 1681,
 1764,
 1849,
 1936,
 2025,
 2116,
 2209,
 2304,
 2401,
 2500,
 2601,
 2704,
 2809,
 2916,
 3025,
 3136,
 3249,
 3364,
 3481,
 3600,
 3721,
 3844,
 3969,
 4096,
 4225,
 4356,
 4489,
 4624,
 4761,
 4900,
 5041,
 5184,
 5329,
 5476,
 5625,
 5776,
 5929,
 6084,
 6241,
 6400,
 6561,
 6724,
 6889,
 7056,
 7225,
 7396,
 7569,
 7744,
 7921,
 8100,
 8281,
 8464,
 8649,
 8836,
 9025,
 9216,
 9409,
 9604,
 9801,
 10000,
 10201,
 10404,
 10609,
 10816,
 11025,
 11236,
 11449,
 11664,
 11881,
 12100,
 12321,
 12544,
 12769,
 12996,
 13225,
 13456,
 13689,
 13924,
 14161,
 14400,
 14641,
 14884,
 15129,
 15376,
 15625,
 15876,
 16129,
 16384,
 16641,
 16900,
 17161,
 17424,
 17689,
 17956,
 18225,
 18496,
 18769,
 19044,
 19321,
 19600,
 19881,
 20164,
 20449

In [12]:
import timeit
import numpy as np
REPEAT = 10 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_gen = (valor**2 for valor in vetor)'''
tempo_exemplo1_gen = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# np.savetxt(f"Dados_exemplo1_gen_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_gen)
tempo_exemplo1_gen

array([4.66833202e-06, 2.17233416e-06, 2.03033172e-06, 2.05733037e-06,
       1.92933658e-06, 1.94300083e-06, 1.93000111e-06, 1.87233187e-06,
       2.05100029e-06, 1.96300001e-06])

### Utilizando `Numpy` Opção 1

In [None]:
import numpy as np
vetor_square_np1 = np.square(vetor)
vetor_square_np1

In [14]:
import timeit
import numpy as np
REPEAT = 10 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.arange(1, NUMERO_DE_ELEMENTOS + 1)
#vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_np1 = np.square(vetor)'''
tempo_exemplo1_np1 = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# np.savetxt(f"Dados_exemplo1_np1_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_np1)
tempo_exemplo1_np1

array([0.00809125, 0.00267579, 0.00303384, 0.00241072, 0.00257599,
       0.00198317, 0.00195191, 0.00183692, 0.00187837, 0.00219483])

In [15]:
import numpy as np
vetor_square_np2 = np.array(vetor)**2
vetor_square_np2

array([            1,             4,             9, ...,  999996000004,
        999998000001, 1000000000000])

In [17]:
import timeit
import numpy as np
REPEAT = 10 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 5 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
# vetor = np.arange(1, NUMERO_DE_ELEMENTOS + 1)
vetor = range(1, NUMERO_DE_ELEMENTOS + 1)
'''
avalidar_codigo = '''
vetor_square_np2 = np.array(vetor)**2'''
tempo_exemplo1_np2= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=avalidar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo1_np2_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo1_np2)
tempo_exemplo1_np2

array([0.27854829, 0.30380167, 0.29326271, 0.29862624, 0.31082525,
       0.2687966 , 0.27425564, 0.28184041, 0.26483134, 0.29116804])

In [None]:
np.array(x)**2

In [36]:
"""
Graficando os dados e mostrando as estatísticas dos códigos comparados
"""
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
%matplotlib notebook
pd.options.display.float_format = '{:.5e}'.format
colunas = "Mínimo Máximo Média Variância STD".split(" ")
filas = "For-List\nComprehension-Set\nComprehension-Generator-Numpy Opção 1-Numpy Opção 2-Numpy Opção 3".split("-")
resultados = np.array([np.loadtxt("Dados_exemplo1/Dados_exemplo1_for_repeat=1000_number=5.csv"),
                     np.loadtxt("Dados_exemplo1/Dados_exemplo1_lc_repeat=1000_number=5.csv"),
                     np.loadtxt("Dados_exemplo1/Dados_exemplo1_sc_repeat=1000_number=5.csv"),
                     np.loadtxt("Dados_exemplo1/Dados_exemplo1_gen_repeat=1000_number=5.csv"),
                     np.loadtxt("Dados_exemplo1/Dados_exemplo1_np1_repeat=1000_number=5.csv"),
                     np.loadtxt("Dados_exemplo1/Dados_exemplo1_np2_repeat=1000_number=5.csv"),
                      np.loadtxt("Dados_exemplo1/Dados_exemplo1_np3_repeat=1000_number=5.csv")]).T
comparacao = np.c_[np.amin(resultados, axis=0),
                   np.amax(resultados, axis=0),
                   np.mean(resultados, axis=0),
                   np.var(resultados, axis=0),
                   np.std(resultados, axis=0)]
comparacao_df = pd.DataFrame(data=comparacao,
                             index=filas,
                             columns=colunas)
plt.boxplot(resultados,
            labels=filas,
            patch_artist=True,
            boxprops=dict(facecolor="C0"),
            flierprops=dict(markerfacecolor='red', marker='o', markersize=5))
plt.ylabel("Tempo [s]")
plt.grid(True);
comparacao_df.sort_values(by=["Média"])

<IPython.core.display.Javascript object>

Unnamed: 0,Mínimo,Máximo,Média,Variância,STD
Generator,3.45599e-07,3.9784e-06,7.83232e-07,1.24188e-13,3.52404e-07
Numpy Opção 3,0.00148462,0.00334773,0.00175637,2.7605e-08,0.000166148
Numpy Opção 2,0.214643,0.302617,0.226668,0.000107744,0.01038
Numpy Opção 1,0.209353,0.638054,0.247289,0.00178003,0.0421904
List\nComprehension,0.296593,0.716251,0.329568,0.00110357,0.03322
For,0.349827,1.01005,0.385478,0.00178434,0.0422415
Set\nComprehension,0.530174,1.36311,0.586499,0.00975003,0.0987422


## Exemplo 2
Vamos trabalhar com vetor de 1.000.000 valores aleatórios com média 5 e desvio padrão de 4,5 e estamos interessados em aplicar a seguinte função e calcular:
$$f(x) = x^3 + {{5} \over {\pi}}x^{{1}\over{2}} – {{x}\over{x^2 + 1}}$$
  - Aplicar a função para cada valor;
  - Calcular a soma do novo vetor.
  
  Para conseguir este resultado vamos aplicar:
  - Loop for opção 1;
  - Loop for opção 2;
  - Loop for opção 3;
  - list comprehension;
  - generator;
  - numpy;
  - map.
---

In [21]:
import numpy as np
NUMERO_DE_ELEMENTOS = 100_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
vetor

array([-3.90371366,  1.60850676, 12.55485045, ...,  1.48829113,
        5.19655766,  1.85671707])

### Utilizando `For` Opção 1

In [22]:
vetor_fun_for1 = []
soma = 0
for valor in vetor:
    vetor_fun_for1.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for1[-1]
    

In [23]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 2 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for1 = []
soma = 0
for valor in vetor:
    vetor_fun_for1.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for1[-1]'''
tempo_exemplo2_for1 = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo2_for1_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_for1)
tempo_exemplo2_for1

array([4.2986849 , 4.27872761, 4.06151009, 4.16737396, 4.39423806])

### Utilizando `for` opção 2

In [None]:
vetor_fun_for2 = []
soma = 0.0
for valor in vetor:
    vetor_fun_for2.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for2[-1]

In [24]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for2 = []
soma = 0.0
for valor in vetor:
    vetor_fun_for2.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
    soma  += vetor_fun_for2[-1]'''
tempo_exemplo2_for2 = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# np.savetxt(f"Dados_exemplo2_for2_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_for2)
tempo_exemplo2_for2

array([4.23348602, 5.14297297, 4.23555907, 5.81320281, 5.73136648])

### Utilizando `for` opção 3

In [None]:
vetor_fun_for3 = []
for valor in vetor:
    vetor_fun_for3.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
soma = sum(vetor_fun_for3)

In [25]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_for3 = []
for valor in vetor:
    vetor_fun_for3.append(valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1))
soma = sum(vetor_fun_for3)'''
tempo_exemplo2_for3= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo2_for3_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_for3)
tempo_exemplo2_for3

array([4.70008384, 5.2185301 , 5.68898556, 5.83919496, 4.71801574])

### Utilizando `list comprenhension`

In [None]:
vetor_fun_lc = [valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor]
sum(vetor_fun_lc)

In [26]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_lc = [valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor]
sum(vetor_fun_lc)'''
tempo_exemplo2_lc= np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo2_lc_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_lc)
tempo_exemplo2_lc

array([3.99373734, 5.08736186, 6.52937132, 4.70708601, 5.51973234])

### Utilizando `generetors`

In [None]:
vetor_fun_gen = (valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor)
sum(vetor_fun_gen)

In [29]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_gen = (valor**3+ 5/3.141516*valor**1/2 - valor/(valor**2 + 1) for valor in vetor)
#sum(vetor_fun_gen)
'''
tempo_exemplo2_gen = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo2_gen2_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_gen)
tempo_exemplo2_gen

array([1.11606690e-05, 5.30233471e-06, 4.53466297e-06, 4.75000221e-06,
       4.64466575e-06])

### Utilizando `Numpy`

In [None]:
vetor_fun_np = vetor**3 + 5/3.141516*vetor**1/2 - vetor/(vetor**2 + 1)
vetor_fun_np.sum()

In [30]:
import timeit
REPEAT  = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_np = vetor**3 + 5/3.141516*vetor**1/2 - vetor/(vetor**2 + 1)
vetor_fun_np.sum()'''
tempo_exemplo2_np2 = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER
# tempo_exemplo1_for
# np.savetxt(f"Dados_exemplo2_np2_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_np2)
tempo_exemplo2_np2

array([0.13560037, 0.14092262, 0.1371716 , 0.12209217, 0.12045443])

### Utilizando `map()`

In [None]:
vetor_fun_map = map(lambda x: x**3 +5/3.141516*x**1/2 - x/(x**2 + 1), vetor)
sum(vetor_fun_map)

In [28]:
import timeit
REPEAT = 5 # Quantidade de vezes que será medido o tempo de execução
NUMBER = 3 # Quantidade de vezes que será executado o código
setup_codigo = '''
import numpy as np
NUMERO_DE_ELEMENTOS = 1_000_000
vetor = np.random.normal(5, 4.5, NUMERO_DE_ELEMENTOS)
'''
validar_codigo = '''
vetor_fun_map = map(lambda x: x**3 +5/3.141516*x**1/2 - x/(x**2 + 1), vetor)
sum(vetor_fun_map)'''
tempo_exemplo2_map = np.array(timeit.repeat(setup=setup_codigo,
                                         stmt=validar_codigo,
                                         repeat=REPEAT,
                                         number=NUMBER))/NUMBER

# np.savetxt(f"Dados_exemplo2_map_repeat={REPEAT}_number={NUMBER}.csv",
#            tempo_exemplo2_map)
tempo_exemplo2_map 

array([5.46997769, 5.58249358, 6.19329452, 5.29527083, 5.45883028])

In [37]:
"""
Graficando os dados e mostrando as estatísticas dos códigos comparados
"""
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
%matplotlib notebook
pd.options.display.float_format = '{:.5e}'.format
colunas = "Mínimo Máximo Média Variância STD".split(" ")
filas = "For 1,For 2,For 3,Map,List Comprenhension,Generator,Array".split(",")
filas_df = list(nome for nome in filas for _ in range(250)) 

resultados = np.array([np.loadtxt("Dados_exemplo2/Dados_exemplo2_for1_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_for2_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_for3_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_map_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_lc_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_gen_repeat=250_number=5.csv"),
                       np.loadtxt("Dados_exemplo2/Dados_exemplo2_np_repeat=250_number=5.csv")]).T
comparacao = np.c_[np.amin(resultados, axis=0),
                   np.amax(resultados, axis=0),
                   np.mean(resultados, axis=0),
                   np.var(resultados, axis=0),
                   np.std(resultados, axis=0)]
comparacao_df = pd.DataFrame(data=comparacao,
                             index=filas,
                             columns=colunas)
boxplot_python = plt.boxplot(resultados,
                             labels=filas,
                             patch_artist=True,
                             boxprops=dict(facecolor="C0"),
                             showfliers=True)
plt.ylabel("Tempo [s]")
plt.grid(True);
comparacao_df.sort_values(by=["Média"])

<IPython.core.display.Javascript object>

Unnamed: 0,Mínimo,Máximo,Média,Variância,STD
Array,0.0980313,0.125195,0.101839,6.05286e-06,0.00246026
List Comprenhension,2.64782,2.89671,2.69795,0.00108059,0.0328723
For 3,2.68387,2.99305,2.7542,0.00206604,0.0454537
Generator,2.53779,4.94324,2.79164,0.102795,0.320617
Map,2.58001,8.13596,3.0459,0.714148,0.845073
For 1,2.90484,3.27195,3.07268,0.00755399,0.0869137
For 2,2.84428,6.05782,3.18159,0.121931,0.349187


In [39]:
# Julia
resultados_jl = np.array([np.loadtxt("Dados_julia/Dados Julia for1 repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia for2 repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia for2 repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia map repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia lc repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia gen repeat=5 samples=250.csv"),
                       np.loadtxt("Dados_julia/Dados Julia arr repeat=5 samples=250.csv")]).T
comparacao_jl = np.c_[np.amin(resultados_jl, axis=0),
                   np.amax(resultados_jl, axis=0),
                   np.mean(resultados_jl, axis=0),
                   np.var(resultados_jl, axis=0),
                   np.std(resultados_jl, axis=0)]
comparacao_jl_df = pd.DataFrame(data=comparacao_jl,
                             index=filas,
                             columns=colunas)

boxplot_julia =plt.boxplot(resultados_jl,
                           labels=filas,
                           patch_artist=True,
                           boxprops=dict(facecolor="C2"),
                           showfliers=True)
plt.ylabel("Tempo [s]")
plt.grid(True)
plt.show();
comparacao_jl_df.sort_values(by=["Média"])

<IPython.core.display.Javascript object>

Unnamed: 0,Mínimo,Máximo,Média,Variância,STD
Generator,0.0044,0.0168,0.004972,5.84656e-07,0.000764628
Map,0.0054,0.028,0.0058232,2.08826e-06,0.00144508
List Comprenhension,0.0054,0.0272,0.006328,2.16218e-06,0.00147043
Array,0.0092,0.1068,0.0111016,3.82308e-05,0.00618311
For 1,0.0582,0.1108,0.0692112,3.61605e-05,0.00601336
For 2,0.0594,0.3694,0.082932,0.00155589,0.0394448
For 3,0.0594,0.3694,0.082932,0.00155589,0.0394448


In [40]:
boxplot_python = plt.boxplot(resultados,
                             positions=np.arange(1, len(filas)+1)*2.0-0.4,
                             patch_artist=True,
                             boxprops=dict(facecolor="C0"),
                             showfliers=False)
boxplot_julia =plt.boxplot(resultados_jl,
                           positions=np.arange(1, len(filas)+1)*2.0+0.4,
                           patch_artist=True,
                           boxprops=dict(facecolor="C2"),
                           showfliers=False)
plt.legend([boxplot_python["boxes"][0],
            boxplot_julia["boxes"][0]], ['Python', 'Julia'], loc='upper right')
plt.xticks(np.arange(1, len(filas)+1)*2, filas)
plt.ylabel("Tempo [s]")
plt.grid(True)
plt.show()

<IPython.core.display.Javascript object>