# Otimização de código: Presentes nos Feriados

Neste exemplo, vamos mostrar que usar operações vetorizadas e estruturas de dados mais eficientes podem otimizar nosso código.

Digamos que em uma determinada loja online de presentes tem um milhão de usuários onde cada um listou um presente em uma lista de desejos. Temos os preços para cada um desses presentes e estão armazenados em `gift_costs.txt`. Para cada feriado, teremos que dar a lista de desejos para um dado cliente caso o presente custe menos de 25 dólares. Agora, queremos aclcular o custo total para todos os presentes abaixo de 25 dólares para ver quanto iremos gastar em presentes gratuitos. Aqui veremos um modo de fazer isso.

Este notebook foi traduzido e complementado de uma das atividades do programa Udacity Machine Learning Nanodegree.

In [1]:
import time
import numpy as np

In [8]:
with open('gift_costs.txt') as f:
    gift_costs = f.read().split('\n')
    
gift_costs = np.array(gift_costs).astype(int)  # converte string em int

In [9]:
start = time.time()

total_price = 0
for cost in gift_costs:
    if cost < 25:
        total_price += cost * 1.08  # Adiciona o custo depois das taxas

print(total_price)
print('Duration: {} seconds'.format(time.time() - start))

32765421.24
Duration: 6.227868318557739 seconds


Aqui iremos iterar a cada custo da lista e checar se está abaixo de 25 dólares. Se sim, precisamos adicionar o custo ao preço total depois das taxas. Isso funciona, porém há um modo muito mais eficiente de fazer isso. Veremos:

## Código refatorado

**Dica:** Usar numpy torna muito fácil selecionat todos os elementos em um array que atende a certa condição e depois executa operações em todos os elementos de uma única vez. Assim, podemos encontrar a soma total mais rápido.

In [10]:
start = time.time()

total_price = np.sum(gift_costs[np.where(gift_costs < 25 )]*1.08)

print(total_price)
print('Duration: {} seconds'.format(time.time() - start))

32765421.24
Duration: 0.09282779693603516 seconds
