# Filtrando informações nos dataframes


## Resumo

Um dos grandes potenciais do pandas é para tratar condições.

E a forma com que analisamos condições no dataframe é diferente do que já fizemos até agora no curso, vamos ver como funciona.

- Preparando as bases de dados

In [1]:
import pandas as pd
vendas_df = pd.read_csv('Contoso - Vendas - 2017.csv', sep = ';')
clientes_df = pd.read_csv('Contoso - Clientes.csv', sep = ';')
lojas_df = pd.read_csv('Contoso - Lojas.csv', sep = ';')
produtos_df = pd.read_csv('Contoso - Cadastro Produtos.csv', sep = ';')
promocoes_df = pd.read_csv('Contoso - Promocoes.csv', sep = ';')

clientes_df = clientes_df[['ID Cliente', 'E-mail']]
produtos_df = produtos_df[[ 'ID Produto', 'Nome do Produto']]
promocoes_df = promocoes_df[['ID Promocao', 'Percentual Desconto']]
lojas_df = lojas_df[['ID Loja', 'Nome da Loja']]

vendas_df = vendas_df.merge(produtos_df, on='ID Produto')
vendas_df = vendas_df.merge(lojas_df, on='ID Loja')
vendas_df = vendas_df.merge(promocoes_df, on='ID Promocao')
vendas_df = vendas_df.merge(clientes_df, on='ID Cliente')
vendas_df = vendas_df.rename(columns = {'E-mail': 'E-mail dos clientes'})
vendas_df

Unnamed: 0,Numero da Venda,Data da Venda,Data do Envio,ID Canal,ID Loja,ID Produto,ID Promocao,ID Cliente,Quantidade Vendida,Quantidade Devolvida,Nome do Produto,Nome da Loja,Percentual Desconto,E-mail dos clientes
0,1,01/01/2017,02/01/2017,1,86,981,2,6825,9,1,A. Datum Advanced Digital Camera M300 Pink,Loja Contoso Austin,005,rbrumfieldmy@ameblo.jp
1,191019,20/03/2017,21/03/2017,1,172,376,2,6825,9,0,Adventure Works Laptop12 M1201 Silver,Loja Contoso Hartford,005,rbrumfieldmy@ameblo.jp
2,18610,08/01/2017,10/01/2017,2,200,448,2,6825,48,0,WWI Desktop PC1.80 E1801 Black,Loja Contoso Catalog,005,rbrumfieldmy@ameblo.jp
3,26350,12/01/2017,18/01/2017,6,21,568,2,6825,9,0,Proseware Projector 480p DLP12 Silver,Loja Contoso Wheat Ridge,005,rbrumfieldmy@ameblo.jp
4,287704,23/04/2017,26/04/2017,3,76,280,1,6825,10,0,Contoso Home Theater System 2.1 Channel M1210 ...,Loja Contoso Beaumont No.1,0,rbrumfieldmy@ameblo.jp
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
980637,239298,08/04/2017,14/04/2017,6,254,750,6,39372,9,1,Contoso Education Essentials Bundle M300 Black,Loja Contoso Yerevan,02,nina6@adventure-works.com
980638,169447,11/03/2017,13/03/2017,2,254,1212,6,39061,4,1,Fabrikam Social Videographer 1'' 25mm E400 Grey,Loja Contoso Yerevan,02,fernando55@adventure-works.com
980639,105791,13/02/2017,14/02/2017,1,278,411,6,38270,9,0,Proseware Laptop15 M510 White,Loja Contoso Urumqi,02,jacqueline11@adventure-works.com
980640,153585,04/03/2017,09/03/2017,5,296,1639,6,50,4,0,Contoso DVD 38 DVD Storage Binder E25 Red,Loja Contoso Bangkok No.2,02,znorcock1d@canalblog.com


### Primeiro, vamos aplicar uma função normalmente. Qual o % das vendas que foi devolvido?

- Para isso vamos somar as quantidades nas colunas correspondentes. Lembrando, o % vai ser: Total Devolvido / Total Vendido.

In [4]:
qtde_vendas = vendas_df['Quantidade Vendida'].sum()
qtde_devolvida = vendas_df['Quantidade Devolvida'].sum()
print('{:.2%}'.format(qtde_devolvida / qtde_vendas))

1.17%


### Agora, se quisermos fazer a mesma análise apenas para 1 loja. Queremos filtrar apenas os itens da Loja Contoso Europe Online e saber o % de devolução dessa loja.

- Para isso, vamos precisar filtrar. A forma de filtrar nos dataframes é uma "simples" comparação

In [8]:
vendas_lojaC_E_O = vendas_df[vendas_df['ID Loja'] == 306]
qtde_vendas = vendas_lojaC_E_O['Quantidade Vendida'].sum()
qtde_devolvida = vendas_lojaC_E_O['Quantidade Devolvida'].sum()
print('{:.2%}'.format(qtde_devolvida / qtde_vendas))

1.33%


### Vamos fazer em 2 passos para entender certinho o que está acontecendo.

### Desafio: e se eu quisesse criar uma tabela apenas com as vendas da Loja Contoso Europe Online e que não tiveram nenhuma devolução. Quero criar essa tabela e saber quantas vendas são.

- Repare que nesse caso são 2 condições, como fazemos isso?

In [9]:
vendas_lojaC_E_O = vendas_df[vendas_df['ID Loja'] == 306]
vendas_lojasemdevolução = vendas_lojaC_E_O[vendas_lojaC_E_O['Quantidade Devolvida'] == 0]
vendas_lojasemdevolução

Unnamed: 0,Numero da Venda,Data da Venda,Data do Envio,ID Canal,ID Loja,ID Produto,ID Promocao,ID Cliente,Quantidade Vendida,Quantidade Devolvida,Nome do Produto,Nome da Loja,Percentual Desconto,E-mail dos clientes
12,880458,23/11/2017,23/11/2017,0,306,235,10,6825,8,0,Litware Home Theater System 7.1 Channel M710 B...,Loja Contoso Europe Online,02,rbrumfieldmy@ameblo.jp
61,829161,04/11/2017,13/11/2017,9,306,832,10,12464,8,0,Contoso USB Optical Mouse E200 Grey,Loja Contoso Europe Online,02,rcaffincx@netlog.com
91,830377,04/11/2017,12/11/2017,8,306,1225,10,19476,8,0,"Fabrikam Trendsetter 1/2"" 3mm X300 Orange",Loja Contoso Europe Online,02,dfortmandb@army.mil
123,890603,27/11/2017,27/11/2017,0,306,300,10,22491,4,0,SV Car Video AM/FM E1001 Black,Loja Contoso Europe Online,02,stephanie44@adventure-works.com
124,73237,31/01/2017,05/02/2017,5,306,809,10,22491,8,0,Contoso Dual USB Power Adapter - power adapter...,Loja Contoso Europe Online,02,stephanie44@adventure-works.com
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
980505,696092,20/09/2017,27/09/2017,7,306,1160,9,937,18,0,"Fabrikam Business Videographer 1"" 25mm M600 Blue",Loja Contoso Europe Online,01,kforresterq0@hatena.ne.jp
980548,717419,28/09/2017,28/09/2017,0,306,1537,9,39106,27,0,The Phone Company PDA GPS Phone 4.7 inch L950 ...,Loja Contoso Europe Online,01,justine0@adventure-works.com
980549,659606,05/09/2017,06/09/2017,1,306,711,9,39338,9,0,Proseware All-In-One Photo Printer M200 White,Loja Contoso Europe Online,01,maria18@adventure-works.com
980550,655599,04/09/2017,04/09/2017,0,306,1070,9,38800,12,0,A. Datum SLR Camera M141 Blue,Loja Contoso Europe Online,01,megan8@adventure-works.com
