# <font color='blue'>Data Science Academy - Python Fundamentos - Capítulo 7</font>

## Download: http://github.com/dsacademybr

## Missão: Analisar o Comportamento de Compra de Consumidores.

## Nível de Dificuldade: Alto

Você recebeu a tarefa de analisar os dados de compras de um web site! Os dados estão no formato JSON e disponíveis junto com este notebook.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos no arquivo JSON.

Seu trabalho é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Mas nesta missão você vai analisar o comportamento de compra dos consumidores usando o pacote Pandas da linguagem Python e seu relatório final deve incluir cada um dos seguintes itens:

** Contagem de Consumidores **

* Número total de consumidores


** Análise Geral de Compras **

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


** Informações Demográficas Por Gênero **

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


** Análise de Compras Por Gênero **

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras por faixa etária


** Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela): **

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


** Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra
* Itens mais lucrativos


** Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


** Como considerações finais: **

* Seu script deve funcionar para o conjunto de dados fornecido.
* Você deve usar a Biblioteca Pandas e o Jupyter Notebook.


In [1]:
# Imports
import pandas as pd
import numpy as np

In [2]:
# Carrega o arquivo
load_file = "dados_compras.json"
purchase_file = pd.read_json(load_file, orient = "records")
purchase_file.head()

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor
0,Aelalis34,38,Masculino,165,Bone Crushing Silver Skewer,3.37
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46
3,Pheusrical25,21,Masculino,92,Final Critic,1.36
4,Aela59,23,Masculino,63,Stormfury Mace,1.27


## Informações Sobre os Consumidores

In [3]:
print("Número total de consumidores:")
print(len(purchase_file.Login.unique()))

Número total de consumidores:
573


## Análise Geral de Compras

In [4]:
print("Número de itens exclusivos:")
print(len(purchase_file['Item ID'].unique()))
print("\n")
print("Preço médio de compra:")
print("$ ", purchase_file['Valor'].mean())
print("\n")
print("Número total de compras:")
print(purchase_file['Item ID'].count())
print("\n")
print("Rendimento total:")
print("$ ", purchase_file['Valor'].sum())

Número de itens exclusivos:
183


Preço médio de compra:
$  2.931192307692303


Número total de compras:
780


Rendimento total:
$  2286.33


## Análise Demográfica

In [5]:
print("Porcentagem e contagem de compradores masculinos:")
total = purchase_file['Login'].count()
masc = purchase_file[purchase_file.Sexo == 'Masculino'].Login.count()
print(round(masc / total, 2) * 100, '%')
print(masc)
print("\n")
print("Porcentagem e contagem de compradores do sexo feminino:")
fem = purchase_file[purchase_file.Sexo == 'Feminino'].Login.count()
print(round(fem / total, 2) * 100, '%')
print(fem)
print("\n")
print("Porcentagem e contagem de outros / não divulgados:")
ond = purchase_file[purchase_file.Sexo == 'Outro / Não Divulgado'].Login.count()
print(round(ond / total, 2) * 100, '%')
print(ond)

Porcentagem e contagem de compradores masculinos:
81.0 %
633


Porcentagem e contagem de compradores do sexo feminino:
17.0 %
136


Porcentagem e contagem de outros / não divulgados:
1.0 %
11


## Análise de Compras Por Gênero

In [6]:
print("Número de compras:")
print("Masculino {} | Feminino {}".format(masc, fem))
print("\n")
print("Preço médio de compra:")
valor_masc = purchase_file[purchase_file.Sexo == 'Masculino'].Valor.mean()
valor_fem = purchase_file[purchase_file.Sexo == 'Feminino'].Valor.mean()
print("Masculino ${} | Feminino ${}".format(round(valor_masc, 2), round(valor_fem, 2)))
print("\n")
print("Valor Total de Compra:")
masc_total = purchase_file[purchase_file.Sexo == 'Masculino'].Valor.sum()
fem_total = purchase_file[purchase_file.Sexo == 'Feminino'].Valor.sum()
print("Masculino ${} | Feminino ${}".format(round(masc_total, 2), round(fem_total, 2)))
print("\n")
print("Compras por faixa etária:")
masc_u18 = purchase_file[(purchase_file.Idade < 18) & (purchase_file.Sexo == 'Masculino')].Login.count()
masc_18_29 = purchase_file[(purchase_file.Idade >= 18) & (purchase_file.Idade < 30) & (purchase_file.Sexo == 'Masculino')].Login.count()
masc_30 = purchase_file[(purchase_file.Idade > 29) & (purchase_file.Sexo == 'Masculino')].Login.count()
print("Masculino")
print("Até 18: {} | 18 - 29: {} | +30: {}".format(masc_u18, masc_18_29, masc_30))
fem_u18 = purchase_file[(purchase_file.Idade < 18) & (purchase_file.Sexo == 'Feminino')].Login.count()
fem_18_29 = purchase_file[(purchase_file.Idade >= 18) & (purchase_file.Idade < 30) & (purchase_file.Sexo == 'Feminino')].Login.count()
fem_30 = purchase_file[(purchase_file.Idade > 29) & (purchase_file.Sexo == 'Feminino')].Login.count()
print("Feminino")
print("Até 18: {} | 18 - 29: {} | +30: {}".format(fem_u18, fem_18_29, fem_30))

Número de compras:
Masculino 633 | Feminino 136


Preço médio de compra:
Masculino $2.95 | Feminino $2.82


Valor Total de Compra:
Masculino $1867.68 | Feminino $382.91


Compras por faixa etária:
Masculino
Até 18: 119 | 18 - 29: 416 | +30: 98
Feminino
Até 18: 30 | 18 - 29: 86 | +30: 20


## Consumidores Mais Populares (Top 5)

In [16]:
print("Login:")
login_gb = purchase_file.groupby(['Login']).size().to_frame(name='Grouped')
loginList = login_gb.sort_values(by='Grouped', ascending=False).head().index.to_list()
i = 1;
for login in loginList:
    print(i, login)
    i += 1
print("\n")
print("Número de compras:")
login_gb = purchase_file.groupby(['Login']).size().to_frame(name='Compras')
print(login_gb.sort_values(by='Compras', ascending=False).head())
print("\n")
print("Preço médio de compra:")
mean_gb = purchase_file.groupby(['Login'])['Valor'].describe()
print(mean_gb.sort_values(by='mean', ascending=False)['mean'].head())
print("\n")
print("Valor Total de Compra:")
mean_gb = purchase_file.groupby(['Login'])['Valor'].sum()
print(mean_gb.sort_values(ascending=False).head())
print("\n")
print("Itens mais populares:")
itens_gb = purchase_file.groupby(['Nome do Item']).size().to_frame(name='Grouped')
itensList = itens_gb.sort_values(by='Grouped', ascending=False).head().index.to_list()
i = 1;
for item in itensList:
    print(i, item)
    i += 1

Login:
1 Undirrala66
2 Mindimnya67
3 Qarwen67
4 Saedue76
5 Sondastan54


Número de compras:
             Compras
Login               
Undirrala66        5
Mindimnya67        4
Qarwen67           4
Saedue76           4
Sondastan54        4


Preço médio de compra:
Login
Frichaststa61    4.95
Palurrian69      4.95
Tyarithn67       4.95
Qiluard68        4.95
Syathe73         4.89
Name: mean, dtype: float64


Valor Total de Compra:
Login
Undirrala66    17.06
Saedue76       13.56
Mindimnya67    12.74
Haellysu29     12.73
Eoda93         11.58
Name: Valor, dtype: float64


Itens mais populares:
1 Final Critic
2 Arcane Gem
3 Betrayal, Whisper of Grieving Widows
4 Stormcaller
5 Woeful Adamantite Claymore


## Itens Mais Populares

In [19]:
itens_mp = purchase_file.groupby(['Item ID', 'Nome do Item', 'Valor']).size().to_frame(name='Total')
itensList = itens_mp.sort_values(by='Total', ascending=False).head()
print(itensList)

                                                    Total
Item ID Nome do Item                         Valor       
39      Betrayal, Whisper of Grieving Widows 2.35      11
84      Arcane Gem                           2.23      11
31      Trickster                            2.07       9
175     Woeful Adamantite Claymore           1.24       9
13      Serenity                             1.49       9


## Itens Mais Lucrativos

In [24]:
itens_mp = purchase_file.groupby(['Item ID', 'Nome do Item', 'Valor']).size().to_frame(name='Total')
itensList = itens_mp.sort_values(by='Valor', ascending=False).head()
print(itensList)

                                                        Total
Item ID Nome do Item                             Valor       
32      Orenmir                                  4.95       6
177     Winterthorn, Defender of Shifting Worlds 4.89       4
103     Singed Scalpel                           4.87       6
173     Stormfury Longsword                      4.83       5
131     Fury                                     4.82       4


## Fim

### Obrigado - Data Science Academy - <a href="http://facebook.com/dsacademybr">facebook.com/dsacademybr</a>