In [61]:
# Imports
import pandas as pd
import numpy as np

In [96]:
# Carrega o arquivo
load_file = "dados_compras.json"
purchase_file = pd.read_json(load_file, orient = "records")
purchase_file['Compras'] = 1
purchase_file.head()

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor,Compras
0,Aelalis34,38,Masculino,165,Bone Crushing Silver Skewer,3.37,1
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32,1
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46,1
3,Pheusrical25,21,Masculino,92,Final Critic,1.36,1
4,Aela59,23,Masculino,63,Stormfury Mace,1.27,1


## Contagem de Consumidores

In [174]:
purchase_grouped = purchase_file.groupby("Login").agg(
    {
        'Valor': 'sum', 
        'Compras': 'sum'
    }
)

total_consumers = len(purchase_grouped)

print(f'Número total de consumidores: {total_consumers}')

purchase_grouped.head()

Número total de consumidores: 573


Unnamed: 0_level_0,Valor,Compras
Login,Unnamed: 1_level_1,Unnamed: 2_level_1
Adairialis76,2.46,1
Aduephos78,6.7,3
Aeduera68,5.8,3
Aela49,2.46,1
Aela59,1.27,1


## Análise Geral de Compras

In [98]:
print(f'Número de itens exclusivos: {len(purchase_file["Item ID"].unique())}')

print('Preço médio de compra: R${0:.2f}'.format(purchase_file["Valor"].mean()))
total_buys = len(purchase_file)
print(f'Número total de compras: {total_buys}')

print('Rendimento total: R${0:.2f}'.format(purchase_file["Valor"].sum()))

Número de itens exclusivos: 183
Preço médio de compra: R$2.93
Número total de compras: 780
Rendimento total: R$2286.33


## Informações Demográfica por gênero

In [99]:
genders_groups = {}

def gender_info(gender):
    genders_groups[gender] = purchase_file[purchase_file['Sexo'] == gender]
    gender_group = genders_groups[gender].groupby(['Login'])
    num_gender = len(gender_group)
    pct_gender = num_gender / total_consumers
    print('----------------------')
    print(f'Compradores {gender}')
    print(f'Quantidade: {num_gender}')
    print('Porcentagem: {0:.2f}%'.format(pct_gender * 100))
    print('----------------------')

# Male buyer percentage and count
gender_info('Masculino')

# Female buyer percentage and count
gender_info('Feminino')

# Other buyer percentage and count
gender_info('Outro / Não Divulgado')

----------------------
Compradores Masculino
Quantidade: 465
Porcentagem: 81.15%
----------------------
----------------------
Compradores Feminino
Quantidade: 100
Porcentagem: 17.45%
----------------------
----------------------
Compradores Outro / Não Divulgado
Quantidade: 8
Porcentagem: 1.40%
----------------------


## Análise de Compras Por Gênero

In [100]:
def gender_analysis(gender):
    num_gender_buys = len(purchase_file[purchase_file['Sexo'] ==  gender])
    buy_mean_price = len(genders_groups[gender]) / total
    print('----------------------')
    print(f'Compradores {gender}')
    print(f'Número de compras: {len(genders_groups[gender])}')
    print('Preço médio de compra: R${0:.2f}'.format(genders_groups[gender]["Valor"].mean()))
    print('Valor total de compra: R${0:.2f}'.format(genders_groups[gender]["Valor"].sum()))
    for age in range(10, 110, 10):
        age_range = [(age - 10), age]
        print('Valor de compra [{0}-{1} anos]: R${2:.2f}'
              .format(
                  age_range[0], 
                  age_range[1], 
                  genders_groups[gender][(genders_groups[gender]["Idade"] >= age_range[0]) 
                                         & (genders_groups[gender]["Idade"] < age_range[1])]["Valor"].sum()
              ))
    print('----------------------')

# Male buy analysis
gender_analysis('Masculino')

# Female buy analysis
gender_analysis('Feminino')

# Other buy analysis
gender_analysis('Outro / Não Divulgado')

----------------------
Compradores Masculino
Número de compras: 633
Preço médio de compra: R$2.95
Valor total de compra: R$1867.68
Valor de compra [0-10 anos]: R$65.04
Valor de compra [10-20 anos]: R$386.36
Valor de compra [20-30 anos]: R$1120.68
Valor de compra [30-40 anos]: R$249.76
Valor de compra [40-50 anos]: R$45.84
Valor de compra [50-60 anos]: R$0.00
Valor de compra [60-70 anos]: R$0.00
Valor de compra [70-80 anos]: R$0.00
Valor de compra [80-90 anos]: R$0.00
Valor de compra [90-100 anos]: R$0.00
----------------------
----------------------
Compradores Feminino
Número de compras: 136
Preço médio de compra: R$2.82
Valor total de compra: R$382.91
Valor de compra [0-10 anos]: R$18.42
Valor de compra [10-20 anos]: R$93.01
Valor de compra [20-30 anos]: R$210.25
Valor de compra [30-40 anos]: R$53.32
Valor de compra [40-50 anos]: R$7.91
Valor de compra [50-60 anos]: R$0.00
Valor de compra [60-70 anos]: R$0.00
Valor de compra [70-80 anos]: R$0.00
Valor de compra [80-90 anos]: R$0.00
V

## Consumidores Mais Populares (Top 5)

In [175]:
# Top buyers dataframe
purchase_grouped['Preço médio'] = purchase_grouped['Valor'] / purchase_grouped['Compras']

top_buyers = purchase_grouped.sort_values('Valor', ascending=False)
print(top_buyers.head())

top_itens_grouped = purchase_file.groupby("Item ID")['Item ID'].count()

# Top itens dataframe
top_itens_grouped.sort_values(ascending=False)[:5]

             Valor  Compras  Preço médio
Login                                   
Undirrala66  17.06        5     3.412000
Saedue76     13.56        4     3.390000
Mindimnya67  12.74        4     3.185000
Haellysu29   12.73        3     4.243333
Eoda93       11.58        3     3.860000


Item ID
84     11
39     11
31      9
34      9
175     9
Name: Item ID, dtype: int64

## Itens Mais Populares

## Itens Mais Lucrativos