# <font color='blue'>Como Analisar o Comportamento de Compra de Consumidores.</font>

## Compras de um Web Site

O nosso objetivo será analisar os dados de compras de um site! Os dados estão no formato JSON.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos neste arquivo JSON.

O objetivo é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Iremos analisar o comportamento de compra dos consumidores utilizado o pacote Pandas do Python contendo a resposta para os seguintes itens:

** Contagem de Compradores **

* Número total de compradores


** Análise Geral de Compras **

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


** Informações Demográficas Por Gênero **

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


** Análise de Compras Por Gênero **

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras for faixa etária


** Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela): **

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


** Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra
* Itens mais lucrativos


** Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra

In [1]:
# Imports
import pandas as pd
import numpy as np

In [2]:
# Carregando o arquivo
arquivo_compras = pd.read_json('https://docs.google.com/uc?export=download&id=1OaUZkbS0FqpqeUiiz-yx28O6dIqWwZBH', orient = "records")
arquivo_compras.head(10)

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor
0,Aelalis34,38,Masculino,164,Bone Crushing Silver Skewer,3.37
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46
3,Pheusrical25,21,Masculino,92,Final Critic,1.36
4,Aela59,23,Masculino,63,Stormfury Mace,1.27
5,Tanimnya91,20,Masculino,10,Sleepwalker,1.73
6,Undjaskla97,20,Masculino,153,Mercenary Sabre,4.57
7,Iathenudil29,29,Feminino,169,"Interrogator, Blood Blade of the Queen",3.32
8,Sondenasta63,25,Masculino,118,"Ghost Reaver, Longsword of Magic",2.77
9,Hilaerin92,31,Masculino,99,"Expiration, Warscythe Of Lost Worlds",4.53


## Informações Sobre os Compradores

In [3]:
compradores = arquivo_compras.loc[:, ["Sexo", "Login", "Idade"]]
compradores.head()

Unnamed: 0,Sexo,Login,Idade
0,Masculino,Aelalis34,38
1,Masculino,Eolo46,21
2,Masculino,Assastnya25,34
3,Masculino,Pheusrical25,21
4,Masculino,Aela59,23


In [4]:
# Limpeza dos dados e remoção de duplicatas
compradores = compradores.drop_duplicates()
contagem_compradores = compradores.count()[0]
contagem_compradores

573

In [5]:
# Converter saída para DF para uso posterior em análise
pd.DataFrame({"Total de Compradores" : [contagem_compradores]})

Unnamed: 0,Total de Compradores
0,573


## Análise de Compra

In [6]:
# Cálculos básicos
media_preco_item = arquivo_compras["Valor"].mean()
total_preco_item = arquivo_compras["Valor"].sum()
total_item = arquivo_compras["Valor"].count()
id_item = len(arquivo_compras["Item ID"].unique())

# Dataframe para os resultados
resumo_calculos = pd.DataFrame({"Número de Itens Únicos" : id_item,
                                     "Número de Compras" : total_item, 
                                     "Total de Vendas" : total_preco_item, 
                                     "Preço Médio" : [media_preco_item]})

# Data Munging
resumo_calculos = resumo_calculos.round(2)
resumo_calculos ["Preço Médio"] = resumo_calculos["Preço Médio"].map("${:,.2f}".format)
resumo_calculos ["Total de Vendas"] = resumo_calculos["Total de Vendas"].map("${:,.2f}".format)
resumo_calculos = resumo_calculos.loc[:, ["Número de Itens Únicos", "Preço Médio", "Número de Compras", "Total de Vendas"]]

resumo_calculos

Unnamed: 0,Número de Itens Únicos,Preço Médio,Número de Compras,Total de Vendas
0,183,$2.93,780,"$2,286.33"


## Informações por Gênero

In [8]:
# Cálculos básicos
contagem_genero = compradores["Sexo"].value_counts()
percentual_genero = (contagem_genero / contagem_compradores) * 100

# Dataframe para os resultados
generos = pd.DataFrame({"Sexo" : contagem_genero, 
                                    "%" : percentual_genero})

# Data Munging
generos = generos.round(2)
generos ["%"] = generos["%"].map("{:,.1f}%".format)

In [9]:
# Exibindo a contagem de generos(Masculino/Feminino)
contagem_genero

Masculino                465
Feminino                 100
Outro / Não Divulgado      8
Name: Sexo, dtype: int64

In [10]:
# Exibindo o percentual de generos(Masculino/Feminino)
percentual_genero

Masculino                81.151832
Feminino                 17.452007
Outro / Não Divulgado     1.396161
Name: Sexo, dtype: float64

In [11]:
# Exibindo todos
generos

Unnamed: 0,Sexo,%
Masculino,465,81.2%
Feminino,100,17.4%
Outro / Não Divulgado,8,1.4%


## Análise de Compra Por Gênero

In [12]:
# Agrupamentos
total_preco_itens_por_genero = arquivo_compras.groupby(["Sexo"]).sum()["Valor"].rename("Total de Vendas")
media_preco_itens_por_genero = arquivo_compras.groupby(["Sexo"]).mean()["Valor"].rename("Average Price")
contagem_compra = arquivo_compras.groupby(["Sexo"]).count()["Valor"].rename("Número de Compras")
total = total_preco_itens_por_genero / generos["Sexo"]

# Armazenando o resultado em um Dataframe
analise_compra_por_generos = pd.DataFrame({"Número de Compras" : contagem_compra, 
                                           "Valor Médio Por Item" : media_preco_itens_por_genero, 
                                           "Total de Vendas" : total_preco_itens_por_genero, 
                                           "Total Normalizado" : total})

# Manipulação de Dados
analise_compra_por_generos = analise_compra_por_generos.round(2)
analise_compra_por_generos ["Valor Médio Por Item"] = analise_compra_por_generos["Valor Médio Por Item"].map("${:,.2f}".format)
analise_compra_por_generos ["Total de Vendas"] = analise_compra_por_generos["Total de Vendas"].map("${:,.2f}".format)
analise_compra_por_generos ["Total Normalizado"] = analise_compra_por_generos["Total Normalizado"].map("${:,.2f}".format)

In [13]:
# Resultado
total_preco_itens_por_genero

Sexo
Feminino                  382.91
Masculino                1867.68
Outro / Não Divulgado      35.74
Name: Total de Vendas, dtype: float64

In [14]:
# Resultado
media_preco_itens_por_genero

Sexo
Feminino                 2.815515
Masculino                2.950521
Outro / Não Divulgado    3.249091
Name: Average Price, dtype: float64

In [15]:
# Resultado
analise_compra_por_generos

Unnamed: 0,Número de Compras,Valor Médio Por Item,Total de Vendas,Total Normalizado
Feminino,136,$2.82,$382.91,$3.83
Masculino,633,$2.95,"$1,867.68",$4.02
Outro / Não Divulgado,11,$3.25,$35.74,$4.47


In [16]:
# Resultado
total

Feminino                 3.829100
Masculino                4.016516
Outro / Não Divulgado    4.467500
dtype: float64

## Análise Demográfica

In [17]:
# Cálculos básicos
idade_bins = [0, 9.99, 14.99, 19.99, 24.99, 29.99, 34.99, 39.99, 999]
idade_categoria = ["Menos de 10", "10 a 14", "15 a 19", "20 a 24", "25 a 29", "30 a 34", "35 a 39", "Mais de 40"]

arquivo_compras["Range de Idades"] = pd.cut(arquivo_compras["Idade"], idade_bins, labels=idade_categoria)

# Cálculos básicos
contagem_idade = arquivo_compras["Range de Idades"].value_counts()
media_preco_item_por_idade = arquivo_compras.groupby(["Range de Idades"]).mean()["Valor"]
total_preco_item_por_idade = arquivo_compras.groupby(["Range de Idades"]).sum()["Valor"]
percentual_por_idade = (contagem_idade / contagem_compradores) * 100

# Dataframe para os resultados
idade = pd.DataFrame({"Contagem": contagem_idade, "%": percentual_por_idade, "Valor Unitario": media_preco_item_por_idade, "Valor Total de Compra": total_preco_item_por_idade})

# Manipulação de Dados
idade ["Valor Unitario"] = idade["Valor Unitario"].map("${:,.2f}".format)
idade ["Valor Total de Compra"] = idade["Valor Total de Compra"].map("${:,.2f}".format)
idade ["%"] = idade["%"].map("{:,.2f}%".format)

In [18]:
# Resultado
idade = idade.sort_index()
idade

Unnamed: 0,Contagem,%,Valor Unitario,Valor Total de Compra
Menos de 10,28,4.89%,$2.98,$83.46
10 a 14,35,6.11%,$2.77,$96.95
15 a 19,133,23.21%,$2.91,$386.42
20 a 24,336,58.64%,$2.91,$978.77
25 a 29,125,21.82%,$2.96,$370.33
30 a 34,64,11.17%,$3.08,$197.25
35 a 39,42,7.33%,$2.84,$119.40
Mais de 40,17,2.97%,$3.16,$53.75


## Maiores Compradores (Quem mais gastou)

In [19]:
# Cálculos básicos
total_compras = arquivo_compras.groupby(["Login"]).sum()["Valor"].rename("Valor Total de Compra")
media_compras = arquivo_compras.groupby(["Login"]).mean()["Valor"].rename("Valor Médio de Compra")
numero_compras = arquivo_compras.groupby(["Login"]).count()["Valor"].rename("Número de Compras")

# Dataframe para os resultados
dados_usuarios = pd.DataFrame({"Valor Total de Compra": total_compras, "Valor Médio de Compra": media_compras, "Número de Compras": numero_compras})

# Manipulação de Dados
dados_usuarios ["Valor Total de Compra"] = dados_usuarios["Valor Total de Compra"].map("${:,.2f}".format)
dados_usuarios ["Valor Médio de Compra"] = dados_usuarios["Valor Médio de Compra"].map("${:,.2f}".format)
dados_usuarios.sort_values("Valor Total de Compra", ascending=False).head(10)

Unnamed: 0_level_0,Valor Total de Compra,Valor Médio de Compra,Número de Compras
Login,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Qarwen67,$9.97,$2.49,4
Sondim43,$9.38,$3.13,3
Tillyrin30,$9.19,$3.06,3
Lisistaya47,$9.19,$3.06,3
Tyisriphos58,$9.18,$4.59,2
Frichaya88,$9.16,$3.05,3
Assassasta79,$9.12,$4.56,2
Lisossan98,$9.10,$4.55,2
Yadanun74,$9.09,$3.03,3
Mindirra92,$9.01,$3.00,3


In [20]:
# Resultado 
dados_usuarios

Unnamed: 0_level_0,Valor Total de Compra,Valor Médio de Compra,Número de Compras
Login,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Adairialis76,$2.46,$2.46,1
Aduephos78,$6.70,$2.23,3
Aeduera68,$5.80,$1.93,3
Aela49,$2.46,$2.46,1
Aela59,$1.27,$1.27,1
...,...,...,...
Yasurra52,$3.14,$3.14,1
Yathecal72,$7.77,$3.88,2
Yathecal82,$2.41,$2.41,1
Zhisrisu83,$2.46,$1.23,2


## Itens Mais Populares

In [21]:
# Cálculos básicos
total_compras = arquivo_compras.groupby(["Nome do Item"]).sum()["Valor"].rename("Valor Total de Compra")
media_compras = arquivo_compras.groupby(["Nome do Item"]).mean()["Valor"].rename("Valor Médio de Compra")
numero_compras = arquivo_compras.groupby(["Nome do Item"]).count()["Valor"].rename("Número de Compras")

# Dataframe para os resultados
dados_usuarios = pd.DataFrame({"Valor Total de Compra": total_compras, "Valor Médio de Compra": media_compras, "Número de Compras": numero_compras})

# Manipulação de Dados
dados_usuarios ["Valor Total de Compra"] = dados_usuarios["Valor Total de Compra"].map("${:,.2f}".format)
dados_usuarios ["Valor Médio de Compra"] = dados_usuarios["Valor Médio de Compra"].map("${:,.2f}".format)
dados_usuarios.sort_values("Número de Compras", ascending=False).head(5)

Unnamed: 0_level_0,Valor Total de Compra,Valor Médio de Compra,Número de Compras
Nome do Item,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Final Critic,$38.60,$2.76,14
Arcane Gem,$24.53,$2.23,11
"Betrayal, Whisper of Grieving Widows",$25.85,$2.35,11
Stormcaller,$34.65,$3.47,10
Woeful Adamantite Claymore,$11.16,$1.24,9


## Itens Mais Lucrativos

In [22]:
# Cálculos básicos
total_compras = arquivo_compras.groupby(["Nome do Item"]).sum()["Valor"].rename("Valor Total de Compra")
media_compras = arquivo_compras.groupby(["Nome do Item"]).mean()["Valor"].rename("Valor Médio de Compra")
numero_compras = arquivo_compras.groupby(["Nome do Item"]).count()["Valor"].rename("Número de Compras")

# Dataframe para os resultados
dados_usuarios = pd.DataFrame({"Valor Total de Compra": total_compras, "Valor Médio de Compra": media_compras, \
                          "Número de Compras": numero_compras})

# Manipulação de Dados
dados_usuarios ["Valor Total Compra"] = dados_usuarios["Valor Total de Compra"]
dados_usuarios ["Valor Total de Compra"] = dados_usuarios["Valor Total de Compra"].map("${:,.2f}".format)
dados_usuarios ["Valor Médio de Compra"] = dados_usuarios["Valor Médio de Compra"].map("${:,.2f}".format)


display(dados_usuarios.sort_values("Valor Total Compra", ascending=False).head(5)[ \
    ['Valor Total de Compra','Valor Médio de Compra','Número de Compras']])

Unnamed: 0_level_0,Valor Total de Compra,Valor Médio de Compra,Número de Compras
Nome do Item,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Final Critic,$38.60,$2.76,14
Retribution Axe,$37.26,$4.14,9
Stormcaller,$34.65,$3.47,10
Spectral Diamond Doomblade,$29.75,$4.25,7
Orenmir,$29.70,$4.95,6
