<a href="https://colab.research.google.com/github/joyzinhw/analise-de-dados/blob/main/Analise_de_dados_de_compra.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Tarefa: Analisar o Comportamento de Compra de Consumidores.

**GRUPO**

Daniel Araujo,
Hilizangela Tallia,
James Morais,
Joyce Moura.

Você recebeu a tarefa de analisar os dados de compras de um web site! Os dados estão no formato JSON.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos no arquivo JSON.

Seu trabalho é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Mas nesta missão você vai analisar o comportamento de compra dos consumidores na linguagem Python e seu relatório final deve incluir cada um dos seguintes itens:

**Contagem de Compradores**

* Número total de compradores


**Análise Geral de Compras**

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


**Informações Demográficas Por Gênero**

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


**Análise de Compras Por Gênero**

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras for faixa etária


**Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste:**

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


**Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste:**

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


**Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste:**

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


**Como considerações finais:**

* Seu script deve funcionar para o conjunto de dados fornecido.
* Eu sugiro o uso dos pacotes numpy e pandas, porém serão aceitos quaisquer outros pacotes utilizados.
* A biblioteca pandas possui funções implementadas que permitem a realização de quase todas as tarefas desse exercício sem necessidade de utilizar comandos de repetição (for ou while). Portanto procurem as funções desse pacote que melhor auxiliem na resolução dessa atividade.  


In [None]:
# Imports
import pandas as pd
import numpy as np

In [None]:
# Endereco do arquivo
endereco = 'dados_compras.json'

dados_compras = pd.read_json(endereco, orient = "values")
dados_compras.head()#Para ver toda a tabela de valores basta remover o head()

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor
0,Aelalis34,38,Masculino,165,Bone Crushing Silver Skewer,3.37
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46
3,Pheusrical25,21,Masculino,92,Final Critic,1.36
4,Aela59,23,Masculino,63,Stormfury Mace,1.27


In [None]:
#Para acessar as posições da variavel
dados_compras['Login'][0]

'Aelalis34'

## Contagem de Compradores

In [None]:
# Número total de compradores

In [None]:
# Implemente aqui sua solução
total_compradores = len(dados_compras['Login'].unique())
print("Total de compradores:\n", total_compradores)

Total de compradores:
 573


## Análise Geral de Compras

In [None]:
# Número de itens exclusivos
# Preço médio de compra
# Número total de compras
# Rendimento total

In [None]:
# Implemente aqui sua solução
itens_exclusivos = len(dados_compras['Item ID'].unique())
preco_medio_compra = dados_compras['Valor'].mean()
total_compras = len(dados_compras)
rendimento_total = dados_compras['Valor'].sum()

print("Itens exclusivos:\n", itens_exclusivos)
print("Preço medio:\n", preco_medio_compra)
print("Total de compras:\n", total_compras)
print("Rendimento total:\n", rendimento_total)

Itens exclusivos:
 183
Preço medio:
 2.9311923076923074
Total de compras:
 780
Rendimento total:
 2286.33


## Informações Demográficas Por Gênero

In [None]:
# Porcentagem e contagem de compradores masculinos
# Porcentagem e contagem de compradores do sexo feminino
# Porcentagem e contagem de outros / não divulgados

In [None]:
# Implemente aqui sua solução

contagem_genero = dados_compras['Sexo'].value_counts()
porcentagem_genero = (contagem_genero / total_compradores) * 100

print("\nInformações Demográficas Por Gênero:")
print(contagem_genero, "\n")
print(porcentagem_genero, "\n")


Informações Demográficas Por Gênero:
Sexo
Masculino                633
Feminino                 136
Outro / Não Divulgado     11
Name: count, dtype: int64 

Sexo
Masculino                110.471204
Feminino                  23.734729
Outro / Não Divulgado      1.919721
Name: count, dtype: float64 



## Análise de Compras Por Gênero

In [None]:
# Número de compras
# Preço médio de compra
# Valor Total de Compra
# Compras por faixa etária

In [None]:
# Implemente aqui sua solução
compras_por_genero = dados_compras.groupby('Sexo')['Item ID'].count()
preco_medio_por_genero = dados_compras.groupby('Sexo')['Valor'].mean()
valor_total_por_genero = dados_compras.groupby('Sexo')['Valor'].sum()

print("Número de compras por gênero:")
print(compras_por_genero)
print("\nPreço médio de compra por gênero:")
print(preco_medio_por_genero)
print("\nValor Total de Compra por gênero:")
print(valor_total_por_genero)

faixas_etarias = pd.cut(dados_compras['Idade'], bins=[0, 18, 25, 35, 45, 55, 65, 100],
                        labels=['<18', '18-24', '25-34', '35-44', '45-54', '55-64', '65+'])

dados_compras['Faixa Etária'] = faixas_etarias
compras_por_faixa_etaria = dados_compras.groupby('Faixa Etária')['Item ID'].count()

print("\nNúmero de compras por faixa etária:")
print(compras_por_faixa_etaria)


Número de compras por gênero:
Sexo
Feminino                 136
Masculino                633
Outro / Não Divulgado     11
Name: Item ID, dtype: int64

Preço médio de compra por gênero:
Sexo
Feminino                 2.815515
Masculino                2.950521
Outro / Não Divulgado    3.249091
Name: Valor, dtype: float64

Valor Total de Compra por gênero:
Sexo
Feminino                  382.91
Masculino                1867.68
Outro / Não Divulgado      35.74
Name: Valor, dtype: float64

Número de compras por faixa etária:
Faixa Etária
<18      174
18-24    425
25-34    134
35-44     47
45-54      0
55-64      0
65+        0
Name: Item ID, dtype: int64


## Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste:

In [None]:
# Login
# Número de compras
# Preço médio de compra
# Valor Total de Compra
# Itens mais populares

In [None]:
# Implemente aqui sua solução


total_por_comprador = dados_compras.groupby('Login')['Valor'].sum()
top_5_compradores = total_por_comprador.nlargest(5)
print("Os 5 principais compradores pelo valor total de compra:")
print(top_5_compradores, '\n')


for comprador in top_5_compradores.index:
    compras_comprador = dados_compras[dados_compras['Login'] == comprador]
    numero_de_compras = compras_comprador.shape[0]
    preco_medio = compras_comprador['Valor'].mean()
    valor_total = top_5_compradores[comprador]
    itens_populares = compras_comprador['Nome do Item'].value_counts().head(3)


    print("\nComprador:", comprador)
    print("\n Número de compras:", numero_de_compras)
    print("\nPreço médio de compra: ${:.2f}".format(preco_medio))
    print("\nValor Total de Compra: ${:.2f}".format(valor_total))
    print("\n\nItens mais populares:")
    print(itens_populares)




Os 5 principais compradores pelo valor total de compra:
Login
Undirrala66    17.06
Saedue76       13.56
Mindimnya67    12.74
Haellysu29     12.73
Eoda93         11.58
Name: Valor, dtype: float64 


Comprador: Undirrala66

 Número de compras: 5

Preço médio de compra: $3.41

Valor Total de Compra: $17.06


Itens mais populares:
Nome do Item
Blood Infused Guardian        1
Spectral Diamond Doomblade    1
Piece Maker                   1
Name: count, dtype: int64

Comprador: Saedue76

 Número de compras: 4

Preço médio de compra: $3.39

Valor Total de Compra: $13.56


Itens mais populares:
Nome do Item
Serenity                        1
Striker                         1
Thorn, Satchel of Dark Souls    1
Name: count, dtype: int64

Comprador: Mindimnya67

 Número de compras: 4

Preço médio de compra: $3.18

Valor Total de Compra: $12.74


Itens mais populares:
Nome do Item
Striker                 1
Thunderfury Scimitar    1
Fiery Glass Crusader    1
Name: count, dtype: int64

Comprador: Haell

## Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste:

In [None]:
# ID do item
# Nome do item
# Número de compras
# Preço do item
# Valor Total de Compra

In [None]:
# Implemente aqui sua solução

contagem_compras = dados_compras['Item ID'].value_counts()
top_5_itens = contagem_compras.head(5)

for item_id, compras in top_5_itens.items():
    item_info = dados_compras[dados_compras['Item ID'] == item_id].iloc[0]
    nome_item = item_info['Nome do Item']
    preco_item = item_info['Valor']
    valor_total_compra = preco_item * compras


    print("ID do item:", item_id)
    print("Nome do item:", nome_item)
    print("Número de compras:", compras)
    print("Preço do item:", preco_item)
    print("Valor Total de Compra:", valor_total_compra)
    print("\n")



ID do item: 39
Nome do item: Betrayal, Whisper of Grieving Widows
Número de compras: 11
Preço do item: 2.35
Valor Total de Compra: 25.85


ID do item: 84
Nome do item: Arcane Gem
Número de compras: 11
Preço do item: 2.23
Valor Total de Compra: 24.53


ID do item: 175
Nome do item: Woeful Adamantite Claymore
Número de compras: 9
Preço do item: 1.24
Valor Total de Compra: 11.16


ID do item: 13
Nome do item: Serenity
Número de compras: 9
Preço do item: 1.49
Valor Total de Compra: 13.41


ID do item: 31
Nome do item: Trickster
Número de compras: 9
Preço do item: 2.07
Valor Total de Compra: 18.63




## Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste:

In [None]:
# ID do item
# Nome do item
# Número de compras
# Preço do item
# Valor Total de Compra

In [None]:
# Implemente aqui sua solução

itens_mais_lucrativos = dados_compras.groupby(['Item ID', 'Nome do Item']).agg({'Valor': 'sum', 'Item ID': 'count'}).rename(columns={'Item ID': 'Número de compras', 'Valor': 'Valor Total de Compra'}).sort_values(by='Valor Total de Compra', ascending=False).head(5)

print("Os 5 itens mais lucrativos pelo valor total de compra são:")
print(itens_mais_lucrativos)



Os 5 itens mais lucrativos pelo valor total de compra são:
                                    Valor Total de Compra  Número de compras
Item ID Nome do Item                                                        
34      Retribution Axe                             37.26                  9
115     Spectral Diamond Doomblade                  29.75                  7
32      Orenmir                                     29.70                  6
103     Singed Scalpel                              29.22                  6
107     Splitter, Foe Of Subtlety                   28.88                  8
