# <font color='blue'>Data Science Academy - Python Fundamentos - Capítulo 7</font>

## Download: http://github.com/dsacademybr

In [42]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.8.3


## Missão: Analisar o Comportamento de Compra de Consumidores.

## Nível de Dificuldade: Alto

Você recebeu a tarefa de analisar os dados de compras de um web site! Os dados estão no formato JSON e disponíveis junto com este notebook.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos no arquivo JSON.

Seu trabalho é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Mas nesta missão você vai analisar o comportamento de compra dos consumidores usando o pacote Pandas da linguagem Python e seu relatório final deve incluir cada um dos seguintes itens:

** Contagem de Consumidores **

* Número total de consumidores


** Análise Geral de Compras **

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


** Informações Demográficas Por Gênero **

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


** Análise de Compras Por Gênero **

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras por faixa etária


** Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela): **

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


** Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra
* Itens mais lucrativos


** Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


** Como considerações finais: **

* Seu script deve funcionar para o conjunto de dados fornecido.
* Você deve usar a Biblioteca Pandas e o Jupyter Notebook.


In [43]:
# Imports
import pandas as pd
import numpy as np

In [44]:
# Carrega o arquivo
load_file = "dados_compras.json"
purchase_file = pd.read_json(load_file, orient = "records")
purchase_file.head()

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor
0,Aelalis34,38,Masculino,165,Bone Crushing Silver Skewer,3.37
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46
3,Pheusrical25,21,Masculino,92,Final Critic,1.36
4,Aela59,23,Masculino,63,Stormfury Mace,1.27


## Informações Sobre os Consumidores

In [45]:
# Implemente aqui sua solução
uniques = purchase_file['Login']
uniques = uniques.drop_duplicates() # limpeza dos dados duplicados
consumers = uniques.count() # contagem dos consumidores
pd.DataFrame({'Total de consumidores': [consumers]}) # transformação para dataframe


Unnamed: 0,Total de consumidores
0,573


## Análise Geral de Compras

In [75]:
# Número de itens exclusivos
items = purchase_file['Item ID'].drop_duplicates()
exclusive_items = items.count()

# Número total de compras
total_purchase = purchase_file.shape[0]

# Rendimento total
total_yeld = purchase_file['Valor'].sum()

# Preço médio de compra
average_purchase = total_yeld / total_purchase

# Dataframe
general_analysis = pd.DataFrame({
'Itens exclusivos': [exclusive_items], 
'Total de compras': [total_purchase], 
'Valor total': [total_yeld], 
'Valor médio': [average_purchase]}, index=['Compras'])

# Formatação dos dados
general_analysis['Valor total'] = general_analysis['Valor total'].map("${:,.2f}".format)
general_analysis['Valor médio'] = general_analysis['Valor médio'].map("${:,.2f}".format)
general_analysis

Unnamed: 0,Itens exclusivos,Total de compras,Valor total,Valor médio
Compras,183,780,"$2,286.33",$2.93


## Análise Demográfica

In [76]:
# Porcentagem e contagem de compradores masculinos
consumers_masc = purchase_file.loc[:, ['Login', 'Sexo']]
consumers_masc = consumers_masc.drop_duplicates()
consumers_masc = consumers_masc[consumers_masc['Sexo'] == 'Masculino'].shape[0]
percent_masc = (consumers_masc / consumers)*100


# Porcentagem e contagem de compradores do sexo feminino
consumers_fem = purchase_file.loc[:, ['Login', 'Sexo']]
consumers_fem = consumers_fem.drop_duplicates()
consumers_fem = consumers_fem[consumers_fem['Sexo'] == 'Feminino'].shape[0]
percent_fem = (consumers_fem / consumers)*100

# Porcentagem e contagem de outros / não divulgados
consumers_others = purchase_file.loc[:, ['Login', 'Sexo']]
consumers_others = consumers_others.drop_duplicates()
consumers_others = consumers_others[consumers_others['Sexo'] == 'Outro / Não Divulgado'].shape[0]
percent_others = (consumers_others / consumers)*100 

# Dataframe 
demographic_analysis = pd.DataFrame({
'Masculino': [consumers_masc, percent_masc], 
'Feminino':[consumers_fem, percent_fem], 
'Outros': [consumers_others, percent_others]}, index=['Total', 'Percentual'])

# Formatação dos dados
demographic_analysis.iloc[1] = demographic_analysis.iloc[1].map("{:.2f}%".format)
demographic_analysis


Unnamed: 0,Masculino,Feminino,Outros
Total,465,100,8
Percentual,81.15%,17.45%,1.40%


## Informações Demográficas Por Gênero

In [48]:
# Número de compras

# Preço médio de compra
# Valor Total de Compra
# Compras por faixa etária

## Análise de Compras Por Gênero

In [49]:
# Implemente aqui sua solução

## Consumidores Mais Populares (Top 5)

In [50]:
# Implemente aqui sua solução

## Itens Mais Populares

In [51]:
# Implemente aqui sua solução

## Itens Mais Lucrativos

In [52]:
# Implemente aqui sua solução

## Fim

### Obrigado - Data Science Academy - <a href="http://facebook.com/dsacademybr">facebook.com/dsacademybr</a>