# <font color='blue'>Data Science Academy - Python Fundamentos - Capítulo 7</font>

## Download: http://github.com/dsacademybr

## Missão: Analisar o Comportamento de Compra de Consumidores.

## Nível de Dificuldade: Alto

Você recebeu a tarefa de analisar os dados de compras de um web site! Os dados estão no formato JSON e disponíveis junto com este notebook.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos no arquivo JSON.

Seu trabalho é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Mas nesta missão você vai analisar o comportamento de compra dos consumidores usando o pacote Pandas da linguagem Python e seu relatório final deve incluir cada um dos seguintes itens:

** Contagem de Consumidores **

* Número total de consumidores


** Análise Geral de Compras **

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


** Informações Demográficas Por Gênero **

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


** Análise de Compras Por Gênero **

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras for faixa etária


** Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela): **

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


** Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra
* Itens mais lucrativos


** Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


** Como considerações finais: **

* Seu script deve funcionar para o conjunto de dados fornecido.
* Você deve usar a Biblioteca Pandas e o Jupyter Notebook.


In [1]:
# Imports
import pandas as pd
import numpy as np

In [2]:
# Carrega o arquivo
load_file = "dados_compras.json"
purchase_file = pd.read_json(load_file, orient = "records")
purchase_file.head()

Unnamed: 0,Login,Idade,Sexo,Item ID,Nome do Item,Valor
0,Aelalis34,38,Masculino,165,Bone Crushing Silver Skewer,3.37
1,Eolo46,21,Masculino,119,"Stormbringer, Dark Blade of Ending Misery",2.32
2,Assastnya25,34,Masculino,174,Primitive Blade,2.46
3,Pheusrical25,21,Masculino,92,Final Critic,1.36
4,Aela59,23,Masculino,63,Stormfury Mace,1.27


# Informações Sobre os Consumidores

### Número total de consumidores

In [3]:
total_consumers = purchase_file.groupby(['Login'], as_index=False).size().count()

print('O número total de consumidores é:', total_consumers)

O número total de consumidores é: 573


# Análise Geral de Compras

### Número de itens exclusivos

In [4]:
count_exclusive_itens = purchase_file.groupby(['Item ID'], as_index=False).size().count()

print('O número de itens exclusivos é:', count_exclusive_itens)

O número de itens exclusivos é: 183


### Preço médio de compra

In [5]:
average_purchase_price = purchase_file['Valor'].mean()

print('O preço médio da compra é: {:0.3f}'.format(average_purchase_price))

O preço médio da compra é: 2.931


### Número total de compras

In [6]:
# I remove the duplicates rows in the DataFrame, then I get the shape in position 0
total_purchases = purchase_file.drop_duplicates().shape[0]

print('O número total de compras é:', total_purchases)

O número total de compras é: 777


### Rendimento total

In [17]:
total_income = purchase_file['Valor'].sum()

print('O rendimento total é: R$', total_income)

O rendimento total é: R$ 2286.33


# Informações Demográficas Por Gênero

In [154]:
genres = purchase_file.groupby(['Sexo'], as_index=False).size()
# Posição 0: Masculino, Posição 1: Feminino, Posição 2: outros / não divulgados

### Porcentagem e contagem de compradores masculinos

In [152]:
male_percentage = (genres[1] / (genres[0] + genres[1] + genres[2])) * 100
male_count = genres[1]

print('A porcentagem de compradores masculinos é: {:0.2f}% e a contagem é: {}'.format(male_percentage, male_count))

A porcentagem de compradores masculinos é: 81.15% e a contagem é: 633


### Porcentagem e contagem de compradores do sexo feminino

In [151]:
female_percentage = (genres[0] / (genres[0] + genres[1] + genres[2])) * 100
female_count = genres[0]

print('A porcentagem de compradores femininos é: {:0.2f}% e a contagem é: {}'.format(female_percentage, female_count))

A porcentagem de compradores femininos é: 17.44% e a contagem é: 136


### Porcentagem e contagem de outros / não divulgados

In [153]:
others_percentage = (genres[2] / (genres[0] + genres[1] + genres[2])) * 100
others_count = genres[2]

print('A porcentagem de compradores não divulgados é: {:0.2f}% e a contagem é: {}'.format(others_percentage, others_count))

A porcentagem de compradores não divulgados é: 1.41% e a contagem é: 11


## Análise de Compras Por Gênero

### Número de compras

In [190]:
def func(x):
    if x == 'Masculino':
        return True

genres = purchase_file.groupby(['Login', 'Sexo'], as_index=False).size()

genres

#genres = genres.aggregate(lambda x: x == "Masculino", axis=0)

#genres

Login         Sexo     
Adairialis76  Masculino    1
Aduephos78    Masculino    3
Aeduera68     Masculino    3
Aela49        Masculino    1
Aela59        Masculino    1
                          ..
Yasurra52     Feminino     1
Yathecal72    Masculino    2
Yathecal82    Masculino    1
Zhisrisu83    Masculino    2
Zontibe81     Masculino    1
Length: 573, dtype: int64

### Preço médio de compra

### Valor Total de Compra

### Compras for faixa etária

# Consumidores Mais Populares (Top 5)

In [10]:
# Implemente aqui sua solução

# Itens Mais Populares

In [11]:
# Implemente aqui sua solução

# Itens Mais Lucrativos

In [12]:
# Implemente aqui sua solução

## Fim

### Obrigado - Data Science Academy - <a href="http://facebook.com/dsacademybr">facebook.com/dsacademybr</a>