# <font color='blue'>Data Science Academy - Python Fundamentos - Capítulo 7</font>

## Download: http://github.com/dsacademybr

## Missão: Analisar o Comportamento de Compra de Consumidores.

## Nível de Dificuldade: Alto

Você recebeu a tarefa de analisar os dados de compras de um web site! Os dados estão no formato JSON e disponíveis junto com este notebook.

No site, cada usuário efetua login usando sua conta pessoal e pode adquirir produtos à medida que navega pela lista de produtos oferecidos. Cada produto possui um valor de venda. Dados de idade e sexo de cada usuário foram coletados e estão fornecidos no arquivo JSON.

Seu trabalho é entregar uma análise de comportamento de compra dos consumidores. Esse é um tipo de atividade comum realizado por Cientistas de Dados e o resultado deste trabalho pode ser usado, por exemplo, para alimentar um modelo de Machine Learning e fazer previsões sobre comportamentos futuros.

Mas nesta missão você vai analisar o comportamento de compra dos consumidores usando o pacote Pandas da linguagem Python e seu relatório final deve incluir cada um dos seguintes itens:

** Contagem de Consumidores **

* Número total de consumidores


** Análise Geral de Compras **

* Número de itens exclusivos
* Preço médio de compra
* Número total de compras
* Rendimento total


** Informações Demográficas Por Gênero **

* Porcentagem e contagem de compradores masculinos
* Porcentagem e contagem de compradores do sexo feminino
* Porcentagem e contagem de outros / não divulgados


** Análise de Compras Por Gênero **

* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Compras for faixa etária


** Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela): **

* Login
* Número de compras
* Preço médio de compra
* Valor Total de Compra
* Itens mais populares


** Identifique os 5 itens mais populares por contagem de compras e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra
* Itens mais lucrativos


** Identifique os 5 itens mais lucrativos pelo valor total de compra e, em seguida, liste (em uma tabela): **

* ID do item
* Nome do item
* Número de compras
* Preço do item
* Valor Total de Compra


** Como considerações finais: **

* Seu script deve funcionar para o conjunto de dados fornecido.
* Você deve usar a Biblioteca Pandas e o Jupyter Notebook.


In [1]:
# Imports
import pandas as pd
import numpy as np

In [71]:
# Carrega o arquivo
load_file = "dados_compras.json"
purchase_file = pd.read_json(load_file, orient = "records")
purchase_file.head()

Unnamed: 0,Idade,Item ID,Login,Nome do Item,Sexo,Valor
0,38,165,Aelalis34,Bone Crushing Silver Skewer,Masculino,3.37
1,21,119,Eolo46,"Stormbringer, Dark Blade of Ending Misery",Masculino,2.32
2,34,174,Assastnya25,Primitive Blade,Masculino,2.46
3,21,92,Pheusrical25,Final Critic,Masculino,1.36
4,23,63,Aela59,Stormfury Mace,Masculino,1.27


## Informações Sobre os Consumidores

In [72]:
# - Número total de consumidores

total_of_consumers = purchase_file.Login.count()
print(f'Total de consumidores: {total_of_consumers}')

Total de consumidores: 780


## Análise Geral de Compras

In [98]:
# - Número de itens exclusivos

exclusive_itens = []

purchase_file = purchase_file.rename(columns={'Nome do Item':'Nome_do_Item'})

for item in purchase_file.Nome_do_Item:
    if item not in exclusive_itens:
        exclusive_itens.append(item)

print(f'Número de itens exclusivos: {len(exclusive_itens)}')

Número de itens exclusivos: 179


In [107]:
# - Preço médio de compra

sum_of_values = purchase_file.Valor.sum()
media = sum_of_values / purchase_file.Valor.count()
print(f'Preço médio de compra: {media:.3}')

Preço médio de compra: 2.93


In [109]:
# - Número total de compras

print(f'Número total de compras: {purchase_file.Valor.count()}')

Número total de compras: 780


In [111]:
# - Rendimento total

print(f'Rendimento total: {purchase_file.Valor.sum()}')

Rendimento total: 2286.33


## Informações Demográficas Por Gênero

In [150]:
# - Porcentagem e contagem de compradores masculinos

tot_masc = 0
tot_fem = 0
tot_other = 0

for sex in purchase_file.Sexo:
    if sex == 'Masculino':
        tot_masc += 1
    elif sex == 'Feminino':
        tot_fem += 1
    else:
        tot_other += 1

percent_masc = tot_masc / total_of_consumers * 100

print(f'Porcentagem de compradores masculinos: {percent_masc:.1f}%')
print(f'Contagem de compradores masculinos: {tot_masc}')

Porcentagem de compradores masculinos: 81.2%
Contagem de compradores masculinos: 633


In [149]:
# - Porcentagem e contagem de compradores do sexo feminino

percent_fem = tot_fem / total_of_consumers * 100
print(f'Porcentagem de compradores do sexo feminino: {percent_fem:.1f}%')
print(f'Contagem de compradores do sexo feminino: {tot_fem}')

Porcentagem de compradores do sexo feminino: 17.4%
Contagem de compradores do sexo feminino: 136


In [152]:
# - Porcentagem e contagem de outros / não divulgados

percent_other = tot_other / total_of_consumers * 100
print(f'Porcentagem de outros / não divulgados: {percent_other:.1f}%')
print(f'Contagem de outros / não divulgados: {tot_other}')

Porcentagem de outros / não divulgados: 1.4%
Contagem de outros / não divulgados: 11


## Análise de Compras Por Gênero

In [153]:
# - Número de compras

print(f'Número de compras do gênero Masculino: {tot_masc}')
print(f'Número de compras do gênero Feminino: {tot_fem}')
print(f'Número de compras de gêneros outros / não divulgados: {tot_other} ')

Número de compras do gênero Masculino: 633
Número de compras do gênero Feminino: 136
Número de compras de gêneros outros / não divulgados: 11 


In [245]:
# - Preço médio de compra

tot_purchase_all = purchase_file.Valor.sum()
tot_purchase_masc = 0
tot_purchase_fem = 0
tot_purchase_other = 0

for i in range(len(purchase_file)):
    if purchase_file.Sexo[i] == 'Masculino':
        tot_purchase_masc += purchase_file.Valor[i]
    elif purchase_file.Sexo[i] == 'Feminino':
        tot_purchase_fem += purchase_file.Valor[i]
    else:
        tot_purchase_other += purchase_file.Valor[i]

med_price_masc = tot_purchase_masc / tot_masc
med_price_fem = tot_purchase_fem / tot_fem
med_price_other = tot_purchase_other / tot_other

print(f'Preço médio de compra do gênero Masculino: ${med_price_masc:.2f}')
print(f'Preço médio de compra do gênero Feminino: ${med_price_fem:.2f}')
print(f'Preço médio de compra do gênero Outros / Não divulgados: ${med_price_other:.2f}')

Preço médio de compra do gênero Masculino: $2.95
Preço médio de compra do gênero Feminino: $2.82
Preço médio de compra do gênero Outros / Não divulgados: $3.25


In [249]:
# - Valor Total de Compra

print(f'Valor Total de Compra do gênero Masculino: ${tot_purchase_masc:.2f}')
print(f'Valor Total de Compra do gênero Feminino: ${tot_purchase_fem:.2f}')
print(f'Valor Total de Compra do gênero Outros / Não divulgados: ${tot_purchase_other:.2f}')

Valor Total de Compra do gênero Masculino: $1867.68
Valor Total de Compra do gênero Feminino: $382.91
Valor Total de Compra do gênero Outros / Não divulgados: $35.74


In [266]:
# - Compras por faixa etária

tot_purchase_young = 0
tot_purchase_adult = 0
tot_purchase_elderly = 0

for age in purchase_file.Idade:
    if age < 20:
        tot_purchase_young += 1
    elif age < 60:
        tot_purchase_adult += 1
    else: 
        tot_purchase_elderly += 1
        
print(f'Compras feitas pela faixa etária Jovem (até 19 anos): {tot_purchase_young}')
print(f'Compras feitas pela faixa etária Adulta (de 20 a 59 anos): {tot_purchase_adult}')
print(f'Compras feitas pela faixa etária Idosa (a partir de 60 anos): {tot_purchase_elderly}')

Compras feitas pela faixa etária Jovem (até 19 anos): 196
Compras feitas pela faixa etária Adulta (de 20 a 59 anos): 584
Compras feitas pela faixa etária Idosa (a partir de 60 anos): 0


## Consumidores Mais Populares (Top 5)

In [327]:
# - Identifique os 5 principais compradores pelo valor total de compra e, em seguida, liste (em uma tabela):

consumers = {}
c = 0

for i in range(len(purchase_file)):
    if purchase_file.Login[i] == purchase_file.Login[c]:
        print(c, purchase_file.Login[i])
        c += 1

# - Login
# - Número de compras
# - Preço médio de compra
# - Valor Total de Compra
# - Itens mais populares

0 Aelalis34
1 Eolo46
2 Assastnya25
3 Pheusrical25
4 Aela59
5 Tanimnya91
6 Undjaskla97
7 Iathenudil29
8 Sondenasta63
9 Hilaerin92
10 Chamosia29
11 Sally64
12 Iskossa88
13 Seorithstilis90
14 Sundast29
15 Haellysu29
16 Sundista85
17 Aenarap34
18 Iskista88
19 Assossa43
20 Irith83
21 Iaralrgue74
22 Deural48
23 Chanosia65
24 Qarwen67
25 Idai61
26 Aerithllora36
27 Assastnya25
28 Ilariarin45
29 Phaedai25
30 Eulaeria40
31 Iarilis73
32 Malunil62
33 Iskimnya76
34 Yararmol43
35 Aisur51
36 Undare39
37 Sondossa91
38 Chamjasknya65
39 Lassilsa63
40 Tyisur83
41 Aeral43
42 Lassadarsda57
43 Alaephos75
44 Frichjask31
45 Eusur90
46 Palatyon26
47 Saellyra72
48 Ililsa62
49 Eosur70
50 Saistyphos30
51 Reula64
52 Chanirrala39
53 Chadanto83
54 Minduli80
55 Heunadil74
56 Marilsasya33
57 Alallo58
58 Tyaeristi78
59 Ila44
60 Iskossaya95
61 Rinallorap73
62 Aeri84
63 Ryanara76
64 Syally44
65 Shaidanu32
66 Syasriria69
67 Lisiriya82
68 Qarwen67
69 Iskosia51
70 Eosurdru76
71 Lassimla92
72 Tauldilsa43
73 Erudrion71
74 Cha

592 Mindimnya67
593 Euna48
594 Lisassasta50
595 Eusur90
596 Undirrala66
597 Lamil70
598 Chamadarnya73
599 Ilast79
600 Sondilsa35
601 Ralonurin90
602 Marundi65
603 Phaedan76
604 Farenon57
605 Ilassa51
606 Lirtossa84
607 Airi27
608 Indcil77
609 Chamastya76
610 Lassjask63
611 Heolo60
612 Isurria36
613 Lisossan98
614 Sondim43
615 Mindirra92
616 Reuthelis39
617 Thourdirra92
618 Frichadar89
619 Raesursurap33
620 Jiskilsa35
621 Philistirap41
622 Tyidainu31
623 Mindimnya67
624 Tridaira71
625 Queusurra38
626 Mindadaran26
627 Lisassa39
628 Alaesu77
629 Ilogha82
630 Pharithdil38
631 Mindossasya74
632 Syadaillo88
633 Lassilsala30
634 Eusri26
635 Chanastsda67
636 Hilaerin92
637 Aeliriam77
638 Lirtossan50
639 Iskossan49
640 Sondim73
641 Assosia38
642 Reula64
643 Tyeosri53
644 Raesurdil91
645 Anallorgue57
646 Idai61
647 Aeduera68
648 Rithe53
649 Quinarap53
650 Haerithp41
651 Seuthelis34
652 Styaduen40
653 Ennoncil86
654 Lassassasda30
655 Tyeosri53
656 Ilaststa70
657 Tyarithn67
658 Streural92
659 Hael

## Itens Mais Populares

In [None]:
# Implemente aqui sua solução

## Itens Mais Lucrativos

In [None]:
# Implemente aqui sua solução

## Fim

### Obrigado - Data Science Academy - <a href="http://facebook.com/dsacademybr">facebook.com/dsacademybr</a>