# Análise de dados / Data Analysis

## Carregando dados - Pandas/ Loading data - Pandas

In [83]:
import pandas as pd

In [84]:
dados = pd.read_excel("vendas.xlsx")

# Análise Exploratória/ Exploratory Analysis

In [85]:
dados.tail()

Unnamed: 0,id_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento,ano_mes
69995,PED67084,2022-12-31,Loja 6,Florianópolis,Santa Catarina,Sul,500ml,Consumo no local,11,Crédito,2022-12
69996,PED67857,2022-12-31,Loja 3,Rio de Janeiro,Rio de Janeiro,Sudeste,200ml,Consumo no local,7,Pix,2022-12
69997,PED69171,2022-12-31,Loja 4,Santos,São Paulo,Sudeste,500ml,Consumo no local,5,Dinheiro,2022-12
69998,PED69229,2022-12-31,Loja 4,Santos,São Paulo,Sudeste,300ml,Consumo no local,9,Pix,2022-12
69999,PED69356,2022-12-31,Loja 1,Fortaleza,Ceará,Nordeste,300ml,Delivery,9,Pix,2022-12


In [86]:
dados.head()

Unnamed: 0,id_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento,ano_mes
0,PED1994,2020-01-01,Loja 4,Santos,São Paulo,Sudeste,300ml,Consumo no local,5,Dinheiro,2020-01
1,PED2246,2020-01-01,Loja 6,Florianópolis,Santa Catarina,Sul,500ml,Consumo no local,11,Débito,2020-01
2,PED3876,2020-01-01,Loja 3,Rio de Janeiro,Rio de Janeiro,Sudeste,300ml,Delivery,7,Crédito,2020-01
3,PED4352,2020-01-01,Loja 1,Fortaleza,Ceará,Nordeste,1000ml,Consumo no local,7,Débito,2020-01
4,PED8633,2020-01-01,Loja 5,São Paulo,São Paulo,Sudeste,200ml,Delivery,9,Crédito,2020-01


In [87]:
dados.shape

(70000, 11)

# Estatísticas/ Statistics 


In [88]:
dados.describe()

Unnamed: 0,preco
count,70000.0
mean,8.3552
std,2.653061
min,5.0
25%,7.0
50%,7.0
75%,11.0
max,13.0


## Análises/ Analyses

In [89]:
# total de pedidos por loja 
# total of orders per store
dados.loja.value_counts()

Loja 4    13483
Loja 6    13075
Loja 1    12344
Loja 5    12177
Loja 3    10603
Loja 2     8318
Name: loja, dtype: int64

In [90]:
# total de pedido por forma de pagamento
# total of orders per payment form

dados.forma_pagamento.value_counts()

Crédito     26063
Débito      20427
Dinheiro    14709
Pix          8801
Name: forma_pagamento, dtype: int64

In [91]:
# total de pedidos por tamanho de copo
# total of orders per bowl size

dados.tamanho.value_counts()

300ml     20475
200ml     15804
500ml     13591
700ml     11158
1000ml     8972
Name: tamanho, dtype: int64

## Faturamento/ Revenue

In [92]:
# faturamento por loja
# revenue per store

dados.groupby("loja").sum()

Unnamed: 0_level_0,preco
loja,Unnamed: 1_level_1
Loja 1,103162
Loja 2,69592
Loja 3,88357
Loja 4,112379
Loja 5,102189
Loja 6,109185


In [93]:
# preço médio por loja
# average price per store

dados.groupby("loja").mean()

Unnamed: 0_level_0,preco
loja,Unnamed: 1_level_1
Loja 1,8.357259
Loja 2,8.366434
Loja 3,8.333208
Loja 4,8.334866
Loja 5,8.391968
Loja 6,8.350669


In [94]:
# faturamento por estado e loja
# revenue per state and store

dados_loja_estado = dados.groupby(["estado","loja"]).sum()

# salvando dados no excel
# saving data in Excel
dados_loja_estado.to_excel("Faturamento por estado.xlsx")

## Vizualização de dados - Plotly Express / Data visualization - Plotly Express


In [95]:
!pip install plotly_express



In [96]:
import plotly_express as px

## Gráfico Animado/ Animated graph

In [97]:
dados_agrupados = dados.groupby(['loja','ano_mes']).sum()
dados_agrupados.reset_index(inplace= True)
dados_agrupados['acumulado'] = dados_agrupados.groupby('loja').cumsum()

In [98]:
fig = px.bar(dados_agrupados, x= 'acumulado', y= 'loja', color= 'loja', text_auto=True, range_x=[0,160000], animation_frame='ano_mes')
fig.show()

In [None]:
#salvando em html
#saving in html
fig.write_html('grafico_animado.html')