# Projeto 3

#### Bibliotecas

- `pip install pandas`
- `pip install openpyxl`
- `pip install plotly`
- `pip install nbformat`

Carregando os dados do Excel

In [58]:
import pandas as pd

dados = pd.read_excel("vendas.xlsx")

#### Análises exploratórias

In [59]:
# Visualizando as primeiras linhas
dados.head()

Unnamed: 0,d_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento
0,PED13941,2020-01-01,Loja 4,São Paulo,São Paulo,Sudeste,300ml,Consumo,5,Dinheiro
1,PED2246,2020-01-01,Loja 3,Florianópolis,Santa Cat,Sul,500ml,Consumo,11,Débito
2,PED15402,2020-01-01,Loja 1,Rio de Jan,Rio de Jan,Sudeste,300ml,Consumo,11,Crédito
3,PED4357,2020-01-01,Loja 1,Fortaleza,Ceará,Nordeste,100ml,Delivery,9,Pix
4,PED6186,2020-01-01,Loja 4,São Paulo,São Paulo,Sudeste,1000ml,Consumo,10,Débito


In [60]:
# Visualizando as ultimas linhas
dados.tail()

Unnamed: 0,d_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento
19,PED31673,2020-01-01,Loja 3,São Paulo,São Paulo,Sudeste,300ml,Delivery,5,Pix
20,PED34147,2020-01-01,Loja 1,Niterói,Rio de Jan,Sudeste,300ml,Consumo,9,Pix
21,PED35641,2020-01-01,Loja 4,Santos,São Paulo,Sudeste,100ml,Delivery,6,Dinheiro
22,PED36823,2020-01-01,Loja 3,São Paulo,São Paulo,Sudeste,200ml,Consumo,7,Débito
23,PED41458,2020-01-01,Loja 1,Fortaleza,Ceará,Nordeste,200ml,Delivery,7,Dinheiro


In [61]:
# formato da tabela de dados
dados.shape

(24, 10)

In [62]:
# Visualizando informações das colunas
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 24 entries, 0 to 23
Data columns (total 10 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   d_pedido         24 non-null     object        
 1   data             24 non-null     datetime64[ns]
 2   loja             24 non-null     object        
 3   cidade           24 non-null     object        
 4   estado           24 non-null     object        
 5   regiao           24 non-null     object        
 6   tamanho          24 non-null     object        
 7   local_consumo    24 non-null     object        
 8   preco            24 non-null     int64         
 9   forma_pagamento  24 non-null     object        
dtypes: datetime64[ns](1), int64(1), object(8)
memory usage: 2.0+ KB


In [63]:
# Selecionando colunas

# ou desta forma:
# dados.loja

dados[["cidade", "estado"]]

Unnamed: 0,cidade,estado
0,São Paulo,São Paulo
1,Florianópolis,Santa Cat
2,Rio de Jan,Rio de Jan
3,Fortaleza,Ceará
4,São Paulo,São Paulo
5,Santos,São Paulo
6,Florianópolis,Santa Cat
7,Santos,São Paulo
8,Rio de Jan,Rio de Jan
9,São Paulo,São Paulo


#### Estatísticas

In [64]:
#dados.describe()

dados["preco"].describe()

# Tabela com descrição de cada analises

count    24.000000
mean      8.041667
std       2.010390
min       5.000000
25%       6.750000
50%       8.000000
75%       9.250000
max      11.000000
Name: preco, dtype: float64

#### Análises

In [65]:
# Contagem de vendas por Loja

dados["cidade"].value_counts()

#Contagem de linhas por loja

cidade
São Paulo        6
Santos           6
Fortaleza        4
Rio de Jan       3
Niterói          3
Florianópolis    2
Name: count, dtype: int64

In [66]:
dados["forma_pagamento"].value_counts()

forma_pagamento
Débito      7
Pix         7
Crédito     6
Dinheiro    4
Name: count, dtype: int64

#### Agrupando dados

In [67]:
# .to_frame() //coloca em uma tabela bonitinha

dados.groupby("loja")["preco"].sum().to_frame()

Unnamed: 0_level_0,preco
loja,Unnamed: 1_level_1
Loja 1,87
Loja 3,57
Loja 4,43
Loja 5,6


In [68]:
# faturamento por forma de pagamento

dados.groupby("forma_pagamento")["preco"].sum().to_frame()


Unnamed: 0_level_0,preco
forma_pagamento,Unnamed: 1_level_1
Crédito,51
Dinheiro,28
Débito,59
Pix,55


In [69]:
# faturamento por forma de pagamento

dados_agrupados = dados.groupby(["estado", "cidade", "loja", "forma_pagamento"])["preco"].sum().to_frame()
dados_agrupados

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,preco
estado,cidade,loja,forma_pagamento,Unnamed: 4_level_1
Ceará,Fortaleza,Loja 1,Dinheiro,7
Ceará,Fortaleza,Loja 1,Pix,18
Ceará,Fortaleza,Loja 3,Pix,9
Rio de Jan,Niterói,Loja 1,Débito,6
Rio de Jan,Niterói,Loja 1,Pix,9
Rio de Jan,Niterói,Loja 3,Crédito,7
Rio de Jan,Rio de Jan,Loja 1,Crédito,22
Rio de Jan,Rio de Jan,Loja 4,Crédito,7
Santa Cat,Florianópolis,Loja 3,Débito,22
São Paulo,Santos,Loja 1,Crédito,8


In [70]:
# Gera um excel com a tabela dos faturamentos

dados_agrupados.to_excel("Faturamento.xlsx")

### Visualização de dados

In [71]:
# Biblioteca para a criação de gráficos interativos

import plotly.express as px

In [72]:
#                      eixo x    eixo y  mostra os valores em cima    titulo do gráfico     Colorir conforme a forma de pagamento
grafico = px.histogram(dados, x="loja", y="preco", text_auto="true",          title="Faturamento",      color="forma_pagamento")

# É possível clicar, selecionar algumas partes etc.


# Com o .show é possível mostrar o gráfico
grafico.show()

# Cria um html com o gráfico
grafico.write_html("Faturamento.html")


### Listas e o comando ``For``

In [73]:
lista_nomes = ["Vinícius", "Pietro", "Cesar"] 

# For eatch em python
for nome in lista_nomes:
    print(nome)

Vinícius
Pietro
Cesar


In [74]:
lista_colunas = ["loja", "cidade", "estado", "tamanho", "local_consumo"]

for coluna in lista_colunas:
    grafico = px.histogram(dados, x=coluna, y="preco", text_auto="true", title=f"Faturamento-{coluna}",color="forma_pagamento")
    grafico.show()
    grafico.write_html(f"Faturamento-{coluna}.html")