# Análise de dados com Python

## Biblioteca 


In [1]:
import pandas as pd

## Carregando dados

In [5]:
dados = pd.read_excel("vendas.xlsx")

## Análise exploratória

In [7]:
# Mostrar as primeiras linhas

dados.head()

Unnamed: 0,id_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento,ano_mes
0,PED1994,2020-01-01,Loja 4,Santos,São Paulo,Sudeste,300ml,Consumo no local,5,Dinheiro,2020-01
1,PED2246,2020-01-01,Loja 6,Florianópolis,Santa Catarina,Sul,500ml,Consumo no local,11,Débito,2020-01
2,PED3876,2020-01-01,Loja 3,Rio de Janeiro,Rio de Janeiro,Sudeste,300ml,Delivery,7,Crédito,2020-01
3,PED4352,2020-01-01,Loja 1,Fortaleza,Ceará,Nordeste,1000ml,Consumo no local,7,Débito,2020-01
4,PED8633,2020-01-01,Loja 5,São Paulo,São Paulo,Sudeste,200ml,Delivery,9,Crédito,2020-01


In [8]:
# Mostrar as últimas linhas

dados.tail()

Unnamed: 0,id_pedido,data,loja,cidade,estado,regiao,tamanho,local_consumo,preco,forma_pagamento,ano_mes
69995,PED67084,2022-12-31,Loja 6,Florianópolis,Santa Catarina,Sul,500ml,Consumo no local,11,Crédito,2022-12
69996,PED67857,2022-12-31,Loja 3,Rio de Janeiro,Rio de Janeiro,Sudeste,200ml,Consumo no local,7,Pix,2022-12
69997,PED69171,2022-12-31,Loja 4,Santos,São Paulo,Sudeste,500ml,Consumo no local,5,Dinheiro,2022-12
69998,PED69229,2022-12-31,Loja 4,Santos,São Paulo,Sudeste,300ml,Consumo no local,9,Pix,2022-12
69999,PED69356,2022-12-31,Loja 1,Fortaleza,Ceará,Nordeste,300ml,Delivery,9,Pix,2022-12


In [11]:
# Verificando a quantidade de linhas e colunas

dados.shape

(70000, 11)

In [13]:
# Verificando os tipos de dados

dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 70000 entries, 0 to 69999
Data columns (total 11 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   id_pedido        70000 non-null  object        
 1   data             70000 non-null  datetime64[ns]
 2   loja             70000 non-null  object        
 3   cidade           70000 non-null  object        
 4   estado           70000 non-null  object        
 5   regiao           70000 non-null  object        
 6   tamanho          70000 non-null  object        
 7   local_consumo    70000 non-null  object        
 8   preco            70000 non-null  int64         
 9   forma_pagamento  70000 non-null  object        
 10  ano_mes          70000 non-null  object        
dtypes: datetime64[ns](1), int64(1), object(9)
memory usage: 5.9+ MB


In [14]:
dados.preco

0         5
1        11
2         7
3         7
4         9
         ..
69995    11
69996     7
69997     5
69998     9
69999     9
Name: preco, Length: 70000, dtype: int64

## Gerando estatísticas

In [15]:
dados.preco.describe()

count    70000.000000
mean         8.355200
std          2.653061
min          5.000000
25%          7.000000
50%          7.000000
75%         11.000000
max         13.000000
Name: preco, dtype: float64

## Análises

In [16]:
# Total e vendas por loja

dados.loja.value_counts()

loja
Loja 4    13483
Loja 6    13075
Loja 1    12344
Loja 5    12177
Loja 3    10603
Loja 2     8318
Name: count, dtype: int64

In [17]:
# Total de vendas por cidade

dados.cidade.value_counts()

cidade
Santos            13483
Florianópolis     13075
Fortaleza         12344
São Paulo         12177
Rio de Janeiro    10603
Niterói            8318
Name: count, dtype: int64

In [18]:
# Total de vendas por forma de pagamento

dados.forma_pagamento.value_counts()

forma_pagamento
Crédito     26063
Débito      20427
Dinheiro    14709
Pix          8801
Name: count, dtype: int64

## Agrupamento de dados

In [19]:
#faturamento por loja

dados.groupby("loja").preco.sum()

loja
Loja 1    103162
Loja 2     69592
Loja 3     88357
Loja 4    112379
Loja 5    102189
Loja 6    109185
Name: preco, dtype: int64

In [29]:
# Faturamento por estado

dados.groupby(["estado", "cidade", "loja"]).preco.sum().to_excel("faturamento-estado-cidade.xlsx")
# dados.groupby("estado").preco.mean().to_frame()
# dados.groupby("estado").preco.min().to_frame()

## Visualização de dados


In [30]:
!pip install plotly_express

Collecting plotly_express
  Downloading plotly_express-0.4.1-py2.py3-none-any.whl (2.9 kB)
Installing collected packages: plotly_express
Successfully installed plotly_express-0.4.1


In [31]:
import plotly_express as px

In [40]:
grafico = px.histogram(dados, x='cidade', y='preco', title="Vendas por loja", text_auto=True, color="forma_pagamento")

In [42]:
grafico.show()

In [43]:
grafico.write_html('grafico.html')

## Lista

In [None]:
nomes = ["kaue", "pietro", "lorenzo"]

## Estrutura de repetição

In [None]:
for i in nomes