<a href="https://colab.research.google.com/github/rodzhttp/Analise-de-Vendas-com-Python/blob/main/Analise_de_Vendas_com_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Analise de Vendas com Python
- Percorrer e filtrar todos os arquivos de vendas
- Importar base de dados
- Calcular o produto mais vendido em quantidade
- Calcular o produto com mais faturamento
- Calcular a loja que mais vendeu (em faturamento) / criar um grafico

In [45]:
# Percorrer todos os arquivos da pasta base de dados (vendas)

import os
import pandas as pd
import plotly.express as px

lista_arquivos = os.listdir('/content/drive/MyDrive/Colab Notebooks/Analise de Vendas com Python/Vendas')
display(lista_arquivos)

['Devolucoes - Belo Horizonte.csv',
 'Devolucoes - Goiás.csv',
 'Vendas - Belo Horizonte.csv',
 'Vendas - Fortaleza.csv',
 'Vendas - Rio de Janeiro.csv',
 'Vendas - Porto Alegre.csv',
 'Vendas - São Paulo.csv',
 'Devolucoes - São Paulo.csv',
 'Devolucoes - Fortaleza.csv',
 'Devolucoes - Porto Alegre.csv',
 'Vendas - Curitiba.csv',
 'Devolucoes - Recife.csv',
 'Vendas - Recife.csv',
 'Devolucoes - Rio de Janeiro.csv',
 'Devolucoes - Salvador.csv',
 'Vendas - Salvador.csv',
 'Vendas - Goiás.csv',
 'Devolucoes - Curitiba.csv']

In [46]:
# Importar base de dados de vendas (descartar arquivos de devoluções)

tabelas = []

for arquivo in lista_arquivos:
    if "Vendas" in arquivo:
        tabela = pd.read_csv(f'/content/drive/MyDrive/Colab Notebooks/Analise de Vendas com Python/Vendas/{arquivo}')
        tabelas.append(tabela) # adiciona cada DataFrame lido a uma lista.

tabela_total = pd.concat(tabelas, ignore_index=True) # junta todos os DataFrames da lista em um só.

display(tabela_total) # compila a base de dados

Unnamed: 0.1,Unnamed: 0,SKU,Produto,Quantidade Vendida,Primeiro Nome,Sobrenome,Data,Loja,Preco Unitario,Unnamed: 8
0,17,HL4379,Televisão,2,Carolina,Alfradique,2/25/2018,Belo Horizonte,2500,
1,25,HL4379,Televisão,1,Danilo,Rubim,2/20/2018,Belo Horizonte,2500,
2,27,HL1918,iPhone,5,Bernard,Pedrosa,7/7/2018,Belo Horizonte,5300,
3,54,HL1918,iPhone,5,Lucas,Lemos,12/26/2018,Belo Horizonte,5300,
4,67,HL8851,Notebook,5,Bernardo,Botelho,6/8/2018,Belo Horizonte,3500,
...,...,...,...,...,...,...,...,...,...,...
9994,9925,HL1918,iPhone,2,Victor,Gomes,1/9/2018,Goiás,5300,
9995,9937,HL8851,Notebook,2,Gabriel,Ribeiro,11/28/2018,Goiás,3500,
9996,9943,HL2714,Tablet,2,Giuseppe,Borges,10/5/2018,Goiás,1600,
9997,9968,HL2714,Tablet,2,Caio,Caldas,4/4/2018,Goiás,1600,


In [47]:
# Calcular o produto mais vendido em quantidade

tabela_produtos = tabela_total.groupby('Produto').sum() # agrupando as colunas e somando
tabela_produtos = tabela_produtos[['Quantidade Vendida']].sort_values(by="Quantidade Vendida", ascending=False) # filtrando a coluna que vai aparecer / ordenando
display(tabela_produtos)

Unnamed: 0_level_0,Quantidade Vendida
Produto,Unnamed: 1_level_1
iPhone,8974
Televisão,5931
Notebook,3249
Android,3183
SmartWatch,2980
Tablet,2921
Câmera,2805


In [48]:
# Calcular o produto que mais faturou

tabela_total['Faturamento'] = tabela_total['Quantidade Vendida'] * tabela_total['Preco Unitario'] # cria uma nova coluna chamada 'Faturamento' na tabela tabela_total

tabela_faturamento = tabela_total.groupby('Produto').sum() # agrupa as vendas pelo nome do produto (coluna 'Produto') e soma todos os valores numéricos das colunas para cada grupo
tabela_faturamento = tabela_faturamento[['Faturamento']].sort_values(by="Faturamento", ascending=False) # ordenação (da loja que mais faturou para a que menos faturou)

display(tabela_faturamento)

Unnamed: 0_level_0,Faturamento
Produto,Unnamed: 1_level_1
iPhone,47562200
Televisão,14827500
Notebook,11371500
Android,10822200
Câmera,5890500
Tablet,4673600
SmartWatch,4172000


In [49]:
# Calcular a loja/cidade que mais vendeu (em faturamento) - criar um grafico/dashboard

# tabela faturamento
tabela_lojas = tabela_total.groupby('Loja').sum() # agrupa os dados da tabela_total pela coluna 'Loja'.
tabela_lojas = tabela_lojas[['Faturamento']] # filtra a tabela tabela_lojas para manter apenas a coluna 'Faturamento'.
tabela_lojas = tabela_lojas.sort_values(by='Faturamento', ascending=False) # ordenação (da loja que mais faturou para a que menos faturou)
display(tabela_lojas)

# grafico com plotly
grafico = px.bar(tabela_lojas, x=tabela_lojas.index, y='Faturamento')
grafico.show()

Unnamed: 0_level_0,Faturamento
Loja,Unnamed: 1_level_1
São Paulo,22098300
Rio de Janeiro,14867800
Fortaleza,14087900
Salvador,13111300
Goiás,7441800
Recife,7303000
Curitiba,7060500
Porto Alegre,6868600
Belo Horizonte,6480300
