<a href="https://colab.research.google.com/github/sarasantosds/analise-base-vendas-independente/blob/main/base_vendas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análise Base Vendas


A base analisada trata-se do histórico de vendas de cursos online

In [None]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

In [None]:
df = pd.read_excel('base-vendas.xlsx')

In [None]:
df.head()

Unnamed: 0,Data,Ano,Mês,Vendedor,Cliente,Região,Produto,Valor,FormaPgto
0,2019-01-01,2019,jan,Paulo Lira,Thamires Bastos,Sudeste,Python,450,Cartão de Débito
1,2019-01-01,2019,jan,Paulo Lira,Jessika Mineiro,Centro-Oeste,Excel,500,Cartão de Débito
2,2019-01-02,2019,jan,Diego Amorim,Glenda Jalles,Norte,VBA,600,Cartão de Crédito
3,2019-01-02,2019,jan,Diego Amorim,Eugênio Mattos,Sul,Python,450,Cartão de Débito
4,2019-01-02,2019,jan,Alon Pinheiro,Yasmine Gomes,Norte,VBA,600,Boleto Bancário


# Análise da Base Vendas

### Faturamento Total

Abaixo temos um faturamento total de 1.696.050,00. Após a retirada do faturamento total destrinchei a análise para compreender o resultado.

In [None]:
fat_total = df['Valor'].sum()
fat_total

np.int64(1696050)

### Faturamento por Região

Entre o período analisado de 2019 à 2021, a região sudeste teve o maior faturamento, o que foi oposto para região sul, sendo esta a região que menos faturou durante esse período.

Abaixo dou continuidade a investigação do faturamento entre as regiões.

In [None]:
faturamento_regiao = df['Valor'].groupby(df['Região']).sum().sort_values(ascending=False)
faturamento_regiao

Unnamed: 0_level_0,Valor
Região,Unnamed: 1_level_1
Sudeste,483700
Norte,425600
Nordeste,300250
Centro-Oeste,255050
Sul,231450


### Faturamento por Produto

O curso de VBA teve um faturamento de 548.400,00 durante o período analisado, precisamos verificar em qual região houve a maior concentração de alunos no curso de VBA, dado que este curso custa R$ 600,00.


Power BI foi o curso com menor faturamento, 275.400 durante o mesmo período, assim como o curso de VBA precisamos analisar a sua concentração regional, dado que o curso de Power BI custa R$ 300,00

In [None]:
faturamento_curso = df['Valor'].groupby(df['Produto']).sum().sort_values(ascending=False)
faturamento_curso

Unnamed: 0_level_0,Valor
Produto,Unnamed: 1_level_1
VBA,548400
Excel,456000
Python,416250
Power BI,275400


### Quantidade de Alunos por Região

A quantidade de alunos na região sudeste justifica o faturamento, contudo ainda não o justifica por completo, precisamos compreender em qual curso houve a maior concentração e realizar uma soma ponderada para termos noção do real impacto deste dado no faturamento final.


O mesmo podemos dizer da região sul, sendo esta a região com menor concentração de alunos em relação as outras regiões, apenas 542 alunos. Precisamos analisar qual curso houve menor concentração e realizar uma soma ponderada para termos noção do impacto deste dado no faturamento final desta região, também podemos analisar o curso com maior concentração nessa região para compreender o alcance financeiro e trabalhar em estratégias para modificar o cenário dessa região.

In [None]:
df['Cliente'].groupby(df['Região']).count().sort_values(ascending=False)

Unnamed: 0_level_0,Cliente
Região,Unnamed: 1_level_1
Sudeste,951
Norte,930
Nordeste,663
Centro-Oeste,583
Sul,542


### Quantidade de Alunos por Curso

Python é o curso com maior concentração de alunos, contudo é VBA que possui o maior faturamento, logo o que fez a diferença foi o preço do curso, enquanto Python custa 450,00, o curso de VBA custa 600,00 o que resulta em uma soma ponderada favorável para este curso.

In [None]:
df['Cliente'].groupby(df['Produto']).count().sort_values(ascending=False)

Unnamed: 0_level_0,Cliente
Produto,Unnamed: 1_level_1
Python,925
Power BI,918
VBA,914
Excel,912


### Quantidade de Alunos por Ano

Os dados abaixo mostra que em 2020 houve um pequeno aumento no número de alunos, o que pode ter influenciado para um aumento no faturamento desse ano, por outro lado em 2021 houve uma queda não expressiva, mas que explica porque o faturamento de 2021 ficou abaixo dos anos anteriores.

In [27]:
df['Cliente'].groupby(df['Ano']).count().sort_values(ascending=False)

Unnamed: 0_level_0,Cliente
Ano,Unnamed: 1_level_1
2020,1240
2019,1224
2021,1205


### Quantidade de Aluno por Curso em cada Região

Com a tabela abaixo temos um panorama sobre alunos por curso em cada região, isso nos ajuda a compreender o faturamento de cada região. Se formos ver a região sudeste tem um "boom" no curso de VBA, com 449 alunos a 600,00 cada, o que resulta em um aumento significativo no faturamento final desta região.

Por outro lado o curso de Excel teve menor adesão na região sul, tendo apenas 72 alunos a 500,00 cada. Mesmo que o curso de Power BI seja o curso com maior adesão de alunos nessa região, o preço do curso não agrega no faturamento final.

In [None]:
pd.crosstab(df['Região'], df['Produto'])

Produto,Excel,Power BI,Python,VBA
Região,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Centro-Oeste,91,180,211,101
Nordeste,263,151,173,76
Norte,274,236,228,192
Sudeste,212,148,142,449
Sul,72,203,171,96


### Valor em média de cada curso

Os dados abaixo foram extraídos apenas para sabermos o impacto do valor do curso no faturamento final.

In [None]:
df['Valor'].groupby(df['Produto']).mean().sort_values(ascending=False)

Unnamed: 0_level_0,Valor
Produto,Unnamed: 1_level_1
VBA,600.0
Excel,500.0
Python,450.0
Power BI,300.0


### Faturamento por Vendedor

Esse dado é importante para ações de recompensa e reconhecimento àqueles vendedores que tiveram bons resultados, além de trazer meios de treinamento para qualificar o restante da equipe de vendas para que possam também obter bons resultados.

Como os vendedores é o ínicio para a adesão do curso, servindo como se fosse uma porta de entrada, mantê-la de forma atraente e convidativa pode resultar em mais alunos e consequentemente no aumento do faturamento.

In [None]:
faturamento_vendedor = df['Valor'].groupby(df['Vendedor']).sum().sort_values(ascending=False)
faturamento_vendedor

Unnamed: 0_level_0,Valor
Vendedor,Unnamed: 1_level_1
Marcus Cavalcanti,306750
Alon Pinheiro,290800
Paulo Lira,285200
Diego Amorim,280050
Gabriel Cajado,270550
João Martins,262700


### Faturamento por Ano

Realizar a análise do faturamento anual em vez do faturamento mensal me parece mais importante porque poderíamos posteriormente atualizar a análise a cada dois anos, o que a torna em quadro progressivo em que a história da empresa pode ser contada anualmente.

Contudo pensar em uma análise mensal não estaria errado, poderíamos analisar por trimestre ou semestre por exemplo, mas seria de um ano para o outro.

Quando fazemos a análise anual podemos condensar as informações mais relevantes de cada ano e fazer um comparativo, após isso montar estratégias para os próximos dois anos.

In [None]:
faturamento_ano = df['Valor'].groupby(df['Ano']).sum().sort_values(ascending=False)
faturamento_ano

Unnamed: 0_level_0,Valor
Ano,Unnamed: 1_level_1
2020,571150
2019,563800
2021,561100


### Percentual de Participação por Região

In [28]:
faturamento_regiao = pd.DataFrame(faturamento_regiao)
faturamento_regiao['Participação (%)'] = (faturamento_regiao['Valor'] / fat_total) * 100
faturamento_regiao

Unnamed: 0_level_0,Valor,Participação (%)
Região,Unnamed: 1_level_1,Unnamed: 2_level_1
Sudeste,483700,28.519206
Norte,425600,25.0936
Nordeste,300250,17.702898
Centro-Oeste,255050,15.037882
Sul,231450,13.646414


### Percentual de Participação por Curso


O percentual de participação por curso nos fornece a informação do quanto o curso de VBA que teve o maior faturamento participou no faturamento total, essa informação é importante porque revela o real impacto do curso de VBA no faturamento final, mostra o quão decisivo ele foi durante os dois anos analisados.

A mesma a análise aponta para abaixa participação do curso de Power BI durante os dois anos. Como o curso é o mais barato o impacto não é tão sentido, contudo se fosse o mais caro, abaixa adesão poderia resultar em faturamento baixo, apontando talvez para um problema de custeio do curso por parte dos estudantes, seria preciso talvez trabalhar em promoções e desconto, caso não coubesse uma redução do preço do curso devida a manutenção dos equipamentos para realizá-lo.

In [29]:
faturamento_curso = pd.DataFrame(faturamento_curso)
faturamento_curso['Participação (%)'] = (faturamento_curso['Valor'] / fat_total) * 100
faturamento_curso

Unnamed: 0_level_0,Valor,Participação (%)
Produto,Unnamed: 1_level_1,Unnamed: 2_level_1
VBA,548400,32.333952
Excel,456000,26.886
Python,416250,24.542319
Power BI,275400,16.237729


### Percentual de Participação por Vendedor

In [30]:
faturamento_vendedor = pd.DataFrame(faturamento_vendedor)
faturamento_vendedor['Participação (%)'] = (faturamento_vendedor['Valor'] / fat_total) * 100
faturamento_vendedor

Unnamed: 0_level_0,Valor,Participação (%)
Vendedor,Unnamed: 1_level_1,Unnamed: 2_level_1
Marcus Cavalcanti,306750,18.086141
Alon Pinheiro,290800,17.145721
Paulo Lira,285200,16.815542
Diego Amorim,280050,16.511895
Gabriel Cajado,270550,15.95177
João Martins,262700,15.48893


### Percentual de Participação por Ano

In [31]:
faturamento_ano= pd.DataFrame(faturamento_ano)
faturamento_ano['Participação (%)'] = (faturamento_ano['Valor'] / fat_total) * 100
faturamento_ano

Unnamed: 0_level_0,Valor,Participação (%)
Ano,Unnamed: 1_level_1,Unnamed: 2_level_1
2020,571150,33.675304
2019,563800,33.241945
2021,561100,33.082751


### Percentual de Participação por Vendedor e por Ano (Análise)

Em ambos cenários os percentuais foram muito próximos em comparação com as outras variáveis da mesma categoria.

Sobre os vendedores: Gabriel Cajado e João Martins, os quais tiveram menor participação, caberia um treinamento para qualificá-los ainda mais e aumentar o percentual de participação para os próximos dois anos.