<a href="https://colab.research.google.com/github/guifav/sales_analysis/blob/main/Analise_de_vendas_detalhado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Início da análise

### **Este tutorial foi elaborado por Guilherme Favaron. Para melhor compreensão, acesse: ** https://www.guilhermefavaron.com.br/post/tutorial-analise-de-dados-colab-python-ia

## Carregando Bibliotecas Necessárias

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

## Carregando os dados

In [None]:
df = pd.read_csv('vendas_farmaceuticas.csv')

## Convertendo a coluna 'Data' para o tipo datetime

In [None]:
df['Data'] = pd.to_datetime(df['Data'])

## Convertendo as colunas de preço e custo para float

In [None]:
df['Preço Unitário'] = df['Preço Unitário'].str.replace(',', '.').astype(float)
df['Custo Unitário'] = df['Custo Unitário'].str.replace(',', '.').astype(float)

## Calculando o lucro

In [None]:
df['Lucro'] = (df['Preço Unitário'] - df['Custo Unitário']) * df['Unidades Vendidas']

## Análise detalhada

### 1. Visão geral dos dados

In [None]:
print(df.describe())

### 2. Top 10 produtos mais vendidos

In [None]:
top_produtos = df.groupby('Produto')['Unidades Vendidas'].sum().sort_values(ascending=False).head(10)
plt.figure(figsize=(12, 6))
top_produtos.plot(kind='bar')
plt.title('Top 10 Produtos Mais Vendidos')
plt.xlabel('Produto')
plt.ylabel('Unidades Vendidas')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

### 3. Vendas por região

In [None]:
vendas_por_regiao = df.groupby('Região')['Lucro'].sum().sort_values(ascending=False)
plt.figure(figsize=(10, 6))
vendas_por_regiao.plot(kind='pie', autopct='%1.1f%%')
plt.title('Distribuição de Lucro por Região')
plt.ylabel('')
plt.show()

### 4. Tendência de vendas ao longo do tempo



In [None]:
df_diario = df.groupby('Data')['Lucro'].sum().reset_index()
plt.figure(figsize=(12, 6))
plt.plot(df_diario['Data'], df_diario['Lucro'])
plt.title('Tendência de Lucro Diário')
plt.xlabel('Data')
plt.ylabel('Lucro')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

### 5. Performance por categoria de produto

In [None]:
categoria_performance = df.groupby('Categoria')[['Unidades Vendidas', 'Lucro']].sum().sort_values('Lucro', ascending=False)
plt.figure(figsize=(12, 6))
sns.scatterplot(data=categoria_performance, x='Unidades Vendidas', y='Lucro', s=100)
for i, txt in enumerate(categoria_performance.index):
    plt.annotate(txt, (categoria_performance['Unidades Vendidas'].iloc[i], categoria_performance['Lucro'].iloc[i]))
plt.title('Performance por Categoria de Produto')
plt.xlabel('Unidades Vendidas')
plt.ylabel('Lucro Total')
plt.tight_layout()
plt.show()

### 6. Análise de canal de vendas

In [None]:
canal_vendas = df.groupby('Canal de Venda')['Lucro'].sum().sort_values(ascending=False)
plt.figure(figsize=(10, 6))
canal_vendas.plot(kind='bar')
plt.title('Lucro por Canal de Venda')
plt.xlabel('Canal de Venda')
plt.ylabel('Lucro Total')
plt.xticks(rotation=0)
plt.tight_layout()
plt.show()

### 7. Produtos mais lucrativos

In [None]:
produtos_lucrativos = df.groupby('Produto')['Lucro'].sum().sort_values(ascending=False).head(10)
plt.figure(figsize=(12, 6))
produtos_lucrativos.plot(kind='bar')
plt.title('Top 10 Produtos Mais Lucrativos')
plt.xlabel('Produto')
plt.ylabel('Lucro Total')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

### 8. Correlação entre preço e unidades vendidas

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(data=df, x='Preço Unitário', y='Unidades Vendidas')
plt.title('Relação entre Preço Unitário e Unidades Vendidas')
plt.xlabel('Preço Unitário')
plt.ylabel('Unidades Vendidas')
plt.tight_layout()
plt.show()

### 9. Análise de margem de lucro

In [None]:
df['Margem de Lucro'] = (df['Lucro'] / (df['Preço Unitário'] * df['Unidades Vendidas'])) * 100
margem_media = df.groupby('Produto')['Margem de Lucro'].mean().sort_values(ascending=False).head(10)
plt.figure(figsize=(12, 6))
margem_media.plot(kind='bar')
plt.title('Top 10 Produtos com Maior Margem de Lucro Média')
plt.xlabel('Produto')
plt.ylabel('Margem de Lucro Média (%)')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

### 10. Resumo estatístico

In [None]:
print("\nResumo Estatístico:")
print(f"Total de Vendas: R$ {(df['Preço Unitário'] * df['Unidades Vendidas']).sum():.2f}")
print(f"Total de Custos: R$ {(df['Custo Unitário'] * df['Unidades Vendidas']).sum():.2f}")
print(f"Lucro Total: R$ {df['Lucro'].sum():.2f}")
print(f"Margem de Lucro Média: {df['Margem de Lucro'].mean():.2f}%")
print(f"Produto Mais Vendido: {df.groupby('Produto')['Unidades Vendidas'].sum().idxmax()}")
print(f"Produto Mais Lucrativo: {df.groupby('Produto')['Lucro'].sum().idxmax()}")
print(f"Região Mais Lucrativa: {df.groupby('Região')['Lucro'].sum().idxmax()}")
print(f"Canal de Venda Mais Lucrativo: {df.groupby('Canal de Venda')['Lucro'].sum().idxmax()}")