<a href="https://colab.research.google.com/github/joelma-ramos/imc/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta
import random

# 1. GERANDO DADOS FICTÍCIOS
np.random.seed(42)
produtos = ['Smartphone', 'Notebook', 'Fone de Ouvido', 'Smartwatch', 'TV', 'Tablet', 'Teclado', 'Mouse']
categorias = ['Eletrônicos', 'Informática', 'Acessórios']
localizacoes = ['SP', 'RJ', 'MG', 'RS', 'BA', 'PR', 'SC', 'PE']

# Simula 5000 vendas
n = 5000
df = pd.DataFrame({
    'produto': np.random.choice(produtos, n),
    'categoria': np.random.choice(categorias, n),
    'preco': np.round(np.random.uniform(100, 5000, n), 2),
    'data_transacao': [datetime(2023, 1, 1) + timedelta(days=random.randint(0, 699)) for _ in range(n)],
    'local_cliente': np.random.choice(localizacoes, n),
    'quantidade': np.random.randint(1, 5, n),
    'desconto': np.round(np.random.uniform(0, 0.5, n), 2)
})
df['valor_total'] = df['preco'] * df['quantidade'] * (1 - df['desconto'])

# 2. ANÁLISE EXPLORATÓRIA
print("\nResumo estatístico:")
print(df.describe())

print("\nQuantidade de vendas por categoria:")
print(df['categoria'].value_counts())

# 3. VISUALIZAÇÕES
plt.figure(figsize=(10, 5))
sns.countplot(data=df, x='categoria', palette='viridis')
plt.title('Quantidade de Vendas por Categoria')
plt.savefig('grafico_vendas_categoria.png')
plt.close()

plt.figure(figsize=(12, 5))
df['mes'] = df['data_transacao'].dt.to_period('M')
df.groupby('mes')['valor_total'].sum().plot()
plt.title('Evolução das Vendas por Mês')
plt.ylabel('Valor Total em R$')
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig('grafico_vendas_mes.png')
plt.close()

plt.figure(figsize=(10, 5))
sns.barplot(data=df.groupby('produto').sum(numeric_only=True).sort_values('valor_total', ascending=False).reset_index(), x='produto', y='valor_total', palette='magma')
plt.title('Top Produtos por Faturamento')
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig('grafico_top_produtos.png')
plt.close()

plt.figure(figsize=(10, 5))
sns.boxplot(data=df, x='categoria', y='desconto', palette='coolwarm')
plt.title('Descontos por Categoria')
plt.tight_layout()
plt.savefig('grafico_desconto_categoria.png')
plt.close()

plt.figure(figsize=(10, 5))
sns.heatmap(df[['preco', 'quantidade', 'desconto', 'valor_total']].corr(), annot=True, cmap='crest')
plt.title('Correlação entre Variáveis Numéricas')
plt.tight_layout()
plt.savefig('grafico_correlacao.png')
plt.close()

print("\nAnálises e gráficos salvos com sucesso!")



Resumo estatístico:
             preco              data_transacao   quantidade     desconto  \
count  5000.000000                        5000  5000.000000  5000.000000   
mean   2516.715370  2023-12-19 10:01:20.640000     2.503400     0.254990   
min     100.260000         2023-01-01 00:00:00     1.000000     0.000000   
25%    1312.432500         2023-06-30 00:00:00     2.000000     0.130000   
50%    2500.105000         2023-12-20 00:00:00     3.000000     0.260000   
75%    3710.317500         2024-06-10 00:00:00     3.000000     0.380000   
max    4997.580000         2024-11-30 00:00:00     4.000000     0.500000   
std    1397.025087                         NaN     1.115812     0.143537   

        valor_total  
count   5000.000000  
mean    4705.147282  
min       65.767000  
25%     1781.758800  
50%     3694.695700  
75%     6893.528800  
max    19153.960000  
std     3712.398672  

Quantidade de vendas por categoria:
categoria
Informática    1679
Acessórios     1663
Eletrônic


Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `x` variable to `hue` and set `legend=False` for the same effect.

  sns.countplot(data=df, x='categoria', palette='viridis')

Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `x` variable to `hue` and set `legend=False` for the same effect.

  sns.barplot(data=df.groupby('produto').sum(numeric_only=True).sort_values('valor_total', ascending=False).reset_index(), x='produto', y='valor_total', palette='magma')

Passing `palette` without assigning `hue` is deprecated and will be removed in v0.14.0. Assign the `x` variable to `hue` and set `legend=False` for the same effect.

  sns.boxplot(data=df, x='categoria', y='desconto', palette='coolwarm')



Análises e gráficos salvos com sucesso!
