## 1. Importação das bibliotecas

In [None]:
# Instala o pacote watermark
!pip install -q -U watermark

In [None]:
# Importação da biblioteca Pandas para a manipulação de dados em tabelas
import pandas as pd

# Importação da biblioteca NumPy para operações matemáticas e arrays
import numpy as np

# Importação da biblioteca Matplotlib para a geração de gráficos
import matplotlib.pyplot as plt

# Importação da bibloteca Seaborn para a visualição estatística de dados
import seaborn as sns

# Importação da biblioteca random para a geração de números aleatórios
import random

# Importação das classes datetime e timedelta para a manipulação de datas e intervalos de tempo
from datetime import datetime, timedelta

# Comando do jupter notebook para pertimir a exibição de gráficos diretamente no notebook
%matplotlib inline

In [None]:
%reload_ext watermark
%watermark -a "Valter de Pauli Netto"

In [None]:
%watermark --iversions

In [None]:
# Instalação da versão especifica do pandas
!pip install -q pandas==2.3.1

## 2. Função Para Geração de Dados

In [None]:
# Definição da função para gerar os dados de venda
def luzia_bolos(num_registros = 600):

    """
    Gera um Dataframe do Pandas com dados de vendas

    """

    #Mensagem inicial indicando a quantidade de registros a serem gerados
    print(f"\nIniciando a geração de {num_registros} registros de vendas...")

    # Dicionário com produtos, suas categorias e preços

    produtos = {
    
        'Bolo de quatro leites': {'categoria': 'bolos', 'unidade': 'KG', 'preco': 70.00},
        'Bolo de dois amores': {'categoria': 'bolos', 'unidade': 'KG', 'preco':70.00},
        'Bolo de brigadeiro': {'categoria': 'bolos', 'unidade': 'KG', 'preco': 70.00 },
        'Bolo trufado': {'categoria': 'bolos', 'unidade': 'KG', 'preco': 80.00},
        'Bombom de morango': {'categoria': 'doces', 'unidade': 'cento', 'preco': 180.00},
        'Bombom de uva' : {'categoria': 'doces', 'unidade': 'cento', 'preco':  180.00},
        'Brigadeiro': {'categoria': 'doces', 'unidade': 'cento', 'preco': 90.00},
        'Cajuzinho': {'categoria': 'doces', 'unidade': 'cento', 'preco': 90.00},
        'Coxinha': {'categoria': 'salgados', 'unidade': 'cento', 'preco': 85.00} 
         
    }

    # Cria uma lista apenas com os nomes dos produtos
    lista_produtos = list(produtos.keys()) #.keys para retornar todas as chaves do dicionário

    # Dicionário com as cidades e seus respectivos estados
    cidades_estado = {
        'Cornélio Procópio': 'PR', 'Santa Mariana' : 'PR', 'Nova Fatima': 'PR', 
        'Urai': 'PR', "Congonhas": "PR", 'Bandeirantes': 'PR'   
    }

    # Cria uma lista apenas com o nome das cidades
    lista_cidades = list(cidades_estado.keys())

    # Lista para armazenar os registros de vendas
    dados_vendas = []

    # Define a data inicial dos pedidos
    data_inicial = datetime(2026, 1, 1)

    # Loop para gerar os registros de venda
    for i in range(num_registros):

        # Seleciona aleatoriamente um produto
        produto_nome = random.choice(lista_produtos) 

        # Seleciona aleatoriamente uma cidade
        cidade = random.choice(lista_cidades)

        # Gera uma quantidade de produtos vendida entre 1 a 7
        quantidade = np.random.randint(1,8) #randint gera números interios aleatórios dentro de um intervalo especificado

        # Calcula a data do pedido a partir da data inicial
        data_pedido = data_inicial + timedelta(days = int(i/5), hours = random.randint (0,23))

        # Se o produto for cajuzinho ou bolo trufado, aplica desconto aleatório de até 10%
        if produto_nome in ['Cajuzinho', 'Bolo trufado']:
            preco = produtos[produto_nome]['preco'] * np.random.uniform(0.9, 1.0)
        else:
            preco = produtos[produto_nome]['preco']

        # Adiciona um registro de venda a lista
        dados_vendas.append({
            'ID_Pedido': 1000 + i,
            'Data_Pedido' : data_pedido,
            'Nome_Produto' : produto_nome,
            'Categoria' : produtos[produto_nome]['categoria'],
            'Unidade' : produtos[produto_nome]['unidade'],
            'Preco' : round(preco, 2),
            'Quantidade' : quantidade,
            'ID_Cliente': np.random.randint(100, 150),
            'Cidade': cidade,
            'Estado': cidades_estado[cidade]
        })

    # Mensagem final alertando que a geração terminou
    print("Geração de dados concluída.\n")

    # Retorna os dados no formato de DataFrame
    return pd.DataFrame(dados_vendas)  

## 3. Gerar, Carregar e Explorar os Dados

In [None]:
# Gera os dados chamando a função da célula anterior
df_vendas = luzia_bolos(500)

In [None]:
type(df_vendas)

In [None]:
df_vendas.shape

In [None]:
# Exibe as 5 primeiras linhas do DataFrame
df_vendas.head()

In [None]:
# Exibe as 5 últimas linhas do DataFrame
df_vendas.tail()

In [None]:
# Exibe informações gerais sobre o DataFrame (Tipo de dados, valores não nulos) 
df_vendas.info()

In [None]:
# Resumo estatístico
df_vendas.describe()

## 4. Limpeza, Pré-Processamento e Engenharia de Atributos

In [None]:
# Analise temporal
df_vendas ['Data_Pedidos'] = pd.to_datetime(df_vendas['Data_Pedido'])

In [None]:
# Criando uma coluna de faturamentos (preço x quantidade) -> Engenharia de atributos
df_vendas['Faturamento'] = df_vendas['Preco'] * df_vendas['Quantidade']

In [None]:
# Utilizando uma função lamda para criar uma coluna de status de entrega -> Engenharia de atributos
df_vendas['Status_Entrega'] = df_vendas['Cidade'].apply(lambda cidade: 'Rápida' if cidade in ['Cornélio Procópio', 'Santa Mariana'] else 'Normal')
#apply -> utilizado para aplicar uma função em um eixo do DataFrame

In [None]:
# Exibe informações gerais sobre o DataFrame (tipos de dados, valores não nulos)
df_vendas.info()

In [None]:
# Exibe as 5 primeiras linhas novamente para ver as novas colunas
df_vendas.head()

## 5. Análise do faturamento mensal

In [None]:
df_vendas['Mes'] = df_vendas['Data_Pedido'].dt.to_period('M')

In [None]:
df_vendas.head()

In [None]:
# Agrupa por mês e soma o faturamento
faturamento_mensal = df_vendas.groupby('Mes')['Faturamento'].sum()

In [None]:
# Converte o índice para strig facilitando a plotagem do gráfico
faturamento_mensal.index = faturamento_mensal.index.strftime('%Y-%m')

In [None]:
# Formata para duas casas decimais
faturamento_mensal.map('R$ {:,.2f}'.format)

In [None]:
# Cria uma nova figura com o tamanho 12 por 6 polegadas
plt.figure(figsize = (12,6))

# Plota os dados de faturamento mensal em formato de linha
faturamento_mensal.plot(kind = 'line', marker = 'o', linestyle = '-', color = 'blue')

# Define o título do gráfico
plt.title('Evolução do faturamento mensal', fontsize = 16)

# Define o rótulo X
plt.xlabel('Mes', fontsize = 12)

# Define o rótulo Y
plt.ylabel('Faturamento (R$)', fontsize = 12)

# Rotação dos valores do eixo X em 45 graus para melhor visualização
plt.xticks(rotation = 45)

# Adiciona uma grade com estilo tracejado e linhas finas
plt.grid(True, which = 'both', linestyle = '--', linewidth = 0.5)

# Ajusta automaticamente os elementos para evitar sobreposição
plt.tight_layout()

#Exibe o gráfico
plt.show()

## 6. Análise do faturamento por categoria

In [None]:
# Agrupa por categoria, soma o fatumento e formata como moeda para melhor leitura
faturamento_categoria = df_vendas.groupby('Categoria')['Faturamento'].sum().sort_values(ascending = False)

In [None]:
# o .map('{: ,.2f}'.format) deixa a leitura mais clara
faturamento_categoria.map('{:,.2f}'.format)

In [None]:
# Importa a função FuncFormatter para formatar os eixos
from matplotlib.ticker import FuncFormatter

# Ordena os dados para o gráfico ficar mais fácil de ler
faturamento_ordenado = faturamento_categoria.sort_values(ascending = False)

# Criar a figura e os eixos (ax) com plt.subplots() possibilita maior controle sobre elementos do gráfico
fig, ax = plt.subplots(figsize = (12,7))

# Criar uma função para formatar os números, recebendo um valor de 'Y' e o transformar em uma strg
def formatador_milhares(y, pos):
    """ Formata o valor em milhares em R$ """
    return f'R$ {y/1000:,.0f}k'

# Cria o objeto formatador
formatter = FuncFormatter(formatador_milhares)

# Aplica o formatador ao eixo Y (ax.yaxis)
ax.yaxis.set_major_formatter(formatter)

# Plota os dados usando o objeto 'ax'
faturamento_ordenado.plot(kind = 'bar', ax = ax, color = sns.color_palette("viridis", len(faturamento_ordenado)))

# Adiciona título e labels usando 'ax.set_...'
ax.set_title('Faturamento por categoria', fontsize = 16)
ax.set_xlabel('Categoria', fontsize = 12)
ax.set_ylabel('Faturamento', fontsize = 12)

# Ajusta a rotação dos rótulos do eixo X
plt.xticks(rotation = 45, ha = 'right')

# Garante que tudo fique bem ajustado
plt.tight_layout()

# Exibe o gráfico
plt.show()