In [101]:
import pandas as pd
import random
from faker import Faker
from datetime import datetime  # Certifique-se de incluir esta linha


In [102]:
# Configuração inicial
fake = Faker('pt_BR')  # Localização brasileira
Faker.seed(42)
random.seed(42)

# Parâmetros
num_rows = random.randint(1200, 2000)
years = [2022, 2023, 2024]
categories = ['Acessórios Informática', 'Tecnologia', 'Games', 'Eletro-Eletrônicos', 'Celulares', 'Eletro-Domésticos']
regions = ['Norte', 'Nordeste', 'Centro-Oeste', 'Sudeste', 'Sul']
channels = ['Online', 'Loja Física']

In [103]:
# Categorias e produtos reais
category_to_products = {
    "Acessórios Informática": [
        "Teclado Mecânico", "Mouse Sem Fio", "Mouse Gamer", "Headset Gamer", "Hub USB", 
        "Cabo HDMI", "Cadeira Gamer", "Monitor Suporte", "Base para Notebook", "Adaptador USB"
    ],
    "Tecnologia": [
        "Smartwatch", "Assistente Virtual", "Carregador Rápido", "Tablet", "HD Externo", 
        "SSD", "Power Bank", "Projetor Portátil", "Drone", "Echo Dot"
    ],
    "Games": [
        "Console PS5", "Console Xbox Series X", "Joystick para PC", "Controle Xbox", 
        "Controle DualSense", "Headset para Xbox", "Volante para Simulação", 
        "Cadeira Gamer RGB", "Teclado para Consoles", "Dock para Switch"
    ],
    "Eletro-Eletrônicos": [
        "TV 4K", "Home Theater", "Soundbar", "Receptor de TV", "Rádio Portátil", 
        "Caixa de Som Bluetooth", "Smart TV", "Controle Remoto Universal", 
        "Antena Digital", "Carregador Universal"
    ],
    "Celulares": [
        "iPhone 14", "Samsung Galaxy S23", "Moto G Power", "Xiaomi Redmi Note 12", 
        "Realme Narzo", "OnePlus Nord", "Fone Bluetooth", "Carregador Wireless", 
        "Capa Protetora", "Película de Vidro"
    ],
    "Eletro-Domésticos": [
        "Geladeira Frost Free", "Máquina de Lavar", "Forno Microondas", "Fogão 4 Bocas", 
        "Aspirador de Pó", "Liquidificador", "Airfryer", "Cafeteira", 
        "Ventilador", "Purificador de Água"
    ]
}

# Função para gerar lista de produtos como DataFrame
def generate_product_list():
    products = []
    product_id = 1  # Para rastrear IDs únicos
    for category, product_names in category_to_products.items():
        for product_name in product_names:
            products.append({
                'ProdutoID': fake.uuid4(), #f"P{product_id:03d}",  # IDs formatados como P001, P002...
                'Produto': product_name,
                'Categoria': category,
                'PrecoUnitario': round(random.uniform(50, 5000), 2),  # Preço unitário
                'Custo': round(random.uniform(20, 3000), 2),  # Custo
                'QtdEstoque': random.randint(0, 500)  # Estoque disponível
            })
            product_id += 1
    # Converter para DataFrame
    return pd.DataFrame(products)



In [104]:
# Função para gerar dados de vendas
def generate_sales_data():
    sales = []
    for _ in range(num_rows):
        order_date = fake.date_between_dates(
            date_start=datetime.strptime(f'{min(years)}-01-01', '%Y-%m-%d').date(),
            date_end=datetime.strptime('2024-11-25', '%Y-%m-%d').date()
        )
        sales.append({
            'OrdemID': fake.uuid4(),
            'DataVenda': order_date,
            'ClienteID': fake.uuid4(), #random.choice(product_ids),  # Relaciona com ProductID da tabela -- 
            'ProdutoID': fake.uuid4(),
            'Regiao': random.choice(regions),
            'Canal': random.choice(channels),
            'Quantidade': random.randint(1, 10),
            'Receita': round(random.uniform(50, 5000), 2),
            'Disconto': round(random.uniform(0, 0.5), 2),
            'Lucro': round(random.uniform(20, 2500), 2)
        })
    return pd.DataFrame(sales)


In [105]:
# Dicionário de estados e cidades
estados_e_cidades = {
    "Acre": ["Rio Branco", "Cruzeiro do Sul"],
    "Amapá": ["Macapá", "Santana"],
    "Amazonas": ["Manaus", "Parintins"],
    "Pará": ["Belém", "Santarém"],
    "Rondônia": ["Porto Velho", "Ji-Paraná"],
    "Roraima": ["Boa Vista", "Rorainópolis"],
    "Tocantins": ["Palmas", "Araguaína"],
    "Alagoas": ["Maceió", "Arapiraca"],
    "Bahia": ["Salvador", "Feira de Santana"],
    "Ceará": ["Fortaleza", "Sobral"],
    "Maranhão": ["São Luís", "Imperatriz"],
    "Paraíba": ["João Pessoa", "Campina Grande"],
    "Pernambuco": ["Recife", "Caruaru"],
    "Piauí": ["Teresina", "Parnaíba"],
    "Rio Grande do Norte": ["Natal", "Mossoró"],
    "Sergipe": ["Aracaju", "Itabaiana"],
    "Distrito Federal": ["Brasília"],
    "Goiás": ["Goiânia", "Anápolis"],
    "Mato Grosso": ["Cuiabá", "Rondonópolis"],
    "Mato Grosso do Sul": ["Campo Grande", "Dourados"],
    "Espírito Santo": ["Vitória", "Vila Velha"],
    "Minas Gerais": ["Belo Horizonte", "Uberlândia"],
    "Rio de Janeiro": ["Rio de Janeiro", "Niterói"],
    "São Paulo": ["São Paulo", "Campinas"],
    "Paraná": ["Curitiba", "Londrina"],
    "Rio Grande do Sul": ["Porto Alegre", "Caxias do Sul"],
    "Santa Catarina": ["Florianópolis", "Joinville"]
}

# Função para gerar dados de clientes
def generate_customer_data():
    fake = Faker(['pt_BR'])
    customers = []
    for _ in range(500):  # Simular 500 clientes
        estado = random.choice(list(estados_e_cidades.keys()))  # Seleciona um estado aleatoriamente
        cidade = random.choice(estados_e_cidades[estado])  # Seleciona uma cidade do estado escolhido
        customers.append({
            'ClienteID': fake.uuid4(),
            'Nome': fake.name(),
            'Idade': random.randint(18, 70),
            'Genero': random.choice(['M', 'F']),
            'Segmento': random.choice(['Alta Frequência', 'Alta Receita', 'Recorrente']),
            'Localizacao': f"{cidade}, {estado}"  # Combinação de cidade e estado
        })
    return pd.DataFrame(customers)


In [106]:
# Função para gerar metas de vendas
def generate_sales_targets():
    targets = []
    for region in regions:
        for channel in channels:
            for year in years:
                for quarter in range(1, 5):
                    targets.append({
                        'Regiao': region,
                        'Canal': channel,
                        'Periodo': f'{year}-Q{quarter}',
                        'MetaReceita': round(random.uniform(100000, 1000000), 2),
                        'MetaLucro': round(random.uniform(50000, 500000), 2)
                    })
    return pd.DataFrame(targets)

In [107]:
# Função para gerar dados de calendário
def generate_calendar_data():
    calendar = []
    for year in years:
        for month in range(1, 13):
            for day in range(1, 29):  # Simples para evitar problemas com meses diferentes
                date = f'{year}-{month:02d}-{day:02d}'
                calendar.append({
                    'Data': date,
                    'Dia': fake.day_of_week(),
                    'Mes': fake.month_name(),
                    'Trimestre': (month - 1) // 3 + 1,
                    'Ano': year
                })
    return pd.DataFrame(calendar)

In [108]:
# Geração dos datasets
sales_data = generate_sales_data()
product_data = generate_product_list()
customer_data = generate_customer_data()
sales_targets = generate_sales_targets()
calendar_data = generate_calendar_data()

In [109]:
# Salvando os datasets em arquivos CSV
sales_data.to_csv('vendas_data.csv', index=False)
product_data.to_csv('produto_data.csv', index=False)
customer_data.to_csv('cliente_data.csv', index=False)
sales_targets.to_csv('vendas_meta.csv', index=False)
calendar_data.to_csv('calendario_data.csv', index=False)

print("Planilhas geradas com sucesso!")


Planilhas geradas com sucesso!
