In [1]:
import pandas as pd
import random
from faker import Faker

fake = Faker('pt_BR')
Faker.seed(42)
random.seed(42)

# --- CONFIGURAÇÃO DAS ESTRUTURAS (SUA EDIÇÃO) ---
print("--- Definindo estruturas das lojas ---")

mc_matriz = {
    'Administração': {'Gerente': 1, 'Subgerente': 1},
    'Frente de Caixa': {'Encarregado': 1, 'Fiscal de Caixa': 5, 'Operador de Caixa': 30, 'Empacotador': 10},
    'Padaria': {'Encarregado': 1, 'Padeiro': 2, 'Confeiteiro': 1, 'Atendente de Perecíveis': 5},
    'Hortifruti': {'Encarregado': 1,'Atendente de Perecíveis': 7},
    'Açougue': {'Encarregado': 1, 'Açougueiro': 3, 'Auxiliar de Açougue': 4},
    'Loja': {'Encarregado': 1, 'Estoquista': 10},
    'Depósito': {'Encarregado': 1, 'Conferente': 2, 'Auxiliar': 4},
    'RH': {'Psicóloga': 1, 'Auxiliar': 2},
    'Comercial': {'Chefe': 1, 'Auxiliar': 3},
    'Marketing': {'Chefe': 1, 'Auxiliar': 2}
}

mc_filial01 = {
    'Administração': {'Gerente': 1, 'Subgerente': 1},
    'Frente de Caixa': {'Encarregado': 1, 'Fiscal de Caixa': 4, 'Operador de Caixa': 16, 'Empacotador': 5},
    'Padaria': {'Padeiro': 1, 'Confeiteiro': 1, 'Atendente de Perecíveis': 4},
    'Hortifruti': {'Encarregado': 1,'Atendente de Perecíveis': 7},
    'Açougue': {'Açougueiro': 2, 'Auxiliar de Açougue': 3},
    'Loja': {'Encarregado': 1, 'Estoquista': 6},
    'Depósito': {'Conferente': 1, 'Auxiliar': 2}
}

mc_filial02 = {
    'Administração': {'Gerente': 1, 'Subgerente': 1},
    'Frente de Caixa': {'Encarregado': 1, 'Fiscal de Caixa': 4, 'Operador de Caixa': 16, 'Empacotador': 5},
    'Padaria': {'Padeiro': 1, 'Confeiteiro': 1, 'Atendente de Perecíveis': 4},
    'Hortifruti': {'Encarregado': 1,'Atendente de Perecíveis': 7},
    'Açougue': {'Açougueiro': 2, 'Auxiliar de Açougue': 3},
    'Loja': {'Encarregado': 1, 'Estoquista': 6},
    'Depósito': {'Conferente': 1, 'Auxiliar': 2}
}


--- Definindo estruturas das lojas ---


In [None]:
# --- CRIAR DIM_LOJAS ---
print("--- 1. Criando dim_lojas ---")

config_lojas = [
    {'id_loja': 1, 'nome': 'MC Matriz', 'tipo': 'Matriz', 'cep' : '94810-000', 'estado': 'RS', 'cidade': 'Alvorada', 'Bairro': 'Bela Vista', 'endereço': 'Av. Washington Luís, 3919', 'estrutura': mc_matriz},
    {'id_loja': 2, 'nome': 'MC Filial 01', 'tipo': 'Filial', 'cep' : '94838-031', 'estado': 'RS', 'cidade': 'Alvorada', 'Bairro': 'Porto Verde', 'endereço': 'Av. Major Sylvio de Magalhães Padilha, 741', 'estrutura': mc_filial01},
    {'id_loja': 3, 'nome': 'MC Filial 02', 'tipo': 'Filial', 'cep' : '91110-001', 'estado': 'RS', 'cidade': 'Porto Alegre', 'Bairro': 'Sarandi', 'endereço': 'Av. Brigadeiro Luís Antônio, 2013', 'estrutura': mc_filial02}
]

df_lojas = pd.DataFrame([{k:v for k,v in loja.items() if k != 'estrutura'} for loja in config_lojas])
df_lojas.to_csv('dim_lojas.csv', index=False, encoding='utf-8-sig')
print("dim_lojas.csv criada com sucesso!")
print(df_lojas)


--- 1. Criando dim_lojas ---
dim_lojas.csv criada com sucesso!
   id_loja          nome    tipo        cep estado        cidade       Bairro  \
0        1     MC Matriz  Matriz  04627-002     RS      Alvorada   Bela Vista   
1        2  MC Filial 01  Filial  05693-000     RS      Alvorada  Porto Verde   
2        3  MC Filial 02  Filial  01317-002     RS  Porto Alegre      Sarandi   

                                     endereço  
0                   Av. Washington Luís, 3919  
1  Av. Major Sylvio de Magalhães Padilha, 741  
2           Av. Brigadeiro Luís Antônio, 2013  


In [3]:
# --- CRIAR DIM_FUNCIONARIOS (COM VÍNCULO DE LOJA) ---
print("--- 2. Criando dim_funcionarios vinculada às lojas ---")

lista_funcionarios = []
id_atual = 1

for loja in config_lojas:
    id_loja = loja['id_loja']
    estrutura_loja = loja['estrutura']
    
    for departamento, cargos in estrutura_loja.items():
        for cargo, quantidade in cargos.items():
            for _ in range(quantidade):
                # Geração de Gênero e Nome
                genero = random.choice(['M', 'F'])
                if genero == 'M':
                    nome = fake.name_male()
                else:
                    nome = fake.name_female()
                
                # Definição de Salários (Estimativa Baseada no Cargo)
                if 'Gerente' in cargo or 'Chefe' in cargo:
                    salario = random.uniform(5000, 8500)
                elif 'Subgerente' in cargo or 'Psicóloga' in cargo:
                    salario = random.uniform(3500, 5000)
                elif 'Encarregado' in cargo:
                    salario = random.uniform(2800, 3800)
                elif 'Padeiro' in cargo or 'Açougueiro' in cargo or 'Confeiteiro' in cargo or 'Conferente' in cargo:
                    salario = random.uniform(2200, 3000)
                elif 'Fiscal' in cargo:
                    salario = random.uniform(1800, 2400)
                else:
                    # Operacionais (Operador, Empacotador, Auxiliar, Atendente)
                    salario = random.uniform(1412, 1900)
                
                # Data de Contratação (Aleatória nos últimos 4 anos)
                data_contratacao = fake.date_between(start_date='-4y', end_date='today')
                
                # Status (90% de chance de estar ativo)
                ativo = random.choices([True, False], weights=[90, 10])[0]

                func = {
                    'id_funcionario': id_atual,
                    'id_loja': id_loja,
                    'nome': nome,
                    'genero': genero,
                    'departamento': departamento,
                    'cargo': cargo,
                    'salario': round(salario, 2),
                    'data_contratacao': data_contratacao,
                    'ativo': ativo
                }
                
                lista_funcionarios.append(func)
                id_atual += 1

# --- SALVAR ARQUIVO ---
df_funcionarios = pd.DataFrame(lista_funcionarios)
df_funcionarios.to_csv('dim_funcionarios.csv', index=False, encoding='utf-8-sig')

print(f"\nSucesso! dim_funcionarios.csv gerado.")
print(f"Total de colaboradores: {len(df_funcionarios)}")
print(f"Colaboradores por Loja:\n{df_funcionarios['id_loja'].value_counts().sort_index()}")
print("\nAmostra dos dados:")
print(df_funcionarios[['id_funcionario', 'id_loja', 'cargo', 'departamento']].head())

--- 2. Criando dim_funcionarios vinculada às lojas ---

Sucesso! dim_funcionarios.csv gerado.
Total de colaboradores: 215
Colaboradores por Loja:
id_loja
1    101
2     57
3     57
Name: count, dtype: int64

Amostra dos dados:
   id_funcionario  id_loja            cargo     departamento
0               1        1          Gerente    Administração
1               2        1       Subgerente    Administração
2               3        1      Encarregado  Frente de Caixa
3               4        1  Fiscal de Caixa  Frente de Caixa
4               5        1  Fiscal de Caixa  Frente de Caixa
