In [2]:
import pandas as pd
import random
from faker import Faker

# Configurar o Faker para português do Brasil
fake = Faker('pt_BR')
Faker.seed(0)
random.seed(0)

# Quantidades para geração de dados
NUM_CLIENTES = 100
NUM_FORNECEDORES = 50
NUM_CONTRATOS = 200
NUM_PAGAMENTOS = 500
NUM_VIOLACOES = 100
NUM_PROFISSIONAIS = 150

# 1. Gerar Dim_Clientes
def gerar_dim_clientes(num_clientes):
    clientes = []
    for _ in range(num_clientes):
        cliente = {
            'ID_Cliente': fake.unique.random_int(min=1000, max=9999),
            'Nome_Cliente': fake.company(),
            'Segmento': random.choice(['Varejo', 'Tecnologia', 'Saúde', 'Financeiro', 'Educação']),
            'Localização': fake.city(),
            'Tamanho_Empresa': random.choice(['Pequena', 'Média', 'Grande'])
        }
        clientes.append(cliente)
    df_clientes = pd.DataFrame(clientes)
    return df_clientes

# 2. Gerar Dim_Fornecedores
def gerar_dim_fornecedores(num_fornecedores):
    fornecedores = []
    for _ in range(num_fornecedores):
        fornecedor = {
            'ID_Fornecedor': fake.unique.random_int(min=5000, max=9999),
            'Nome_Fornecedor': fake.company(),
            'Categoria': random.choice(['Matérias-primas', 'Serviços', 'Equipamentos', 'Consultoria']),
            'Localização': fake.city(),
            'Avaliação': random.randint(1, 5)
        }
        fornecedores.append(fornecedor)
    df_fornecedores = pd.DataFrame(fornecedores)
    return df_fornecedores

# 3. Gerar Dim_Tipo_Contrato
def gerar_dim_tipo_contrato():
    tipos_contrato = [
        {'ID_Tipo_Contrato': 1, 'Descrição_Tipo': 'Fornecimento', 'Categoria_Tipo': 'Produtos'},
        {'ID_Tipo_Contrato': 2, 'Descrição_Tipo': 'Prestação de Serviços', 'Categoria_Tipo': 'Serviços'},
        {'ID_Tipo_Contrato': 3, 'Descrição_Tipo': 'Locação', 'Categoria_Tipo': 'Imóveis'},
        {'ID_Tipo_Contrato': 4, 'Descrição_Tipo': 'Parceria', 'Categoria_Tipo': 'Negócios'},
        {'ID_Tipo_Contrato': 5, 'Descrição_Tipo': 'Distribuição', 'Categoria_Tipo': 'Logística'}
    ]
    df_tipo_contrato = pd.DataFrame(tipos_contrato)
    return df_tipo_contrato

# 4. Gerar Dim_Tipo_Pagamento
def gerar_dim_tipo_pagamento():
    tipos_pagamento = [
        {'ID_Tipo_Pagamento': 1, 'Descrição_Pagamento': 'Boleto Bancário'},
        {'ID_Tipo_Pagamento': 2, 'Descrição_Pagamento': 'Cartão de Crédito'},
        {'ID_Tipo_Pagamento': 3, 'Descrição_Pagamento': 'Transferência Bancária'},
        {'ID_Tipo_Pagamento': 4, 'Descrição_Pagamento': 'Depósito'},
        {'ID_Tipo_Pagamento': 5, 'Descrição_Pagamento': 'Pix'}
    ]
    df_tipo_pagamento = pd.DataFrame(tipos_pagamento)
    return df_tipo_pagamento

# 5. Gerar Dim_Tipo_Violação
def gerar_dim_tipo_violacao():
    tipos_violacao = [
        {'ID_Tipo_Violação': 1, 'Descrição_Violação': 'Atraso na Entrega', 'Categoria_Violação': 'Operacional'},
        {'ID_Tipo_Violação': 2, 'Descrição_Violação': 'Não Conformidade', 'Categoria_Violação': 'Qualidade'},
        {'ID_Tipo_Violação': 3, 'Descrição_Violação': 'Inadimplência', 'Categoria_Violação': 'Financeiro'},
        {'ID_Tipo_Violação': 4, 'Descrição_Violação': 'Quebra de Exclusividade', 'Categoria_Violação': 'Legal'},
        {'ID_Tipo_Violação': 5, 'Descrição_Violação': 'Uso Indevido de Marca', 'Categoria_Violação': 'Marketing'}
    ]
    df_tipo_violacao = pd.DataFrame(tipos_violacao)
    return df_tipo_violacao

# 6. Gerar Dim_Profissionais
def gerar_dim_profissionais(num_profissionais, contratos_ids):
    profissionais = []
    for _ in range(num_profissionais):
        profissional = {
            'ID_Profissional': fake.unique.random_int(min=2000, max=9999),
            'Nome_Profissional': fake.name(),
            'Categoria_Profissional': random.choice(['Gerente de Projetos', 'Advogado', 'Analista de Contratos', 'Financeiro']),
            'Departamento': random.choice(['Jurídico', 'Financeiro', 'Operações', 'Vendas']),
            'ID_Contrato': random.choice(contratos_ids)
        }
        profissionais.append(profissional)
    df_profissionais = pd.DataFrame(profissionais)
    return df_profissionais

# 7. Gerar Dim_Tempo
def gerar_dim_tempo(data_inicio, data_fim):
    datas = pd.date_range(start=data_inicio, end=data_fim)
    dim_tempo = pd.DataFrame({
        'Data': datas,
        'Dia': datas.day,
        'Mês': datas.month,
        'Ano': datas.year,
        'Trimestre': datas.quarter,
        'Dia_Semana': datas.day_name(locale='pt_BR')
    })
    return dim_tempo

# 8. Gerar Fato_Contratos
def gerar_fato_contratos(num_contratos, clientes_ids, fornecedores_ids, tipos_contrato_ids):
    contratos = []
    for _ in range(num_contratos):
        data_inicio = fake.date_between(start_date='-2y', end_date='today')
        data_fim = fake.date_between(start_date='today', end_date='+2y')
        valor_total = round(random.uniform(10000.0, 500000.0), 2)
        saldo_contrato = round(valor_total * random.uniform(0.1, 1.0), 2)
        contrato = {
            'ID_Contrato': fake.unique.random_int(min=10000, max=99999),
            'ID_Cliente': random.choice(clientes_ids),
            'ID_Fornecedor': random.choice(fornecedores_ids),
            'ID_Tipo_Contrato': random.choice(tipos_contrato_ids),
            'Data_Início': data_inicio,
            'Data_Término': data_fim,
            'Valor_Total': valor_total,
            'Status_Contrato': random.choice(['Ativo', 'Encerrado', 'Pendente']),
            'Saldo_Contrato': saldo_contrato
        }
        contratos.append(contrato)
    df_contratos = pd.DataFrame(contratos)
    return df_contratos

# 9. Gerar Fato_Pagamentos
def gerar_fato_pagamentos(num_pagamentos, contratos_ids, tipos_pagamento_ids):
    pagamentos = []
    for _ in range(num_pagamentos):
        data_pagamento = fake.date_between(start_date='-2y', end_date='today')
        valor_pagamento = round(random.uniform(1000.0, 50000.0), 2)
        pagamento = {
            'ID_Pagamento': fake.unique.random_int(min=50000, max=999999),
            'ID_Contrato': random.choice(contratos_ids),
            'Data_Pagamento': data_pagamento,
            'Valor_Pagamento': valor_pagamento,
            'Método_Pagamento': random.choice(['Online', 'Presencial']),
            'ID_Tipo_Pagamento': random.choice(tipos_pagamento_ids)
        }
        pagamentos.append(pagamento)
    df_pagamentos = pd.DataFrame(pagamentos)
    return df_pagamentos

# 10. Gerar Fato_Violações
def gerar_fato_violacoes(num_violacoes, contratos_ids, tipos_violacao_ids):
    violacoes = []
    for _ in range(num_violacoes):
        data_violacao = fake.date_between(start_date='-1y', end_date='today')
        violacao = {
            'ID_Violação': fake.unique.random_int(min=70000, max=999999),
            'ID_Contrato': random.choice(contratos_ids),
            'Data_Violação': data_violacao,
            'ID_Tipo_Violação': random.choice(tipos_violacao_ids),
            'Descrição_Violação': fake.sentence(nb_words=6),
            'Ação_Tomada': random.choice(['Sim', 'Não']),
            'Severidade': random.choice(['Baixa', 'Média', 'Alta'])
        }
        violacoes.append(violacao)
    df_violacoes = pd.DataFrame(violacoes)
    return df_violacoes

# 11. Função principal para gerar todas as tabelas
def gerar_bases():
    # Gerar Dimensões
    df_clientes = gerar_dim_clientes(NUM_CLIENTES)
    df_fornecedores = gerar_dim_fornecedores(NUM_FORNECEDORES)
    df_tipo_contrato = gerar_dim_tipo_contrato()
    df_tipo_pagamento = gerar_dim_tipo_pagamento()
    df_tipo_violacao = gerar_dim_tipo_violacao()

    # Gerar Fatos
    df_contratos = gerar_fato_contratos(
        NUM_CONTRATOS,
        df_clientes['ID_Cliente'].tolist(),
        df_fornecedores['ID_Fornecedor'].tolist(),
        df_tipo_contrato['ID_Tipo_Contrato'].tolist()
    )
    df_pagamentos = gerar_fato_pagamentos(
        NUM_PAGAMENTOS,
        df_contratos['ID_Contrato'].tolist(),
        df_tipo_pagamento['ID_Tipo_Pagamento'].tolist()
    )
    df_violacoes = gerar_fato_violacoes(
        NUM_VIOLACOES,
        df_contratos['ID_Contrato'].tolist(),
        df_tipo_violacao['ID_Tipo_Violação'].tolist()
    )

    # Gerar Dim_Profissionais
    df_profissionais = gerar_dim_profissionais(
        NUM_PROFISSIONAIS,
        df_contratos['ID_Contrato'].tolist()
    )

    # Gerar Dim_Tempo
    data_min = min(df_contratos['Data_Início'].min(), df_pagamentos['Data_Pagamento'].min(), df_violacoes['Data_Violação'].min())
    data_max = max(df_contratos['Data_Término'].max(), df_pagamentos['Data_Pagamento'].max(), df_violacoes['Data_Violação'].max())
    df_tempo = gerar_dim_tempo(data_min, data_max)

    # Salvar as tabelas em CSV
    df_clientes.to_csv('Dim_Clientes.csv', index=False, encoding='utf-8')
    df_fornecedores.to_csv('Dim_Fornecedores.csv', index=False, encoding='utf-8')
    df_tipo_contrato.to_csv('Dim_Tipo_Contrato.csv', index=False, encoding='utf-8')
    df_tipo_pagamento.to_csv('Dim_Tipo_Pagamento.csv', index=False, encoding='utf-8')
    df_tipo_violacao.to_csv('Dim_Tipo_Violação.csv', index=False, encoding='utf-8')
    df_profissionais.to_csv('Dim_Profissionais.csv', index=False, encoding='utf-8')
    df_tempo.to_csv('Dim_Tempo.csv', index=False, encoding='utf-8')

    df_contratos.to_csv('Fato_Contratos.csv', index=False, encoding='utf-8')
    df_pagamentos.to_csv('Fato_Pagamentos.csv', index=False, encoding='utf-8')
    df_violacoes.to_csv('Fato_Violações.csv', index=False, encoding='utf-8')

    print("Bases de dados geradas com sucesso!")

# Executar a função principal
if __name__ == "__main__":
    gerar_bases()

ModuleNotFoundError: No module named 'faker'