In [1]:
import pandas as pd
import numpy as np
from faker import Faker
from random import randint, choice, sample
from tqdm import tqdm

fake = Faker('pt_BR')

N_CLIENTES = 10000
N_PRODUTOS = 500
N_PEDIDOS = 60000
N_ITENS = 150000
N_PAGAMENTOS = 65000

# CLIENTES
clientes = pd.DataFrame({
    'cliente_id': np.arange(1, N_CLIENTES + 1),
    'nome': [fake.name() for _ in range(N_CLIENTES)],
    'email': [fake.email() for _ in range(N_CLIENTES)],
    'cidade': [fake.city() for _ in range(N_CLIENTES)],
    'data_cadastro': [fake.date_between('-5y', 'today') for _ in range(N_CLIENTES)],
})

# PRODUTOS
produtos = pd.DataFrame({
    'produto_id': np.arange(1, N_PRODUTOS + 1),
    'nome_produto': [fake.word().capitalize() for _ in range(N_PRODUTOS)],
    'categoria': [choice(['Eletrônico', 'Roupas', 'Livros', 'Alimentos', 'Casa', 'Beleza']) for _ in range(N_PRODUTOS)],
    'preco': np.round(np.random.uniform(10, 2000, N_PRODUTOS), 2),
})

# PEDIDOS
pedidos = pd.DataFrame({
    'pedido_id': np.arange(1, N_PEDIDOS + 1),
    'cliente_id': np.random.choice(clientes['cliente_id'], size=N_PEDIDOS),
    'data_pedido': [fake.date_between('-3y', 'today') for _ in range(N_PEDIDOS)],
    'status': [choice(['entregue', 'cancelado', 'em_andamento', 'faturado']) for _ in range(N_PEDIDOS)],
})

# ITENS_PEDIDO
itens_pedido = pd.DataFrame({
    'item_id': np.arange(1, N_ITENS + 1),
    'pedido_id': np.random.choice(pedidos['pedido_id'], size=N_ITENS),
    'produto_id': np.random.choice(produtos['produto_id'], size=N_ITENS),
    'quantidade': np.random.randint(1, 6, size=N_ITENS),
    'preco_unitario': np.round(np.random.uniform(10, 2000, N_ITENS), 2),
})

# PAGAMENTOS
pagamentos = pd.DataFrame({
    'pagamento_id': np.arange(1, N_PAGAMENTOS + 1),
    'pedido_id': np.random.choice(pedidos['pedido_id'], size=N_PAGAMENTOS),
    'data_pagamento': [fake.date_between('-3y', 'today') for _ in range(N_PAGAMENTOS)],
    'valor_pago': np.round(np.random.uniform(10, 4000, N_PAGAMENTOS), 2),
    'forma_pagamento': [choice(['boleto', 'cartao_credito', 'pix', 'transferencia']) for _ in range(N_PAGAMENTOS)],
})

# Salvando os arquivos
clientes.to_csv('clientes.csv', index=False)
produtos.to_csv('produtos.csv', index=False)
pedidos.to_csv('pedidos.csv', index=False)
itens_pedido.to_csv('itens_pedido.csv', index=False)
pagamentos.to_csv('pagamentos.csv', index=False)
