<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/oficina_mecanica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Criando base de dados de uma oficina mecânica multimarcas


In [26]:
# Necessário instalar a biblioteca faker
! pip install faker



In [35]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 50  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_AGENDAMENTOS = 100 # Número de agendamentos
NUM_SERVICOS = 100 # Número de orçamentos/serviços


In [36]:
# Gerar clientes

clientes = []
for i in range(1, NUM_CLIENTES + 1):
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "telefone": fake.phone_number(),
        "email": fake.safe_email(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "endereco": fake.street_address(),
        "numero": fake.building_number(),
        "bairro": fake.neighborhood(),
        "cep": fake.postcode(),
        "cidade": "São Paulo",
        "estado": "São Paulo",
    })

df_clientes = pd.DataFrame(clientes)
df_clientes.head()

Unnamed: 0,id_cliente,nome,cpf,telefone,email,data_nascimento,sexo,endereco,numero,bairro,cep,cidade,estado
0,1,Diego Aparecida,857.940.163-10,+55 (021) 9521 8945,miguelrios@example.net,1958-02-22,Masculino,"Praça de Gomes, 176",111,Eymard,21444-100,São Paulo,São Paulo
1,2,Augusto Carvalho,035.281.694-51,+55 (051) 9431-7509,cassianothomas@example.org,1958-12-23,Masculino,"Viaduto de Rodrigues, 4",9,Flavio De Oliveira,92407828,São Paulo,São Paulo
2,3,Stephany Jesus,051.387.942-05,0900 866 4373,melojose-miguel@example.net,1997-09-06,Feminino,"Passarela de Andrade, 54",58,Vitoria Da Conquista,27401-280,São Paulo,São Paulo
3,4,Augusto Teixeira,476.852.093-65,+55 (051) 3097 8059,joao-lucas46@example.com,2003-06-10,Masculino,Praça Rhavi Sales,72,Independência,58610-857,São Paulo,São Paulo
4,5,André Ramos,617.532.089-12,51 7541 3723,da-motamaya@example.org,2005-08-20,Masculino,"Trecho Martins, 3",94,Santa Helena,90155470,São Paulo,São Paulo


In [29]:
# Gerar veículos

marcas_modelos = {
    "Fiat" : [ "Argo", "Cronos", "Pulse"],
    "Volkswagen" : [ "Polo", "Virtus", "Nivus"],
    "Hyundai" : ["HB20", "HB20S","Creta"],
    "GM" : ["Onix", "Onix Sedan", "Tracker"]
}

cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]

veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    marca = random.choice(list(marcas_modelos.keys()))
    modelo = random.choice(marcas_modelos[marca])
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_cliente": random.randint(1, NUM_CLIENTES),  # Associa o veículo a um cliente
        "id_veiculo": i,
        "marca": marca,
        "modelo": modelo,
        "ano": ano,
        "placa": placa,
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
    })

df_veiculos = pd.DataFrame(veiculos)
df_veiculos.head()

Unnamed: 0,id_cliente,id_veiculo,marca,modelo,ano,placa,cor,quilometragem
0,31,1,Hyundai,HB20,2017,GHI5892,Azul,99160
1,42,2,Fiat,Argo,2015,ABC2182,Cinza,1845
2,50,3,GM,Tracker,2023,ABC6257,Vermelho,1313
3,22,4,Volkswagen,Virtus,2015,GHI8640,Branco,11787
4,46,5,GM,Onix,2022,DEF8312,Vermelho,9531


In [33]:
# Gerar catálogo de peças

# Lista de peças
pecas = [
    "Filtro de ar",
    "Filtro de oleo",
    "Filtro de combustivel",
    "Filtro de cabine",
    "Oleo do motor",
    "Fluido de freio",
    "Disco de freio",
    "Pastilha de freio dianteira",
    "Vela de ignição"
]

# Dicionário de siglas para as peças
siglas_pecas = {
    "Filtro de ar": "AR",
    "Filtro de oleo": "OL",
    "Filtro de combustivel": "CO",
    "Filtro de cabine": "CA",
    "Oleo do motor": "OM",
    "Fluido de freio": "FF",
    "Disco de freio": "DF",
    "Pastilha de freio dianteira": "PD",
    "Vela de ignição": "VI"
}

# Dicionário de siglas para as marcas
siglas_marcas = {
    "Fiat": "FI",
    "Volkswagen": "VW",
    "Hyundai": "HYU",
    "GM": "GM"
}

# Faixas de preço por tipo de peça (em reais)
faixas_preco = {
    "Filtro de ar": (20, 55),
    "Filtro de oleo": (15, 40),
    "Filtro de combustivel": (15, 50),
    "Filtro de cabine": (40, 120),
    "Oleo do motor": (120, 200),
    "Fluido de freio": (15, 35),
    "Disco de freio": (100, 300),
    "Pastilha de freio dianteira": (50, 150),
    "Vela de ignição": (40, 80)
}

# Função para gerar preço aleatório dentro de uma faixa
def gerar_preco(peca):
    min_preco, max_preco = faixas_preco[peca]
    return round(random.uniform(min_preco, max_preco), 2)

catalogo_pecas = []

for marca, modelos in marcas_modelos.items():
    for peca in pecas:
        # Gera um código único para a peça
        numero_aleatorio = random.randint(100, 999)
        sigla_peca = siglas_pecas[peca]
        sigla_marca = siglas_marcas[marca]
        codigo_peca = f"{sigla_peca}{numero_aleatorio}{sigla_marca}"
        preco = gerar_preco(peca)

        # Adiciona a peça ao catálogo
        catalogo_pecas.append({
            "codigo_peca": codigo_peca,
            "peca": peca,
            "marca": marca,
            "modelos": modelos,  # Modelos compatíveis
            "preco": preco
        })

# Criar DataFrame do catálogo de peças
df_catalogo_pecas = pd.DataFrame(catalogo_pecas)

# Exibir as primeiras linhas do catálogo
df_catalogo_pecas.head(20)

Unnamed: 0,codigo_peca,peca,marca,modelos,preco
0,AR814FI,Filtro de ar,Fiat,"[Argo, Cronos, Pulse]",20.89
1,OL797FI,Filtro de oleo,Fiat,"[Argo, Cronos, Pulse]",17.42
2,CO107FI,Filtro de combustivel,Fiat,"[Argo, Cronos, Pulse]",39.45
3,CA978FI,Filtro de cabine,Fiat,"[Argo, Cronos, Pulse]",42.74
4,OM552FI,Oleo do motor,Fiat,"[Argo, Cronos, Pulse]",122.7
5,FF622FI,Fluido de freio,Fiat,"[Argo, Cronos, Pulse]",28.12
6,DF748FI,Disco de freio,Fiat,"[Argo, Cronos, Pulse]",285.59
7,PD895FI,Pastilha de freio dianteira,Fiat,"[Argo, Cronos, Pulse]",66.07
8,VI462FI,Vela de ignição,Fiat,"[Argo, Cronos, Pulse]",77.09
9,AR176VW,Filtro de ar,Volkswagen,"[Polo, Virtus, Nivus]",45.13


In [50]:
# Lista de serviços que podem ser agendados
servicos_agendaveis = ["Revisão completa", "Troca de óleo", "Troca de discos e pastilhas de freio", "Troca de pastilhas de freio"]

# Gerar agendamentos
agendamentos = []
for i in range(1, NUM_AGENDAMENTOS + 1):
    id_veiculo = random.randint(1, NUM_VEICULOS)
    veiculo = df_veiculos[df_veiculos['id_veiculo'] == id_veiculo].iloc[0]
    id_cliente = veiculo['id_cliente']  # Recupera o ID do cliente associado ao veículo

    # Gera uma data de agendamento que antecede a data do serviço
    data_agendamento = fake.date_between(start_date='-1y', end_date='-1d').strftime('%d-%m-%Y')

    agendamentos.append({
        "id_agendamento": i,
        "id_cliente": id_cliente,
        "id_veiculo": id_veiculo,  # Adiciona o ID do veículo
        "descricao": random.choice(servicos_agendaveis),
        "data_agendamento": data_agendamento,
        "status": random.choice(["Aprovado", "Não Aprovado"])

    })

# Criar DataFrame dos agendamentos
df_agendamentos = pd.DataFrame(agendamentos)

# Exibir as primeiras linhas dos agendamentos
df_agendamentos.head()

Unnamed: 0,id_agendamento,id_cliente,id_veiculo,descricao,data_agendamento,status
0,1,7,14,Troca de pastilhas de freio,29-09-2024,Aprovado
1,2,36,27,Revisão completa,05-04-2024,Aprovado
2,3,49,12,Troca de pastilhas de freio,06-10-2024,Não Aprovado
3,4,48,38,Revisão completa,10-05-2024,Aprovado
4,5,45,41,Troca de discos e pastilhas de freio,13-03-2024,Não Aprovado


In [51]:
# Gerar serviços realizados com base nos agendamentos aprovados
servicos_realizados = []
for agendamento in agendamentos:
    if agendamento["status"] == "Aprovado":
        # Gera uma data de serviço que é posterior à data de agendamento
        # Converting data_agendamento to datetime object before passing to date_between
        data_agendamento_dt = datetime.strptime(agendamento["data_agendamento"], '%d-%m-%Y').date()
        data_servico = fake.date_between(start_date=data_agendamento_dt, end_date='today').strftime('%d-%m-%Y')

        # Gera um custo aleatório para o serviço
        custo = round(random.uniform(100, 1000), 2)

        servicos_realizados.append({
            "id_servico": len(servicos_realizados) + 1,
            "id_cliente": agendamento["id_cliente"],
            "id_veiculo": agendamento["id_veiculo"],
            "descricao": agendamento["descricao"],
            "data_servico": data_servico,  # Data do serviço
            "custo": custo,
            "status": "Concluído"
        })

# Criar DataFrame dos serviços realizados
df_servicos_realizados = pd.DataFrame(servicos_realizados)

# Substituindo . dos valores e ajustando ao padrão brasileiro
df_servicos_realizados['custo'] = df_servicos_realizados['custo'].astype(str).str.replace('.', ',')

# Exibir as primeiras linhas dos serviços realizados
df_servicos_realizados.head()

# Substituindo . dos valores e ajustando ao padrão brasileiro
df_servicos_realizados['custo'] = df_servicos_realizados['custo'].astype(str).str.replace('.', ',')

df_servicos_realizados.head()

Unnamed: 0,id_servico,id_cliente,id_veiculo,descricao,data_servico,custo,status
0,1,7,14,Troca de pastilhas de freio,12-01-2025,20514,Concluído
1,2,36,27,Revisão completa,25-11-2024,14439,Concluído
2,3,48,38,Revisão completa,01-12-2024,83733,Concluído
3,4,16,19,Troca de óleo,07-03-2025,22874,Concluído
4,5,22,4,Troca de óleo,03-06-2024,14739,Concluído


In [None]:
from google.colab import files

# Cria arquivos .csv com o separador ;
df_clientes.to_csv('clientes.csv', index=False, sep=';')
df_veiculos.to_csv('veiculos.csv', index=False, sep=';')
df_servicos_realizados.to_csv('servicos.csv', index=False, sep=';')

In [None]:
# Faz o download dos arquivos
files.download('clientes.csv')
files.download('veiculos.csv')
files.download('servicos.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>