<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/oficina_mecanica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Criando base de dados de uma oficina mecânica multimarcas


In [None]:
# Necessário instalar a biblioteca faker
! pip install faker

Collecting faker
  Downloading faker-37.0.0-py3-none-any.whl.metadata (15 kB)
Downloading faker-37.0.0-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m19.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-37.0.0


In [None]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 50  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_SERVICOS = 200 # Número de orçamentos/serviços

In [None]:
# Gerar clientes

clientes = []
for i in range(1, NUM_CLIENTES + 1):
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "telefone": fake.phone_number(),
        "email": fake.safe_email(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "endereco": fake.street_address(),
        "numero": fake.building_number(),
        "bairro": fake.neighborhood(),
        "cep": fake.postcode(),
        "cidade": "São Paulo",
        "estado": "São Paulo",
    })

df_clientes = pd.DataFrame(clientes)
df_clientes.head()

Unnamed: 0,id_cliente,nome,cpf,telefone,email,data_nascimento,sexo,endereco,numero,bairro,cep,cidade,estado
0,1,Ana Clara Jesus,329.675.084-38,+55 41 0036 1659,portomatheus@example.com,1971-01-05,Feminino,"Feira Correia, 62",35,Juliana,23661025,São Paulo,São Paulo
1,2,Isabela Lopes,058.269.413-24,41 3354-3131,franciscorodrigues@example.com,1961-11-21,Feminino,"Rodovia Santos, 98",4,Estrela Do Oriente,4830863,São Paulo,São Paulo
2,3,Eloá Fernandes,924.708.351-60,0300 402 6784,agatha22@example.com,2001-04-09,Feminino,"Setor Olivia Cavalcante, 20",601,Belmonte,40747379,São Paulo,São Paulo
3,4,Guilherme Castro,259.710.463-06,(031) 3377 2216,cmendes@example.com,1980-12-13,Masculino,"Rua Sophie Fogaça, 53",16,Céu Azul,94583375,São Paulo,São Paulo
4,5,Alice Mendonça,345.271.089-05,84 6704-1851,alexia62@example.net,1997-08-29,Feminino,Colônia Campos,147,Liberdade,51370425,São Paulo,São Paulo


In [23]:
# Gerar veículos

marcas_modelos = {
    "Fiat" : [ "Argo", "Cronos", "Pulse"],
    "Volkswagen" : [ "Polo", "Virtus", "Nivus"],
    "Hyundai" : ["HB20", "HB20S","Creta"],
    "GM" : ["Onix", "Onix Sedan", "Tracker"]
}

cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]

veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    marca = random.choice(list(marcas_modelos.keys()))
    modelo = random.choice(marcas_modelos[marca])
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_cliente": random.randint(1, NUM_CLIENTES),  # Associa o veículo a um cliente
        "id_veiculo": i,
        "marca": marca,
        "modelo": modelo,
        "ano": ano,
        "placa": placa,
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
    })

df_veiculos = pd.DataFrame(veiculos)
df_veiculos.head()

Unnamed: 0,id_cliente,id_veiculo,marca,modelo,ano,placa,cor,quilometragem
0,29,1,Volkswagen,Virtus,2022,ABC7179,Azul,67072
1,34,2,GM,Onix,2020,DEF8144,Vermelho,35164
2,38,3,GM,Onix Sedan,2021,ABC4477,Azul,77846
3,12,4,Fiat,Cronos,2021,ABC6216,Prata,568
4,6,5,Fiat,Pulse,2018,DEF5795,Vermelho,61432


In [25]:
# Gerar catálogo de peças

# Lista de peças
pecas = [
    "Filtro de ar",
    "Filtro de oleo",
    "Filtro de combustivel",
    "Filtro de cabine",
    "Oleo do motor",
    "Fluido de freio",
    "Disco de freio",
    "Pastilha de freio dianteira",
    "Vela de ignição"
]

# Dicionário de siglas para as peças
siglas_pecas = {
    "Filtro de ar": "AR",
    "Filtro de oleo": "OL",
    "Filtro de combustivel": "CO",
    "Filtro de cabine": "CA",
    "Oleo do motor": "OM",
    "Fluido de freio": "FF",
    "Disco de freio": "DF",
    "Pastilha de freio dianteira": "PD",
    "Vela de ignição": "VI"
}

# Dicionário de siglas para as marcas
siglas_marcas = {
    "Fiat": "FI",
    "Volkswagen": "VW",
    "Hyundai": "HYU",
    "GM": "GM"
}

catalogo_pecas = []

for marca, modelos in marcas_modelos.items():
    for peca in pecas:
        # Gera um código único para a peça
        numero_aleatorio = random.randint(100, 999)
        sigla_peca = siglas_pecas[peca]
        sigla_marca = siglas_marcas[marca]
        codigo_peca = f"{sigla_peca}{numero_aleatorio}{sigla_marca}"

        # Adiciona a peça ao catálogo
        catalogo_pecas.append({
            "codigo_peca": codigo_peca,
            "peca": peca,
            "marca": marca,
            "modelos": modelos  # Modelos compatíveis
        })

# Criar DataFrame do catálogo de peças
df_catalogo_pecas = pd.DataFrame(catalogo_pecas)

# Exibir as primeiras linhas do catálogo
df_catalogo_pecas.head(20)

Unnamed: 0,codigo_peca,peca,marca,modelos
0,AR711FI,Filtro de ar,Fiat,"[Argo, Cronos, Pulse]"
1,OL430FI,Filtro de oleo,Fiat,"[Argo, Cronos, Pulse]"
2,CO244FI,Filtro de combustivel,Fiat,"[Argo, Cronos, Pulse]"
3,CA205FI,Filtro de cabine,Fiat,"[Argo, Cronos, Pulse]"
4,OM559FI,Oleo do motor,Fiat,"[Argo, Cronos, Pulse]"
5,FF469FI,Fluido de freio,Fiat,"[Argo, Cronos, Pulse]"
6,DF497FI,Disco de freio,Fiat,"[Argo, Cronos, Pulse]"
7,PD395FI,Pastilha de freio dianteira,Fiat,"[Argo, Cronos, Pulse]"
8,VI808FI,Vela de ignição,Fiat,"[Argo, Cronos, Pulse]"
9,AR213VW,Filtro de ar,Volkswagen,"[Polo, Virtus, Nivus]"


In [None]:
# Gerar serviços realizados
servicos_realizados = []
for i in range(1, NUM_SERVICOS + 1):
    id_veiculo = random.randint(1, NUM_VEICULOS)
    veiculo = df_veiculos[df_veiculos['id_veiculo'] == id_veiculo].iloc[0]
    id_cliente = veiculo['id_cliente']  # Recupera o ID do cliente associado ao veículo

    servicos_realizados.append({
        "id_servico": i,
        "id_cliente": id_cliente,  # Adiciona o ID do cliente
        "id_veiculo": id_veiculo,  # Adiciona o ID do veículo
        "descricao": random.choice(["Troca de óleo", "Revisão", "Limpeza de bicos injetores", "Alinhamento", "Troca de pastilhas de freio"]),
        "data_servico": fake.date_between(start_date='-1y', end_date='today').strftime('%d-%m-%Y'),
        "custo": round(random.uniform(100, 1000), 2),
        "status": random.choice(["Concluído", "Cancelado"])
    })

df_servicos_realizados = pd.DataFrame(servicos_realizados)

# Substituindo . dos valores e ajustando ao padrão brasileiro
df_servicos_realizados['custo'] = df_servicos_realizados['custo'].astype(str).str.replace('.', ',')

df_servicos_realizados.head()

Unnamed: 0,id_servico,id_cliente,id_veiculo,descricao,data_servico,custo,status
0,1,20,49,Revisão,28-05-2024,9016,Concluído
1,2,9,14,Revisão,03-07-2024,22425,Concluído
2,3,17,7,Troca de óleo,02-05-2024,48325,Cancelado
3,4,29,39,Limpeza de bicos injetores,02-02-2025,72491,Cancelado
4,5,32,17,Revisão,05-07-2024,39505,Concluído


In [None]:
from google.colab import files

# Cria arquivos .csv com o separador ;
df_clientes.to_csv('clientes.csv', index=False, sep=';')
df_veiculos.to_csv('veiculos.csv', index=False, sep=';')
df_servicos_realizados.to_csv('servicos.csv', index=False, sep=';')

In [None]:
# Faz o download dos arquivos
files.download('clientes.csv')
files.download('veiculos.csv')
files.download('servicos.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>