<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/oficina_mecanica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Criando base de dados de uma oficina mecânica multimarcas


In [1]:
# Necessário instalar a biblioteca faker
! pip install faker


Collecting faker
  Downloading faker-37.0.0-py3-none-any.whl.metadata (15 kB)
Downloading faker-37.0.0-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m20.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-37.0.0


In [37]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 50  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_SERVICOS = 200 # Número de orçamentos/serviços


In [38]:
# Gerar clientes

clientes = []
for i in range(1, NUM_CLIENTES + 1):
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "telefone": fake.phone_number(),
        "email": fake.safe_email(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "endereco": fake.street_address(),
        "numero": fake.building_number(),
        "bairro": fake.neighborhood(),
        "cep": fake.postcode(),
        "cidade": fake.city(),
        "estado": fake.state(),
    })

df_clientes = pd.DataFrame(clientes)
df_clientes.head()

Unnamed: 0,id_cliente,nome,cpf,telefone,email,data_nascimento,sexo,endereco,numero,bairro,cep,cidade,estado
0,1,Maria Júlia Mendonça,473.251.869-91,0900-407-9598,da-pazdavi-miguel@example.com,1981-11-03,Feminino,"Ladeira Maria Fernanda Mendonça, 50",963,Vila Esplanada,75190-071,Pastor,Rio Grande do Norte
1,2,Marcelo Casa Grande,312.459.760-52,+55 84 8916-2132,mendesisabela@example.net,1959-06-20,Masculino,"Trevo Leonardo Sá, 37",3,Vila Minaslandia,33645716,Gonçalves do Oeste,Roraima
2,3,Maria Helena Dias,371.405.628-90,+55 (041) 7584 9148,araujoana-livia@example.org,1991-09-03,Feminino,"Recanto João Lucas Silveira, 82",59,Granja Werneck,23440609,Ramos,Paraíba
3,4,Noah Nascimento,042.985.376-92,(061) 8384 3516,paulobarbosa@example.com,1983-03-01,Masculino,"Rua Hellena Montenegro, 110",873,Nova Vista,16880694,da Rosa,Rondônia
4,5,Caio Vieira,547.602.139-61,0300 467 8874,eloada-cunha@example.net,1992-08-22,Masculino,"Morro Martins, 30",3,Conjunto Jatoba,36498779,Albuquerque,Acre


In [39]:
# Gerar veículos

marcas_modelos = {
    "Fiat" : [ "Argo", "Cronos", "Pulse"],
    "Volkswagen" : [ "Polo", "Virtus", "Nivus"],
    "Hyundai" : ["HB20", "HB20S","Creta"],
    "GM" : ["Onix", "Onix Sedan", "Tracker"]
}

cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]

veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    marca = random.choice(list(marcas_modelos.keys()))
    modelo = random.choice(marcas_modelos[marca])
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_cliente": random.randint(1, NUM_CLIENTES),  # Associa o veículo a um cliente
        "id_veiculo": i,
        "marca": marca,
        "modelo": modelo,
        "ano": ano,
        "placa": placa,
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
    })

df_veiculos = pd.DataFrame(veiculos)
df_veiculos.head()

Unnamed: 0,id_cliente,id_veiculo,marca,modelo,ano,placa,cor,quilometragem
0,44,1,Hyundai,Creta,2022,GHI8912,Branco,41542
1,11,2,Volkswagen,Polo,2022,ABC6924,Azul,63275
2,32,3,Fiat,Argo,2018,DEF6523,Cinza,44544
3,34,4,Volkswagen,Nivus,2017,ABC8806,Azul,81441
4,24,5,Volkswagen,Nivus,2015,DEF3614,Azul,34874


In [40]:
# Gerar serviços realizados
servicos_realizados = []
for i in range(1, NUM_SERVICOS + 1):
    id_veiculo = random.randint(1, NUM_VEICULOS)
    veiculo = df_veiculos[df_veiculos['id_veiculo'] == id_veiculo].iloc[0]
    id_cliente = veiculo['id_cliente']  # Recupera o ID do cliente associado ao veículo

    servicos_realizados.append({
        "id_servico": i,
        "id_cliente": id_cliente,  # Adiciona o ID do cliente
        "id_veiculo": id_veiculo,  # Adiciona o ID do veículo
        "descricao": random.choice(["Troca de óleo", "Revisão", "Limpeza de bicos injetores", "Alinhamento", "Troca de pastilhas de freio"]),
        "data_servico": fake.date_between(start_date='-1y', end_date='today').strftime('%d-%m-%Y'),
        "custo": round(random.uniform(100, 1000), 2),
        "status": random.choice(["Concluído", "Cancelado"])
    })

df_servicos_realizados = pd.DataFrame(servicos_realizados)

# Substituindo . dos valores e ajustando ao padrão brasileiro
df_servicos_realizados['custo'] = df_servicos_realizados['custo'].astype(str).str.replace('.', ',')

df_servicos_realizados.head()

Unnamed: 0,id_servico,id_cliente,id_veiculo,descricao,data_servico,custo,status
0,1,20,49,Revisão,28-05-2024,9016,Concluído
1,2,9,14,Revisão,03-07-2024,22425,Concluído
2,3,17,7,Troca de óleo,02-05-2024,48325,Cancelado
3,4,29,39,Limpeza de bicos injetores,02-02-2025,72491,Cancelado
4,5,32,17,Revisão,05-07-2024,39505,Concluído


In [41]:
from google.colab import files

# Cria arquivos .csv com o separador ;
df_clientes.to_csv('clientes.csv', index=False, sep=';')
df_veiculos.to_csv('veiculos.csv', index=False, sep=';')
df_servicos_realizados.to_csv('servicos.csv', index=False, sep=';')

In [42]:
# Faz o download dos arquivos
files.download('clientes.csv')
files.download('veiculos.csv')
files.download('servicos.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>