<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/locadora_de_ve%C3%ADculos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Criando base de dados de uma locadora de veículos

---
- Clientes
- Locações
- Frota de veículos


In [1]:
#Necessário instalar a biblioteca faker
! pip install faker

Collecting faker
  Downloading Faker-36.1.1-py3-none-any.whl.metadata (15 kB)
Downloading Faker-36.1.1-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m15.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-36.1.1


In [14]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta

# Inicializa o Faker
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 3650  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_LOCACOES = 20000 # Número de locações

# Listas de opções
marcas_modelos = {
    "Fiat": ["Mobi", "Argo", "Cronos", "Pulse", "Toro"],
    "Volkswagen": ["Gol", "Polo", "Virtus", "T-Cross"],
    "Chevrolet": ["Onix", "Cruze", "Tracker", "S10"],
    "Hyundai": ["HB20", "Creta", "Tucson"],
    "Toyota": ["Corolla", "Hilux", "SW4"],
    "Ford": ["Ka", "EcoSport", "Ranger"]
}

categorias_veiculos = ["Econômico", "Intermediário", "SUV", "Pickup", "Luxo"]
cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]
status_locacao = ["Ativa", "Finalizada", "Cancelada"]

# Função para gerar datas aleatórias
def gerar_data_aleatoria(inicio, fim):
    return inicio + timedelta(days=random.randint(0, (fim - inicio).days))

# Gerar clientes
clientes = []
for i in range(1, NUM_CLIENTES + 1):
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "email": fake.email(),
        "telefone": fake.phone_number(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "cidade": fake.city(),
        "estado": fake.state_abbr()
    })

df_clientes = pd.DataFrame(clientes)

# Gerar veículos
veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    marca = random.choice(list(marcas_modelos.keys()))
    modelo = random.choice(marcas_modelos[marca])
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_veiculo": i,
        "marca": marca,
        "modelo": modelo,
        "ano": ano,
        "placa": placa,
        "categoria": random.choice(categorias_veiculos),
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
        "disponivel": random.choice([True, False])
    })

df_veiculos = pd.DataFrame(veiculos)

# Gerar locações
locacoes = []
data_inicio = datetime(2020, 1, 1)
data_fim = datetime(2024, 12, 31)

for i in range(1, NUM_LOCACOES + 1):
    id_cliente = random.randint(1, NUM_CLIENTES)
    id_veiculo = random.randint(1, NUM_VEICULOS)
    data_locacao = gerar_data_aleatoria(data_inicio, data_fim)
    data_devolucao = data_locacao + timedelta(days=random.randint(1, 30))
    valor_diaria = round(random.uniform(100, 500), 2)
    dias_locacao = (data_devolucao - data_locacao).days
    valor_total = round(valor_diaria * dias_locacao, 2)
    status = random.choice(status_locacao)

    locacoes.append({
        "id_locacao": i,
        "id_cliente": id_cliente,
        "id_veiculo": id_veiculo,
        "data_locacao": data_locacao.strftime('%d-%m-%Y'),
        "data_devolucao": data_devolucao.strftime('%d-%m-%Y'),
        "valor_diaria": valor_diaria,
        "dias_locacao": dias_locacao,
        "valor_total": valor_total,
        "status": status
    })

df_locacoes = pd.DataFrame(locacoes)

# Exibir DataFrames

In [15]:
print("Clientes:")
df_clientes.head()


Clientes:


Unnamed: 0,id_cliente,nome,cpf,email,telefone,data_nascimento,sexo,cidade,estado
0,1,Matheus Camargo,452.071.896-11,araujoapollo@example.net,+55 (011) 1125-2674,1988-12-19,Masculino,Abreu,MT
1,2,Maria Flor Pinto,783.152.490-88,juliacamara@example.com,+55 51 5024 8109,2005-02-18,Feminino,Marques do Amparo,SC
2,3,Erick da Cruz,367.041.289-13,spereira@example.org,+55 51 5133 3905,1968-01-22,Masculino,Sá,MT
3,4,Thales Caldeira,748.103.695-01,enricosantos@example.net,(021) 5557-3312,1967-04-04,Masculino,Porto,PI
4,5,Luiz Fernando Ferreira,310.465.872-26,diegovieira@example.com,+55 (081) 5422-7708,1980-02-07,Masculino,Nogueira,AM


In [16]:
print("\nVeículos:")
df_veiculos.head()


Veículos:


Unnamed: 0,id_veiculo,marca,modelo,ano,placa,categoria,cor,quilometragem,disponivel
0,1,Volkswagen,T-Cross,2015,GHI5949,SUV,Prata,28373,False
1,2,Ford,EcoSport,2022,ABC1573,Econômico,Vermelho,10991,True
2,3,Ford,Ranger,2018,DEF4188,Intermediário,Cinza,99023,True
3,4,Fiat,Cronos,2022,GHI4028,SUV,Vermelho,47775,False
4,5,Chevrolet,Cruze,2015,ABC2641,Econômico,Branco,72578,True


In [17]:
print("\nLocações:")
df_locacoes.head()


Locações:


Unnamed: 0,id_locacao,id_cliente,id_veiculo,data_locacao,data_devolucao,valor_diaria,dias_locacao,valor_total,status
0,1,2038,36,07-05-2023,17-05-2023,329.14,10,3291.4,Cancelada
1,2,382,33,08-05-2021,18-05-2021,306.0,10,3060.0,Cancelada
2,3,1402,6,01-05-2020,22-05-2020,391.21,21,8215.41,Finalizada
3,4,542,1,10-06-2020,12-06-2020,376.04,2,752.08,Cancelada
4,5,857,5,25-12-2022,04-01-2023,498.34,10,4983.4,Finalizada


#Criando os arquivos .csv

In [18]:
df_clientes.to_csv('clientes.csv', index=False)
df_veiculos.to_csv('veiculos.csv', index=False)
df_locacoes.to_csv('locacoes.csv', index=False)