<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/locadora_de_ve%C3%ADculos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Criando base de dados de uma locadora de veículos

---
- Clientes
- Locações
- Frota de veículos


In [55]:
#Necessário instalar a biblioteca faker
! pip install faker



In [71]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 100  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_LOCACOES = 20000 # Número de locações

# Lista de veiculos
modelos_categorias = [
    {"marca": "Fiat", "modelo": "Mobi", "categoria": "Econômico"},
    {"marca": "Fiat", "modelo": "Argo", "categoria": "Econômico"},
    {"marca": "Fiat", "modelo": "Cronos", "categoria": "Intermediário"},
    {"marca": "Fiat", "modelo": "Pulse", "categoria": "SUV"},
    {"marca": "Fiat", "modelo": "Toro", "categoria": "Pickup"},
    {"marca": "Volkswagen", "modelo": "Gol", "categoria": "Econômico"},
    {"marca": "Volkswagen", "modelo": "Polo", "categoria": "Intermediário"},
    {"marca": "Volkswagen", "modelo": "Virtus", "categoria": "Intermediário"},
    {"marca": "Volkswagen", "modelo": "T-Cross", "categoria": "SUV"},
    {"marca": "Chevrolet", "modelo": "Onix", "categoria": "Econômico"},
    {"marca": "Chevrolet", "modelo": "Cruze", "categoria": "Intermediário"},
    {"marca": "Chevrolet", "modelo": "Tracker", "categoria": "SUV"},
    {"marca": "Chevrolet", "modelo": "S10", "categoria": "Pickup"},
    {"marca": "Hyundai", "modelo": "HB20", "categoria": "Econômico"},
    {"marca": "Hyundai", "modelo": "Creta", "categoria": "SUV"},
    {"marca": "Hyundai", "modelo": "Tucson", "categoria": "SUV"},
    {"marca": "Toyota", "modelo": "Corolla", "categoria": "Intermediário"},
    {"marca": "Toyota", "modelo": "Hilux", "categoria": "Pickup"},
    {"marca": "Toyota", "modelo": "SW4", "categoria": "SUV"},
    {"marca": "Ford", "modelo": "Ka", "categoria": "Econômico"},
    {"marca": "Ford", "modelo": "EcoSport", "categoria": "SUV"},
    {"marca": "Ford", "modelo": "Ranger", "categoria": "Pickup"}
]

# Listas de opções

cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]

status_locacao = ["Ativa", "Finalizada", "Cancelada"]

cidades_estados = { "São Paulo": "SP", "Rio de Janeiro": "RJ","Belo Horizonte": "MG",
    "Porto Alegre": "RS","Curitiba": "PR",  "Salvador": "BA", "Fortaleza": "CE",
    "Recife": "PE", "Brasília": "DF", "Manaus": "AM","Belém": "PA","Goiânia": "GO",
    "Campinas": "SP", "São Luís": "MA","Maceió": "AL","Natal": "RN","Teresina": "PI",
    "João Pessoa": "PB","Aracaju": "SE", "Florianópolis": "SC","Vitória": "ES",
    "Cuiabá": "MT", "Campo Grande": "MS","Porto Velho": "RO","Boa Vista": "RR",
    "Palmas": "TO","Rio Branco": "AC","Macapá": "AP"
}


# Função para gerar datas aleatórias
def gerar_data_aleatoria(inicio, fim):
    return inicio + timedelta(days=random.randint(0, (fim - inicio).days))

# Gerar veículos

In [72]:
# Gerar veículos
veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    veiculo = random.choice(modelos_categorias)  # Escolhe um veículo aleatório da lista
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_veiculo": i,
        "marca": veiculo["marca"],
        "modelo": veiculo["modelo"],
        "ano": ano,
        "placa": placa,
        "categoria": veiculo["categoria"],
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
        "disponivel": random.choice([True, False])
    })

df_veiculos = pd.DataFrame(veiculos)

# Gerar lojas

In [73]:
# Gerar lojas
lojas = []
for i, (cidade, estado) in enumerate(cidades_estados.items(), start=1):
    lojas.append({
        "id_loja": i,
        "nome_loja": f"Locadora {cidade}",
        "cidade": cidade,
        "estado": estado
    })

# Criar DataFrame de lojas
df_lojas = pd.DataFrame(lojas)

# Gerar clientes

In [74]:
# Gerar clientes com lojas associadas
clientes = []
for i in range(1, NUM_CLIENTES + 1):  # Número de clientes
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    loja = random.choice(lojas)  # Escolhe uma loja aleatória
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "email": fake.email(),
        "telefone": fake.phone_number(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "cidade": loja["cidade"],  # Cidade da loja
        "estado": loja["estado"],  # Estado da loja
        "id_loja": loja["id_loja"]  # ID da loja
    })

df_clientes = pd.DataFrame(clientes)

#Gerar locações

In [75]:
# Gerar locações
locacoes = []
data_inicio = datetime(2020, 1, 1)
data_fim = datetime(2024, 12, 31)

for i in range(1, NUM_LOCACOES + 1):
    id_cliente = random.randint(1, NUM_CLIENTES)
    id_veiculo = random.randint(1, NUM_VEICULOS)
    data_locacao = gerar_data_aleatoria(data_inicio, data_fim)
    data_devolucao = data_locacao + timedelta(days=random.randint(1, 30))
    valor_diaria = round(random.uniform(100, 500), 2)
    dias_locacao = (data_devolucao - data_locacao).days
    valor_total = round(valor_diaria * dias_locacao, 2)
    status = random.choice(status_locacao)

    locacoes.append({
        "id_locacao": i,
        "id_cliente": id_cliente,
        "id_veiculo": id_veiculo,
        "data_locacao": data_locacao.strftime('%Y-%m-%d'),
        "data_devolucao": data_devolucao.strftime('%Y-%m-%d'),
        "valor_diaria": valor_diaria,
        "dias_locacao": dias_locacao,
        "valor_total": valor_total,
        "status": status
    })

df_locacoes = pd.DataFrame(locacoes)
#substituindo . dos valores e ajustando ao padrão brasileiro
df_locacoes['valor_diaria'] = df_locacoes['valor_diaria'].astype(str).str.replace('.', ',')
df_locacoes['valor_total'] = df_locacoes['valor_total'].astype(str).str.replace('.', ',')

# Exibir DataFrames

In [76]:
print("\nVeículos:")
df_veiculos.head()


Veículos:


Unnamed: 0,id_veiculo,marca,modelo,ano,placa,categoria,cor,quilometragem,disponivel
0,1,Chevrolet,S10,2018,ABC2182,Pickup,Azul,79297,False
1,2,Chevrolet,Onix,2022,ABC1476,Econômico,Preto,86659,True
2,3,Toyota,Corolla,2015,GHI7824,Intermediário,Branco,95910,False
3,4,Toyota,SW4,2022,ABC1801,SUV,Preto,99170,False
4,5,Ford,EcoSport,2023,ABC4527,SUV,Vermelho,70568,False


In [77]:
print("Lojas:")
df_lojas.head()

Lojas:


Unnamed: 0,id_loja,nome_loja,cidade,estado
0,1,Locadora São Paulo,São Paulo,SP
1,2,Locadora Rio de Janeiro,Rio de Janeiro,RJ
2,3,Locadora Belo Horizonte,Belo Horizonte,MG
3,4,Locadora Porto Alegre,Porto Alegre,RS
4,5,Locadora Curitiba,Curitiba,PR


In [78]:
print("Clientes:")
df_clientes.head()

Clientes:


Unnamed: 0,id_cliente,nome,cpf,email,telefone,data_nascimento,sexo,cidade,estado,id_loja
0,1,Ana Laura Silva,783.109.264-13,uda-cruz@example.net,+55 81 3646 6788,1982-08-11,Feminino,Natal,RN,16
1,2,Otto Aragão,387.451.069-75,benjamimandrade@example.com,0300 042 5165,1957-03-26,Masculino,Campo Grande,MS,23
2,3,Sofia Moreira,938.502.416-70,andradeluan@example.org,+55 (071) 3775-0919,1976-09-19,Feminino,Rio de Janeiro,RJ,2
3,4,Thales Lopes,240.169.837-03,benjamin75@example.net,+55 (041) 7534 7760,1958-04-22,Masculino,Rio de Janeiro,RJ,2
4,5,Henry Fernandes,097.458.612-94,benjamimaragao@example.net,+55 81 7817-4195,2004-04-21,Masculino,Palmas,TO,26


In [79]:
print("\nLocações:")
df_locacoes.head()


Locações:


Unnamed: 0,id_locacao,id_cliente,id_veiculo,data_locacao,data_devolucao,valor_diaria,dias_locacao,valor_total,status
0,1,24,30,2020-06-14,2020-07-06,49917,22,1098174,Ativa
1,2,33,12,2023-08-03,2023-08-25,27843,22,612546,Ativa
2,3,30,47,2024-11-18,2024-12-13,16041,25,401025,Ativa
3,4,10,12,2020-01-28,2020-02-13,18863,16,301808,Cancelada
4,5,89,4,2021-03-10,2021-03-22,20897,12,250764,Cancelada


#Criando os arquivos .csv

In [80]:
from google.colab import files

# Cria arquivos .csv com o separador ;
df_veiculos.to_csv('veiculos.csv', index=False, sep=';')
df_lojas.to_csv('lojas.csv', index=False, sep=';')
df_clientes.to_csv('clientes.csv', index=False, sep=';')
df_locacoes.to_csv('locacoes.csv', index=False, sep=';')

# Faz o download dos arquivos
files.download('veiculos.csv')
files.download('lojas.csv')
files.download('clientes.csv')
files.download('locacoes.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>