<a href="https://colab.research.google.com/github/fabiobaroliveira/gerador_base_de_dados/blob/main/locadora_de_ve%C3%ADculos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Criando base de dados de uma locadora de veículos

---
- Clientes
- Locações
- Frota de veículos


In [2]:
#Necessário instalar a biblioteca faker
! pip install faker

Collecting faker
  Downloading Faker-36.2.0-py3-none-any.whl.metadata (15 kB)
Downloading Faker-36.2.0-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m28.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-36.2.0


#Definido alguns parametros

In [30]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta
fake = Faker('pt_BR')

# Configurações
NUM_CLIENTES = 100  # Número de clientes
NUM_VEICULOS = 50   # Número de veículos
NUM_LOCACOES = 20000 # Número de locações

# Lista de veiculos
modelos_categorias = [
    {"marca": "Fiat", "modelo": "Mobi", "categoria": "Econômico"},
    {"marca": "Fiat", "modelo": "Argo", "categoria": "Econômico"},
    {"marca": "Fiat", "modelo": "Cronos", "categoria": "Intermediário"},
    {"marca": "Fiat", "modelo": "Pulse", "categoria": "SUV"},
    {"marca": "Fiat", "modelo": "Toro", "categoria": "Pickup"},
    {"marca": "Volkswagen", "modelo": "Gol", "categoria": "Econômico"},
    {"marca": "Volkswagen", "modelo": "Polo", "categoria": "Intermediário"},
    {"marca": "Volkswagen", "modelo": "Virtus", "categoria": "Intermediário"},
    {"marca": "Volkswagen", "modelo": "T-Cross", "categoria": "SUV"},
    {"marca": "Chevrolet", "modelo": "Onix", "categoria": "Econômico"},
    {"marca": "Chevrolet", "modelo": "Cruze", "categoria": "Intermediário"},
    {"marca": "Chevrolet", "modelo": "Tracker", "categoria": "SUV"},
    {"marca": "Chevrolet", "modelo": "S10", "categoria": "Pickup"},
    {"marca": "Hyundai", "modelo": "HB20", "categoria": "Econômico"},
    {"marca": "Hyundai", "modelo": "Creta", "categoria": "SUV"},
    {"marca": "Hyundai", "modelo": "Tucson", "categoria": "SUV"},
    {"marca": "Toyota", "modelo": "Corolla", "categoria": "Intermediário"},
    {"marca": "Toyota", "modelo": "Hilux", "categoria": "Pickup"},
    {"marca": "Toyota", "modelo": "SW4", "categoria": "SUV"},
    {"marca": "Ford", "modelo": "Ka", "categoria": "Econômico"},
    {"marca": "Ford", "modelo": "EcoSport", "categoria": "SUV"},
    {"marca": "Ford", "modelo": "Ranger", "categoria": "Pickup"}
]

# Listas de opções

cores = ["Preto", "Branco", "Prata", "Vermelho", "Azul", "Cinza"]

status_locacao = ["Ativa", "Finalizada", "Cancelada"]

cidades_estados = { "São Paulo": "SP", "Rio de Janeiro": "RJ","Belo Horizonte": "MG",
    "Porto Alegre": "RS","Curitiba": "PR",  "Salvador": "BA", "Fortaleza": "CE",
    "Recife": "PE", "Brasília": "DF", "Manaus": "AM","Belém": "PA","Goiânia": "GO",
    "Campinas": "SP", "São Luís": "MA","Maceió": "AL","Natal": "RN","Teresina": "PI",
    "João Pessoa": "PB","Aracaju": "SE", "Florianópolis": "SC","Vitória": "ES",
    "Cuiabá": "MT", "Campo Grande": "MS","Porto Velho": "RO","Boa Vista": "RR",
    "Palmas": "TO","Rio Branco": "AC","Macapá": "AP"
}


# Função para gerar datas aleatórias
def gerar_data_aleatoria(inicio, fim):
    return inicio + timedelta(days=random.randint(0, (fim - inicio).days))

# Gerar veículos

In [31]:
# Gerar veículos
veiculos = []
for i in range(1, NUM_VEICULOS + 1):
    veiculo = random.choice(modelos_categorias)  # Escolhe um veículo aleatório da lista
    ano = random.randint(2015, 2023)
    placa = f"{random.choice(['ABC', 'DEF', 'GHI'])}{random.randint(1000, 9999)}"
    veiculos.append({
        "id_veiculo": i,
        "marca": veiculo["marca"],
        "modelo": veiculo["modelo"],
        "ano": ano,
        "placa": placa,
        "categoria": veiculo["categoria"],
        "cor": random.choice(cores),
        "quilometragem": random.randint(0, 100000),
        "disponivel": random.choice([True, False])
    })

df_veiculos = pd.DataFrame(veiculos)

# Gerar lojas

In [32]:
# Gerar lojas
lojas = []
for i, (cidade, estado) in enumerate(cidades_estados.items(), start=1):
    lojas.append({
        "id_loja": i,
        "nome_loja": f"Locadora {cidade}",
        "cidade": cidade,
        "estado": estado
    })

df_lojas = pd.DataFrame(lojas)

# Gerar clientes

In [17]:
# Gerar clientes
clientes = []
for i in range(1, NUM_CLIENTES + 1):
    sexo = random.choice(["Masculino", "Feminino"])
    nome = fake.first_name_male() if sexo == "Masculino" else fake.first_name_female()
    cidade, estado = random.choice(list(cidades_estados.items()))  # Escolhe uma cidade e estado aleatórios
    clientes.append({
        "id_cliente": i,
        "nome": f"{nome} {fake.last_name()}",
        "cpf": fake.cpf(),
        "email": fake.email(),
        "telefone": fake.phone_number(),
        "data_nascimento": fake.date_of_birth(minimum_age=18, maximum_age=70),
        "sexo": sexo,
        "cidade": cidade,
        "estado": estado
    })

df_clientes = pd.DataFrame(clientes)

#Gerar locações

In [28]:
# Gerar locações
locacoes = []
data_inicio = datetime(2020, 1, 1)
data_fim = datetime(2024, 12, 31)

for i in range(1, NUM_LOCACOES + 1):
    id_cliente = random.randint(1, NUM_CLIENTES)
    id_veiculo = random.randint(1, NUM_VEICULOS)
    data_locacao = gerar_data_aleatoria(data_inicio, data_fim)
    data_devolucao = data_locacao + timedelta(days=random.randint(1, 30))
    valor_diaria = round(random.uniform(100, 500), 2)
    dias_locacao = (data_devolucao - data_locacao).days
    valor_total = round(valor_diaria * dias_locacao, 2)
    status = random.choice(status_locacao)

  # Recupera a cidade do cliente
    cliente = df_clientes[df_clientes['id_cliente'] == id_cliente].iloc[0]
    cidade_cliente = cliente['cidade']

  # Encontra a loja correspondente à cidade do cliente
    loja = df_lojas[df_lojas['cidade'] == cidade_cliente].iloc[0]
    id_loja = loja['id_loja']


    locacoes.append({
        "id_locacao": i,
        "id_loja": id_loja,
        "id_cliente": id_cliente,
        "id_veiculo": id_veiculo,
        "data_locacao": data_locacao.strftime('%d-%m-%Y'),
        "data_devolucao": data_devolucao.strftime('%d-%m-%Y'),
        "valor_diaria": valor_diaria,
        "dias_locacao": dias_locacao,
        "valor_total": valor_total,
        "status": status

    })

df_locacoes = pd.DataFrame(locacoes)

#substituindo . dos valores e ajustando ao padrão brasileiro
df_locacoes['valor_diaria'] = df_locacoes['valor_diaria'].astype(str).str.replace('.', ',')
df_locacoes['valor_total'] = df_locacoes['valor_total'].astype(str).str.replace('.', ',')

# Exibir DataFrames

In [26]:
print("\nVeículos:")
df_veiculos.head()


Veículos:


Unnamed: 0,id_veiculo,marca,modelo,ano,placa,categoria,cor,quilometragem,disponivel
0,1,Chevrolet,Onix,2019,GHI5933,Econômico,Vermelho,30284,True
1,2,Volkswagen,Polo,2023,GHI8657,Intermediário,Azul,84745,False
2,3,Chevrolet,Onix,2022,DEF4642,Econômico,Preto,63669,False
3,4,Toyota,SW4,2023,GHI4565,SUV,Azul,5352,True
4,5,Ford,Ranger,2017,DEF7491,Pickup,Cinza,37484,True


In [18]:
print("Lojas:")
df_lojas.head()

Lojas:


Unnamed: 0,id_loja,nome_loja,cidade,estado
0,1,Locadora São Paulo,São Paulo,SP
1,2,Locadora Rio de Janeiro,Rio de Janeiro,RJ
2,3,Locadora Belo Horizonte,Belo Horizonte,MG
3,4,Locadora Porto Alegre,Porto Alegre,RS
4,5,Locadora Curitiba,Curitiba,PR


In [27]:
print("Clientes:")
df_clientes.head()

Clientes:


Unnamed: 0,id_cliente,nome,cpf,email,telefone,data_nascimento,sexo,cidade,estado
0,1,Asafe Moura,901.387.245-04,macedoaylla@example.com,41 8165-3002,2006-01-15,Masculino,São Luís,MA
1,2,Ana Sophia Nogueira,208.937.615-59,andradeana@example.com,11 8638 0610,1974-07-12,Feminino,Boa Vista,RR
2,3,Maria Helena Vieira,630.895.271-03,vbrito@example.org,41 0492 4072,1986-05-03,Feminino,Curitiba,PR
3,4,Heloisa Camargo,176.895.324-46,nmachado@example.com,+55 21 7197-7541,1976-12-16,Feminino,João Pessoa,PB
4,5,Guilherme Câmara,401.738.562-17,luararamos@example.org,+55 21 9779 9957,1981-03-16,Masculino,Natal,RN


In [29]:
print("\nLocações:")
df_locacoes.head()


Locações:


Unnamed: 0,id_locacao,id_loja,id_cliente,id_veiculo,data_locacao,data_devolucao,valor_diaria,dias_locacao,valor_total,status
0,1,5,3,29,20-04-2024,21-04-2024,20362,1,20362,Finalizada
1,2,26,59,12,03-05-2021,10-05-2021,29269,7,204883,Cancelada
2,3,15,69,3,03-09-2024,14-09-2024,2440,11,26840,Ativa
3,4,21,11,37,27-03-2022,08-04-2022,35933,12,431196,Finalizada
4,5,18,4,1,20-11-2023,15-12-2023,28383,25,709575,Cancelada


#Criando os arquivos .csv

In [None]:
from google.colab import files

# Cria arquivos .csv com o separador ;
df_veiculos.to_csv('veiculos.csv', index=False, sep=';')
df_lojas.to_csv('lojas.csv', index=False, sep=';')
df_clientes.to_csv('clientes.csv', index=False, sep=';')
df_locacoes.to_csv('locacoes.csv', index=False, sep=';')

# Faz o download dos arquivos
files.download('veiculos.csv')
files.download('lojas.csv')
files.download('clientes.csv')
files.download('locacoes.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>