# **Estrutura do DataSet**

O dataset será elaborado com foco em diagnósticos automotivos, com o objetivo de treinar um chatbot para ajudar os usuários a identificar problemas em seus veículos.

O dataset conterá as seguintes colunas:

- ID: Identificador único do problema (número inteiro).

- Descrição do Problema: Texto que descreve o problema conforme relatado pelo usuário.

- Categoria: Classificação do problema em categorias gerais (e.g., motor, freios, suspensão, elétrica, etc.).

- Possível Causa: A causa mais provável do problema (e.g., bateria descarregada, cabo solto, etc.).

- Gravidade: Classificação do problema em termos de urgência (baixo, médio, alto).

- Custo Estimado de Reparo (R$): Valor estimado para o reparo do problema (em
reais).

- Tempo Estimado de Reparo (horas): Tempo médio necessário para resolver o problema.

- Região do Veículo: Local onde o problema foi identificado no carro (e.g., parte frontal, traseira, lateral direita, etc.).

# **Origem e Explicação dos dados**

Os dados são simulados com base em informações comuns sobre problemas automotivos, como encontrados em oficinas mecânicas e serviços de assistência técnica. Eles foram organizados para cobrir uma ampla variedade de problemas mecânicos, de diferentes partes do veículo, e com diferentes níveis de gravidade e custo.

- Quantidade: O dataset tem 100 exemplos de problemas mecânicos. Cada exemplo representa um relato único de um cliente sobre um possível problema no carro.

- Qualidade: Como é um dataset simulado, a precisão dos dados é limitada. No entanto, as informações foram geradas para serem representativas e úteis para o contexto de treinamento do chatbot.

# **Objetivo do Dataset**

Este dataset será utilizado para treinar o chatbot da nossa solução que atenderá os clientes na nossa plataforma e terá como objetivo ajudar os clientes a diagnosticar problemas em seus veículos com base em descrições de falhas mecânicas que os usuários vão fornecer durante as interações.

O chatbot poderá sugerir diagnósticos, classificar a gravidade do problema e estimar custos e tempos de reparo, facilitando o encaminhamento para uma oficina mecânica ou assistência técnica.

# **Gerando o DataSet**

In [None]:
import pandas as pd
import random

# Definindo listas com valores simulados para o dataset
categorias = ['Motor', 'Freios', 'Suspensão', 'Elétrica', 'Transmissão', 'Exaustão', 'Pneus', 'Sistema de Arrefecimento']
causas = {
    'Motor': ['Problema na bomba de óleo', 'Correia dentada rompida', 'Falha na injeção eletrônica', 'Sobre-aquecimento', 'Desgaste de anéis'],
    'Freios': ['Desgaste de pastilhas', 'Fusível queimado', 'Problema no cilindro mestre', 'Disco de freio empenado', 'Mangueira do freio rachada'],
    'Suspensão': ['Amortecedor danificado', 'Mola quebrada', 'Problema na bucha da suspensão', 'Barulho ao passar em buracos', 'Desgaste das buchas'],
    'Elétrica': ['Bateria descarregada', 'Alternador com defeito', 'Fusível queimado', 'Problema no módulo de controle', 'Fiação solta'],
    'Transmissão': ['Problema na embreagem', 'Desgaste no sincronizador', 'Vazamento de fluido', 'Dificuldade nas trocas de marcha', 'Ruído ao trocar marcha'],
    'Exaustão': ['Válvula de escape danificada', 'Catalisador entupido', 'Escape vazando', 'Barulho no sistema de escape', 'Fumaça excessiva'],
    'Pneus': ['Pneu furado', 'Desgaste irregular dos pneus', 'Calibragem incorreta', 'Pneu desbalanceado', 'Rachaduras no pneu'],
    'Sistema de Arrefecimento': ['Radiador vazando', 'Termostato com defeito', 'Mangueira do radiador rompida', 'Nível baixo de líquido de arrefecimento', 'Ventoinha não funcionando']
}
gravidades = ['Baixo', 'Médio', 'Alto']
regioes_veiculo = ['Frontal', 'Traseira', 'Lateral Direita', 'Lateral Esquerda', 'Inferior', 'Superior']

# Função para gerar uma descrição de problema com base na categoria
def gerar_descricao_problema(categoria):
    descricoes = {
        'Motor': [
            "O motor está fazendo um barulho estranho e não parece estar funcionando bem.",
            "O carro está esquentando demais e parece estar perdendo potência.",
            "Há um cheiro de óleo queimado vindo do motor."
        ],
        'Freios': [
            "Os freios estão fazendo um barulho alto e não estão respondendo bem.",
            "Há um cheiro de queimado quando você pisa no freio.",
            "Os freios estão vibrando e não estão funcionando corretamente."
        ],
        'Suspensão': [
            "O carro está balançando muito e fazendo barulho ao passar por buracos.",
            "A suspensão parece estar mais dura do que o normal e o carro está desconfortável.",
            "Há um som de batida quando você dirige em estrada irregular."
        ],
        'Elétrica': [
            "As luzes do carro estão piscando e há dificuldade para ligar o veículo.",
            "O carro está apresentando falhas elétricas e o rádio está desligando sozinho.",
            "O sistema elétrico está falhando e a bateria parece não carregar corretamente."
        ],
        'Transmissão': [
            "A transmissão está trocando de marcha de forma brusca e com dificuldade.",
            "Há um barulho estranho ao mudar as marchas e o carro não está acelerando bem.",
            "A embreagem parece estar deslizando e a transmissão não está suave."
        ],
        'Exaustão': [
            "O carro está soltando fumaça e há um barulho incomum no sistema de escape.",
            "O sistema de exaustão está fazendo um barulho alto e há um cheiro estranho.",
            "O escape está vazando e parece estar obstruído."
        ],
        'Pneus': [
            "O carro está tremendo e os pneus parecem estar desgastados.",
            "Há um barulho de vibração vindo dos pneus e eles parecem estar mal calibrados.",
            "Os pneus estão com rachaduras e precisam ser trocados."
        ],
        'Sistema de Arrefecimento': [
            "O motor está superaquecendo e parece que há um vazamento no radiador.",
            "O sistema de arrefecimento não está funcionando e há um cheiro de líquido quente.",
            "A ventoinha do radiador não está ligando e o carro está aquecendo demais."
        ]
    }
    return random.choice(descricoes.get(categoria, ["O carro está com um problema, mas não sei exatamente o que é."]))

# Função para gerar uma linha do dataset
def gerar_linha(id):
    categoria = random.choice(categorias)
    causa = random.choice(causas[categoria])
    gravidade = random.choice(gravidades)
    custo_estimado = round(random.uniform(200, 5000), 2)  # Gerar custo entre R$200 e R$5000
    tempo_reparo = round(random.uniform(1, 12), 1)  # Tempo de reparo entre 1h e 12h
    regiao = random.choice(regioes_veiculo)
    descricao_problema = gerar_descricao_problema(categoria)

    return [id, descricao_problema, categoria, causa, gravidade, custo_estimado, tempo_reparo, regiao]

# Gerando o dataset com 100 exemplos
dataset = [gerar_linha(i) for i in range(1, 101)]

# Criando o dataframe
colunas = ['ID', 'Descrição do Problema', 'Categoria', 'Possível Causa', 'Gravidade',
           'Custo Estimado de Reparo (R$)', 'Tempo Estimado de Reparo (horas)', 'Região do Veículo']
df = pd.DataFrame(dataset, columns=colunas)

# Salvando o dataset em um arquivo CSV
df.to_csv('dataset_problemas_mecanicos.csv', index=False)

print("Dataset gerado e salvo como 'dataset_problemas_mecanicos.csv'.")
