In [7]:
import numpy as np
import pandas as pd
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 📌 1️⃣ Criando os dados fictícios
dados = pd.DataFrame({
    'Combustível': ['Gasolina', 'Diesel', 'Etanol', 'Gasolina', 'Diesel', 'Etanol', 'Gasolina', 'Diesel'],
    'Idade': [3, 5, 2, 8, 1, 4, 6, 7],
    'Quilometragem': [40000, 80000, 25000, 120000, 10000, 50000, 70000, 110000],
    'Preço': [35000, 28000, 45000, 18000, 50000, 32000, 26000, 20000]
})

# 📌 2️⃣ Definição das colunas categóricas e numéricas
categorical_features = ['Combustível']
numerical_features = ['Idade', 'Quilometragem']

# 📌 3️⃣ Criando os transformadores
categorical_transformer = OneHotEncoder(handle_unknown='ignore')
numerical_transformer = StandardScaler()

# 📌 4️⃣ Criando o ColumnTransformer para processar os dados
preprocessor = ColumnTransformer(
    transformers=[
        ('num', numerical_transformer, numerical_features),
        ('cat', categorical_transformer, categorical_features)
    ]
)

# 📌 5️⃣ Criando o pipeline com regressão linear
pipeline = Pipeline(steps=[
    ('preprocessor', preprocessor),
    ('model', LinearRegression())
])

# 📌 6️⃣ Separação entre treino e teste
X = dados.drop(columns=['Preço'])
y = dados['Preço']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 📌 7️⃣ Treinando o modelo
pipeline.fit(X_train, y_train)

# 📌 8️⃣ Fazendo previsões no conjunto de teste
y_pred = pipeline.predict(X_test)

# 📌 9️⃣ Avaliação do modelo
mse = mean_squared_error(y_test, y_pred)
print(f'Erro Quadrático Médio (MSE): {mse:.2f}')

# 📌 🔟 Fazendo a previsão de um novo carro
novo_carro = pd.DataFrame({
    'Combustível': ['Gasolina'],  # Pode ser 'Gasolina', 'Diesel' ou 'Etanol'
    'Idade': [3],  # Idade do carro em anos
    'Quilometragem': [50000]  # Quilometragem rodada
})

previsao_preco = pipeline.predict(novo_carro)

print(f'🔮 Previsão do preço para o novo carro: R$ {previsao_preco[0]:.2f}')



Erro Quadrático Médio (MSE): 16338179.65
🔮 Previsão do preço para o novo carro: R$ 35790.24
