In [None]:
import pandas as pd
from sklearn.compose import ColumnTransformer
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder

df = pd.read_csv("../data/livros_vendidos2.csv").drop(columns="NM_LIVRO")
cat_cols = ["NM_GENERO", "NM_EDITORA"]
num_cols = ["NR_VALOR_VENDA"]

X = df[cat_cols + num_cols]
y = df["NR_UNIDADES_VENDIDAS"]

preprocessor = ColumnTransformer([("cat", OneHotEncoder(handle_unknown="ignore"), cat_cols)], remainder="passthrough")

model_linear = Pipeline([("preprocess", preprocessor), ("regressor", LinearRegression())])

model_linear.fit(X, y)

novos = pd.DataFrame(
    {
        "NM_GENERO": ["Tecnologia"],
        "NM_AUTOR": ["Sofia Almeida"],
        "NR_VALOR_VENDA": [50],
        "NM_EDITORA": ["Intrínseca"],
        "NM_LIVRARIA": ["Livraria Fnac"],
    }
)

pred_linear = model_linear.predict(novos)
print(f"Regressão Linear → Vendas: {pred_linear}")

Regressão Linear → Vendas: [15149.85373549]


In [5]:
import itertools
import numpy as np

# Valores possíveis (exemplo)
generos = df["NM_GENERO"].unique()
editoras = df["NM_EDITORA"].unique()
precos = np.arange(10, 100, 1)  # preços de 10 a 50 em passos de 5

# Todas as combinações possíveis
combinacoes = list(itertools.product(generos, editoras, precos))

# Criar DataFrame
novos = pd.DataFrame(combinacoes, columns=["NM_GENERO", "NM_EDITORA", "NR_VALOR_VENDA"])

# Previsão
novos["vendas_previstas"] = model_linear.predict(novos)

# Melhor combinação
melhor = novos.loc[novos["vendas_previstas"].idxmax()]
print(melhor)

NM_GENERO                           children
NM_EDITORA          HarperCollins Publishing
NR_VALOR_VENDA                            99
vendas_previstas                28343.220643
Name: 3149, dtype: object
