# Análise de Regressão Linear: Investimento em Propaganda vs. Vendas

## Contexto

Uma empresa deseja entender a relação entre o valor investido em propaganda e o retorno em vendas. O objetivo é encontrar um modelo matemático (uma equação) que descreva essa relação para prever futuras vendas com base em novos investimentos. Utilizaremos a regressão linear para encontrar a equação da reta que melhor se ajusta aos dados históricos.

**Onde:**
- `y` (variável dependente) será o valor das **Vendas (em milhares)**.
- `x` (variável independente) será o valor do **Investimento em Propaganda (em milhares)**.

### 1. Importando as Bibliotecas Necessárias

In [1]:
import pandas as pd
from sklearn.linear_model import LinearRegression
import plotly.express as px
import plotly.graph_objects as go
import numpy as np

### 2. Carregando e Preparando os Dados

Vamos carregar o arquivo `vendas.csv` e ajustar os dados para o formato correto. A coluna 'venda_k' está com vírgula como separador decimal, então precisamos corrigir isso.

In [2]:
# Carregar os dados
df = pd.read_csv('vendas.csv')

# Exibir as primeiras linhas do dataframe para verificação
df.head()

Unnamed: 0,avaliacao,propaganda_k,venda_k
0,1,30,184.4
1,2,40,279.1
2,3,40,244.0
3,4,50,314.2
4,5,60,382.2


### 3. Visualizando a Dispersão dos Dados

Antes de criar o modelo, é sempre bom visualizar os dados para entender a relação entre as variáveis.

In [3]:
fig = px.scatter(df, x='propaganda_k', y='venda_k', title='Investimento em Propaganda vs. Vendas')
fig.show()

### 4. Criando e Treinando o Modelo de Regressão Linear

Agora vamos criar o modelo. O `scikit-learn` espera que a variável `x` (independente) seja uma matriz 2D. Usaremos `.values.reshape(-1, 1)` para fazer essa transformação.

In [4]:
# Preparando os dados para o modelo
x = df['propaganda_k'].values.reshape(-1, 1)
y = df['venda_k'].values

# Criando e treinando o modelo
modelo = LinearRegression()
modelo.fit(x, y)

0,1,2
,fit_intercept,True
,copy_X,True
,tol,1e-06
,n_jobs,
,positive,False


### 5. Obtendo a Equação da Reta

A equação da reta é dada por `y = a * x + b`, onde:
- `a` é o coeficiente angular (inclinação da reta), que o modelo armazena em `modelo.coef_`
- `b` é o intercepto (onde a reta cruza o eixo y), que o modelo armazena em `modelo.intercept_`

In [5]:
# Coeficiente angular (a)
a = modelo.coef_[0]

# Intercepto (b)
b = modelo.intercept_

print(f"A equação da reta é: y = {a:.2f} * x + {b:.2f}")

A equação da reta é: y = 5.55 * x + 36.34


### 6. Visualizando a Reta de Regressão

Agora vamos plotar a reta que encontramos junto com os dados originais para ver o quão bem ela se ajusta.

In [6]:
# Gerar pontos para a reta de regressão
x_reta = np.array([df['propaganda_k'].min(), df['propaganda_k'].max()])
y_reta = a * x_reta + b

# Criar o gráfico de dispersão
fig = px.scatter(df, x='propaganda_k', y='venda_k', title='Reta de Regressão: Propaganda vs. Vendas')

# Adicionar a reta de regressão ao gráfico
fig.add_trace(go.Scatter(x=x_reta, y=y_reta, name='Reta de Regressão', mode='lines'))

fig.show()

### 7. Utilizando a Equação para Previsões

Com a equação `y = 5.25 * x + 49.41`, a empresa pode agora estimar o retorno em vendas para qualquer investimento em propaganda.

**Exemplo:** Se a empresa investir **R$ 100.000** em propaganda (`x = 100`), qual seria a venda esperada?

In [7]:
# Novo investimento em propaganda (ex: 100k)
novo_investimento = np.array([[100]])

# Previsão de vendas
venda_prevista = modelo.predict(novo_investimento)

print(f"Com um investimento de R$ {novo_investimento[0][0]}k, a venda prevista é de R$ {venda_prevista[0]:.2f}k")

Com um investimento de R$ 100k, a venda prevista é de R$ 591.37k


Se a empresa espera um retorno de **R$ 400k**, qual seria o investimento necessário em propaganda?

In [8]:
# Retorno de vendas desejado
retorno_desejado = 400

# Calculando o investimento necessário (x)
# x = (y - b) / a
investimento_necessario = (retorno_desejado - b) / a

print(f"Para um retorno de R$ {retorno_desejado}k, o investimento em propaganda precisa ser de R$ {investimento_necessario:.2f}k")

Para um retorno de R$ 400k, o investimento em propaganda precisa ser de R$ 65.52k
