# **Projeto de Data Science e Analytics - Colaboração com Equipe de Marketing**

## 1. Objetivo do Projeto
O objetivo deste projeto é colaborar com a equipe de marketing para otimizar campanhas por meio de análise preditiva. Neste caso iremos gerar modelo para prever a taxa de conversão com base na taxa de cliques.


## 2. Coleta de Dados
- Fonte de Dados: Dados simulados de campanhas de marketing.
- Formato: CSV.

In [None]:
# Importando bibliotecas
import pandas as pd
from google.colab import files

In [None]:
## IMPORTAR ARQUIVO / CRIAR DATAFRAME
# Criando dados fictícios
data = {'customer_id': [1, 2, 3, 4, 5],
        'campaign_id': [101, 102, 103, 104, 105],
        'click_through_rate': [0.2, 0.15, 0.25, 0.18, 0.3],
        'conversion_rate': [0.1, 0.08, 0.12, 0.09, 0.14]}
df = pd.DataFrame(data)

In [None]:
# Salvando dados em um arquivo CSV
df.to_csv('marketing_data.csv', index=False)

In [None]:
# Fazendo upload para o Google Colab
uploaded = files.upload()

## 3. Pré-processamento de Dados
- Limpeza e Transformação:
  - Tratar valores ausentes, se houver.
  - Normalizar os dados, se necessário

In [None]:
# Carregando dados
df = pd.read_csv('marketing_data.csv')

In [None]:
# Tratamento de valores ausentes
df.fillna(0, inplace=True)

In [None]:
# Normalização (opcional, dependendo dos algoritmos escolhidos)
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
df[['click_through_rate', 'conversion_rate']] = scaler.fit_transform(df[['click_through_rate', 'conversion_rate']])

## 4. Análise Exploratória de Dados (EDA)
- Visualização de Padrões:
  - Identificar correlações entre taxas de clique e conversão.
  - Visualizar distribuições e tendências.

In [None]:
# Visualizando correlações
import seaborn as sns
import matplotlib.pyplot as plt

sns.pairplot(df[['click_through_rate', 'conversion_rate']])
plt.show()


## 5. Modelagem
- Tarefa: Prever a taxa de conversão com base na taxa de cliques.
- Algoritmo Escolhido: Regressão Linear.

In [None]:
# Modelagem ML
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score

X = df[['click_through_rate']]
y = df['conversion_rate']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LinearRegression()
model.fit(X_train, y_train)

# Avaliação do Modelo
predictions = model.predict(X_test)
r2 = r2_score(y_test, predictions)

print(f'R-squared Score: {r2}')


## 6. Avaliação e Validação do Modelo
- Método de Avaliação: R-squared Score.

In [None]:
# Avaliação do Modelo
predictions = model.predict(X_test)
r2 = r2_score(y_test, predictions)

print(f'R-squared Score: {r2}')