In [None]:
import plotly.express as px
import plotly.io as pio
import plotly.graph_objects as go
pio.templates.default = "plotly_white"
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt


In [None]:
df = pd.read_csv('customer_acquisition_cost_dataset.csv')
df.head()

In [None]:
df.tail()

In [None]:
df.shape

In [None]:
# Traduzindo e renomeando as colunas
novo_nome_colunas = {
    'Customer_ID': 'ID_do_Cliente',
    'Marketing_Channel': 'Canal_de_Marketing',
    'Marketing_Spend': 'Despesa_de_Marketing',
    'New_Customers': 'Novos_Clientes'
}

df = df.rename(columns=novo_nome_colunas)
# Definindo a coluna 'ID_do_Cliente' como índice
df.set_index('ID_do_Cliente', inplace=True)


df

In [None]:
df.isnull().sum()

In [None]:
df.info()

In [None]:
df.describe()

In [None]:
# Agrupar por canal de marketing e calcular a soma de novos clientes para cada canal
novos_clientes_por_canal = df.groupby('Canal_de_Marketing')['Novos_Clientes'].sum()

# Classificar os canais com base no número de novos clientes em ordem decrescente
novos_clientes_por_canal = novos_clientes_por_canal.sort_values(ascending=False)

# Plotar o gráfico de barras
novos_clientes_por_canal.plot(kind='bar', color='skyblue', alpha=0.7)

# Adicionar rótulos e título
plt.xlabel('Canal de Marketing')
plt.ylabel('Número de Novos Clientes')
plt.title('Número de Novos Clientes por Canal de Marketing')

# Mostrar o gráfico
plt.show()

In [None]:
# Calcular o custo por novo cliente para cada canal de marketing
df['Custo_por_Novo_Cliente'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']
df

In [None]:
df['Canal_de_Marketing'].unique()

In [None]:
# Calcular o custo por novo cliente para cada canal de marketing
df['Custo_por_Novo_Cliente'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']

# Criar um novo DataFrame agrupado por canal de marketing
custo_por_canal = df.groupby('Canal_de_Marketing')['Custo_por_Novo_Cliente'].mean()

# Reordenar o DataFrame de acordo com a ordem especificada
canais_ordem_especificada = ['Email Marketing', 'Online Ads', 'Social Media', 'Referral']
custo_por_canal = custo_por_canal.reindex(canais_ordem_especificada)

# Plotar o gráfico de barras
custo_por_canal.plot(kind='bar', color='skyblue', alpha=0.7)

# Adicionar rótulos e título
plt.xlabel('Canal de Marketing')
plt.ylabel('Custo por Novo Cliente')
plt.title('Custo por Novo Cliente por Canal de Marketing')

# Mostrar o gráfico
plt.show()

In [None]:
# Plotar o número de novos clientes ao longo do tempo
plt.figure(figsize=(10, 6))
plt.plot(df.index, df['Novos_Clientes'], marker='o', color='skyblue', label='Novos Clientes')
plt.title('Número de Novos Clientes ao Longo do Tempo')
plt.xlabel('Data')
plt.ylabel('Número de Novos Clientes')
plt.legend()
plt.grid(True)
plt.show()

# Plotar os gastos de marketing ao longo do tempo
plt.figure(figsize=(10, 6))
plt.plot(df.index, df['Despesa_de_Marketing'], marker='o', color='orange', label='Despesa de Marketing')
plt.title('Despesa de Marketing ao Longo do Tempo')
plt.xlabel('Data')
plt.ylabel('Despesa de Marketing')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
# Calcular o CAC (Custo de Aquisição de Cliente) para cada canal de marketing
df['CAC'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']

# Plotar o desempenho de cada canal de marketing em relação ao CAC
plt.figure(figsize=(10, 6))
sns.scatterplot(data=df, x='CAC', y='Novos_Clientes', hue='Canal_de_Marketing')
plt.title('Novos Clientes vs. CAC por Canal de Marketing')
plt.xlabel('CAC (Custo de Aquisição de Cliente)')
plt.ylabel('Número de Novos Clientes')
plt.legend(title='Canal de Marketing')
plt.grid(True)
plt.show()

In [None]:
# Calcular o CAC (Custo de Aquisição de Cliente) para cada canal de marketing
df['CAC'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']

# Identificar segmentos que respondem melhor a determinados canais de marketing
# e que tenham um custo de aquisição de cliente mais baixo
plt.figure(figsize=(12, 6))

# Comparação do CAC entre os canais de marketing
sns.boxplot(data=df, x='Canal_de_Marketing', y='CAC')
plt.title('Comparação do CAC entre os Canais de Marketing')
plt.xlabel('Canal de Marketing')
plt.ylabel('CAC (Custo de Aquisição de Cliente)')

plt.show()

In [None]:
# Calcular a correlação entre as despesas de marketing e o número de novos clientes
correlation = df['Despesa_de_Marketing'].corr(df['Novos_Clientes'])

# Plotar o gráfico de dispersão
plt.figure(figsize=(8, 6))
sns.scatterplot(x='Despesa_de_Marketing', y='Novos_Clientes', data=df)
plt.title('Despesa de Marketing vs. Número de Novos Clientes')
plt.xlabel('Despesa de Marketing')
plt.ylabel('Número de Novos Clientes')

# Adicionar o coeficiente de correlação ao gráfico
plt.text(1300, 75, f'Correlação: {correlation:.2f}', fontsize=12, bbox=dict(facecolor='lightblue', alpha=0.5))

plt.show()

In [None]:
# Calcular a correlação entre as despesas de marketing e o número de novos clientes para cada canal
correlation_per_channel = df.groupby('Canal_de_Marketing').apply(lambda x: x['Despesa_de_Marketing'].corr(x['Novos_Clientes']))

# Plotar o gráfico de barras das correlações por canal de marketing
plt.figure(figsize=(10, 6))
sns.barplot(x=correlation_per_channel.index, y=correlation_per_channel.values)
plt.title('Correlação entre Despesa de Marketing e Novos Clientes por Canal de Marketing')
plt.xlabel('Canal de Marketing')
plt.ylabel('Correlação')

plt.show()

In [None]:
# Calcular a taxa de conversão para cada tipo de canal de marketing
df['Taxa_de_Conversao'] = (df['Novos_Clientes'] / df['Despesa_de_Marketing']) * 100
df

In [None]:
# Plotar o gráfico de barras
fig = px.bar(df, x='Canal_de_Marketing', y='Taxa_de_Conversao', 
             title='Taxa de Conversão por Canal de Marketing',
             labels={'Canal_de_Marketing': 'Canal de Marketing', 'Taxa_de_Conversao': 'Taxa de Conversão'})
fig.show()

In [None]:
# Calcular o custo por novo cliente para cada canal de marketing
df['Custo_por_Novo_Cliente'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']

# Calcular o ponto de equilíbrio dos clientes para cada canal de marketing
df['Ponto_de_Equilibrio'] = df['Despesa_de_Marketing'] / df['Custo_por_Novo_Cliente']
print(df[['Canal_de_Marketing', 'Ponto_de_Equilibrio']])

In [None]:
# Plotar o gráfico de barras
fig = px.bar(df, x='Canal_de_Marketing', 
             y='Ponto_de_Equilibrio', 
             title='Clientes de Equilíbrio por Canal de Marketing')
fig.show()

In [None]:
import matplotlib.pyplot as plt

# Plotar o gráfico de barras
plt.figure(figsize=(10, 6))
bar_width = 0.35
index = range(len(df))

plt.bar(index, df['Novos_Clientes'], bar_width, label='Clientes Reais')
plt.bar([i + bar_width for i in index], df['Ponto_de_Equilibrio'], bar_width, label='Ponto de Equilíbrio')

plt.xlabel('Canal de Marketing')
plt.ylabel('Número de Clientes')
plt.title('Comparação entre Clientes Reais e Ponto de Equilíbrio por Canal de Marketing')
plt.legend()

plt.show()


In [None]:
import plotly.graph_objects as go

# Criar o gráfico de barras
fig = go.Figure()

# Adicionar os clientes reais adquiridos
fig.add_trace(go.Bar(x=df['Canal_de_Marketing'], y=df['Novos_Clientes'],
                     name='Clientes Reais Adquiridos', marker_color='royalblue'))

# Adicionar os clientes de ponto de equilíbrio
fig.add_trace(go.Bar(x=df['Canal_de_Marketing'], y=df['Ponto_de_Equilibrio'],
                     name='Clientes de Ponto de Equilíbrio', marker_color='lightcoral'))

# Atualizar o layout
fig.update_layout(barmode='group', title='Clientes Reais vs. Ponto de Equilíbrio por Canal de Marketing',
                  xaxis_title='Canal de Marketing', yaxis_title='Número de Clientes')

# Mostrar o gráfico
fig.show()


In [None]:
# Calcular o custo médio por novo cliente para cada canal de marketing
df['Custo_Medio_por_Novo_Cliente'] = df['Despesa_de_Marketing'] / df['Novos_Clientes']

# Encontrar o canal com o menor custo médio por novo cliente
canal_menor_custo = df.loc[df['Custo_Medio_por_Novo_Cliente'].idxmin()]

print("O canal com o menor custo médio por novo cliente é:", canal_menor_custo['Canal_de_Marketing'])
