In [3]:
# Importando as bibliotecas necessárias

import pandas as pd # pandas é usado para manipular dados em tabelas (DataFrame)
from sklearn.model_selection import train_test_split # para dividir os dados em treino e teste
from sklearn.tree import DecisionTreeClassifier # o algoritmo de Árvore de Decisão
from sklearn.metrics import accuracy_score, classification_report # para calcular a acurácia do modelo

# Criando um DataFrame com dados fictícios sobre o(s) cliente(s)
# As colunas são:
# - idade: idade dos clientes (ex: 18, 19, 20, 24...)
# - Tempo de cadastro: contabilizado em dias (100, 200, 300 ...)
# - E-mail aberto: (1=sim, 0=não)
# - clicou no link: (1=sim, 0=não)
# - comprou: (1=sim, 0=não)

dados = pd.DataFrame({
  'idade': [18, 22, 25, 29, 30, 32, 35, 36, 40, 41, 45, 52, 54, 60, 65],
  'tempo_cadastro': [120, 450, 30, 80, 800, 210, 50, 300, 600, 150, 1000, 1200, 90, 180, 400],
  'email_aberto': [1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1],
  'clicou_link': [1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1],
  'comprou': [1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1]
})

# Separando as variáveis independentes (X) e a variável alvo (y)
x = dados.drop('comprou', axis=1) # X são todas as colunas exceto 'comprou'
y = dados['comprou'] # y é apenas a coluna 'comprou'

# Dividindo os dados em conjuntos de treino e teste
# 70% para treino e 30% para teste
X_treino, X_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3, random_state=42)

# Criando o modelo de Árvore de Decisão
modelo = DecisionTreeClassifier()

# Treinando o modelo com os dados de treino
modelo.fit(X_treino, y_treino)

# Fazendo previsões no conjunto de teste
previsoes = modelo.predict(X_teste)

# Calculando a acurácia do modelo (quantas previsões o modelo acertou em relação ao total)
print("Acurácia do modelo:", accuracy_score(y_teste, previsoes))

# Gerando o relatório de classificação
print(f"\nRelatório de Classificação:\n{classification_report(y_teste, previsoes)}")


Acurácia do modelo: 1.0

Relatório de Classificação:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         1
           1       1.00      1.00      1.00         4

    accuracy                           1.00         5
   macro avg       1.00      1.00      1.00         5
weighted avg       1.00      1.00      1.00         5

