In [8]:
import pandas as pd
import numpy as np
from sklearn.metrics import classification_report, recall_score, precision_score
from flask import Flask, request, jsonify, render_template
from sklearn.ensemble import RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
import pickle


# Gerar o conjunto de dados
tamanho_dataset = 1000

data = {
    'ID': np.arange(1, tamanho_dataset + 1),
    'Nome': ['Cliente ' + str(i) for i in range(1, tamanho_dataset + 1)],
    'Idade': np.random.randint(18, 65, size=tamanho_dataset),
    'Gênero': np.random.choice(['Masculino', 'Feminino'], size=tamanho_dataset),
    'Pontuação': np.random.randint(1, 101, size=tamanho_dataset),
    'Comprou': np.random.choice([0, 1], size=tamanho_dataset)  # 0 para não comprou, 1 para comprou
}

df = pd.DataFrame(data)

df.head()

Unnamed: 0,ID,Nome,Idade,Gênero,Pontuação,Comprou
0,1,Cliente 1,50,Feminino,25,1
1,2,Cliente 2,61,Feminino,88,0
2,3,Cliente 3,37,Feminino,62,0
3,4,Cliente 4,31,Feminino,42,0
4,5,Cliente 5,20,Masculino,4,0


In [9]:
# Separar dados em X e y
X = df[['Idade', 'Pontuação']]
y = df['Comprou']

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [10]:
# Criar e treinar o modelo Random Forest
model_rf = RandomForestClassifier(random_state=42)
model_rf.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred_rf = model_rf.predict(X_test)

In [11]:
# Salvar o modelo Random Forest com pickle
with open('random_forest_model.pkl', 'wb') as model_file:
    pickle.dump(model_rf, model_file)

# Carregar o modelo Random Forest com pickle
with open('random_forest_model.pkl', 'rb') as model_file:
    loaded_rf_model = pickle.load(model_file)

In [12]:
# Avaliar o modelo
classification_rep_rf = classification_report(y_test, y_pred_rf)
recall_rf = recall_score(y_test, y_pred_rf)
precision_rf = precision_score(y_test, y_pred_rf)

print("Classification Report (Random Forest):")
print(classification_rep_rf)
print(f"Recall: {recall_rf}")
print(f"Precision: {precision_rf}")

Classification Report (Random Forest):
              precision    recall  f1-score   support

           0       0.51      0.51      0.51       106
           1       0.45      0.46      0.46        94

    accuracy                           0.48       200
   macro avg       0.48      0.48      0.48       200
weighted avg       0.49      0.48      0.49       200

Recall: 0.4574468085106383
Precision: 0.45263157894736844


In [13]:
# Criar e treinar o modelo de árvore de decisão
model_tree = DecisionTreeClassifier(random_state=42)
model_tree.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred_tree = model_tree.predict(X_test)

In [14]:
# Salvar o modelo de árvore de decisão com pickle
with open('decision_tree_model.pkl', 'wb') as model_file:
    pickle.dump(model_tree, model_file)

# Carregar o modelo de árvore de decisão com pickle
with open('decision_tree_model.pkl', 'rb') as model_file:
    loaded_tree_model = pickle.load(model_file)

In [15]:
# Avaliar o modelo
classification_rep = classification_report(y_test, y_pred_tree)
recall = recall_score(y_test, y_pred_tree)
precision = precision_score(y_test, y_pred_tree)

print("Classification Report (Árvore de Decisão):")
print(classification_rep)
print(f"Recall: {recall}")
print(f"Precision: {precision}")

Classification Report (Árvore de Decisão):
              precision    recall  f1-score   support

           0       0.58      0.57      0.57       106
           1       0.52      0.53      0.53        94

    accuracy                           0.55       200
   macro avg       0.55      0.55      0.55       200
weighted avg       0.55      0.55      0.55       200

Recall: 0.5319148936170213
Precision: 0.5208333333333334
