### 1. Importar as Bibliotecas

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report
import joblib #serializar (salvar) o modelo

### 2. Criando o dataset

In [2]:
# Gerando um dataset fictício mas realista para previsão de churn
np.random.seed(42)
n_samples = 500

# Features simuladas
dias_sem_login = np.random.randint(0, 61, size=n_samples)
qtd_suportes_abertos = np.random.poisson(1.5, size=n_samples)
tempo_uso_plataforma = np.random.normal(45, 15, size=n_samples).clip(0, 120)

# Gerando churn com base em uma função simulada
churn_prob = (dias_sem_login / 60) + (qtd_suportes_abertos / 10) - (tempo_uso_plataforma / 100)
churn = (churn_prob + np.random.normal(0, 0.1, size=n_samples)) > 0.5
churn = churn.astype(int) # Variável alvo (0 = cliente ativo, 1 = cliente que cancelou)

### 3. Criando dataframe

In [3]:
df = pd.DataFrame({
    'dias_sem_login': dias_sem_login,
    'qtd_suportes_abertos': qtd_suportes_abertos,
    'tempo_uso_plataforma': tempo_uso_plataforma,
    'churn': churn
})

# Visualizar os primeiros dados
df.head()

Unnamed: 0,dias_sem_login,qtd_suportes_abertos,tempo_uso_plataforma,churn
0,38,1,32.140884,0
1,51,1,29.125506,1
2,28,0,55.39049,0
3,14,1,51.86314,0
4,42,0,60.432574,0


### 4. Divisão em treimo e teste

In [4]:
X = df[['dias_sem_login', 'qtd_suportes_abertos', 'tempo_uso_plataforma']]
y = df['churn']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

### 5. Treinamento do Modelo

In [6]:
cls_rf = RandomForestClassifier()
cls_rf.fit(X_train, y_train)

### Avaliação do Modelo

In [7]:
print(classification_report(y_test, cls_rf.predict(X_test)))

              precision    recall  f1-score   support

           0       0.93      0.95      0.94       113
           1       0.83      0.78      0.81        37

    accuracy                           0.91       150
   macro avg       0.88      0.87      0.87       150
weighted avg       0.91      0.91      0.91       150



### Salvar o Modelo

In [7]:
#pkl significa pickle (conservar ou persistir)
joblib.dump(cls_rf, 'model.pkl')

['model.pkl']