# Sistema de Análise de Score de Crédito
Predição de score usando Random Forest e KNN

In [None]:
# Imports necessários
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report

In [None]:
# Carrega dataset de clientes
df = pd.read_csv("clientes.csv")
print(f"Dataset: {df.shape}")
display(df.info())

In [None]:
# Codifica variáveis categóricas em números
colunas_cat = ['profissao', 'mix_credito', 'comportamento_pagamento']
encoders = {}

for coluna in colunas_cat:
    encoder = LabelEncoder()  # Cria codificador
    df[coluna] = encoder.fit_transform(df[coluna])  # Aplica codificação
    encoders[coluna] = encoder  # Salva para uso posterior

print("✅ Variáveis codificadas!")
display(df.head())

In [None]:
# Separa dados em features (X) e target (y)
y = df['score_credito']  # Variável que queremos prever
X = df.drop(columns=['score_credito', 'id_cliente'])  # Features para previsão

# Divide em treino (70%) e teste (30%)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

print(f"Treino: {X_train.shape} | Teste: {X_test.shape}")

In [None]:
# Treina modelos de Machine Learning
rf = RandomForestClassifier(random_state=42)  # Modelo Random Forest
knn = KNeighborsClassifier(n_neighbors=5)     # Modelo KNN

# Treina ambos os modelos
rf.fit(X_train, y_train)
knn.fit(X_train, y_train)

print("✅ Modelos treinados!")

In [None]:
# Avalia performance dos modelos
modelos = [rf, knn]
nomes = ['Random Forest', 'KNN']

for modelo, nome in zip(modelos, nomes):
    y_pred = modelo.predict(X_test)  # Faz previsões
    acc = accuracy_score(y_test, y_pred)  # Calcula acurácia
    
    print(f"\n=== {nome.upper()} ===")
    print(f"Acurácia: {acc:.3f}")
    print(classification_report(y_test, y_pred))

In [None]:
# Previsão para novos clientes (opcional)
import os

if os.path.exists("novos_clientes.csv"):
    # Carrega novos dados
    novos = pd.read_csv("novos_clientes.csv")
    
    # Aplica mesma codificação
    for coluna in colunas_cat:
        novos[coluna] = encoders[coluna].transform(novos[coluna])
    
    # Faz previsões com melhor modelo (Random Forest)
    previsoes = rf.predict(novos)
    print(f"Previsões para {len(previsoes)} clientes: {previsoes}")
else:
    print("Arquivo 'novos_clientes.csv' não encontrado")