In [None]:
# Projeto que implemente uma IA para a previsão do score de crédito de clientes
# Passo 1 - Ver a base de dados e entender os dados
import pandas as pd

tabela = pd.read_csv('clientes.csv')
display(tabela.info())

In [None]:
# Passo 2 - Manipular a base de dados com Pandas

tabela = tabela.drop(columns='id_cliente')
display(tabela.info())

In [None]:
# Passo 3 - Prepara a base de dados para a IA
from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()
codificador2 = LabelEncoder()
codificador3 = LabelEncoder()

# IA não entende texto, então precisamos transformar os textos em números

# Colunas que precisamos tratar são as que não serão previstas. Colunas: profissao, mix_credito,
# comportamento_pagamento

# O label encoder transforma texto em números de forma automática e refaz a transformação se necessário
# Exemplo: "Advogado", "Médico", "Arquiteto" vira 0, 1, 2

# Transformando Profissão
tabela['profissao'] = codificador.fit_transform(tabela['profissao'])
# Transformando Mix Crédito
tabela['mix_credito'] = codificador2.fit_transform(tabela['mix_credito'])
# Transformando Comportamento Pagamento
tabela['comportamento_pagamento'] = codificador3.fit_transform(tabela['comportamento_pagamento'])



In [None]:
# Passo 4 - Criar os dados de Treino e a IA usando uma biblioteca de machine learning - Scikit-learn

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# Dados de treino
y = tabela['score_credito']  # O que queremos prever
x = tabela.drop(columns='score_credito')  # Dados que temos para prever (Todas as outras colunas)

# Dividir os dados em treino e teste

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3) #test_size é a porcentagem de dados que serão usados para teste

# Criar a IA

forest = RandomForestClassifier() # Random Forest é um algoritmo de machine learning
knn = KNeighborsClassifier() # KNN é outro algoritmo de machine learning



In [None]:
# Passo 5 - Treinar a IA com os dados históricos

forest.fit(x_treino, y_treino)
knn.fit(x_treino, y_treino)



In [None]:
# Passo 6 - Selecionar a melhor IA e medir a precisão dela

previsao_forest = forest.predict(x_teste)
previsao_knn = knn.predict(x_teste)

# Para medir a precisão, usamos a métrica de acurácia (accuracy)
from sklearn.metrics import accuracy_score
display(accuracy_score(y_teste, previsao_forest))
display(accuracy_score(y_teste, previsao_knn))

In [None]:
# Passo 7 - Colocar a IA para previsão do score de crédito de novos clientes

# Foi selecionada a Random Forest por ter tido a maior acurácia

tabela_novos = pd.read_csv('novos_clientes.csv')
display(tabela_novos.info())

# Antes de colocar a IA para prever, precisamos tratar os dados da mesma forma que tratamos os dados de treino

tabela_novos['profissao'] = codificador.transform(tabela_novos['profissao'])
tabela_novos['mix_credito'] = codificador2.transform(tabela_novos['mix_credito'])
tabela_novos['comportamento_pagamento'] = codificador3.transform(tabela_novos['comportamento_pagamento'])
display(tabela_novos.info())

previsao_novos = forest.predict(tabela_novos)
tabela_novos['score_credito'] = previsao_novos

display(tabela_novos)