# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
import pandas as pd

In [None]:
# importar a base de dados
clientes_df = pd.read_csv('clientes.csv')
display(clientes_df)

In [None]:
# tratar a base de dados - verificar valores vazios ou com formato errado
display(clientes_df.info())

In [None]:
# convertendo colunas do tipo object para o tipo numérico
from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()
clientes_df['profissao'] = codificador.fit_transform(clientes_df['profissao'])
clientes_df['mix_credito'] = codificador.fit_transform(clientes_df['mix_credito'])
clientes_df['comportamento_pagamento'] = codificador.fit_transform(clientes_df['comportamento_pagamento'])
display(clientes_df.info())

In [None]:
# separando os conjuntos de treino e de teste
from sklearn.model_selection import train_test_split

# y - coluna que o modelo irá prever
# x - colunas que serão utilizadas para prever y, a coluna id_cliente será removida por ser um valor qualquer que não ajuda na previsão

# definindo x e y
x = clientes_df.drop(['score_credito', 'id_cliente'], axis=1)
y = clientes_df['score_credito']

# separando conjunto para treino e para teste
x_train, x_test, y_train, y_test = train_test_split(x, y)


In [None]:
# treinar os modelos escolhidos
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

modelo_arvore_decisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

modelo_arvore_decisao.fit(x_train, y_train)
modelo_knn.fit(x_train, y_train)

In [None]:
# calculando a acurácia do modelo se o mesmo "chutasse" tudo "Standard"
contagem_scores = clientes_df['score_credito'].value_counts()
acuracia = contagem_scores['Standard'] / contagem_scores.sum()
print(acuracia)

In [None]:
# prevendo com base no conjunto x de teste
previsao_arvore_decisao = modelo_arvore_decisao.predict(x_test)
previsao_knn = modelo_knn.predict(x_test.to_numpy())

print(previsao_arvore_decisao)
print(previsao_knn)

In [None]:
from sklearn.metrics import accuracy_score

# comparando as previsões com o y de teste
score_arvore_decisao = accuracy_score(y_test, previsao_arvore_decisao)
score_knn = accuracy_score(y_test, previsao_knn)

print(score_arvore_decisao)
print(score_knn)

In [None]:
# vamos seguir com o modelo de árvore de decisão, dado que o seu score é maior que o do modelo knn
# quais as características mais importantes para a definição do score de crédito?
colunas = list(x_test.columns)
importancia = pd.DataFrame(index=colunas, data=modelo_arvore_decisao.feature_importances_)
importancia *= 100
print(importancia)

# juros_emprestimo, mix_credito e divida_total

In [None]:
# prevendo o score de novos clientes
novos_clientes_df = pd.read_csv('novos_clientes.csv')
novos_clientes_df['profissao'] = codificador.fit_transform(novos_clientes_df['profissao'])
novos_clientes_df['mix_credito'] = codificador.fit_transform(novos_clientes_df['mix_credito'])
novos_clientes_df['comportamento_pagamento'] = codificador.fit_transform(novos_clientes_df['comportamento_pagamento'])
display(novos_clientes_df.info())

In [None]:
previsao = modelo_arvore_decisao.predict(novos_clientes_df)
print(previsao)