# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom


In [None]:
# Passo a passo
# Passo 0 - Entender o desafio e a empresa
# Passo 1 - Importar a base de dados
import pandas as pd

tabela = pd.read_csv("clientes.csv")
display(tabela)

In [None]:
print(tabela.info())

In [None]:
# Passo 2 - Preparar a base de dados para a inteligencia artificial
# LabelEncoder
from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder() # Vai tranformar as colunas de str em numeros.
tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])
print(tabela.info())

In [None]:
# Separar as informações em dados de treino e dados de teste
y = tabela["score_credito"]
# todas as colunas que vamos usar para fazer a previsao do score de credito
x = tabela.drop(["score_credito", "id_cliente"], axis=1)

from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3)

In [None]:
# Passo 3 - Criar um modelo de IA -> Score de crédito: Ruim, Médio, Bom
# Arvore de Decisão
# KNN - nearest neighbors
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

# Passo 4 - Escolher o melhor modelo
# Passo 5 - Usar o modelo em um cenário real

In [None]:
# Passo 4 - Escolher o melhor modelo
# acurácia do modelo
from sklearn.metrics import accuracy_score

previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste.to_numpy()) # o modelo knn tem que transformar no formato numpy para não dar erro.

print(accuracy_score(y_teste, previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_knn))

# Passo 5 - Usar o modelo em um cenário real

In [None]:
# O melhor modelo é o modelo_arvoredecisao = 83% acurácia
# Processo de previsão com novos clientes
novos_clientes = pd.read_csv("novos_clientes.csv")
novos_clientes["profissao"] = codificador.fit_transform(novos_clientes["profissao"])
novos_clientes["mix_credito"] = codificador.fit_transform(novos_clientes["mix_credito"])
novos_clientes["comportamento_pagamento"] = codificador.fit_transform(novos_clientes["comportamento_pagamento"])
display(novos_clientes)

previsao = modelo_arvoredecisao.predict(novos_clientes)
print(previsao)