# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [11]:
# Passo a Passo
# Passo 0: Entender o desafio da empresa
# Passo 1: Importar a base de dados
# Passo 2: Preparar a base de dados para a IA
# Passo 3: Criar um modelo de IA -> Score de credito: Ruim, Medio, Bom
# Passo 4: Escolher o melhor modelo
# Passo 5: Usar a nossa IA para fazer novas PREVISOES
# !pip3 install pandas numpy scikit-learn

In [12]:
import pandas as pd

tabela = pd.read_csv("clientes.csv")
display(tabela)

Unnamed: 0,id_cliente,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,...,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,score_credito,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,3392,1,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,265.0,21.465380,alto_gasto_pagamento_baixos,312.494089,Good,1,1,1,1,0
1,3392,2,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,266.0,21.465380,baixo_gasto_pagamento_alto,284.629162,Good,1,1,1,1,0
2,3392,3,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,3.0,...,267.0,21.465380,baixo_gasto_pagamento_medio,331.209863,Good,1,1,1,1,0
3,3392,4,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,5.0,...,268.0,21.465380,baixo_gasto_pagamento_baixo,223.451310,Good,1,1,1,1,0
4,3392,5,23.0,cientista,19114.12,3.0,4.0,3.0,4.0,6.0,...,269.0,21.465380,alto_gasto_pagamento_medio,341.489231,Good,1,1,1,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
99995,37932,4,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,23.0,...,378.0,24.028477,alto_gasto_pagamento_alto,479.866228,Poor,1,0,0,0,1
99996,37932,5,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,18.0,...,379.0,24.028477,alto_gasto_pagamento_medio,496.651610,Poor,1,0,0,0,1
99997,37932,6,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,27.0,...,380.0,24.028477,alto_gasto_pagamento_alto,516.809083,Poor,1,0,0,0,1
99998,37932,7,25.0,mecanico,39628.99,4.0,6.0,7.0,2.0,20.0,...,381.0,24.028477,baixo_gasto_pagamento_alto,319.164979,Standard,1,0,0,0,1


In [13]:
# profissao
# mix_credito
# comportamento_pagamento
# a coluna SCORE_CREDITO é a coluna que sera prevista.

# LabelEncoder -> transforma valores de texto em numero criando um tipo de ENUM para cada grupo
    # cientista = 1 // mecanico = 2 ...
from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()
tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

In [14]:
# aprendizado de maquina
 # Separar os valores de TREINO e de TESTE
 # coluna que queremos prever chamaremos de Y
 # colunas que teremos de informacao chamaremos de X
    # nao vamos usar a coluna ID cliente pq é aleatorio

y = tabela["score_credito"]
x = tabela.drop(columns=["score_credito", "id_cliente"])

from sklearn.model_selection import train_test_split
# Por padrao o train_test_split separa uma % dos dados para cada item
    # 70% Treino
    # 30% Teste
    # Pode ser definido um valor para ele == train_test_split(x, y, test_size=0.3)
x_treino, x_test, y_treino, y_test = train_test_split(x, y, test_size=0.3) # separa os dados de treino e teste 

In [15]:
# criar a inteligencia artificial
# importa a inteligencia artificial


# Arvore de decisao -> RandomForest
from sklearn.ensemble import RandomForestClassifier
    # Faz perguntas a sua base de dados -> Idade > 20 - Sim e Nao e continua a separacao

# KNN ->  (Vizinhos proximos) -> KNeighbors
from sklearn.neighbors import KNeighborsClassifier
    # Todos os clientes no grafico separa cada tipo (BOM, MEDIO, RUIM) e vai aproximando os dados

# cria a inteligencia artificial
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# treina a inteligencia artificial
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)


In [16]:
# testar os modelos compara os modelos
from sklearn.metrics import accuracy_score

previsao_arvoredecisao = modelo_arvoredecisao.predict(x_test)
previsao_knn = modelo_knn.predict(x_test.to_numpy())

print(accuracy_score(y_test, previsao_arvoredecisao))
print(accuracy_score(y_test, previsao_knn))



0.8268666666666666
0.7377666666666667


In [19]:
# Fazer novas previsoes

# importar novos clientes
tabela_novos_clientes = pd.read_csv("novos_clientes.csv")

# codificar os novos clientes ( LabelEncoder )
codificador = LabelEncoder()
tabela_novos_clientes["profissao"] = codificador.fit_transform(tabela_novos_clientes["profissao"])
tabela_novos_clientes["mix_credito"] = codificador.fit_transform(tabela_novos_clientes["mix_credito"])
tabela_novos_clientes["comportamento_pagamento"] = codificador.fit_transform(tabela_novos_clientes["comportamento_pagamento"])

# display(tabela_novos_clientes)

# fazer as previsoes
previsoes = modelo_arvoredecisao.predict(tabela_novos_clientes)
print(previsoes)

['Poor' 'Good' 'Standard']
