# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [12]:
#pip install pandas numpy scikit learn
import pandas as pd
dados = pd.read_csv("clientes.csv")
#display(dados)
#display(dados.info())

#Processo de aprendizado de IA não pode ter informações do tipo texto (object)
#Resolve-se isso com label enconder: designar um numero para representar cada informações. Pode-se usar isso da biblioteca scikit learn

from sklearn.preprocessing import LabelEncoder
codificador = LabelEncoder()

# só não aplicamos na coluna de score_credito que é o nosso objetivo
for coluna in dados.columns:
    if dados[coluna].dtype == "object" and coluna != "score_credito":
        dados[coluna] = codificador.fit_transform(dados[coluna])

display(dados.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  int64  
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  int64  
 13  divida_total              100000 non-null  fl

None

In [14]:
#Fazer a IA entender o que ela teria que prefer (score_credito) e quais info precisaria para tal.
#Por convenção O cara que a gente quer prefer a gente chama de Y e os valores que a IA usará para prever são chamados de X

x = dados.drop(columns=["score_credito","id_cliente"])
y = dados["score_credito"]

#Separar parte dos dados para treino e parte para testar se a IA tem aprendido corretamente
from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x,y,test_size=0.3)# aqui a ordem das variaveis é importante, tem que ser nessa sequencia 
# e usando o test_size você define o % da base a ser usada para treino

In [None]:
#Criar um modelo de IA - Nota de Crédito: Ruim, Média ou Boa
#Vamos usar dos modelos de IA disponíveis:
#Arvores de Decisão -> Randon Forest
#Neirest Neighbors -> KNN

#Importar a IA
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

#Criar a IA
modelo_arvore_decisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

#Treinar a IA
modelo_arvore_decisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)



In [16]:
#Escolher o melhor modelo
previsao_arvore_decisao = modelo_arvore_decisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

#calcular a Acurácia de cada um deles
from sklearn.metrics import accuracy_score

#mostrar o resultados
display(accuracy_score(y_teste, previsao_arvore_decisao))
display(accuracy_score(y_teste, previsao_knn))

0.82732

0.74288

In [19]:
#Nesse caso usaremos o modelo de árvore de decisão que teve o melhor resultado
dados_novos_clientes = pd.read_csv("novos_clientes.csv")

display(dados_novos_clientes)

#Ajustar as colunas de texto
for coluna in dados_novos_clientes.columns:
    if dados_novos_clientes[coluna].dtype == "object" and coluna != "score_credito":
        dados_novos_clientes[coluna] = codificador.fit_transform(dados_novos_clientes[coluna])

#fazer as novas previsões
previsoes = modelo_arvore_decisao.predict(dados_novos_clientes)
display(previsoes)

#Veja que o primeiro foi previsto com o Poor, o segundo Good e o terceiro Good também

Unnamed: 0,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,num_pagamentos_atrasados,...,taxa_uso_credito,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,1,31.0,empresario,19300.34,6.0,7.0,17.0,5.0,52.0,19.0,...,29.934186,218.0,44.50951,baixo_gasto_pagamento_baixo,312.487689,1,1,0,0,0
1,4,32.0,advogado,12600.445,5.0,5.0,10.0,3.0,25.0,18.0,...,28.819407,12.0,0.0,baixo_gasto_pagamento_medio,300.994163,0,0,0,0,1
2,2,48.0,empresario,20787.69,8.0,6.0,14.0,7.0,24.0,14.0,...,34.235853,215.0,0.0,baixo_gasto_pagamento_alto,345.081577,0,1,0,1,0


array(['Poor', 'Good', 'Good'], dtype=object)