# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [2]:
#Passo 0: importar bibliotecas --> scikit-learn e pandas | Step 0: import libraries --> scikit-learn and pandas

!pip install scikit-learn pandas

^C


Collecting scikit-learn
  Downloading scikit_learn-1.4.1.post1-cp312-cp312-win_amd64.whl.metadata (11 kB)
Collecting scipy>=1.6.0 (from scikit-learn)
  Downloading scipy-1.12.0-cp312-cp312-win_amd64.whl.metadata (60 kB)
     ---------------------------------------- 0.0/60.4 kB ? eta -:--:--
     --------------------------------- ------ 51.2/60.4 kB 1.3 MB/s eta 0:00:01
     ---------------------------------------- 60.4/60.4 kB 1.1 MB/s eta 0:00:00
Collecting joblib>=1.2.0 (from scikit-learn)
  Downloading joblib-1.3.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=2.0.0 (from scikit-learn)
  Downloading threadpoolctl-3.3.0-py3-none-any.whl.metadata (13 kB)
Downloading scikit_learn-1.4.1.post1-cp312-cp312-win_amd64.whl (10.6 MB)
   ---------------------------------------- 0.0/10.6 MB ? eta -:--:--
    --------------------------------------- 0.2/10.6 MB 4.1 MB/s eta 0:00:03
   -- ------------------------------------- 0.8/10.6 MB 8.0 MB/s eta 0:00:02
   ------ --------------

In [5]:
#Passo 1: Importar base de dados | Step 1: Import database

import pandas as pd
tabela = pd.read_csv("clientes.csv")
display(tabela.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  object 
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  object 
 13  divida_total              100000 non-null  fl

None

In [6]:
#Passo 2: Ajustar dados - IA precisa de valores numéricos | Step 2: Adjust data - AI needs numerical values
# DType object = text

from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()

tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

display(tabela.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  int32  
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  int32  
 13  divida_total              100000 non-null  fl

None

In [18]:
# Passo 3: Definir quem será previsto (y) e quem será utilizado para fazer previsão (x) | Step 3: Define who is gonna be predicted (y) and who is gonna be used for the prediction (x)

y = tabela["score_credito"]
x = tabela.drop(["score_credito", "id_cliente"], axis=1)

from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3)

In [19]:
#Passo 4: Criar e treinar IA | Step 4: Create and train AI
#Random Forest Classifier and KNeighboors Classifier

from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

modelo_arvore = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

modelo_arvore.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)


In [20]:
#Passo 5: Testar acurácia dos modelos | Step 5: Test models' accuracy

from sklearn.metrics import accuracy_score

previsao_arvore = modelo_arvore.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

print(accuracy_score(y_teste, previsao_arvore))
print(accuracy_score(y_teste, previsao_knn))

0.8208
0.7396333333333334


In [21]:
#Passo 6: Verificar parâmetros de maior peso sobre o score_cliente | Step 6: Identify parameters with higher impact on score_clientes

colunas = list(x_teste.columns) 
importancia = pd.DataFrame(index=colunas, data=modelo_arvore.feature_importances_)
importancia = importancia * 100
print(importancia)

#divida_total | total_debt
#juros_emprestimo | interest_loan
#mix_credito | credit_mix

                                  0
mes                        3.914925
idade                      4.226915
profissao                  3.236586
salario_anual              4.981667
num_contas                 3.383392
num_cartoes                4.447685
juros_emprestimo           8.543782
num_emprestimos            2.916612
dias_atraso                6.424709
num_pagamentos_atrasados   4.441806
num_verificacoes_credito   4.557138
mix_credito                8.509219
divida_total              11.946322
taxa_uso_credito           5.068457
idade_historico_credito    7.347986
investimento_mensal        4.831827
comportamento_pagamento    2.336171
saldo_final_mes            5.409006
emprestimo_carro           0.698371
emprestimo_casa            0.712964
emprestimo_pessoal         0.678075
emprestimo_credito         0.699214
emprestimo_estudantil      0.687173
