# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [1]:
# Passo a passo 

# 0- Entender o desafio da empresa
# 1- Importar base de dados
import pandas as pd

tabela = pd.read_csv('clientes.csv')
display(tabela.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  object 
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  object 
 13  divida_total              100000 non-null  fl

None

In [2]:
# 2- Preparar a base de dados para IA
# IA's necessitam receber apenas dados numericos
# As colunas de: profissao, mix_credito, comportamento_pagamento, precisarao ser alteradas. 

from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()

tabela['profissao'] = codificador.fit_transform(tabela['profissao']) # a antiga coluna recebe a nova coluna aplicando o codificador
tabela['mix_credito'] = codificador.fit_transform(tabela['mix_credito'])
tabela['comportamento_pagamento'] = codificador.fit_transform(tabela['comportamento_pagamento'])
# (A de score_credito nao se encaixa pq eh o gabarito final q a gente quer q a IA preveja)

display(tabela.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  int32  
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  int32  
 13  divida_total              100000 non-null  fl

None

In [3]:
# Aprendizado de maquina
# Existem dados de treino e dados de teste, nao faz sentido treinar com os dados que voce vai testar
# coluna q a gente quer prever: y, as colunas q vao servir pra usar pra prever: x.

y = tabela['score_credito']
x = tabela.drop(columns=['score_credito', 'id_cliente'])

from sklearn.model_selection import train_test_split

# precisamos de x e y para teste, e x e y para treino
x_treino, x_teste, y_treino, y_teste = train_test_split(x, y) # por padrao fica 70/30, usando como parametro test_size da pra alterar a proporcao


In [4]:
# 3- Criar um modelo de IA -> Score de credito, medio. bom ou ruim
# Modelos: Arvore de decisao -> RandomForest, KNN -> Nearest neighbors

# importa ia
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# cria ia
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# treina ia
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)


In [5]:
# 4- Escolher melhor modelo
from sklearn.metrics import accuracy_score

previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste.to_numpy())
previsao_knn = modelo_knn.predict(x_teste.to_numpy())

# testar acuracia
print('Porcentagem de acerto da Arvore de decisao:', accuracy_score(y_teste, previsao_arvoredecisao))
print('Porcentagem de acerto da Knn:', accuracy_score(y_teste, previsao_knn))

# Melhor modelo: Arvore de decisao



Porcentagem de acerto da Arvore de decisao: 0.8264
Porcentagem de acerto da Knn: 0.74168


In [6]:
# 5- Usar a nossa IA para fazer novas previsoes 

# importar novos clientes
tabela_novos_clientes = pd.read_csv('novos_clientes.csv')

# codificar novos clientes
tabela_novos_clientes['profissao'] = codificador.fit_transform(tabela_novos_clientes['profissao'])
tabela_novos_clientes['mix_credito'] = codificador.fit_transform(tabela_novos_clientes['mix_credito'])
tabela_novos_clientes['comportamento_pagamento'] = codificador.fit_transform(tabela_novos_clientes['comportamento_pagamento'])

previsao_novos_clientes = modelo_arvoredecisao.predict(tabela_novos_clientes)
print(previsao_novos_clientes)

['Poor' 'Good' 'Standard']
