# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom


In [1]:
# Passo 1 - Importar a base de dados

import pandas as pd

tabela = pd.read_csv('clientes.csv')

display(tabela.info())


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  object 
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  object 
 13  divida_total              100000 non-null  fl

None

In [2]:
# Passo 2 - Preparar a base de dados para a inteligencia artificial
# display(tabela.info())


from sklearn.preprocessing import LabelEncoder # Já aq so esta sendo importando "um livro"/uma função da biblioteca


# profissao
codificador = LabelEncoder()
tabela['profissao'] = codificador.fit_transform(tabela['profissao'])

# mix_credito
codificador2 = LabelEncoder()
tabela['mix_credito'] = codificador2.fit_transform(tabela['mix_credito'])

# comportamento_pagamento
codificador3 = LabelEncoder()
tabela['comportamento_pagamento'] = codificador3.fit_transform(tabela['comportamento_pagamento'])

display(tabela.info())



<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  int64  
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  int64  
 13  divida_total              100000 non-null  fl

None

In [3]:
# Treinando a IA
    # A tabela deve ser dividida em 2 partes: PARTE 1
# 1 parte oque será usado para atingir um resultado (x)
# 2 parte: alguns resultados de exemplo (y)
y = tabela['score_credito'] # Quem a gente quer preve
x = tabela.drop(columns=['score_credito', 'id_cliente']) # quem vai ser usado para prever o resultado de Y (todas colunas, menos o resultado)/ id_cliente = coluna inutil

In [4]:
# Treinando a IA
    # A tabela deve ser dividida em 2 partes: PARTE 2
        # Dividir a tabela pela metade = Parte dos dados vão para treino da IA, e outro parte para o teste da IA

from sklearn.model_selection import train_test_split #função que divide os dados em treinos (train), e em testes (test)

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3) # Test_size = porcentagem de dados a serem mandandos para o estudo da IA


In [5]:
# Passo 3 - Criar um modelo IA -> Nota/Score de credito: Bom, ok, ruim.

# Para cria uma IA são 3 passos:
    # Importa IA
    # Cria IA
    # Treina IA

# 2 modelos de IA -> RandomForest / Nearest Neighbors (KNN)

# Importa IA
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# Cria IA
modelo_random_forest = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# Treinar IA
modelo_random_forest.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

In [6]:
# Passo 4 - Avaliar qual melhor IA

previsao_randomFor = modelo_random_forest.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

# acuracia -> calcula porcentagem acerto 
from sklearn.metrics import accuracy_score

display(accuracy_score(y_teste, previsao_randomFor))
display(accuracy_score(y_teste, previsao_knn))

0.8243333333333334

0.7366

In [7]:
# Passo 5 - Fazer novas previsões
# IA com maior taxa de acerto = RandomForest (83%)

tabela_novos_clientes = pd.read_csv('novos_clientes.csv')

#transformando colunas str em numeros
tabela_novos_clientes['profissao'] = codificador.fit_transform(tabela_novos_clientes['profissao'])
tabela_novos_clientes['mix_credito'] = codificador2.fit_transform(tabela_novos_clientes['mix_credito'])
tabela_novos_clientes['comportamento_pagamento'] = codificador3.fit_transform(tabela_novos_clientes['comportamento_pagamento'])

score_credito_novos_cliente = modelo_random_forest.predict(tabela_novos_clientes)
display(score_credito_novos_cliente)

tabela_novos_clientes['score_creditos'] = score_credito_novos_cliente

array(['Poor', 'Good', 'Standard'], dtype=object)