# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [2]:
# PASSA A PASSO

# Passo 0- entender o desafio da empresa
# Passo 1- importar a base de dados / corrigir a base de dados
# Passo 2- preparar a base de dados para a inteligência artificial
# Passo 3- criar um modelo de IA -> score de crédito
# Passo 4- escolher o melhor modelo
# Passo 5- usar a nossa IA para fazer novas previsões


In [3]:
# PASSO 1- importar a base de dados/corrigir a base de dados
import pandas as pd 

tabela = pd.read_csv("clientes.csv")
#display(tabela)
print(tabela.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 25 columns):
 #   Column                    Non-Null Count   Dtype  
---  ------                    --------------   -----  
 0   id_cliente                100000 non-null  int64  
 1   mes                       100000 non-null  int64  
 2   idade                     100000 non-null  float64
 3   profissao                 100000 non-null  object 
 4   salario_anual             100000 non-null  float64
 5   num_contas                100000 non-null  float64
 6   num_cartoes               100000 non-null  float64
 7   juros_emprestimo          100000 non-null  float64
 8   num_emprestimos           100000 non-null  float64
 9   dias_atraso               100000 non-null  float64
 10  num_pagamentos_atrasados  100000 non-null  float64
 11  num_verificacoes_credito  100000 non-null  float64
 12  mix_credito               100000 non-null  object 
 13  divida_total              100000 non-null  fl

In [4]:
# Passo 2- preparar a base de dados para a inteligência artificial

# colunas com object -> transformar em números inteiro
# profissao
# mix_credito
# comportamento_pagamento

from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()

# codificador -> aplica na coluna "profissao"
tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
# o novo valor da coluna profissao vai ser o antigo valor da coluna profissao, porém aplicando o LabelEncoder()

# codificador -> aplica na coluna "mix_credito"
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])

# codificador -> aplica na coluna "comportamento_pagamento"
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

In [5]:
# x -> dados que quero usar para fazer a previsão (colunas da tabela)
    # não vamos usar a coluna id_cliente porque ela é um número aleatório
# y -> informações que eu quero prevê (colunas da tabela)

y = tabela["score_credito"]
x = tabela.drop(columns=["id_cliente","score_credito"])

# separando dados de teste e treino pelos dados de x y
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x,y, test_size=0.3)


In [None]:
# Passo 3- criar um modelo de IA -> score de crédito

# MODELOS
# Árvore de Decisão -> RandomForest
# KNN -> Vizinhos Próximos -> Kneighbors

# importa a inteligência artificial
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# cria inteligencia artificial
modelo_arvoreDecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# treinar a inteligencia artificial
modelo_arvoreDecisao.fit(x_train,y_train)
modelo_knn.fit(x_train,y_train)

# testar os modelos 3 compara os modelos
# faça uma previsao do modelo...
previsao_arvoreDecisao = modelo_arvoreDecisao.predict(x_test)
previsao_knn = modelo_knn.predict(x_test.to_numpy())

# fazer a comparação entre os modelos para ver quem tem mais acurácia
from sklearn.metrics import accuracy_score

# comparar previsao com y_teste
print(accuracy_score(y_test, previsao_arvoreDecisao))
print(accuracy_score(y_test, previsao_knn))

In [9]:
# melhor modelo: modelo_arvoreDecisao
# fazer novas previsões
# importar novos clientes
tabela_novos_clientes = pd.read_csv("novos_clientes.csv")

# codificar os novos clientes 
tabela_novos_clientes["profissao"] = codificador.fit_transform(tabela_novos_clientes["profissao"])
tabela_novos_clientes["mix_credito"] = codificador.fit_transform(tabela_novos_clientes["mix_credito"])
tabela_novos_clientes["comportamento_pagamento"] = codificador.fit_transform(tabela_novos_clientes["comportamento_pagamento"])

# fazer novas previsoes
previsoes = modelo_arvoreDecisao.predict(tabela_novos_clientes)
print(previsoes)

['Poor' 'Good' 'Standard']
