# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

- Passo a passo
    - Passo 0 - Entender o desafio e a empresa 
    - Passo 1 - Importar a basse de dados
    - Passo 2 - Preparar a base de dados para a IA
    - Passo 3 - Separar as informações em dados de treino e em dados de teste
    - Passo 4 - Criar um modelo de IA
    - Passo 5 - Escolher o melhor modelo
    - Passo 6 - Usar um moledo em um cenário real

- Instalação de Libs para esse projeto
    - pip install pandas numpy scikit-learn

In [None]:
#Passo 1 - Importar a basse de dados
import pandas as pd

tabela = pd.read_csv('clientes.csv')
display(tabela) #Trás a tabela formatada

In [None]:
print(tabela.info()) #Mostra as informações da estrutura da tabela

In [None]:
# Passo 2 - Preparar a base de dados para a IA
    #Vamos transformar as colunas que são do tipo object (texto) em número menos a score_credito pq é a que queremos calcular/exibir no final. Elas são:
        #profissao
        #mix_credito
        #comportamento_pagamento
    #Para isso vamos usar o LabelEncoder que é uma das maneiras mais usadas para esse tratamento de dados de texto em número.

#OBS: Esse tratamento é feito porque a IA não entende textos. O chatGPT sempre precisa de um tratamento.


from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()
tabela['profissao'] = codificador.fit_transform(tabela['profissao'])
tabela['mix_credito'] = codificador.fit_transform(tabela['mix_credito'])
tabela['comportamento_pagamento'] = codificador.fit_transform(tabela['comportamento_pagamento'])

print(tabela.info()) #Mostra as informações da estrutura da tabela

In [5]:
#Passo 3 - Separar as informações em dados de treino e em dados de teste porque a IA precisa que eu separe a base de dados duas vezes.
    #A primeira separação feita se refera as colunas que eu quero calcular/prever(y). Nesse caso é o score_credito 
    #A segunda separação se refere as colunas que eu vou usar para fazer a previsão(x)

y = tabela['score_credito'] #Coluna que quero prever

x = tabela.drop(['score_credito', 'id_cliente'], axis=1) #Todas as colunas que vamso usar para a previsão do score de credito
#drop exclui coisas da tabela
#axis = 0 -> linha
#axis = 1 -> coluna

from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y) #Precisa ser SEMPRE nessa ordem

In [6]:
#Passo 4 - Criar um modelo de IA
    #Importa a IA
    #Cria ela 
    #Treina ela
#Vamos usar os modelos de árvore de decisão e o KNN - nearest neighbord

#Importa a IA
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

#Cria a IA
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

#Treina a IA
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)




In [8]:
#Passo 5 - Escolher o melhor modelo
#Vamos comparar os dois modelos comparando a curacia do modelo (quantas vezes ele acertou e quantas vezes ele errou)

from sklearn.metrics import accuracy_score

previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste.to_numpy())

print(accuracy_score(y_teste, previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_knn))

#A árvore de decisão deu 82,864%, logo ela é o melhor modelo nessa situação



0.82864
0.74096


In [19]:
#Passo 6 - Usar um moledo em um cenário real
    #Realizar o processo de previsão
novos_clientes = pd.read_csv('novos_clientes.csv')

novos_clientes['profissao'] = codificador.fit_transform(novos_clientes['profissao'])
novos_clientes['mix_credito'] = codificador.fit_transform(novos_clientes['mix_credito'])
novos_clientes['comportamento_pagamento'] = codificador.fit_transform(novos_clientes['comportamento_pagamento'])
display(novos_clientes)


previsao = modelo_arvoredecisao.predict(novos_clientes)
print(previsao)


Unnamed: 0,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,num_pagamentos_atrasados,...,taxa_uso_credito,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,1,31.0,1,19300.34,6.0,7.0,17.0,5.0,52.0,19.0,...,29.934186,218.0,44.50951,1,312.487689,1,1,0,0,0
1,4,32.0,0,12600.445,5.0,5.0,10.0,3.0,25.0,18.0,...,28.819407,12.0,0.0,2,300.994163,0,0,0,0,1
2,2,48.0,1,20787.69,8.0,6.0,14.0,7.0,24.0,14.0,...,34.235853,215.0,0.0,0,345.081577,0,1,0,1,0


['Poor' 'Good' 'Standard']
