# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
#passo a passo
#0: Entender o desafi da empresa
#1: importar base de dados
#2: preparar a base para a IA
#3: Criar um modelo de IA > Score de crédito: bom, ok, ruim
#4: escolher o melhor modelo
#5: usar a IA para fazer novas previsões
# pandas(para trabalhar a base de dados) e scikit learn
# pip install scikit-learn

In [None]:
import pandas as pd
tabela = pd.read_csv("clientes.csv")
display(tabela) #mostrar a tabela
display(tabela.info())# ver a estrutura da tabela
# score do cliente==> Good, Standard e Poor
# label encoder - transformar em numero as colunas que estão em texto - fazer para as colunas: profisão, mix_credito, comportamento_pagamento (para a coluna score_credito não precisa pois será a informação retornada pela IA )

#importa o label encoder 
from sklearn.preprocessing import LabelEncoder
#criar o label encoder
codificador = LabelEncoder()
#aplicar o label encoder na coluna

tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

In [20]:
# 2 divisões na base

# o que eu quero prever(y), quem quero usar para fazer a previsao(x, o resto)
y=tabela["score_credito"]
x=tabela.drop(columns=["score_credito","id_cliente"])# tabela sem essas colunas

# treino e teste
from sklearn.model_selection import train_test_split #necessario para fazer o treino e o teste. Treinar a IA e fazer testes.

x_treino, x_teste, y_treino, y_teste = train_test_split(x,y, test_size=0.3)

In [21]:
# criar a IA
# Arvore de decisão
# KNN -> visinhos próximos (Nearest neighbors)

# 3 passos para criar e treinar
# importa a IA
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier 

# Cria a IA
modelo_arvoredecisao = RandomForestClassifier()
modelo_km = KNeighborsClassifier()

# Treina a IA
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_km.fit(x_treino, y_treino)

In [23]:
# testar os modelos
previsao_arvoredecisao=modelo_arvoredecisao.predict(x_teste)
previsao_km=modelo_km.predict(x_teste)

from sklearn.metrics import accuracy_score #calcular a precisão da previsão

print(accuracy_score(y_teste, previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_km))

0.8211333333333334
0.7332


In [None]:
# o melhor modelo é o de arvore de decisão
tabela_nova = pd.read_csv("novos_clientes.csv")
display(tabela_nova)
tabela_nova["profissao"] = codificador.fit_transform(tabela_nova["profissao"])
tabela_nova["mix_credito"] = codificador.fit_transform(tabela_nova["mix_credito"])
tabela_nova["comportamento_pagamento"] = codificador.fit_transform(tabela_nova["comportamento_pagamento"])

previsoes= modelo_arvoredecisao.predict(tabela_nova)
display(previsoes)