# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
# PASSO A PASSO " de uma ia"

# Passo 0 -> Entenda a empresa e o desafio da empresa, o objetivo do projeto, alem do contexto. Imagine, 90% de precisção em nosso caso, é muito bom, mas imagine se fosse pra uma ia de um "remédio"? já não seria tão bom assim. Então, entenda o contexto.

# Passo 1 -> Importe a base de dados
import pandas as pd

tabela = pd.read_csv("clientes.csv")

display(tabela)


In [None]:
# Passo 2 -> Preparar a base de dados para a inteligencia artificial, (ela aceita meio que um modelo especifico, oura coisa, a ia aprende com baseno "histórico antigo", tipo, aquele cliente x com tais caracteristicas, tem score tal)

display(tabela.info())
# Percebemos que a tabela já esta tratada, tudo ok

# No processo de aprendizado, a ia não trabalha com textos

# label encoder -> transforma os textos em numeros
# colunas: profissao, mix_credito, comportamento_pagamento

# Por exemplo, na de profissao, vamos ter dentista, mecanico, artista, engenheiro, etc. O label encoder, vai transformar dentista em 1, mecanico, em 2, por assim em diante!

# importando label encoder:
from sklearn.preprocessing import LabelEncoder # um adendo, usamos esse formato de "from tanana import tanana" pra não escrever muito, assim já pegamos a função!

# profissao:
codificador_profissao = LabelEncoder()
tabela["profissao"] = codificador_profissao.fit_transform(tabela["profissao"]) # fit_transform -> transforma os textos em numeros
# ele encaixa os valores "novos" com os codificados

# mix_credito:
codificador_credito = LabelEncoder()
tabela["mix_credito"] = codificador_credito.fit_transform(tabela["mix_credito"])

# comportamento_pagamento:
codificador_pagamento = LabelEncoder()
tabela["comportamento_pagamento"] = codificador_pagamento.fit_transform(tabela["comportamento_pagamento"])

# deixamos as funções separados, pos os numeros gerados teram significados diferentes em cada coluna

display(tabela.info())
# lembrando que o score credito ainda esta como objeto, pois é o que iremos trabalhar futuramente

In [18]:
# Y -> A COLUNA DA BASE DE DADOS QUE EU QUERO CHEGAR, NO CASO, O SCORE CREDITO
y = tabela["score_credito"]
# x -> AS COLUNAS QUE EU VOU USAR PRA CHEGAR NO Y
# IMPORTANTE -> TEMOS COLUNAS QUE NÃO VAI NOS AJUDAR, VÃO ATÉ ATRAPALHAR, COMO A ID CLIENTE!
x = tabela.drop(columns=["score_credito", "id_cliente"]) # drop é para "jogar fora"/ todas as colunas menos a score credito!

# separar em dados de treino e dados de teste
from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3) # o que importa aqui é a ordem!



In [None]:
# Passo 3 -> Treinar a IA -> Criar o modelo
# Importar a IA
# Vamos usar dois modelos (duas ias), pra que no final, comparamos elas e vemod qual a melhor
# Modelos:

# Arvore de decisão -> Randomforest
# Vizinhos mais próximos -> KNN -> K-Nearest Neighbors
from sklearn.ensemble import RandomForestRegressor
from sklearn.neighbors import KNeighborsRegressor

# Criar a IA
modelo_arvore = RandomForestRegressor()
modelo_knn = KNeighborsRegressor()

# Treinar a IA
# modelo_arvore.fit(x_treino, y_treino) # x_treino -> as caracteristicas dos clientes, y_treino -> o score credito -> o fit é de treino mesmo
# modelo da arvore não esta funcionando, o knn esta de bora, verificar depois
modelo_knn.fit(x_treino, y_treino)




In [None]:
# Passo 4 -> Avaliar o modelo (qual é o melhor?)
# previsao_arvore = modelo_arvore.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

# acurácia -> precisão!
from sklearn.metrics import accuracy_score # vai calcular a precisão
display(accuracy_score(y_teste, previsao_knn)) # y_teste -> o que era pra ser, previsao_knn -> o que a ia previu

# A LÓGICA ENTENDI, MAS NÃO ESTA RODANDO, PC TA COMPLICADO, TALVEZ NUM FUTURO TENTO ARRUAR?


In [6]:

# Passo 5 -> Usar o melhor modelo para fazer previsões
# segundo a aula, o melhor modelo é o da arvore de decisão

# importar os novos clientes para a previsão

tabela_novos_clientes = pd.read_csv("novos_clientes.csv")

# vamos arruar os textos:
# lembra que nossas codifiçãoções já estavam feitas! dai era só colocar!

# profissao:
codificador_profissao = LabelEncoder()
tabela_novos_clientes["profissao"] = codificador_profissao.transform(tabela_novos_clientes["profissao"]) # fit_transform -> transforma os textos em numeros
# ele encaixa os valores "novos" com os codificados

# mix_credito:
codificador_credito = LabelEncoder()
tabela_novos_clientes["mix_credito"] = codificador_credito.transform(tabela_novos_clientes["mix_credito"])

# comportamento_pagamento:
codificador_pagamento = LabelEncoder()
tabela_novos_clientes["comportamento_pagamento"] = codificador_pagamento.transform(tabela_novos_clientes["comportamento_pagamento"])

# transform é para "trocar"

nova_previsao = modelo_arvore.predict(tabela_novos_clientes)
display(nova_previsao)

