# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

O objetivo é definir o score de crédito dos clientes, analisando todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

In [None]:
#vamos usar as bibliotecas:
#pandas -> trabalhar com dados
#scikit-learn -> trabalhar com IA
%pip install pandas scikit-learn

In [None]:
import pandas as pd 

#passo 1 -> importar a base de dados
tabela = pd.read_csv("clientes.csv")
display(tabela)

#analisando os dados buscando entender o tipo de cada coluna, se temos valores vazios, etc:
display(tabela.info())


In [None]:
#passo 2 -> preparar a base de dados para IA
#etapa LabelEncoder
#precisamos transformar os dados que serão estudados em formato numérico
from sklearn.preprocessing import LabelEncoder

codificador = LabelEncoder()

#processo de LabelEncoder nas colunas com informações do tipo texto, transformando em numérico
tabela["profissao"] = codificador.fit_transform(tabela["profissao"])

tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])

tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

display(tabela)
display(tabela.info())

In [None]:
#etapa de divisões -> vamos dividir nossa base duas vezes
#Y = quem queremos prever
#X = quem queremos usar para fazer a previsão (retirar as colunas inúteis para previsão, como ID's)
y = tabela["score_credito"]
x = tabela.drop(columns=["score_credito", "id_cliente"])

#divisão treino e teste -> separar nossa base em dados de treino e dados de teste, com os dados de treino a IA irá aprender e depois treinará com dados de teste
from sklearn.model_selection import train_test_split

#precisa seguir a ordem:
x_treino, x_teste, y_treino, y_teste = train_test_split(x, y)

In [None]:
#passo 3 - criar um modelo de IA
#vamos usar 2 modelos -> árvore de decisão e KNN(K-Nearest Neighbors)
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

#criando a IA
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

#treinando a IA
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

In [None]:
#passo 4 - escolher qual o melhor para fazer nossas previsões
#testando os modelos 
previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

#calculando a precisão dessa previsão (Acurácia - quanto ele acertou e quanto ele errou, comparando o resultado dos testes com a previsão da IA)
from sklearn.metrics import accuracy_score

print(accuracy_score(y_teste, previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_knn))

In [None]:
#passo 5 - usar a IA com novos dados
tabela_nova = pd.read_csv("novos_clientes.csv")

#vamos repetir o processo de LabelEncoder
tabela_nova["profissao"] = codificador.fit_transform(tabela_nova["profissao"])

tabela_nova["mix_credito"] = codificador.fit_transform(tabela_nova["mix_credito"])

tabela_nova["comportamento_pagamento"] = codificador.fit_transform(tabela_nova["comportamento_pagamento"])

#conseguimos agora realizar previsão do score de novos clientes 
previsoes = modelo_arvoredecisao.predict(tabela_nova)
display(previsoes)