# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
import pandas as pd

tabela = pd.read_csv('C:/Users/Gabriela/Desktop/github/projeto.python/aula3/clientes.csv')
display(tabela)
display(tabela.info())


Não há problemas com colunas mal preenchidas nessa base de dados em específico. Porém, vemos que há algumas colunas em que os dados são strings (profissao, mix_credito, comportamento_pagamento). Temos que transformá-las em números para que os modelos de IA possam aprender efetivamente. Para isso, utilizaremos o label encoder.

Exclui-se o score_credito desse processo pois a IA dará a resposta por ele, ou seja, ele não participará da análise, e sim do retorno da informação apenas.

In [None]:
from sklearn.preprocessing import LabelEncoder 

codificador1 = LabelEncoder()
tabela['profissao'] = codificador1.fit_transform(tabela['profissao'])

codificador2 = LabelEncoder()
tabela['mix_credito'] = codificador2.fit_transform(tabela['mix_credito'])

codificador3 = LabelEncoder()
tabela['comportamento_pagamento'] = codificador3.fit_transform(tabela['comportamento_pagamento'])

display(tabela.info())

Agora que tudo já foi resolvido, faremos o processo de treinamento da inteligência artifical que usaremos para prever tendências de comportamento do cliente, baseando-se nos dados que já possuímos.

In [44]:
# axis=1 significa colunas e axis=0 dignifica linhas. Quando não definido, padrão é 0. Mas
# nesse caso nem precisa porque o código já sabe que é uma coluna.

x = tabela.drop(['score_credito', 'id_cliente'], axis=1)
y = tabela['score_credito']

from sklearn.model_selection import train_test_split as treino

(x_treino, x_teste, y_treino, y_teste) = treino(x,y,test_size=0.3) #porcentagem do tamanho do teste.
# Cuidado ao utilizar os mesmos dados para treino e para teste, porque a IA responde com infos decoradas.


Criaremos, nesse momento, duas opções de análise de IA, com duas IAs diferentes. A que performar melhor será usada para previsões.

In [None]:
#TREINO

from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier 

modelo_floresta = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

modelo_floresta.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

O próximo passo é checar a acurácia dos modelos utilizando um teste.

In [None]:
#teste (prever um resultado baseado no x_teste):
previsao_floresta = modelo_floresta.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

#acurácia (comparar esse resultado com o y_teste):

from sklearn.metrics import accuracy_score

display(accuracy_score(y_teste, previsao_floresta))
display(accuracy_score(y_teste, previsao_knn))

Assim, notamos que o primeiro teste foi o mais satisfatório, o que nos diz que o modelo da Random Forest foi o melhor, com 82% de acurácia. O próximo passo é aplicar esse modelo nos dados dos novos clientes, para prever seus resultados, assim como é o objetivo da empresa.

In [None]:
nova_tabela = pd.read_csv('C:/Users/Gabriela/Desktop/github/projeto.python/aula3/novos_clientes.csv')
display(nova_tabela)

#copiar códigos antigos.

codificador1 = LabelEncoder()
nova_tabela['profissao'] = codificador1.fit_transform(nova_tabela['profissao'])

codificador2 = LabelEncoder()
nova_tabela['mix_credito'] = codificador2.fit_transform(nova_tabela['mix_credito'])

codificador3 = LabelEncoder()
nova_tabela['comportamento_pagamento'] = codificador3.fit_transform(nova_tabela['comportamento_pagamento'])

display(nova_tabela.info())

#último passo... prever um resultado baseado na nova_tabela, assim como fizemos no teste:

previsao = modelo_floresta.predict(nova_tabela)
display(previsao)

#joblib
#picket