# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
# Passo a passo do projeto
# passo 0 -> Enteder o desafio da empresa
# Passo 1 -> importar a base de dados
# Passo 2 -> Preparar a base de dados para a inteligência artificial 
# Passo 3 -> Criar um modelo de IA -> Score crédito: bom, ok, Ruim
# Passo 4 -> Escolher o melhor modelo 
# Passo 5 -> Usar a nossa IA para fazer novas previsões

#vamos utilizar pandas e scikit-learn 
!pip install scikit-learn


In [None]:
#Passo 1 -> importar a base de dados

import pandas as pd 

tabela = pd.read_csv("clientes.csv")

display(tabela)

display(tabela.info())
#Good(bom),Standard(ok),Poor(Ruim)


In [None]:
# Passo 2 -> Preparar a base de dados para a inteligência artificial 
#int -> numero inteiro
#float -> casa decimal
#object -> texto
# As inteligências artificial nao consegue aprender em texto so em número

#LABEL ENCODER Transforma uma informação em texto em numero 
#label endoder -> nao precismos utilizar no score_credito pq é ele quem nos queremos prever.
#vamos utilizar o label encoder -> nas colunas profissao, mix_credito, comportamento_pagamento

#como utilizar label encoder passos.
#importar o label encoder

from sklearn.preprocessing import LabelEncoder
# vai transformar as colunas de texto em números, ex: profissoes vai sair de cientista, professor, mecanico, etc para 0, 1, 2, etc
codificador = LabelEncoder()

# só não aplicamos na coluna de score_credito que é o nosso objetivo
for coluna in tabela.columns:
    if tabela[coluna].dtype == "object" and coluna != "score_credito":
        tabela[coluna] = codificador.fit_transform(tabela[coluna])

# verificando se realmente todas as colunas foram modificadas
display(tabela.info())

In [None]:
# Passo 2.1 Divisões Quem quero prever, quem eu quero usar pra fazer a previsão

x = tabela.drop(["score_credito", "id_cliente"], axis=1)
y = tabela["score_credito"]

# Passo 2.2 Divisões Treino e teste para IA
from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x,y)



In [None]:
#criando a interligência artificial 
#modelos de interligência artificial -> Árvore de Decisão e KNN Vizinhos proximos(nearest neighbors)

#importa a interligência artificial
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

#cria a interligência artificial
modelo_arvore= RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

#treinar a interligência artificial
modelo_arvore.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)


In [None]:
# testando os modelos
previsao_arvoredecisao = modelo_arvore.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

#quanto acertos ou precisao os modelos tem.
from sklearn.metrics import accuracy_score

print(accuracy_score(y_teste,previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_knn))

In [None]:
# o melhor modelo é o de arvore de decisão
tabela_nova = pd.read_csv("novos_clientes.csv")
display(tabela_nova)

tabela_nova["profissao"] = codificador.fit_transform(tabela_nova["profissao"])
tabela_nova["mix_credito"] = codificador.fit_transform(tabela_nova["mix_credito"])
tabela_nova["comportamento_pagamento"] = codificador.fit_transform(tabela_nova["comportamento_pagamento"])

previsoes = modelo_arvore.predict(tabela_nova)
display(previsoes)