# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

In [None]:
# Passo a passo do projeto
# Passo 0: Entender o desafio da empresa
# Passo 1: Importar a base de dados
# Passo 2: Preparar a base de dados para a IA
# Passo 3: Criar modelos de IA
# Passo 4: Escolher o melhor modelo
# Passo 5: Usar a IA para fazer novas previsões

!pip install pandas scikit-learn

# pandas -> trabalhar com base de dados
# scikit-learn -> inteligência artificial

In [None]:
# Passo 1: Importar a base de dados

import pandas as pd

tabela = pd.read_csv("clientes.csv")

display(tabela)
display(tabela.info())

# coluna score_credito -> Good (bom), Standard (ok), Poor (ruim)

In [None]:
# Passo 2: Preparar a base de dados para a IA

# Label Encoder -> transformar as informações em texto das colunas para números

# import sklearn # ou importar apenas o label encoder
from sklearn.preprocessing import LabelEncoder

# criar o label encoder
codificador = LabelEncoder()

# aplicar o label encoder nas colunas
tabela["profissao"] = codificador.fit_transform(tabela["profissao"])
tabela["mix_credito"] = codificador.fit_transform(tabela["mix_credito"])
tabela["comportamento_pagamento"] = codificador.fit_transform(tabela["comportamento_pagamento"])

display(tabela.info())

In [None]:
# quem eu quero prever
y = tabela["score_credito"]

# quem eu quero usar para fazer a previsão
x = tabela.drop(columns=["score_credito", "id_cliente"])

from sklearn.model_selection import train_test_split
# treino e teste
x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3)

In [None]:
# Passo 3: Criar modelos de IA

# Árvore de Decisão
# KNN -> Vizinhos Próximos (Nearest Neighbors)

# importar a IA
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# criar a IA
modelo_arvoredecisao = RandomForestClassifier()
modelo_knn = KNeighborsClassifier()

# treinar a IA
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

In [None]:
# testar os modelos

previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

from sklearn.metrics import accuracy_score

print(accuracy_score(y_teste, previsao_arvoredecisao))
print(accuracy_score(y_teste, previsao_knn))

In [None]:
# Passo 4: Escolher o melhor modelo

# o melhor modelo é o de Árvore de Decisão

# Passo 5: Usar a IA para fazer novas previsões

tabela_nova = pd.read_csv("novos_clientes.csv")
display(tabela_nova)

tabela_nova["profissao"] = codificador.fit_transform(tabela_nova["profissao"])
tabela_nova["mix_credito"] = codificador.fit_transform(tabela_nova["mix_credito"])
tabela_nova["comportamento_pagamento"] = codificador.fit_transform(tabela_nova["comportamento_pagamento"])

previsoes = modelo_arvoredecisao.predict(tabela_nova)
display(previsoes)

In [None]:
# E quais as características mais importantes para definir o score de crédito?

colunas = list(x_teste.columns)
importancia = pd.DataFrame(index=colunas, data=modelo_arvoredecisao.feature_importances_)
importancia = importancia * 100

display(importancia)