# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

In [None]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder

# Importar base de dados
try:
    tabela = pd.read_csv("Base de dados dos clientes.csv")
except:
    print("Arquivo não encontrado")

# Tratamento de dados
codificador = LabelEncoder()

# Aplicando a tratativa de codificação a todas as colunas necessárias
for coluna in tabela.select_dtypes(include=["object"]):
    if coluna != "score_credito":
        tabela[coluna] = codificador.fit_transform(tabela[coluna])

# Verificando se as colunas foram codigicadas
for coluna in tabela.select_dtypes(include=["object"]):
    if coluna != "score_credito":
        print(coluna)

display(tabela)

# Treinar o modelo

# Separação de base de dados
# Dados para realizar o treinamento
x = tabela.drop(["score_credito", "id_cliente"], axis=1)

# Dados para realizar o teste
y = tabela["score_credito"]

from sklearn.model_selection import train_test_split

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size=0.3, random_state=1)

# Realiando treinamento do modelo

# Modelo de Árvore de Decisão
from sklearn.ensemble import RandomForestClassifier

# Modelo de Vizinhos mais Próximos
from sklearn.neighbors import KNeighborsClassifier

modelo_arvore = RandomForestClassifier()
modelo_vizinho = KNeighborsClassifier()

# Treinando os modelos
modelo_arvore.fit(treino_x, treino_y)
modelo_vizinho.fit(treino_x, treino_y)

# Acurácia dos Modelos
from sklearn.metrics import accuracy_score
import plotly.express as px

# Calcular previsões
previsao_arvore = modelo_arvore.predict(teste_x)
previsao_vizinho = modelo_vizinho.predict(teste_x.to_numpy())

# Comparação das previsões entre os modelos
acuracia_arvore = accuracy_score(teste_y, previsao_arvore)*100
acuracia_vizinho = accuracy_score(teste_y, previsao_vizinho)*100

# Gerar gráfico para comparação
dados_acuracia = pd.DataFrame({
    "Modelo": ["Árvore de Decisão", "Vizinhos Mais Próximos"],
    "Acurácia (%)": [acuracia_arvore, acuracia_vizinho]
})

grafico = px.bar(
    dados_acuracia, 
    x="Modelo", 
    y="Acurácia (%)", 
    title="Comparação de Acurácia entre os Modelos",
    text="Acurácia (%)",
    color="Modelo",
    labels={"Acurácia (%)": "Acurácia (%)", "Modelo": "Modelo"}
)

# Mostrar o gráfico
grafico.show()

# Caracteristicas mais importantes para definir o score de crédito
colunas = list(teste_x.columns)
importancia = pd.DataFrame(index=colunas, data=modelo_arvore.feature_importances_ * 100)
importancia.columns = ['Importância (%)']
print(importancia.to_string(formatters={'Importância (%)': lambda x: '{:.2f}%'.format(x)}))