# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

In [1]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder

# Importar base de dados
try:
    tabela = pd.read_csv("Base de dados dos clientes.csv")
except:
    print("Arquivo não encontrado")

# Tratamento de dados
codificador = LabelEncoder()

# Aplicando a tratativa de codificação a todas as colunas necessárias
for coluna in tabela.select_dtypes(include=["object"]):
    if coluna != "score_credito":
        tabela[coluna] = codificador.fit_transform(tabela[coluna])

# Verificando se as colunas foram codigicadas
for coluna in tabela.select_dtypes(include=["object"]):
    if coluna != "score_credito":
        print(coluna)

display(tabela)

# Treinar o modelo

# Separação de base de dados
# Dados para realizar o treinamento
x = tabela.drop(["score_credito", "id_cliente"], axis=1)

# Dados para realizar o teste
y = tabela["score_credito"]

from sklearn.model_selection import train_test_split

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size=0.3, random_state=1)

# Realiando treinamento do modelo

# Modelo de Árvore de Decisão
from sklearn.ensemble import RandomForestClassifier

# Modelo de Vizinhos mais Próximos
from sklearn.neighbors import KNeighborsClassifier

modelo_arvore = RandomForestClassifier()
modelo_vizinho = KNeighborsClassifier()

# Treinando os modelos
modelo_arvore.fit(treino_x, treino_y)
modelo_vizinho.fit(treino_x, treino_y)

# Acurácia dos Modelos
from sklearn.metrics import accuracy_score
import plotly.express as px

# Calcular previsões
previsao_arvore = modelo_arvore.predict(teste_x)
previsao_vizinho = modelo_vizinho.predict(teste_x.to_numpy())

# Comparação das previsões entre os modelos
acuracia_arvore = accuracy_score(teste_y, previsao_arvore)*100
acuracia_vizinho = accuracy_score(teste_y, previsao_vizinho)*100

# Gerar gráfico para comparação
dados_acuracia = pd.DataFrame({
    "Modelo": ["Árvore de Decisão", "Vizinhos Mais Próximos"],
    "Acurácia (%)": [acuracia_arvore, acuracia_vizinho]
})

grafico = px.bar(
    dados_acuracia, 
    x="Modelo", 
    y="Acurácia (%)", 
    title="Comparação de Acurácia entre os Modelos",
    text="Acurácia (%)",
    color="Modelo",
    labels={"Acurácia (%)": "Acurácia (%)", "Modelo": "Modelo"}
)

# Mostrar o gráfico
grafico.show()


Unnamed: 0,id_cliente,mes,idade,profissao,salario_anual,num_contas,num_cartoes,juros_emprestimo,num_emprestimos,dias_atraso,...,idade_historico_credito,investimento_mensal,comportamento_pagamento,saldo_final_mes,score_credito,emprestimo_carro,emprestimo_casa,emprestimo_pessoal,emprestimo_credito,emprestimo_estudantil
0,3392,1,23.0,2,19114.12,3.0,4.0,3.0,4.0,3.0,...,265.0,21.465380,1,312.494089,Good,1,1,1,1,0
1,3392,2,23.0,2,19114.12,3.0,4.0,3.0,4.0,3.0,...,266.0,21.465380,3,284.629162,Good,1,1,1,1,0
2,3392,3,23.0,2,19114.12,3.0,4.0,3.0,4.0,3.0,...,267.0,21.465380,5,331.209863,Good,1,1,1,1,0
3,3392,4,23.0,2,19114.12,3.0,4.0,3.0,4.0,5.0,...,268.0,21.465380,4,223.451310,Good,1,1,1,1,0
4,3392,5,23.0,2,19114.12,3.0,4.0,3.0,4.0,6.0,...,269.0,21.465380,2,341.489231,Good,1,1,1,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
99995,37932,4,25.0,11,39628.99,4.0,6.0,7.0,2.0,23.0,...,378.0,24.028477,0,479.866228,Poor,1,0,0,0,1
99996,37932,5,25.0,11,39628.99,4.0,6.0,7.0,2.0,18.0,...,379.0,24.028477,2,496.651610,Poor,1,0,0,0,1
99997,37932,6,25.0,11,39628.99,4.0,6.0,7.0,2.0,27.0,...,380.0,24.028477,0,516.809083,Poor,1,0,0,0,1
99998,37932,7,25.0,11,39628.99,4.0,6.0,7.0,2.0,20.0,...,381.0,24.028477,3,319.164979,Standard,1,0,0,0,1


