# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

<span>**Instalando e importando bibliotecas**</span>


In [5]:
# Instalando bibliotecas (a depender do ambiente, caso necessário)
# Instalando pip install pandas numpy scikit-learn diretamente pelo terminal ou !pip install pandas numpy scikit-learn no notebook

In [2]:
# Importando bibliotecas
import pandas as pd


<span style="color:red">**Passo 1: Importando e analisando previamente os tipos de dados inseridos na base**</span>

In [None]:
# Importando base de dados
tabela = pd.read_csv('clientes.csv') #Aqui está no mesmo local onde o código está sendo executado
display(tabela)

In [None]:
# Analisar previamente os dados
display(tabela.info())


<span style="color:red">**Passo 2: Efetuando tratamento na base de dados para posterior processamento**</span>

In [10]:
# Label Encoder: basicamente associar categorias (textos) à números para efetiva execução dos modelos de previsão

# Nota: da lib sklearn importamos apenas o LabelEncoder
from sklearn.preprocessing import LabelEncoder
codificador = LabelEncoder()

In [11]:
# Transformar colunas de texto em número (códigos)
	# Caso fossem muitas colunas, poderia usar o for
tabela['profissao'] = codificador.fit_transform(tabela['profissao'])
tabela['mix_credito'] = codificador.fit_transform(tabela['mix_credito'])
tabela['comportamento_pagamento'] = codificador.fit_transform(tabela['comportamento_pagamento'])

In [12]:
# Dividir em dados de X e Y
	# x = dados (colunas) necessárias para usar para fazer a previsão
	# y = dados que está querendo prever

colunas = ['score_credito', 'id_cliente'] # não será utilizado em x
x = tabela.drop(columns=colunas) # usará exceto as colunas definidas na variável
y = tabela['score_credito'] # usará apenas a coluna score_credito

In [13]:
# Dividir em dados de TREINO e TESTE
	# x e y de treino
	# x e y de teste

# Nota: da lib sklearn importamos apenas o train para o treino e teste
from sklearn.model_selection import train_test_split

x_treino, x_teste, y_treino, y_teste = train_test_split(x,y, test_size=0.3)



<small>Nota: A função train_test_split no Python, que geralmente é fornecida pela biblioteca Scikit-Learn (sklearn), divide o conjunto de dados em uma porcentagem de treinamento e uma porcentagem de teste. O padrão é dividir os dados em 75% para treinamento e 25% para teste. Isso significa que 75% dos dados são usados para treinar o modelo de aprendizado de máquina e 25% são usados para testar o desempenho do modelo.

Você pode controlar a proporção de divisão ajustando o parâmetro test_size ao chamar a função train_test_split.</small>


<span style="color:red">**Passo 3: Criar o modelo de IA**</span>

In [14]:
# Modelo 1: Árvore de descisão
	# Perguntas para a base de dados (exemplo: a idade do cliente é maior que 30 anos? (Sim ou Não))
from sklearn.ensemble import RandomForestClassifier
model_arvoreDecisao = RandomForestClassifier()
model_arvoreDecisao.fit(x_treino, y_treino)



In [15]:
# Modelo 2: Knn
	# Cria uma região de clientes com crédito bom e clientes com crédito ruim
from sklearn.neighbors import KNeighborsClassifier
model_knn = KNeighborsClassifier()
model_knn.fit(x_treino, y_treino)


<span style="color:red">**Passo 4: Escolhendo o melhor modelo**</span>

In [16]:
from sklearn.metrics import accuracy_score

In [17]:
previsao_arvore = model_arvoreDecisao.predict(x_teste)
previsao_knn = model_knn.predict(x_teste.to_numpy()) # Tem que repassar para numpy



In [18]:
# Visualizar a acurácia de cada modelo
print(accuracy_score(y_teste, previsao_arvore))
print(accuracy_score(y_teste, previsao_knn))

0.8253
0.7366



<span style="color:red">**Passo 5: Fazer novas previsões**</span>


<small>Usando modelo árvore de descisão que, conforme teste executado anteriormente, dos dois modelos testados foi o que teve maior % de acurácia
</small>

In [20]:
# importando base de novos clientes
novos_clientes = pd.read_csv('novos_clientes.csv')

In [21]:
novos_clientes['profissao'] = codificador.fit_transform(novos_clientes['profissao'])
novos_clientes['mix_credito'] = codificador.fit_transform(novos_clientes['mix_credito'])
novos_clientes['comportamento_pagamento'] = codificador.fit_transform(novos_clientes['comportamento_pagamento'])

In [24]:
# Fazer nova previsão, com base no modelo já testado
previsoes = model_arvoreDecisao.predict(novos_clientes)
display(previsoes)

array(['Poor', 'Good', 'Standard'], dtype=object)