## Python IA | inteligência artificial e previsões

---
### Case | score de crédito dos clientes

Você foi contrato por um banco para conseguir definir o score de crédito dos clientes.
Você precisa analisar toda a base de dados de clientes do banco e, com base nessa análise, criar um modelo IA que consiga definir o score de crédito do novo cliente com base no dados dele como: **Ruim**; **Regular**; **Bom**.

[Download do material auxiliar](https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link).

---
### Dependências

```
pip install pandas scikit-learn
```

---
### Fluxograma

```python
# 0 entender o desafio e a empresa
# 1 importar a base de dados
# 2 preparar a base de dados para a inteligência artificial
# 3 criar os modelos de IA e os treinar para prever o score de crédito dos clientes
# 4 escolher o melhor modelo (acertou com maior precisão)
# 5 usar este modelo para fazer novas previsões
```

In [None]:
# importar a dependências do projeto

import pandas as pd

from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

In [None]:
# 1 importar a base de dados

table = pd.read_csv("db_clients.csv")

display(table.info())
display(table)

In [None]:
# 2 preparar a base de dados para a IA
# transformar as colunas para análise de texto para número (vice e versa - processo de label encoder)

profession_coder = LabelEncoder()
credit_mix_coder = LabelEncoder()
payment_behavior_coder = LabelEncoder()

# profissao: string <-> number
table["profissao"] = profession_coder.fit_transform(table["profissao"])
# mix_credito: string <-> number
table["mix_credito"] = credit_mix_coder.fit_transform(table["mix_credito"])
# comportamento_pagamento: string <-> number
table["comportamento_pagamento"] = payment_behavior_coder.fit_transform(table["comportamento_pagamento"])

display(table.info())

In [None]:
# 2 preparar a base de dados para a IA
# 2.1 separar a tabela em X e Y
#     Y é quem eu quero prever (não passa pelo processo de label encoder)
#     X são os dados usados para prever Y
y = table["score_credito"]
X = table.drop(columns=["id_cliente", "score_credito"])

# 2.2 separar os dados de treinamento e teste para a IA
X_train, X_test, y_train, y_test = train_test_split(X, y)  # test_size default = 0.25

In [None]:
# 3 criar os modelos de IA
# 3.1 importar os modelos
# 3.2 criar os modelos
rfc = RandomForestClassifier()  # modelo de árvore de decisão
knc = KNeighborsClassifier()  # modelo de vizinhos próximos

# 3.3 treinar os modelos
rfc.fit(X=X_train, y=y_train)
knc.fit(X=X_train, y=y_train)

In [None]:
# 4 escolher o melhor modelo IA
# 4.1 testar os modelos
pred_rfc = rfc.predict(X=X_test)
pred_knc = knc.predict(X=X_test)

# 4.2 calcular a acurácia de cada um (maior valor é o melhor)
display(accuracy_score(y_test, pred_rfc))  # ~> 83%
display(accuracy_score(y_test, pred_knc))  # ~> 75%

In [None]:
# 5 usar o modelo IA para novas previsões

new_clients = pd.read_csv("new_clients.csv")

display(new_clients)

# profissao: string <-> number
new_clients["profissao"] = profession_coder.fit_transform(new_clients["profissao"])
# mix_credito: string <-> number
new_clients["mix_credito"] = credit_mix_coder.fit_transform(new_clients["mix_credito"])
#comportamento_pagamento: string <-> number
new_clients["comportamento_pagamento"] = payment_behavior_coder.fit_transform(new_clients["comportamento_pagamento"])

display(rfc.predict(new_clients))