# Projeto Python IA: Inteligência Artificial e Previsões

### Case: Score de Crédito dos Clientes

Você foi contratado por um banco para conseguir definir o score de crédito dos clientes. Você precisa analisar todos os clientes do banco e, com base nessa análise, criar um modelo que consiga ler as informações do cliente e dizer automaticamente o score de crédito dele: Ruim, Ok, Bom

Arquivos da aula: https://drive.google.com/drive/folders/1FbDqVq4XLvU85VBlVIMJ73p9oOu6u2-J?usp=drive_link

## Passo a Passo do Projeto de Modelagem

### Passo 1: Importar a Base de Dados
Carregar os dados necessários para análise e modelagem.

### Passo 2: Preparar os Dados
Realizar limpeza, transformação de colunas categóricas para numéricas e exibir as informações atualizadas da base.

### Passo 3: Treinar os Modelos
Criar e treinar dois tipos de modelos:  
- **Random Forest** (baseado em árvores de decisão).  
- **KNN (K-Nearest Neighbors)** (baseado em vizinhos mais próximos).

### Passo 4: Avaliar os Modelos
Calcular métricas de desempenho e comparar os resultados dos modelos.

### Passo 5: Prever Usando Novos Clientes
Aplicar o modelo escolhido para prever os resultados com dados de novos clientes.

---

### Instalação de Pacotes Necessários para o Projeto
Execute os comandos abaixo para instalar os pacotes essenciais:

```python
!pip install pandas scikit-learn
```

In [None]:
# Passo 1: Importar a base de dados
import pandas as pd  # Importa a biblioteca pandas para manipulação de dados.

# Lê o arquivo CSV contendo os dados dos clientes e armazena em um DataFrame.
tabela = pd.read_csv("clientes.csv")

# Exibe os dados carregados.
display(tabela)

# O objetivo é analisar a coluna "score_credito", que indica a classificação de crédito:
# Good -> Boa, Standard -> OK, Poor -> Ruim.

In [None]:
# Passo 2: Preparar os dados
# Exibe informações sobre o DataFrame, incluindo tipos de dados e valores nulos.
display(tabela.info())

# Converte colunas categóricas (texto) em valores numéricos usando LabelEncoder.
from sklearn.preprocessing import LabelEncoder  # Importa o codificador.

# Converte a coluna "profissao" para valores numéricos.
codificador_profissao = LabelEncoder()
tabela["profissao"] = codificador_profissao.fit_transform(tabela["profissao"])

# Converte a coluna "mix_credito".
codificador_credito = LabelEncoder()
tabela["mix_credito"] = codificador_credito.fit_transform(tabela["mix_credito"])

# Converte a coluna "comportamento_pagamento".
codificador_pagamento = LabelEncoder()
tabela["comportamento_pagamento"] = codificador_pagamento.fit_transform(tabela["comportamento_pagamento"])

# Exibe as informações atualizadas da tabela após as transformações.
display(tabela.info())

In [3]:
# Passo 2: Preparar os dados
# Define a variável target (y), que é a coluna que queremos prever.
y = tabela["score_credito"]

# Define as variáveis preditoras (x), removendo colunas irrelevantes.
x = tabela.drop(columns=["score_credito", "id_cliente"])

In [None]:
# Passo 2: Preparar os dados
# Divide os dados em conjuntos de treino (70%) e teste (30%).
from sklearn.model_selection import train_test_split
x_treino, x_teste, y_treino, y_teste = train_test_split(x, y, test_size=0.3)

In [None]:
# Passo 3: Treinar os modelos
# Importa os algoritmos de classificação.
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# Cria os modelos.
modelo_arvoredecisao = RandomForestClassifier()  # Modelo baseado em árvores de decisão.
modelo_knn = KNeighborsClassifier()  # Modelo baseado em KNN (vizinhos mais próximos).

# Treina os modelos com os dados de treino.
modelo_arvoredecisao.fit(x_treino, y_treino)
modelo_knn.fit(x_treino, y_treino)

In [None]:
# Passo 4: Avaliar os modelos
# Faz previsões nos dados de teste.
previsao_arvoredecisao = modelo_arvoredecisao.predict(x_teste)
previsao_knn = modelo_knn.predict(x_teste)

# Calcula a acurácia dos modelos.
from sklearn.metrics import accuracy_score
display(accuracy_score(y_teste, previsao_arvoredecisao))  # Acurácia do modelo RandomForest.
display(accuracy_score(y_teste, previsao_knn))  # Acurácia do modelo KNN.

In [None]:
# Passo 5: Prever usando novos clientes
# Importa os novos clientes para previsão.
tabela_novos_clientes = pd.read_csv("novos_clientes.csv")

# Realiza as mesmas transformações de codificação nos novos dados.
tabela_novos_clientes["profissao"] = codificador_profissao.transform(
    tabela_novos_clientes["profissao"])
tabela_novos_clientes["mix_credito"] = codificador_credito.transform(
    tabela_novos_clientes["mix_credito"])
tabela_novos_clientes["comportamento_pagamento"] = codificador_pagamento.transform(
    tabela_novos_clientes["comportamento_pagamento"])

# Exibe os dados transformados.
display(tabela_novos_clientes)

# Faz previsões com o melhor modelo (modelo_arvoredecisao).
nova_previsao = modelo_arvoredecisao.predict(tabela_novos_clientes)
display(nova_previsao)  # Exibe os resultados das previsões.