# Análise de Dados para Concessão de Crédito

## Explicação do Conjunto de Dados de Classificação de Crédito

Este conjunto de dados oferece uma visão abrangente das solicitações de empréstimo, juntamente com atributos financeiros e demográficos chave que contribuem para a avaliação da aprovação ou rejeição do empréstimo. Os dados incluem tanto características específicas do solicitante quanto características específicas do empréstimo, que podem ajudar a modelar a probabilidade de aprovação do empréstimo. Abaixo está um resumo rápido::

- **🔢 Número de Registros**: 45.000
- **🧩 Total de Colunas**: 14 (Entre Categoricas e Continuas)

#### 📝 Descrição das Features:

| Coluna                               | Descrição                                                 | Tipo de Dados    |
|--------------------------------------|-------------------------------------------------------------|--------------|
| 👤 **Idade**                     | Idade do Solicitante                                             | Float        |
| 🚻 **Sexo**                  | Sexo do Solicitante                                          | Categorical  |
| 🎓 **Grau_Escolaridade**               | Grau de Escolaridade                      | Categorica  |
| 💰 **Salario**                  | Salário anual do Solicitante                       | Float        |
| 📅 **Tempo_Emprego**                 | Anos de experiência profissional                              | Integer      |
| 🏠 **Moradia**          | Situação de Moradia           | Categorica  |
| 🏦 **Valor_Emprestimo**                      | Empréstimo Requisitado                                     | Float        |
| 🎯 **Proposito**                    | Propósito do Empréstimo    | Categorica  |
| 📈 **Taxa**                  | Taxa praticada para o empréstimo                        | Float        |
| 📊 **Comprometimento_Renda**            | Loan amount as a percentage of annual income                | Float        |
| 💳 **Score_Credito**                   | Score de Credito do Solicitante                                    | Integer      |
| ❗ **Inadimplencias_Anteriores**  | Indicador de Inadimplencias Anteriores (Sim/Não)                | Categorica  |
| ✅ **Credito_Concedido**                    | Resultado da Concessao de Credito (1 = aprovada, 0 = reprovada)            | Integer       |



## 1. Importação e Configuração

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display

from sklearn.utils import resample

from sklearn.preprocessing import RobustScaler

from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, roc_auc_score, accuracy_score, classification_report

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
from lightgbm import LGBMClassifier
from sklearn.model_selection import cross_val_score

import warnings
warnings.filterwarnings("ignore")

## 2. Carregamento e Exploração do Conjunto de Dados

- Objetivo: Entender a estrutura de dados, identificar padrões e detectar anomalias.

1. Visualização da distribuição de variáveis
2. Identificação de outliers
3. Análise de correlação entre variáveis
4. Resumo estatístico de variáveis
5. Visualização de dados categóricos e numéricos


In [2]:
data = pd.read_csv('data/dados.csv', encoding='ISO-8859-1', sep=";")
data

Unnamed: 0,Idade,Sexo,Grau_Escolaridade,Salario,Tempo_Emprego,Moradia,Valor_Emprestimo,Proposito,Taxa,Comprometimento_Renda,Score_Credito,Inadimplencias_Anteriores,Credito_Concedido
0,22.0,feminino,Mestrado,71948.0,0,ALUGUEL,35000.0,PESSOAL,16.02,0.49,561,No,1
1,21.0,feminino,Segundo Grau,12282.0,0,PRÓPRIA,1000.0,EDUCACIONAL,11.14,0.08,504,Yes,0
2,25.0,feminino,Segundo Grau,12438.0,3,HIPOTECA,5500.0,MÉDICO,12.87,0.44,635,No,1
3,23.0,feminino,Bacharel,79753.0,0,ALUGUEL,35000.0,MÉDICO,15.23,0.44,675,No,1
4,24.0,masculino,Mestrado,66135.0,1,ALUGUEL,35000.0,MÉDICO,14.27,0.53,586,No,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
44995,27.0,masculino,Tecnólogo,47971.0,6,ALUGUEL,15000.0,MÉDICO,15.66,0.31,645,No,1
44996,37.0,feminino,Tecnólogo,65800.0,17,ALUGUEL,9000.0,REFORMA,14.07,0.14,621,No,1
44997,33.0,masculino,Tecnólogo,56942.0,7,ALUGUEL,2771.0,QUITAÇÃO,10.02,0.05,668,No,1
44998,29.0,masculino,Bacharel,33164.0,4,ALUGUEL,12000.0,EDUCACIONAL,13.23,0.36,604,No,1
