A base utilizada neste projeto contém informações financeiras, comportamentais e históricas de crédito dos clientes. Abaixo, um resumo das principais colunas:

| Coluna                    | Descrição                                                         |
|---------------------------|-------------------------------------------------------------------|
| ID                        | Identificador único do registro                                   |
| Customer_ID               | Identificador do cliente                                          |
| Month                     | Mês de referência da transação                                    |
| Name                      | Nome do cliente                                                   |
| Age                       | Idade do cliente                                                  |
| SSN                       | Número de segurança social (formato com caracteres especiais)     |
| Occupation                | Profissão do cliente                                              |
| Annual_Income             | Renda anual                                                       |
| Monthly_Inhand_Salary     | Salário mensal disponível                                         |
| Num_Bank_Accounts         | Número de contas bancárias                                        |
| Num_Credit_Card           | Número de cartões de crédito                                      |
| Interest_Rate             | Taxa de juros                                                     |
| Num_of_Loan               | Quantidade de empréstimos ativos                                  |
| Type_of_Loan              | Tipos de empréstimos (texto com múltiplos valores)                |
| Delay_from_due_date       | Dias de atraso no pagamento                                       |
| Num_of_Delayed_Payment    | Número de pagamentos atrasados                                    |
| Changed_Credit_Limit      | Alteração no limite de crédito                                    |
| Num_Credit_Inquiries      | Número de consultas de crédito                                    |
| Credit_Mix                | Tipo de crédito utilizado (ruim, padrão, bom)                     |
| Outstanding_Debt          | Dívida pendente                                                   |
| Credit_Utilization_Ratio  | Percentual de utilização do limite de crédito                     |
| Credit_History_Age        | Tempo de histórico de crédito                                     |
| Payment_of_Min_Amount     | Se o pagamento mínimo foi realizado                               |
| Payment_Behaviour         | Comportamento de pagamento                                        |
| Monthly_Balance           | Saldo médio mensal                                                |
| Amount_invested_monthly   | Valor investido mensalmente                                       |
| Credit_Score              | Classificação do crédito (ruim, padrão, bom)                      |
 

In [4]:
# Import necessary libraries
import pandas as pd

In [8]:
# Load dataset
df_total = pd.read_csv('C:/Users/BATISTA/Documents/GitHub/datascience/estudos/base/client_loan/test.csv')

In [None]:
print(df_total.head())

In [None]:
# Creating subplots for distributions of various features
fig = make_subplots(
    rows=3, cols=3,
    subplot_titles=('Income', 'Education Level', 'Family Status', 'Housing Type', 'Age', 'Years Employed')
)

# Income Distribution
income_fig = px.histogram(app_record, x='AMT_INCOME_TOTAL', nbins=50, title='Income Distribution',
                          color_discrete_sequence=['#00CC96'], template='plotly_dark').data[0]
fig.add_trace(income_fig, row=1, col=2)

# Education Level Distribution
education_fig = px.histogram(app_record, x='NAME_EDUCATION_TYPE', title='Education Level Distribution',
                             color='NAME_EDUCATION_TYPE', color_discrete_sequence=px.colors.qualitative.Set2, template='plotly_dark').data[0]
fig.add_trace(education_fig, row=1, col=3)

# Family Status Distribution
family_fig = px.histogram(app_record, x='NAME_FAMILY_STATUS', title='Family Status Distribution',
                          color='NAME_FAMILY_STATUS', color_discrete_sequence=px.colors.qualitative.Vivid, template='plotly_dark').data[0]
fig.add_trace(family_fig, row=2, col=1)

# Housing Type Distribution
housing_fig = px.histogram(app_record, x='NAME_HOUSING_TYPE', title='Housing Type Distribution',
                           color='NAME_HOUSING_TYPE', color_discrete_sequence=px.colors.qualitative.Alphabet, template='plotly_dark').data[0]
fig.add_trace(housing_fig, row=2, col=2)

# Age Distribution
app_record['AGE'] = app_record['DAYS_BIRTH'] // -365
age_fig = px.histogram(app_record, x='AGE', nbins=50, title='Age Distribution',
                       color_discrete_sequence=['#FFA15A'], template='plotly_dark').data[0]
fig.add_trace(age_fig, row=2, col=3)

# Years Employed Distribution
app_record['YEARS_EMPLOYED'] = app_record['DAYS_EMPLOYED'] // -365
employed_fig = px.histogram(app_record, x='YEARS_EMPLOYED', nbins=50, title='Years Employed Distribution',
                            color_discrete_sequence=['#AB63FA'], template='plotly_dark').data[0]
fig.add_trace(employed_fig, row=3, col=1)

fig.update_layout(height=900, width=900, title_text='Distributions of Various Features', title_font_size=24, title_x=0.5)
fig.show()