##### Importações

In [1]:
import pandas as pd

In [3]:
df = pd.read_csv("../data/transformed/transformed_financial_dataset.csv")

In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 32424 entries, 0 to 32423
Data columns (total 25 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   age                      32424 non-null  float64
 1   gender                   32424 non-null  object 
 2   education_level          32424 non-null  object 
 3   employment_status        32424 non-null  object 
 4   job_title                32424 non-null  object 
 5   monthly_income_usd       32424 non-null  float64
 6   monthly_expenses_usd     32424 non-null  float64
 7   savings_usd              32424 non-null  float64
 8   has_loan                 32424 non-null  object 
 9   loan_type                32424 non-null  object 
 10  loan_amount_usd          32424 non-null  float64
 11  loan_term_months         32424 non-null  float64
 12  monthly_emi_usd          32424 non-null  float64
 13  loan_interest_rate_pct   32424 non-null  float64
 14  debt_to_income_ratio  

##### Métricas

In [7]:
loan_holders = df["has_loan"].eq("Yes").mean()
main_loan_type = df.loc[df["has_loan"].eq("Yes"), "loan_type"].mode()[0]
high_loan_burden = (df["loan_to_income_ratio"] > 0.5).mean()

In [11]:
print(f"Aproximadamente {loan_holders:.0%} das pessoas possuem empréstimos ativos. "
      f"\nO tipo de empréstimo mais comum é '{main_loan_type}', mostrando onde está a maior concentração de crédito. "
      f"\nAlém disso, {high_loan_burden:.0%} comprometem mais da metade da sua renda mensal com dívidas, o que indica risco elevado de inadimplência.")

Aproximadamente 40% das pessoas possuem empréstimos ativos. 
O tipo de empréstimo mais comum é 'Home', mostrando onde está a maior concentração de crédito. 
Além disso, 40% comprometem mais da metade da sua renda mensal com dívidas, o que indica risco elevado de inadimplência.


In [12]:
poor_credit = df["credit_score_bucket"].eq("Poor").mean()
good_credit = df["credit_score_bucket"].isin(["Good", "Very Good", "Excellent"]).mean()

In [16]:
print(f"Cerca de {poor_credit:.0%} dos clientes apresentam crédito 'Poor', sinalizando alta vulnerabilidade financeira. "
      f"\nPor outro lado, {good_credit:.0%} estão em faixas de crédito consideradas seguras, o que pode representar oportunidades para produtos financeiros premium.")

Cerca de 51% dos clientes apresentam crédito 'Poor', sinalizando alta vulnerabilidade financeira. 
Por outro lado, 33% estão em faixas de crédito consideradas seguras, o que pode representar oportunidades para produtos financeiros premium.


In [15]:
over_spenders = (df["monthly_expenses_usd"] > df["monthly_income_usd"]).mean()
negative_disposable_income = (df["disposable_income"] < 0).mean()

In [19]:
print(f"{over_spenders:.0%} das pessoas gastam mais do que recebem mensalmente, e {negative_disposable_income:.0%} já apresentam renda disponível negativa. "
      "\nIsso reforça a necessidade de estratégias de educação financeira e produtos de crédito controlado.")

0% das pessoas gastam mais do que recebem mensalmente, e 0% já apresentam renda disponível negativa. 
Isso reforça a necessidade de estratégias de educação financeira e produtos de crédito controlado.


In [20]:
top_region = df["region"].value_counts(normalize=True).idxmax()
top_region_pct = df["region"].value_counts(normalize=True).max()

In [22]:
print(f"A região com maior concentração de registros é {top_region}, representando {top_region_pct:.0%} de toda a base. "
      "\nEsse mercado pode ser priorizado em campanhas, já que concentra a maior parte dos clientes.")

A região com maior concentração de registros é North America, representando 20% de toda a base. 
Esse mercado pode ser priorizado em campanhas, já que concentra a maior parte dos clientes.


In [23]:
heavy_debtors = (df["loan_to_income_ratio"] > 1).mean()
moderate_debtors = df["loan_to_income_ratio"].between(0.3, 1).mean()

In [25]:
print(f"{heavy_debtors:.0%} dos clientes possuem dívidas que superam sua renda anual, o que indica forte risco de insolvência. "
      f"\nJá {moderate_debtors:.0%} estão em um nível moderado de endividamento, sendo potenciais alvos para produtos de renegociação.")

40% dos clientes possuem dívidas que superam sua renda anual, o que indica forte risco de insolvência. 
Já 0% estão em um nível moderado de endividamento, sendo potenciais alvos para produtos de renegociação.


In [26]:
credit_dependents = (df["monthly_emi_usd"] > df["disposable_income"]).mean()

In [27]:
print(f"{credit_dependents:.0%} das pessoas comprometem mais com parcelas de empréstimos do que conseguem guardar em renda disponível. "
      "\nEsse grupo depende fortemente de crédito para manter o consumo.")

33% das pessoas comprometem mais com parcelas de empréstimos do que conseguem guardar em renda disponível. 
Esse grupo depende fortemente de crédito para manter o consumo.


In [28]:
financial_stress = (df["debt_to_income_ratio"] > 40).mean()

In [31]:
median_savings_ratio = df["savings_to_income_ratio"].median()
rich_savers = (df["savings_to_income_ratio"] > 2).mean()

In [32]:
print(f"O cliente mediano poupa o equivalente a {median_savings_ratio:.2f} vezes sua renda anual. "
      f"\nPorém, apenas {rich_savers:.0%} conseguem acumular mais que o dobro da renda em poupança, indicando alta concentração de riqueza em poucos indivíduos.")

O cliente mediano poupa o equivalente a 5.04 vezes sua renda anual. 
Porém, apenas 81% conseguem acumular mais que o dobro da renda em poupança, indicando alta concentração de riqueza em poucos indivíduos.


In [33]:
essential_spenders = (df["monthly_expenses_usd"] / df["monthly_income_usd"]).median()

In [34]:
print(f"O gasto mediano da população corresponde a {essential_spenders:.0%} da renda mensal, mostrando que a maioria compromete grande parte dos ganhos com despesas fixas.")

O gasto mediano da população corresponde a 60% da renda mensal, mostrando que a maioria compromete grande parte dos ganhos com despesas fixas.


In [35]:
no_investment_capacity = (df["disposable_income"] < 200).mean()

In [36]:
print(f"{no_investment_capacity:.0%} dos clientes fecham o mês com menos de USD 200 de sobra, sendo pouco atrativos para produtos de investimento, mas candidatos a linhas de crédito emergenciais.")

3% dos clientes fecham o mês com menos de USD 200 de sobra, sendo pouco atrativos para produtos de investimento, mas candidatos a linhas de crédito emergenciais.


In [37]:
high_interest_loans = (df["loan_interest_rate_pct"] > 20).mean()

In [38]:
print(f"{high_interest_loans:.0%} dos empréstimos ativos têm taxas de juros acima de 20%. "
      "\nIsso coloca parte relevante da carteira em risco de inadimplência devido ao custo elevado do crédito.")

15% dos empréstimos ativos têm taxas de juros acima de 20%. 
Isso coloca parte relevante da carteira em risco de inadimplência devido ao custo elevado do crédito.
