Cálculo da Probabilidade de Default no Ano Seguinte

Quando você tem dados históricos para diferentes empréstimos ao longo de vários anos, a probabilidade de um empréstimo entrar em default no ano seguinte depende do contexto em que os dados foram coletados e do momento tomado como referência.

Esse tipo de cálculo é frequentemente chamado de probabilidade de default condicional ou probabilidade de transição. O momento de referência, ou "baseline", é crucial porque ele captura as condições iniciais do empréstimo e do ambiente econômico.

In [2]:
import pandas as pd

# Dados fictícios
data = pd.DataFrame({
    "ID": [1, 1, 2, 2, 3, 3, 4, 4],
    "Ano": [2020, 2021, 2020, 2021, 2020, 2021, 2020, 2021],
    "Status_t": [0, 1, 0, 0, 0, 1, 0, 0],  # 1 = Default, 0 = Não Default
})

# Criar tabela de transição com ativos do ano anterior
transitions = data.groupby("Ano").apply(
    lambda x: pd.DataFrame({
        "ativos_t": [x[x["Status_t"] == 0].shape[0]],  # Empréstimos ativos no ano t
        "defaults_t+1": [x[x["Status_t"] == 1].shape[0]]  # Empréstimos que entraram em default no ano seguinte
    })
).reset_index()

# Criar coluna defasada para "ativos_t" do ano anterior
transitions["ativos_t-1"] = transitions["ativos_t"].shift(1)

# Calcular probabilidade condicional de default
transitions["PD_t+1"] = transitions["defaults_t+1"] / transitions["ativos_t-1"]

# Substituir NaN (primeiro ano não tem referência) por 0
transitions["PD_t+1"] = transitions["PD_t+1"].fillna(0)

# Resultados
print(transitions)


    Ano  level_1  ativos_t  defaults_t+1  ativos_t-1  PD_t+1
0  2020        0         4             0         NaN     0.0
1  2021        0         2             2         4.0     0.5
