---
title: "O que é a Probabilidade de Inadimplência (PD)?"
author: "Marcus O. da Silva"
date: "12/11/2022"
format:
    html:
        code-fold: true
categories: [Modelagem de Crédito, Teoria]
jupyter: python3
---



A probabilidade de inadimplência (*probability of default* ou PD) é um conceito importante em modelagem de risco de crédito. É a probabilidade de que um tomador de empréstimo não consiga honrar seu empréstimo. Em outras palavras, é a probabilidade de que o tomador de empréstimo não consiga fazer os pagamentos necessários em seu empréstimo.

A PD é uma medida importante para bancos e outros credores, pois ajuda a avaliar o risco de emprestar dinheiro a um determinado tomador de empréstimo. Uma PD mais alta indica um risco maior de inadimplência e, portanto, uma maior probabilidade de que o credor não possa recuperar o valor total de seu empréstimo. Como resultado, os credores geralmente exigem taxas de juros mais altas ou mais garantias de empréstimos com uma PD mais alta. Um novo pedido pode ser negado dependendo de quão alta é a PD desse pedido.

![](h_default_h_rate.png)

A PD é geralmente estimada usando modelos estatísticos que incorporam uma variedade de fatores, como o score de crédito do tomador de empréstimo, renda e a relação dívida/renda. Esses modelos são projetados para prever a probabilidade de inadimplência com base em dados históricos, perfil do tomador e outras informações relevantes. O código abaixo ilustra em python como é a criação de um modelo de PD.

In [None]:
#| code-fold: false
#| echo: true

# Import the LogisticRegression class from the sklearn library
from sklearn.linear_model import LogisticRegression
import pandas as pd

# Read the data
df = pd.read_csv('<path_to_default_dataset>')

# Define the features of the dataset
features = ["income", "age", "payment_delays", "credit_score"]
label = 'default'

# Define the input and the label
X = df[features]
y = df[label]

# Create a logistic regression model
model = LogisticRegression()

# Train the model on our sample dataset
model.fit(X, y)

# Use the model to predict the probability of default for new data
predictions = model.predict_proba(X_new)

Em geral, a probabilidade de inadimplência é uma medida crucial na modelagem de risco de crédito que ajuda os credores a avaliar o risco associado a emprestar dinheiro a um determinado tomador de empréstimo. A forma mais comum de resolver esse tipo de problema é atráves de algum algóritmo de classificação como a regressão logística.