Aplicação de Machine Learning em Modelos de Credit Scoring

🎯 Objetivo

Desenvolver conhecimentos de Machine Learning aplicado no mercado Financeiro através do Curso de Machine Learning: Credit Scoring da Alura, com um case na Concessão de Créditos utilizando um dataset com informações reais do Banco Alemão Statlog (German Credit Data) extraídos do repositírio UCI. Como next steps, o objetivo é realizar ajustes deste modelo para obter uma melhor desempenho.

🔖 Contexto

Neste projeto, vamos entender como o Machine Learning também está inserido no mercado financeiro. A concessão de crédito faz parte da nosso dia-a-dia, como: cartões de crédito, empréstimos pessoais e consignados, financiamento de veículos e imobiliários, são apenas alguns dos exemplos de como o crédito está inserido na nossa rotina.

Os 04 pilares da Cadeia de Créditos:

Prospecção;
Concessão;
Gestão de Risco;
Recuperação;

Entretanto, o contexto deste projeto é voltado para: Concessão de Crédito

Credit Scoring

Ou "Pontuação de Crédito" conforme sua tradução, é um modelo estatístico multivariado que cria um modelo matemático e estima, através de uma probabilidade, a chance do nosso cliente ser adimplente ou inadimplente. Dependendo da pontuação o tomador receberá o crédito para o empréstimo.

A Regressão Logistica é a técnica mais utilizada no sistema financeiro e a qual iremos utilizar para classificar os possíveis eventos: adimplentes ou inadimplentes.

É importante que as empresas de cartão de crédito sejam capazes de reconhecer transações fraudulentas com cartão de crédito para que os clientes não sejam cobrados por itens que não compraram e não causarem prejuízos.

📌 Considerações do Dataset

Este conjunto de dados foi disponibilizado pelo Statlog (German Credit Data) dados reais, onde classifica as pessoas descritas por um conjunto de atributos como bons ou maus riscos de crédito.

A Base de Dados disponibilizada já esta com as informações traduzidas conforme dicionário de dados disponibilizado;
A Base de Dados contém informações sensíveis, como o sexo da pessoa, a qual não deve ser considerado no modelo de acordo com as regulamentações do Banco Central.
A variável default é a nossa variável resposta, onde: 0 = Credito Não Concedido | 1 = Crédito Concedido;

💻 Conteúdo

O Projeto foi organizados nos seguintes tópicos para uma melhor organização e compressão:

Sobre o Dataset do projeto e Análise Exploratória dos dados;
Transformação dos Dados
Declaração de Funções para os modelos;
Preparação dos dados de treino e teste;
Gerando o Modelo;
Gerando as Métricas;
Considerações Finais;

📕 Considerações Finais

Olhando para as métricas, podemos perceber que a acurácia, por exemplo, não é um bom parâmetro para avaliarmos o modelo que foi desenvolvido em cima de uma base de dados desbalanceados, isso porque os parâmetros do modelo não diferenciam a classe majoritária da minoritária. Através do cálcula da área ROC, obtivemos o valor de 0,764, que de acordo com a convenção estatística, temos uma discriminação aceitável;

💡 Referências

UCI Machine Learning

Alura Cursos

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
data		data
Machine_Learning__Credit_Scoring_v1.ipynb		Machine_Learning__Credit_Scoring_v1.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Aplicação de Machine Learning em Modelos de Credit Scoring

🎯 Objetivo

🔖 Contexto

📌 Considerações do Dataset

💻 Conteúdo

📕 Considerações Finais

💡 Referências

About

Releases

Packages

Languages

reynancs/ml-credit-scoring

Folders and files

Latest commit

History

Repository files navigation

Aplicação de Machine Learning em Modelos de Credit Scoring

🎯 Objetivo

🔖 Contexto

📌 Considerações do Dataset

💻 Conteúdo

📕 Considerações Finais

💡 Referências

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages