Area: 🏦 Finance
Description: Projeto de Classificação com Machine Learning aplicado em Análise de Risco de Crédito de um banco, afim de, identificar possíveis inadimplentes.
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Model Evaluation
- Deployment
- Business Results
- Next Steps
- How to Run the Application
- Author
- Licence
A Easy Cash é um banco digital que atua desde 2015 no Brasil oferecendo produtos financeiros como: cartões de crédito, seguros e emprestímos. Uma das área que causa mais problemas para bancos, fintechs é a taxa de inadimplência por parte da sua carteira de clientes. No último resultado trimestral divulgado pela empresa, a diretoria financeira, comunicou que o número de inadimplentes após a liberação de crédito aumentou significativamente, tendo o EL (Expected Loss) com um aumento de 15% representando um EC (Economic Capital) de R$ 6.2 milhões para cobrir essas perdas inesperadas.
Portanto, foi solicitado ao time de Data Science, que realizasse um estudo das informações financeiras e das solicitações de empréstimo para encontrar padrões que possam indicar uma possível inadimplência e determinar quais ações possam ser implementadas, afim de, reduzir estas perdas financeiras por conta de pessoas mutuárias que não quitam suas dívidas.
Assim é encomendado um estudo com os seguintes objetivos:
- Reduzir em 10% as Perdas Esperadas (EL);
- Reduzir o Capital Econômico (EC) para abaixo de R$ 2Mi;
Este estudo será considerado um sucesso se:
- Conseguir modelar um classificador capaz de encontrar potenciais clientes inadimplentes e implementá-lo em produção através de uma API;
- Reduzir em 15% o EL;
- Manter o EC abaixo de R$ 1Mi;
Após reuniões com o time e os stakeholders envolvidos, bem como a disponibilidade dos conjunto de dados o projeto foi dividido em etapas conforme a metodologia CRISP-DM e organizando as tarefas em Sprints pelo aplicativo Trello:
Step 01) Business Understanding
- Pesquisa sobre o análises de riscos de crédito;
- Identificar principais métricas KPI utilizadas;
- Planejamento das tarefas em sprints no Trello;
Step 02) Data understanding
- Coleta dos Dados
- Descrição dos dados
- Análise Exloratória dos Dados
- Verificação da qualidade dos dados
Step 03) Data preparation
- Seleção dos dados
- Limpeza dos dados
- Construção do dados
- Integrar os Dados
Step 04) Modeling
- Selecionar á técnica
- Construção do Modelo
- Avaliação do Modelo
Step 05) Evaluation
- Avaliação dos resultados x objetivos de negócio
- Definir as próximas ações (Next Steps)
Step 06) Deployment
- Implantação do Modelo através de uma API em Flask
- Monitoramento
- Avaliar resultados finais
|Dataset| Kaggle