Avaliação de crédito 🏦

Nesse repositório foi desenvolvido um projeto de avaliação de crédito, tal projeto foi realizado durante o bootcamp datascience da Alura. No projeto foi realizado a análise exploratória com entendimento como o mercado financeiro define quem será concedito crédito, também foi realizado na aprendizagem de máquina o treinamento superficionado e por fim foi feito o deploy da aplicação.

Análise exploratória 📈

Para a análise exploratória foi utilizado o dataset editado pela Alura baseado no dataset disponibilizado no Kaggle. Tal dataset é composto de duas base de dados um com os dados dos clientes e outro utilizado para a aprendizagem de máquina com o conjunto alvo.

Conjunto de dados dos clientes

Na base de dados dos clientes encontramos uma base com um conjunto de informações que são uteis para definição do cliente, com informações categóricas e contínuas. entre elas:

Categóricas binárias	Categóricas não binárias	Contínuas
Tem carro	Categoria de renda	Idade
Tem casa própria	Grau de escolaridade	Quantidade de filhos
Tem telefone do trabalho	Estado civil	Rendimento anual
Tem telefone fixo	Moradia	Anos empregado
Tem e-mail	Ocupação	Tamanho da família

Tal dataset apresenta 438.557 clientes no qual foram utilizados 425.822 clientes após a remoção de linhas repetidas e outliers, uma redução menor que 3% no conjunto original.

A partir da análise de dados observamos de grande parte dos clientes tem rendimento na faixa entre R$ 100.000 e R$ 150.000 anuais com uma média de R$ 176.384 anuais.

Também observamos que grande parte dos clientes não definiram qual profissão realiza.

Observando tal fato, e relacionando com o rendimento, temos que o redimento médio na base de dados está altamente correlacionado com os clientes de definiram como ocupação outros. Como podemos ver no gráfico abaixo.

Conjunto de dados alvo

No conjunto de dados alvo temos um conjunto com 45.985 clientes, sendo esse um valor 89% menor que o conjunto total de clientes, demonstrando assim que um há um seleto grupo de clientes que tiveram o crédito aprovado. sabendo disso foram feitas agregações de dados com base no mês de referência e a faixa de atraso além da análise vintage, sendo esta uma análise muito utilizado no mercado financeiro, feito isso foi determinado que seriam considerados bons clientes aqueles que tivessem uma faixa de atraso de até 60 dias.

Aprendizagem de máquina

Para aprendizagem de máquina devemos primeiro observa os dados, que nesse dataset se apresentava de forma desbalanceada.

Alvo	0	1
	97.726%	2.273%

Sabendo disso foi feito um pipeline que realizou o treinamento identificando o conjunto de variáveis categóricas e contínuas, além de realizar o oversampling como forma de balancear os dados; feito o treinamento com diversos modelos, foi concluido que o modelo de florestas randomicas é o que apresentou melhores resultados. Como pode ser visto abaixo:

AUC 0.8340043216670643
KS Ks_2sampResult(statistic=0.9653534998241294, pvalue=0.0)

Classification Report

	precision	recall	f1-score	support
0	0.99	0.99	0.99	5557
1	0.47	0.36	0.41	129

accuracy			0.98	5686
macro avg	0.73	0.68	0.70	5686
weighted avg	0.97	0.98	0.97	5686

Deploy

Para o deploy foi utilizado o streamlit que permitiu a criação de um interface de forma simples para avaliação com base no modelo sobre a concessão de crédito.

links:

Atividade Kaggle

Base de dados editada pela Alura

Deploy da aplicação no streamlit

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.streamlit		.streamlit
images		images
img		img
objetos		objetos
.gitignore		.gitignore
README.md		README.md
avaliação_de_crédito.ipynb		avaliação_de_crédito.ipynb
requirements.txt		requirements.txt
simulador_avaliacao_credito.py		simulador_avaliacao_credito.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Avaliação de crédito 🏦

Análise exploratória 📈

Conjunto de dados dos clientes

Conjunto de dados alvo

Aprendizagem de máquina

Deploy

About

Releases

Packages

Languages

monclai/Avaliacao_credito

Folders and files

Latest commit

History

Repository files navigation

Avaliação de crédito 🏦

Análise exploratória 📈

Conjunto de dados dos clientes

Conjunto de dados alvo

Aprendizagem de máquina

Deploy

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages