<a href="https://colab.research.google.com/github/RobsonCDToledo/Analise_de_emprestimos_bancarios/blob/main/Analise_de_Empr%C3%A9stimos_Banc%C3%A1rios.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## **Estrutura do Notebook:**


1. **Introdução e Objetivos**: Descrição do projeto e dos objetivos da análise.
2. **Preparação do Ambiente**: Configuração do ambiente de notebook Google Colab e conexão com o banco de dados / arquivo.
3. **Consulta e Análise dos Dados**: Execução dos códigos python e análise dos resultados.
4. **Visualização dos Resultados**: Utilização de gráficos e visualizações para apresentar os insights obtidos.
5. **Conclusão**: Resumo das descobertas e próximos passos.

# **1. Introdução e Objetivos**

## Análise de Dados de Empréstimos Bancários


Neste projeto, iremos realizar uma análise abrangente dos dados de empréstimos bancários usando Python. As consultas serão executadas em arquivo de extensão .xlsx que você pode localizar mais abaixo,os resultados serão analisados para fornecer insights sobre o desempenho das operações de empréstimos do banco em várias métricas-chave.


### Arquivos utilizados.

Emprestimos.xlsx


## Objetivos:

- Analisar o número total de aplicações de empréstimos.
- Avaliar o valor total financiado e o valor total recebido.
- Calcular a média da taxa de juros e da razão dívida/receita (DTI).
- Determinar a porcentagem de empréstimos bons e ruins.
- Investigar a distribuição dos empréstimos por mês, estado, prazo do empréstimo, tempo de emprego, propósito e tipo de propriedade residencial.


## **Métodos:**

Utilizaremos algumas bibliotecas Python para extrair e resumir os dados de empréstimos do banco, permitindo uma análise interativa e visual dos resultados.


## Bibliotecas utilizadas:



- Google Colab: Ambiente de notebook colaborativo baseado em nuvem.
  
- Pandas: Biblioteca Python para análise e manipulação de dados.

  Versão do Pandas 1.5.3
- Matplotlib e Seaborn: Bibliotecas Python para visualização de dados.

  Versão do matplotlib 3.7.1

  Versão do seaborn 1.5.3

# **2. Preparação do Ambiente**

## **.** *Onde baixar a base de dados*

- **OBS**: *Estaremos trabalhando com o arquivo dentro de uma pasta do Google Drive, para se conectar ao arquivo basta efetuar o download do arquivo emprestimos.xlsx*

- Google Drive:

  https://docs.google.com/spreadsheets/d/1-0AosXd5smUTVmilQk4t-fhPf6NlMzlE/edit?usp=drive_link&ouid=102389987557857669192&rtpof=true&sd=true

- GitHub:

  https://github.com/RobsonCDToledo/Analise_de_emprestimos_bancarios/blob/main/emprestimos.xlsx



## **.** Importando *bibliotecas*

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import geopandas as gpd


## **.** *Trazendo arquivo para o notebook*

In [None]:
arquivo = ("/content/drive/MyDrive/Analise_de_Emprestimos_Bancários/emprestimos.xlsx")
dataset = pd.read_excel(arquivo)

## **.** *Visualizando as primeiras linhas do arquivo*

In [None]:
dataset.head(2)

## **.** *Breve descrição do arquivo*

- Vamos agrupar apenas as colunas de valores:  
  (renda_anual,

   DTI_(relação_dívida/renda),

   parcela,

   taxa_juros,

   valor_empréstimo,

   total_contas,

   pagamento_total)

- Fazer uma descrição destas colunas para entender o volume dos dados utilizando a função **Describe()**

In [None]:
sub_set = dataset[['renda_anual', 'DTI_(relação_dívida/renda)', 'parcela', 'taxa_juros', 'valor_empréstimo', 'total_contas', 'pagamento_total']]
sub_set.describe()

# **3. Consultas e Análises de Dados**

**.** *Principais indicadores que vamos analisar*


Resumo das informações que vamos levantar:


- Total de Aplicações de Empréstimos
- Aplicações de Empréstimos do MTD (Mês Atual)
- Aplicações de Empréstimos do PMTD (Mês Anterior)
- Valor Total Financiado
- Valor Total Financiado do MTD
- Valor Total Financiado do PMTD
- Valor Total Recebido
- Valor Total Recebido do MTD
- Valor Total Recebido do PMTD
- Taxa de Juros Média
- Taxa de Juros Média do MTD
- Taxa de Juros Média do PMTD
- Média de DTI (Razão Dívida/Receita)
- Média de DTI do MTD
- Média de DTI do PMTD
- Porcentagem de Empréstimos Bons
- Aplicações de Empréstimos Bons
- Valor Financiado de Empréstimos Bons
- Valor Recebido de Empréstimos Bons
- Porcentagem de Empréstimos Ruins
- Aplicações de Empréstimos Ruins
- Valor Financiado de Empréstimos Ruins
- Valor Recebido de Empréstimos Ruins


Visão Geral:

- Status de Empréstimo
- Por Mês
- Por Estado
- Por Prazo
- Por Tempo de Emprego
- Por Propósito
- Por Propriedade Residencial

## *Gerando os big numbers*

In [None]:
# Total de Aplicações
Ttl_aplicacoes = dataset['id'].count()
MTD_aplicacoes_emprestimos = dataset[dataset['data_emissão'].dt.month == 12]['id'].count()
PMTD_aplicacoes_emprestimos = dataset[dataset['data_emissão'].dt.month == 11]['id'].count()

# Calculos de valor total de financiamentos
Vlr_financiado = dataset['valor_empréstimo'].sum()
MTD_Vlr_financiado = dataset[dataset['data_emissão'].dt.month == 12]['valor_empréstimo'].sum()
PMTD_Vlr_financiado = dataset[dataset['data_emissão'].dt.month == 11]['valor_empréstimo'].sum()

# Calculos de valor total pagamentos
Vlr_recebimento = dataset['pagamento_total'].sum()
MTD_Vlr_recebimento = dataset[dataset['data_emissão'].dt.month == 12]['pagamento_total'].sum()
PMTD_Vlr_recebimento = dataset[dataset['data_emissão'].dt.month == 11]['pagamento_total'].sum()

# calculos de taxa de juros
avr_taxa_de_juros = dataset['taxa_juros'].mean()
MTD_media_taxa_de_juros = dataset[dataset['data_emissão'].dt.month == 12]['taxa_juros'].mean()
PMTD_media_taxa_de_juros = dataset[dataset['data_emissão'].dt.month == 11]['taxa_juros'].mean()

# calculos DTI_(relação_dívida/renda)
avr_dti = dataset['DTI_(relação_dívida/renda)'].mean()
MTD_media_dti = dataset[dataset['data_emissão'].dt.month == 12]['DTI_(relação_dívida/renda)'].mean()
PMTD_media_dti = dataset[dataset['data_emissão'].dt.month == 11]['DTI_(relação_dívida/renda)'].mean()

# calculos para identificar os emprestimos classificados como "Good" ou Corrente|Totalmente pago.
status_desejado = ['Corrente', 'Totalmente pago']
Ttl_good_emprestimos = dataset[dataset['status_empréstimo'].isin(status_desejado)]['id'].count()
porcent_good_emprestimos = ((Ttl_good_emprestimos / Ttl_aplicacoes) *100)
Vlr_good_financiamento = dataset[dataset['status_empréstimo'].isin(status_desejado)]['valor_empréstimo'].sum()
Vlr_good_recebimento = dataset[dataset['status_empréstimo'].isin(status_desejado)]['pagamento_total'].sum()

# calculos para identificar os emprestimos classificados como "Bad" ou Cobrados.

Ttl_bad_emprestimos = dataset[dataset['status_empréstimo'] == 'Cobrado']['id'].count()
porcent_bad_emprestimos = ((Ttl_bad_emprestimos / Ttl_aplicacoes) *100)
Vlr_bad_financiamentos = dataset[dataset['status_empréstimo'] == 'Cobrado']['valor_empréstimo'].sum()
Vlr_bad_recebimento = dataset[dataset['status_empréstimo'] == 'Cobrado']['pagamento_total'].sum()

## *Tabelas Virtuais para análise - Principais Indicadores*

### **.** *Status dos emprestimos*

In [None]:
status_emprestimos = dataset.groupby('status_empréstimo').agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum'),
    Taxa_de_Juros_Média = ('taxa_juros', 'mean'),
    DTI_Médio = ('DTI_(relação_dívida/renda)', 'mean')
)

In [None]:
status_emprestimos

### **.** *Status dos emprestimos Por Mês*

In [None]:
dataset['Mês'] =  dataset['data_emissão'].dt.strftime('%B')

Por_Mês = dataset.groupby([dataset['data_emissão'].dt.month, 'Mês']).agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum')
)

In [None]:
Por_Mês

### **.** *Emprestimos por Estado*

In [None]:
Por_Estado = dataset.groupby('estado_endereço').agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum')
)

In [None]:
Por_Estado

### **.** *Emprestimos por Prazo*

In [None]:
Por_Prazo_de_Contrato = dataset.groupby('prazo').agg(
    Aplicações=('id', 'count'),
    Total_Recebido=('pagamento_total', 'sum'),
    Total_Financiado=('valor_empréstimo', 'sum')
)


In [None]:
Por_Prazo_de_Contrato

### **.** *Emprestimos por Tempo de Emprego*

In [None]:
Por_tempo_de_emprego = dataset.groupby('tempo_emprego').agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum')
)

In [None]:
Por_tempo_de_emprego

### **.** *Emprestimos por Propósito*

In [None]:
Por_proposito = dataset.groupby('propósito').agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum')
)

In [None]:
Por_proposito

### **.** *Emprestimos por Residência*

In [None]:
Por_residencia = dataset.groupby('posse_casa').agg(
    Aplicações = ('id', 'count'),
    Total_Recebido = ('pagamento_total', 'sum'),
    Total_Financiado = ('valor_empréstimo', 'sum')
)

In [None]:
Por_residencia

# **4. Visualização dos Resultados**

In [None]:
sns.set(style="whitegrid")
plt.figure(figsize=(16, 3))
sns.barplot(x='Mês', y='Aplicações', data=Por_Mês, palette='viridis')
plt.xlabel('Mês')
plt.ylabel('Aplicações')
plt.title('Número de Aplicações por Mês')
plt.xticks(rotation=45)
plt.show()

In [None]:
sns.set(style="whitegrid")
plt.figure(figsize=(5, 3))
sns.barplot(x='prazo', y='Aplicações', data=Por_Prazo_de_Contrato, palette='viridis')
plt.xlabel('Prazo')
plt.ylabel('Aplicações')
plt.title('Número de Aplicações por Prazo')
plt.xticks(rotation=45)
plt.show()

In [None]:
sns.set(style="whitegrid")
plt.figure(figsize=(16, 6))
sns.set_color_codes("pastel")
sns.barplot(x='Aplicações', y='propósito', data=Por_proposito, label="Total", color="b")
plt.xlabel('Total de Aplicações')
plt.ylabel('Propósito')
plt.title('Total de Aplicações por Propósito')
plt.xticks(rotation=45)
sns.despine(left=True, bottom=True)
plt.show()

In [None]:
sns.set(style="whitegrid")
fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(10, 10))

sns.set_color_codes("pastel")
sns.barplot(x='Aplicações', y='estado_endereço', data=Por_Estado, label="Total", color="b", ax=axs[0])
axs[0].set_xlabel('Aplicações de Empréstimos')
axs[0].set_ylabel('Estado')
axs[0].set_title('Total Solicitações por Estado')
axs[0].tick_params(axis='y', rotation=0)
sns.despine(left=True, bottom=True, ax=axs[0])

sns.set_color_codes("pastel")
sns.barplot(x='Total_Recebido', y='estado_endereço', data=Por_Estado, label="Total", color="b", ax=axs[1])
axs[1].set_xlabel('Total Recebido')
axs[1].set_ylabel('Estado')
axs[1].set_title('Total Recebido por Estado')
axs[1].tick_params(axis='y', rotation=0)
sns.despine(left=True, bottom=True, ax=axs[1])

plt.tight_layout()

plt.show()


# **5. Conclusão**

In [None]:
#Formatando os Numeros para gerar o Resumo
Ttl_aplicacoes_formatado = Ttl_aplicacoes
MTD_aplicacoes_emprestimos_formatado = f'{MTD_aplicacoes_emprestimos}'
PMTD_aplicacoes_emprestimos_formatado = f'{PMTD_aplicacoes_emprestimos}'
Vlr_financiado_formatado = f'R${Vlr_financiado:,.2f}'
MTD_Vlr_financiado_formatado = f'R${MTD_Vlr_financiado:,.2f}'
PMTD_Vlr_financiado_formatado = f'R${PMTD_Vlr_financiado:,.2f}'
Vlr_recebimento_formatado = f'R${Vlr_recebimento:,.2f}'
MTD_Vlr_recebimento_formatado = f'R${MTD_Vlr_recebimento:,.2f}'
PMTD_Vlr_recebimento_formatado = f'R${PMTD_Vlr_recebimento:,.2f}'
avr_taxa_de_juros_formatado = f'{avr_taxa_de_juros:.2%}'
MTD_media_taxa_de_juros_formatado = f'{MTD_media_taxa_de_juros:.2%}'
PMTD_media_taxa_de_juros_formatado = f'{PMTD_media_taxa_de_juros:.2%}'
avr_dti_formatado = f'{avr_dti:.2%}'
MTD_media_dti_formatado = f'{MTD_media_dti:.2%}'
PMTD_media_dti_formatado = f'{PMTD_media_dti:.2%}'
Ttl_good_emprestimos_formatado = f'{Ttl_good_emprestimos}'
porcent_good_emprestimos_formatado = f'{porcent_good_emprestimos:.2f}%'
Vlr_good_financiamento_formatado = f'R${Vlr_good_financiamento:,.2f}'
Vlr_good_recebimento_formatado = f'R${Vlr_good_recebimento:,.2f}'
Ttl_bad_emprestimos_formatado = f'{Ttl_bad_emprestimos}'
porcent_bad_emprestimos_formatado = f'{porcent_bad_emprestimos:.2f}%'
Vlr_bad_financiamentos_formatado = f'R${Vlr_bad_financiamentos:,.2f}'
Vlr_bad_recebimento_formatado = f'R${Vlr_bad_recebimento:,.2f}'

In [None]:
variaveis_formatadas = [
    Ttl_aplicacoes_formatado,
    MTD_aplicacoes_emprestimos_formatado,
    PMTD_aplicacoes_emprestimos_formatado,
    Vlr_financiado_formatado,
    MTD_Vlr_financiado_formatado,
    PMTD_Vlr_financiado_formatado,
    Vlr_recebimento_formatado,
    MTD_Vlr_recebimento_formatado,
    PMTD_Vlr_recebimento_formatado,
    avr_taxa_de_juros_formatado,
    MTD_media_taxa_de_juros_formatado,
    PMTD_media_taxa_de_juros_formatado,
    avr_dti_formatado,
    MTD_media_dti_formatado,
    PMTD_media_dti_formatado,
    Ttl_good_emprestimos_formatado,
    porcent_good_emprestimos_formatado,
    Vlr_good_financiamento_formatado,
    Vlr_good_recebimento_formatado,
    Ttl_bad_emprestimos_formatado,
    porcent_bad_emprestimos_formatado,
    Vlr_bad_financiamentos_formatado,
    Vlr_bad_recebimento_formatado
]

In [None]:
titulos = [
    "Total de Aplicações:", "Aplicações no Mês (Dezembro):", "Aplicações no Mês (Novembro):",
    "Valor Total Financiado:", "Valor Financiado no Mês (Dezembro):", "Valor Financiado no Mês (Novembro):",
    "Valor Total Recebido:", "Valor Recebido no Mês (Dezembro):", "Valor Recebido no Mês (Novembro):",
    "Taxa de Juros Média:", "Taxa de Juros Média no Mês (Dezembro):", "Taxa de Juros Média no Mês (Novembro):",
    "DTI Médio:", "DTI Médio no Mês (Dezembro):", "DTI Médio no Mês (Novembro):",
    "Total de Empréstimos 'Good':", "Porcentagem de Empréstimos 'Good':", "Valor Financiado 'Good':", "Valor Recebido 'Good':",
    "Total de Empréstimos 'Bad':", "Porcentagem de Empréstimos 'Bad':", "Valor Financiado 'Bad':", "Valor Recebido 'Bad':"
]

# Iterar sobre cada título e resultado e imprimir
for titulo, resultado in zip(titulos, variaveis_formatadas):
    print(titulo, resultado)