# **Exploratory Data Analysis (EDA) - Operações de Financiamento**
<br><br>

## **Explicação dos dados** <br>

Informações detalhadas de operações que não foram aprovadas automaticamente.<br>

Operações contratadas diretamente com o BNDES e operações contratadas via agente financeiro (indiretas) que foram revisadas por analistas do BNDES. O critério principal para seja feita análise manual de operações indiretas é o valor.<br>

Operações indiretas são contratadas através de um Agente Financeiro que avalia o crédito do cliente, cobra um spread acima da taxa do BNDES e assume os riscos da operação.<br>

### **Fonte**:

[Site do BNDES](https://dadosabertos.bndes.gov.br/dataset/operacoes-financiamento/resource/332d446e-d340-46ef-af64-ee6f36e7bd50)

## **Importa bibliotecas**

In [126]:
import pandas as pd
import numpy as np

import warnings
warnings.simplefilter(action='ignore')

pd.set_option('display.float_format', '{:,.2f}'.format)

## **Importa dados como um DataFrame do Pandas**

In [164]:
n_auto = pd.read_csv("./data/operacoes-nao-automaticas.zip", 
                    encoding= "UTF-8", 
                    sep = ";", 
                    decimal = ",")

auto = pd.read_csv("./data/operacoes-indiretas-automaticas.zip", 
                    encoding= "UTF-8", 
                    sep = ";", 
                    decimal = ",")

n_auto.head(5)

Unnamed: 0,cliente,cnpj,descricao_do_projeto,uf,municipio,municipio_codigo,numero_do_contrato,data_da_contratacao,valor_contratado_reais,valor_desembolsado_reais,...,subsetor_cnae_nome,setor_bndes,subsetor_bndes,porte_do_cliente,natureza_do_cliente,instituicao_financeira_credenciada,cnpj_da_instituicao_financeira_credenciada,tipo_de_garantia,tipo_de_excepcionalidade,situacao_do_contrato
0,MUNICIPIO DE RIBEIRAO PRETO,56.024.581/0001-56,PROGRAMA DE MODERNIZACAO DA ADMINISTRACAO TRIB...,SP,RIBEIRAO PRETO,3543402,1247021,2002-01-02,9090000.0,9007445.1,...,ADMINISTRACAO PUBLICA EM GERAL ...,COMERCIO/SERVICOS,COMÉRCIO E SERVIÇOS,GRANDE,ADMINISTRAÇÃO PÚBLICA DIRETA - GOVERNO MUNICIPAL,----------,----------,"OUTRA, DE NATUREZA ESPECÍFICA OU MISTA",----------,LIQUIDADO
1,INSTITUTO DE DESENVOLVIMENTO SUSTENTAVEL DO BA...,02.275.306/0001-86,PROJETO DIREITO E CIDADANIA; PROJETO DEMONSTRA...,BA,ITUBERA,2917300,1247221,2002-01-03,706600.0,745030.36,...,ATIV ATENCAO A SAUDE HUMANA INTEGR C/ASSIST SO...,COMERCIO/SERVICOS,COMÉRCIO E SERVIÇOS,MICRO,PRIVADA,----------,----------,NÃO SE APLICA,----------,LIQUIDADO
2,INSTITUTO DE DESENVOLVIMENTO SUSTENTAVEL DO BA...,02.275.306/0001-86,PROJETO DIREITO E CIDADANIA; PROJETO DEMONSTRA...,BA,ITUBERA,2917300,1247221,2002-01-03,75691.59,78500.0,...,ATIV ATENCAO A SAUDE HUMANA INTEGR C/ASSIST SO...,COMERCIO/SERVICOS,COMÉRCIO E SERVIÇOS,MICRO,PRIVADA,----------,----------,NÃO SE APLICA,----------,LIQUIDADO
3,INSTITUTO DE DESENVOLVIMENTO SUSTENTAVEL DO BA...,02.275.306/0001-86,PROJETO DIREITO E CIDADANIA; PROJETO DEMONSTRA...,BA,ITUBERA,2917300,1247221,2002-01-03,603981.41,653834.69,...,ATIV ATENCAO A SAUDE HUMANA INTEGR C/ASSIST SO...,COMERCIO/SERVICOS,COMÉRCIO E SERVIÇOS,MICRO,PRIVADA,----------,----------,NÃO SE APLICA,----------,LIQUIDADO
4,ACEF S/A,46.722.831/0001-78,AQUISICAO DE EQUIPAMENTOS NACIONAIS E MOBILIAR...,SP,FRANCA,3516200,1255421,2002-01-09,340201.0,340189.32,...,EDUCACAO SUPERIOR - GRADUACAO ...,COMERCIO/SERVICOS,COMÉRCIO E SERVIÇOS,GRANDE,PRIVADA,BANCO BRADESCO S.A.,60746948000112,DEFINIDA PELO AGENTE FINANCEIRO,----------,LIQUIDADO


In [66]:
auto.head()

Unnamed: 0,cliente,cpf_cnpj,uf,municipio,municipio_codigo,data_da_contratacao,valor_da_operacao_em_reais,valor_desembolsado_reais,fonte_de_recurso_desembolsos,custo_financeiro,...,subsetor_cnae_agrupado,subsetor_cnae_codigo,subsetor_cnae_nome,setor_bndes,subsetor_bndes,porte_do_cliente,natureza_do_cliente,instituicao_financeira_credenciada,cnpj_do_agente_financeiro,situacao_da_operacao
0,BANCO COOPERATIVO SICOOB S.A.,**.*38.232/0001-**,SP,PEDREGULHO,3537008,2002-01-02,16000,16000.0,RECURSOS LIVRES - TESOURO,TAXA FIXA,...,Agropecuária,A0119900,CULT PLANTAS LAVOURA TEMPORARIA NAO ESPECIFICA...,AGROPECUÁRIA,AGROPECUÁRIA,MICRO,PRIVADA,BANCO COOPERATIVO SICOOB S.A.,02.038.232.0001-64,LIQUIDADA
1,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,**.*16.560/0001-**,RS,TRES DE MAIO,4321808,2002-01-02,8047,8047.0,RECURSOS VINCULADOS - FAT DEPÓSITOS ESPECIAIS,TAXA FIXA,...,Agropecuária,A0100000,"AGRICULTURA, PECUARIA E SERVICOS RELACIONADOS",AGROPECUÁRIA,AGROPECUÁRIA,MICRO,PRIVADA,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,92.816.560.0001-37,LIQUIDADA
2,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,**.*16.560/0001-**,RS,ERECHIM,4307005,2002-01-02,8104,8104.0,RECURSOS VINCULADOS - FAT DEPÓSITOS ESPECIAIS,TAXA FIXA,...,Agropecuária,A0100000,"AGRICULTURA, PECUARIA E SERVICOS RELACIONADOS",AGROPECUÁRIA,AGROPECUÁRIA,MICRO,PRIVADA,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,92.816.560.0001-37,LIQUIDADA
3,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,**.*16.560/0001-**,RS,ERECHIM,4307005,2002-01-02,6304,6304.0,RECURSOS VINCULADOS - FAT DEPÓSITOS ESPECIAIS,TAXA FIXA,...,Agropecuária,A0100000,"AGRICULTURA, PECUARIA E SERVICOS RELACIONADOS",AGROPECUÁRIA,AGROPECUÁRIA,MICRO,PRIVADA,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,92.816.560.0001-37,LIQUIDADA
4,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,**.*16.560/0001-**,RS,HUMAITA,4309704,2002-01-02,15000,15000.0,RECURSOS VINCULADOS - FAT DEPÓSITOS ESPECIAIS,TAXA FIXA,...,Agropecuária,A0100000,"AGRICULTURA, PECUARIA E SERVICOS RELACIONADOS",AGROPECUÁRIA,AGROPECUÁRIA,MICRO,PRIVADA,BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL,92.816.560.0001-37,LIQUIDADA


# **Comparação entre Operações Automáticas e Não Automáticas**

<br><br>

## **1. Desembolso por categoria**

<br>

### **Métricas de Ordenação:**

<br>

* **Tipo**: (``'auto', 'n_auto'``)    Se vai ordenar pela métrica das Operações Automáticas ou Não Automáticas
* **Média**: Valor médio desembolsado por operação unitária da categoria
* **cliente**: Números de clientes da categoria
* **valor_desembolsado_reais**: Soma do valor desembolsado por categoria

<br>

### **Forma de ordenação**

<br>

* **crescente**: (True ou False), ordena os valores de forma crescente ou não 

<br>

## **1.1 Por Natureza do Cliente**

In [155]:
metrica = 'Média' #Opções: 'Média', 'cliente', 'valor_desembolsado_reais'
crescente = False # Opções: True, False
Tipo = 'auto' #Opções: 'auto', 'n_auto'

auto_natureza_cliente = auto.groupby(['natureza_do_cliente']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

auto_natureza_cliente["Média"] = auto_natureza_cliente["valor_desembolsado_reais"]/auto_natureza_cliente["cliente"]

n_auto['natureza_do_cliente'] = n_auto['natureza_do_cliente'].str.strip()

n_auto_natureza_cliente = n_auto.groupby(['natureza_do_cliente']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

n_auto_natureza_cliente["Média"] = n_auto_natureza_cliente["valor_desembolsado_reais"]/n_auto_natureza_cliente["cliente"]

if Tipo == 'auto':

    result = pd.concat([auto_natureza_cliente.sort_values(by = metrica, ascending = crescente), 
                        n_auto_natureza_cliente],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

elif Tipo == 'n_auto':

    result = pd.concat([auto_natureza_cliente, 
                        n_auto_natureza_cliente.sort_values(by = metrica, ascending = crescente)],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])


result.head()

Unnamed: 0_level_0,Operações Automáticas,Operações Automáticas,Operações Automáticas,Operações Não Automáticas,Operações Não Automáticas,Operações Não Automáticas
Unnamed: 0_level_1,cliente,valor_desembolsado_reais,Média,cliente,valor_desembolsado_reais,Média
natureza_do_cliente,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
ADMINISTRAÇÃO PÚBLICA DIRETA - GOVERNO ESTADUAL,243,722844469.0,2974668.6,419,66608663641.13,158970557.62
ADMINISTRAÇÃO PÚBLICA DIRETA - GOVERNO FEDERAL,1,489000.0,489000.0,5,242761617.83,48552323.57
ADMINISTRAÇÃO PÚBLICA DIRETA - GOVERNO MUNICIPAL,3011,2280301020.0,757323.49,574,9978378921.28,17383935.4
PRIVADA,2079716,549814179988.0,264369.84,17695,588396235875.68,33252118.44
PÚBLICA INDIRETA,392,4975723602.0,12693172.45,872,106909122091.83,122602204.23


## **1.2 Por Setor CNAE**

In [208]:
metrica = 'Média' #Opções: 'Média', 'cliente', 'valor_desembolsado_reais'
crescente = False # Opções: True, False
Tipo = 'auto' #Opções: 'auto', 'n_auto'

auto_setor = auto.groupby(['setor_cnae']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

auto_setor["Média"] = auto_setor["valor_desembolsado_reais"]/setor["cliente"]

n_auto['setor_cnae'] = n_auto['setor_cnae'].str.strip()

n_auto_setor = n_auto.groupby(['setor_cnae']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

n_auto_setor["Média"] = n_auto_setor["valor_desembolsado_reais"]/n_auto_setor["cliente"]

if Tipo == 'auto':

    result = pd.concat([auto_setor.sort_values(by = metrica, ascending = crescente), 
                        n_auto_setor],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

elif Tipo == 'n_auto':

    result = pd.concat([auto_setor, 
                        n_auto_setor.sort_values(by = metrica, ascending = crescente)],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

result

Unnamed: 0_level_0,Operações Automáticas,Operações Automáticas,Operações Automáticas,Operações Não Automáticas,Operações Não Automáticas,Operações Não Automáticas
Unnamed: 0_level_1,cliente,valor_desembolsado_reais,Média,cliente,valor_desembolsado_reais,Média
setor_cnae,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
INDUSTRIA DE TRANSFORMAÇÃO,307353,147008900341.0,478306.38,6387,193944871070.96,30365566.16
INDUSTRIA EXTRATIVA,14922,6283094511.0,421062.49,186,24351204817.05,130920456.01
COMERCIO E SERVICOS,1426476,366876325747.0,257190.68,12263,544253405367.85,44381750.42
AGROPECUÁRIA E PESCA,334612,37625217480.0,112444.32,729,9585680891.9,13149082.16


## **1.3 Por Setor BNDES**

In [209]:
metrica = 'Média' #Opções: 'Média', 'cliente', 'valor_desembolsado_reais'
crescente = False # Opções: True, False
Tipo = 'auto' #Opções: 'auto', 'n_auto'

auto_setor = auto.groupby(['setor_bndes']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

auto_setor["Média"] = auto_setor["valor_desembolsado_reais"]/auto_setor["cliente"]

auto['setor_bndes'] = auto['setor_bndes'].str.strip()
n_auto['setor_bndes'] = n_auto['setor_bndes'].str.strip()
n_auto['setor_bndes'].loc[n_auto.setor_bndes == 'INFRAESTRUTURA'] = 'INFRA-ESTRUTURA'

n_auto_setor = n_auto.groupby(['setor_bndes']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

n_auto_setor["Média"] = n_auto_setor["valor_desembolsado_reais"]/n_auto_setor["cliente"]

if Tipo == 'auto':

    result = pd.concat([auto_setor.sort_values(by = metrica, ascending = crescente), 
                        n_auto_setor],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

elif Tipo == 'n_auto':

    result = pd.concat([auto_setor, 
                        n_auto_setor.sort_values(by = metrica, ascending = crescente)],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

result

Unnamed: 0_level_0,Operações Automáticas,Operações Automáticas,Operações Automáticas,Operações Não Automáticas,Operações Não Automáticas,Operações Não Automáticas
Unnamed: 0_level_1,cliente,valor_desembolsado_reais,Média,cliente,valor_desembolsado_reais,Média
setor_bndes,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
INDUSTRIA,322275,153291994852.0,475655.87,6573,218296075888.01,33211026.3
INFRA-ESTRUTURA,870722,224160220319.0,257441.78,8194,429180312897.96,52377387.47
COMERCIO/SERVICOS,555754,142716105428.0,256797.26,4069,115073092469.89,28280435.6
AGROPECUÁRIA,334612,37625217480.0,112444.32,729,9585680891.9,13149082.16


## **1.4 Por Porte do Cliente**

In [210]:
metrica = 'Média' #Opções: 'Média', 'cliente', 'valor_desembolsado_reais'
crescente = False # Opções: True, False
Tipo = 'auto' #Opções: 'auto', 'n_auto'

auto_porte = auto.groupby(['porte_do_cliente']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

auto_porte["Média"] = auto_porte["valor_desembolsado_reais"]/auto_porte["cliente"]

n_auto_porte = n_auto.groupby(['porte_do_cliente']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

n_auto_porte["Média"] = n_auto_porte["valor_desembolsado_reais"]/n_auto_porte["cliente"]

result = pd.concat([auto_porte.sort_values(by = metrica, ascending = crescente), 
                    n_auto_porte],
                    axis = 1, 
                    keys=['Operações Automáticas','Operações Não Automáticas'])

if Tipo == 'auto':

    result = pd.concat([auto_porte.sort_values(by = metrica, ascending = crescente), 
                        n_auto_porte],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

elif Tipo == 'n_auto':

    result = pd.concat([auto_porte, 
                        n_auto_porte.sort_values(by = metrica, ascending = crescente)],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

result

Unnamed: 0_level_0,Operações Automáticas,Operações Automáticas,Operações Automáticas,Operações Não Automáticas,Operações Não Automáticas,Operações Não Automáticas
Unnamed: 0_level_1,cliente,valor_desembolsado_reais,Média,cliente,valor_desembolsado_reais,Média
porte_do_cliente,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
GRANDE,364372,237200734516.0,650985.08,17101,751788042675.28,43961642.17
MÉDIA,342310,140390982887.0,410128.2,1188,15690606325.55,13207581.08
PEQUENA,428387,85459453275.0,199491.24,731,2023934055.24,2768719.64
MICRO,948294,94742367401.0,99908.22,545,2632579091.67,4830420.35


## **1.5 Por UF**

In [211]:
metrica = 'Média' #Opções: 'Média', 'cliente', 'valor_desembolsado_reais'
crescente = False # Opções: True, False
Tipo = 'auto' #Opções: 'auto', 'n_auto'

auto_uf = auto.groupby(['uf']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

auto_uf["Média"] = auto_uf["valor_desembolsado_reais"]/auto_uf["cliente"]

auto['uf'] = auto['uf'].str.strip()
n_auto['uf'] = n_auto['uf'].str.strip()

n_auto_uf = n_auto.groupby(['uf']).agg({'cliente':'count', 'valor_desembolsado_reais':'sum'})

n_auto_uf["Média"] = n_auto_uf["valor_desembolsado_reais"]/n_auto_uf["cliente"]

if Tipo == 'auto':

    result = pd.concat([auto_uf.sort_values(by = metrica, ascending = crescente), 
                        n_auto_uf],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

elif Tipo == 'n_auto':

    result = pd.concat([auto_uf, 
                        n_auto_uf.sort_values(by = metrica, ascending = crescente)],
                        axis = 1, 
                        keys=['Operações Automáticas','Operações Não Automáticas'])

result

Unnamed: 0_level_0,Operações Automáticas,Operações Automáticas,Operações Automáticas,Operações Não Automáticas,Operações Não Automáticas,Operações Não Automáticas
Unnamed: 0_level_1,cliente,valor_desembolsado_reais,Média,cliente,valor_desembolsado_reais,Média
uf,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
RJ,79365.0,30006121109.0,378077.5,1955,93525633483.82,47839198.71
SP,434734.0,155765261635.0,358300.16,4586,129225471175.93,28178253.64
AM,13602.0,4407210005.0,324011.91,161,7017906105.42,43589478.92
MT,53894.0,17064543615.0,316631.6,382,18108456623.15,47404336.71
DF,14455.0,4387634521.0,303537.5,124,20814162008.21,167856145.23
TO,16533.0,4850581549.0,293387.86,99,5769742831.72,58280230.62
MS,32311.0,9390979534.0,290643.42,375,16221431009.3,43257149.36
MG,232436.0,64300918024.0,276639.24,1507,38511813600.13,25555284.41
PA,29550.0,8133361742.0,275240.67,297,39794267221.91,133987431.72
GO,73032.0,19210539167.0,263042.76,594,14587216351.07,24557603.28
