### TRATAMENTO DO IFDATA DAS IFS REGULADAS PELO BANCO CENTRAL DO BRASIL (BCB)

Aqui há subcontas menos agregadas que não são encontradas nos Balancetes e Balanços Patrimoniais. 

- **Nome oficial da base:** IF.data
- **Órgão:** CMN, BCB
- **Periodicidade:** trimestral 
- **Período:** 2011 a 2022 
- **Forma de extração:** download do csv
- **Link:** https://www3.bcb.gov.br/ifdata/

**Por Luis Adolfo Mazini Rodrigues¹ e Isabella de Moura Rocha²**

* ¹Graduado em Engenharia Mecânica, pela USP São Carlos e Doutorando em Bioenergia, pela USP Piracicaba, luis.mazinirodrigues@gmail.com 
* ²Graduada em Administração, pela UFSCar Sorocaba e Mestra em Administração, pela UFSCar Sorocaba, isabellamrocha0@gmail.com

*Os dados foram usados na dissertação: ROCHA, I.M. Rentabilidade, eficiência e risco em cooperativas de crédito e bancos comerciais. 2023. Dissertação (Mestrado em Administração) – Universidade Federal de São Carlos, Sorocaba, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18956.*

### 1. Bibliotecas necessárias

São importadas as bibliotecas necessárias para o processamento dos dados.

In [1]:
import pandas as pd
import csv
import numpy as np
from pathlib import Path
from itertools import zip_longest

### 2. Pré-processamento de Dados

Nesta seção, os arquivos são tratados para limpeza e organização. É só alterar o nome do seu diretório.

#### 2.1 arquivos 'Passivo'

In [2]:
list_names = ['/home/isabella/Documents/Masters/dados_novos/passivo/' + child.name for child in Path('/home/isabella/Documents/Masters/dados_novos/passivo/').iterdir() if child.is_file()]

In [3]:
# função que lê e trata os dados
def read_masters(arq, head):
    with open(arq, 'r', encoding='ISO8859-1') as readFile:
        lines = list(csv.reader(readFile, delimiter=';'))
    raw_header = lines[:head]
    data = lines[head:]
    raw_headerT = np.array(raw_header, dtype=object).T.tolist()
    header = list()
    for h in raw_headerT:
        st = ''
        for ch in h:
            if ch != '':
                st = ch
        if st != '':
            header.append(st)
    if len(header) > 32:
        print(arq)
    tranposed_tuples = zip_longest(*data, fillvalue=None)
    transposed_tuples_list = list(tranposed_tuples)
    transposed = [list(sublist) for sublist in transposed_tuples_list]
    dict_values = dict(zip(header, transposed))
    
    return pd.DataFrame.from_dict(dict_values)

In [4]:
# concatena os dados
df_passivo = pd.concat(map(lambda x: read_masters(x, 3), list_names))

/home/isabella/Documents/Masters/dados_novos/passivo/dados_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(4)_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(6)_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(2)_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(5)_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(1)_miss.csv
/home/isabella/Documents/Masters/dados_novos/passivo/dados(3)_miss.csv


In [182]:
df_passivo[df_passivo['Conta de Pagamento PrÃ©-Paga (a5)'] == df_passivo['Conta de Pagamento PrÃ©-Paga (a5)'].notna()]

Unnamed: 0,ï»¿InstituiÃ§Ã£o financeira,CÃ³digo,Conglomerado,Conglomerado Financeiro,Conglomerado Prudencial,TCB,TC,TI,Cidade,UF,...,ObrigaÃ§Ãµes por EmprÃ©stimos e Repasses (d),CaptaÃ§Ãµes (e) = (a) + (b) + (c) + (d),Instrumentos Derivativos (f),Outras ObrigaÃ§Ãµes (g),Passivo Circulante e ExigÃ­vel a Longo Prazo (h) = (e) + (f) + (g),Resultados de ExercÃ­cios Futuros (i),PatrimÃ´nio LÃ­quido (j),Passivo Total (k) = (h) + (i) + (j),Conta de Pagamento PrÃ©-Paga (a5),DepÃ³sitos Outros (a6)


In [7]:
# Salvando 
df_passivo.to_csv('/home/isabella/Documents/Masters/dados_novos/passivo_2001_2021.csv', index=False, encoding="utf-8", decimal='.', sep=',')

#### 2.2 arquivos 'Ativo'

In [8]:
list_names = ['/home/isabella/Documents/Masters/dados_novos/ativo/' + child.name for child in Path('/home/isabella/Documents/Masters/dados_novos/ativo/').iterdir() if child.is_file()]

In [9]:
# função que lê e trata os dados
def read_masters(arq, head):
    with open(arq, 'r', encoding='ISO8859-1') as readFile:
        lines = list(csv.reader(readFile, delimiter=';'))
    raw_header = lines[:head]
    data = lines[head:]
    raw_headerT = np.array(raw_header, dtype=object).T.tolist()
    header = list()
    for h in raw_headerT:
        st = ''
        for ch in h:
            if ch != '':
                st = ch
        if st != '':
            header.append(st)
    if len(header) > 32:
        print(arq)
    tranposed_tuples = zip_longest(*data, fillvalue=None)
    transposed_tuples_list = list(tranposed_tuples)
    transposed = [list(sublist) for sublist in transposed_tuples_list]
    dict_values = dict(zip(header, transposed))
    
    return pd.DataFrame.from_dict(dict_values)

In [10]:
# concatena os dados
df_ativo = pd.concat(map(lambda x: read_masters(x, 2), list_names))

In [12]:
# Salvando 
df_ativo.to_csv('/home/isabella/Documents/Masters/dados_novos/ativo_2001_2021.csv', index=False, encoding="utf-8", decimal='.', sep=';')

#### 2.3 arquivos 'DRE'

In [10]:
list_names = ['/home/isabella/Documents/Masters/dados_novos/dre/' + child.name for child in Path('/home/isabella/Documents/Masters/dados_novos/dre/').iterdir() if child.is_file()]

In [11]:
# função que lê e trata os dados
def read_masters(arq, head):
    with open(arq, 'r', encoding='ISO8859-1') as readFile:
        lines = list(csv.reader(readFile, delimiter=';'))
    raw_header = lines[:head]
    data = lines[head:]
    raw_headerT = np.array(raw_header, dtype=object).T.tolist()
    header = list()
    for h in raw_headerT:
        st = ''
        for ch in h:
            if ch != '':
                st = ch
        if st != '':
            header.append(st)
    if len(header) > 32:
        print(arq)
    tranposed_tuples = zip_longest(*data, fillvalue=None)
    transposed_tuples_list = list(tranposed_tuples)
    transposed = [list(sublist) for sublist in transposed_tuples_list]
    dict_values = dict(zip(header, transposed))
    
    return pd.DataFrame.from_dict(dict_values)

In [13]:
# concatena os dados
df_dre = pd.concat(map(lambda x: read_masters(x, 3), list_names))

/home/isabella/Documents/Masters/dados_novos/dre/dados(64).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(27).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(41).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(15).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(76).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(21).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(30).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(69).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(3).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(4).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(72).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(42).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(59).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(22).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(14).csv
/home/isabella/Documents/Masters/dados_novos/dre/dados(68

In [14]:
# Salvando 
df_dre.to_csv('/home/isabella/Documents/Masters/dados_novos/dre_2001_2021.csv', index=False, encoding="utf-8", decimal='.', sep=',')