# CVM Demonstrações Financeiras
***
Este é um projeto de estudo pessoal com o objetivo de avançar nos conhecimentos de automação através da linguagem python. Para isso, foi proposto automatizar o download das demonstrações financeiras disponibilizadas pelo site da CVM http://dados.cvm.gov.br/dados/CIA_ABERTA/DOC/ITR/DADOS/.

Projeto inspirado no canal do Youtube Código Quant - Finanças Quantitavas.

## Importação
***
Nesta fase, além da instalação da biblioteca wget, foi realizada a importação do pandas, wget e zipfile, que são bibliotecas importantes para a realização do projeto.

In [1]:
# INSTALAÇÃO WGET
!pip install wget

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting wget
  Downloading wget-3.2.zip (10 kB)
Building wheels for collected packages: wget
  Building wheel for wget (setup.py) ... [?25l[?25hdone
  Created wheel for wget: filename=wget-3.2-py3-none-any.whl size=9675 sha256=74fdcca776d4d207778b47e38585eb20825725b61dfaf9d4d37f249f29f59d4a
  Stored in directory: /root/.cache/pip/wheels/a1/b6/7c/0e63e34eb06634181c63adacca38b79ff8f35c37e3c13e3c02
Successfully built wget
Installing collected packages: wget
Successfully installed wget-3.2


In [2]:
# IMPORTAÇÃO BIBLIOTECAS
import pandas as pd
import wget
from zipfile import ZipFile

In [3]:
# URL DADOS CVM
uri = 'http://dados.cvm.gov.br/dados/CIA_ABERTA/DOC/ITR/DADOS/'

## Laços de repetição
***
Primeiramente, criei um laço percorrendo todos os arquivos .zip do site da CVM. A intenção é que o laço retorne todos os nomes dos arquivos, ano após ano, para depois colocar dentro de uma lista e utilizar as bibliotecas wget e ZipFile para baixar e extrair. Porém, notei que faltavam os arquivos .zip dos anos 2018 e 2021, por isso utilizei o comando remove para remover o nome dos arquivos inexistentes.

In [24]:
# LAÇO DE REPETIÇÃO ARQUIVOS DE 2011 A 2022, EXCETO 2018 E 2021
arquivos = list()

for i in range(2011, 2023):
  arquivos.append('itr_cia_aberta_{}.zip'.format(i))

arquivos.remove('itr_cia_aberta_2018.zip')
arquivos.remove('itr_cia_aberta_2021.zip')
arquivos

['itr_cia_aberta_2011.zip',
 'itr_cia_aberta_2012.zip',
 'itr_cia_aberta_2013.zip',
 'itr_cia_aberta_2014.zip',
 'itr_cia_aberta_2015.zip',
 'itr_cia_aberta_2016.zip',
 'itr_cia_aberta_2017.zip',
 'itr_cia_aberta_2019.zip',
 'itr_cia_aberta_2020.zip',
 'itr_cia_aberta_2022.zip']

In [25]:
# LAÇO PARA BAIXAR OS ARQUIVOS .ZIP
for j in arquivos:
  wget.download(uri+j)

In [26]:
# LAÇO PARA EXTRAIR OS ARQUIVOS .ZIP
for j in arquivos:
  ZipFile(j, 'r').extractall('CVM')

## Concatenação
***
Após baixar e extrair todos os arquivos, a intenção foi concatenar todos eles em um DataFrame para acesso dos dados. A princípio, tentei utilizar a mesma lógica do laço anterior, percorrendo ano e nome do arquivo. Porém, não foi possível pois haviam arquivos que não estavam no diretório. Dessa forma, utilizando a biblioteca os, eu percorri todos os arquivos extraídos e coloquei seus nomes em uma lista para que no próximo passo fosse possível concatenar todos os arquivos através de um laço.

In [67]:
# IMPORTAÇÃO DA BIBLIOTECA OS E LISTA DE TODOS OS ARQUIVOS EXTRAÍDOS
import os

for _, _, arquivo in os.walk('./CVM'):
    lista = arquivo
    print(lista)

['itr_cia_aberta_DVA_ind_2015.csv', 'itr_cia_aberta_DRA_con_2012.csv', 'itr_cia_aberta_DFC_MI_con_2015.csv', 'itr_cia_aberta_BPA_ind_2020.csv', 'itr_cia_aberta_DFC_MD_ind_2015.csv', 'itr_cia_aberta_DFC_MI_con_2011.csv', 'itr_cia_aberta_BPP_ind_2012.csv', 'itr_cia_aberta_BPP_con_2016.csv', 'itr_cia_aberta_DRA_con_2019.csv', 'itr_cia_aberta_DRE_con_2016.csv', 'itr_cia_aberta_BPP_con_2019.csv', 'itr_cia_aberta_DRA_con_2020.csv', 'itr_cia_aberta_BPA_ind_2016.csv', 'itr_cia_aberta_DFC_MD_con_2019.csv', 'itr_cia_aberta_DFC_MD_ind_2013.csv', 'itr_cia_aberta_DRA_con_2022.csv', 'itr_cia_aberta_DRA_con_2016.csv', 'itr_cia_aberta_DFC_MI_con_2014.csv', 'itr_cia_aberta_BPP_con_2012.csv', 'itr_cia_aberta_DVA_con_2013.csv', 'itr_cia_aberta_DRE_ind_2019.csv', 'itr_cia_aberta_DRE_ind_2017.csv', 'itr_cia_aberta_DMPL_con_2011.csv', 'itr_cia_aberta_DRE_con_2012.csv', 'itr_cia_aberta_BPA_con_2015.csv', 'itr_cia_aberta_DRA_con_2015.csv', 'itr_cia_aberta_DRE_ind_2022.csv', 'itr_cia_aberta_BPA_con_2022.csv', 

In [76]:
# DATAFRAME E CONCATENAÇÃO
df = pd.DataFrame()
for i in lista:
  df = pd.concat([df, pd.read_csv('./CVM/'+i, sep = ';', decimal = ',', encoding = 'ISO-8859=1')])

## Dataframe salvo com sucesso
***
Depois de concatenado o dataframe, utilizei a função to_csv para salvar o novo DataFrame completo com todos os dados de 2011 a 2022.

Lista de dados do dataframe:
- DF Individual - Demonstração de Valor Adicionado
- DF Consolidado - Demonstração de Resultado Abrangente
- DF Consolidado - Demonstração do Fluxo de Caixa (Método Indireto)
- DF Individual - Balanço Patrimonial Ativo
- DF Individual - Demonstração do Fluxo de Caixa (Método Direto)
- DF Individual - Balanço Patrimonial Passivo
- DF Consolidado - Balanço Patrimonial Passivo
- DF Consolidado - Demonstração do Resultado
- DF Consolidado - Demonstração do Fluxo de Caixa (Método Direto)
- DF Consolidado - Demonstração de Valor Adicionado
- DF Individual - Demonstração do Resultado
- DF Consolidado - Demonstração das Mutações do Patrimônio Líquido
- DF Consolidado - Balanço Patrimonial Ativo
- DF Individual - Demonstração das Mutações do Patrimônio Líquido
- DF Individual - Demonstração do Fluxo de Caixa (Método Indireto)
- DF Individual - Demonstração de Resultado Abrangente

In [81]:
# SALVANDO ARQUIVO CSV
df.to_csv('cvm_2011-2022', index = False)

In [84]:
# DATAFRAME COMPLETO
df.head()

Unnamed: 0,CNPJ_CIA,DT_REFER,VERSAO,DENOM_CIA,CD_CVM,GRUPO_DFP,MOEDA,ESCALA_MOEDA,ORDEM_EXERC,DT_INI_EXERC,DT_FIM_EXERC,CD_CONTA,DS_CONTA,VL_CONTA,ST_CONTA_FIXA,COLUNA_DF,CATEG_DOC,ID_DOC,DT_RECEB,LINK_DOC
0,00.000.000/0001-91,2015-03-31,1,BCO BRASIL S.A.,1023,DF Individual - Demonstração de Valor Adicionado,REAL,MIL,PENÚLTIMO,2014-01-01,2014-03-31,7.01,Receitas,29492934.0,S,,,,,
1,00.000.000/0001-91,2015-03-31,1,BCO BRASIL S.A.,1023,DF Individual - Demonstração de Valor Adicionado,REAL,MIL,ÚLTIMO,2015-01-01,2015-03-31,7.01,Receitas,44365804.0,S,,,,,
2,00.000.000/0001-91,2015-03-31,1,BCO BRASIL S.A.,1023,DF Individual - Demonstração de Valor Adicionado,REAL,MIL,PENÚLTIMO,2014-01-01,2014-03-31,7.01.01,Intermediação Financeira,28664624.0,S,,,,,
3,00.000.000/0001-91,2015-03-31,1,BCO BRASIL S.A.,1023,DF Individual - Demonstração de Valor Adicionado,REAL,MIL,ÚLTIMO,2015-01-01,2015-03-31,7.01.01,Intermediação Financeira,46360828.0,S,,,,,
4,00.000.000/0001-91,2015-03-31,1,BCO BRASIL S.A.,1023,DF Individual - Demonstração de Valor Adicionado,REAL,MIL,PENÚLTIMO,2014-01-01,2014-03-31,7.01.02,Prestação de Serviços,3889001.0,S,,,,,
