# Tratamento dos dados - CNPJs da CVM

Junção e tratamento dos dados das tabelas cvm_bruto, cnpj_bruto e uf_bruto - Bronze

Serão tratados e disponibilizados para utilização somente os dados em que o CNPJ está considerado como em funcionamento normal na CVM e que apresentam correspondencia com a API Brasil, os demais serão desconsiderados.

In [0]:
from pyspark.sql.functions import regexp_replace, to_date, col, format_number

In [0]:
#Seleciona e trata os dados necessários da cvm

cvm = spark.sql("""
    SELECT 
    CNPJ_FUNDO, 
    SIT, 
    DT_REG,
    TAXA_ADM, 
    VL_PATRIM_LIQ
    FROM cvm_bruto
    where SIT = 'EM FUNCIONAMENTO NORMAL'
""")

cvm = cvm.withColumn("DT_REG", to_date(col("DT_REG"), "yyyy-MM-dd")) \
        .withColumn("VL_PATRIM_LIQ", col("VL_PATRIM_LIQ").cast("double"))\
        .withColumn("VL_PATRIM_LIQ", format_number(col("VL_PATRIM_LIQ"), 2))

display(cvm)

CNPJ_FUNDO,SIT,DT_REG,TAXA_ADM,VL_PATRIM_LIQ
9636393000107,EM FUNCIONAMENTO NORMAL,2008-09-03,0.35,8390636052.23
9636619000161,EM FUNCIONAMENTO NORMAL,2008-10-02,0.22,776682897.59
9720710000160,EM FUNCIONAMENTO NORMAL,2008-09-26,8.0,267527820.21
11108013000103,EM FUNCIONAMENTO NORMAL,2009-09-25,2.0,83371655.02
11147668000182,EM FUNCIONAMENTO NORMAL,2010-06-16,0.7,186976265.29
11769285000146,EM FUNCIONAMENTO NORMAL,2010-07-23,0.58,2663857309.05
12107422000140,EM FUNCIONAMENTO NORMAL,2011-09-06,0.8,192522690.85
12124044000102,EM FUNCIONAMENTO NORMAL,2010-08-26,1.5,553956292.03
12124044000102,EM FUNCIONAMENTO NORMAL,2010-08-26,1.5,553956292.03
13243834000170,EM FUNCIONAMENTO NORMAL,2011-03-01,,


In [0]:
#Seleciona somente os dados necessários da cnpj_bruto

cnpj = spark.sql("""
    SELECT 
    cnpj,
    uf,
    razao_social
    FROM cnpj_bruto
""")

In [0]:
uf_bruto = spark.sql("""
    SELECT 
    sigla,
    nome
    FROM uf_bruto
""")

In [0]:

cvm_cnpj = cvm.join(
    cnpj, 
    cvm.CNPJ_FUNDO == cnpj.cnpj, 
    how="left"
    )

cvm_tratada = cvm_cnpj.join(
    uf_bruto, 
    cvm_cnpj.uf == uf_bruto.sigla, 
    how="left"
    )

display(cvm_tratada)

CNPJ_FUNDO,SIT,DT_REG,TAXA_ADM,VL_PATRIM_LIQ,cnpj,uf,razao_social,sigla,nome
9636393000107,EM FUNCIONAMENTO NORMAL,2008-09-03,0.35,8390636052.23,9636393000107,SP,BNP PARIBAS MATCH CLASSE DE INVESTIMENTO DE RENDA FIXA REFERENCIADA DI CP RESPONSABILIDADE LIMITADA,SP,São Paulo
9636619000161,EM FUNCIONAMENTO NORMAL,2008-10-02,0.22,776682897.59,9636619000161,SP,BNP PARIBAS SOBERANO CIC DE CLASSE DE INVESTIMENTO RENDA FIXA SIMPLES - RESPONSABILIDADE LIMITADA,SP,São Paulo
9720710000160,EM FUNCIONAMENTO NORMAL,2008-09-26,8.0,267527820.21,9720710000160,MG,INTER CONSERVADOR PLUS FUNDO DE INVESTIMENTO FINANCEIRO RENDA FIXA LONGO PRAZO RESP LIMITADA,MG,Minas Gerais
11108013000103,EM FUNCIONAMENTO NORMAL,2009-09-25,2.0,83371655.02,11108013000103,SP,BNP PARIBAS SMALL CAPS CLASSE DE INVESTIMENTO EM ACOES - RESPONSABILIDADE LIMITADA,SP,São Paulo
11147668000182,EM FUNCIONAMENTO NORMAL,2010-06-16,0.7,186976265.29,11147668000182,SP,BNP PARIBAS ACCESS USA COMPANIES CLASSE DE INVESTIMENTO EM ACOES - RESPONSABILIDADE LIMITADA,SP,São Paulo
11769285000146,EM FUNCIONAMENTO NORMAL,2010-07-23,0.58,2663857309.05,11769285000146,SP,SPHERE CLASSE DE INVESTIMENTO MULTIMERCADO CREDITO PRIVADO INVESTIMENTO NO EXTERIOR,SP,São Paulo
12107422000140,EM FUNCIONAMENTO NORMAL,2011-09-06,0.8,192522690.85,12107422000140,SP,ZURICH BNPP RENDA FIXA CIC DE CLASSES DE INVESTIMENTO PREVIDENCIARIA - RESP LIMITADA,SP,São Paulo
12124044000102,EM FUNCIONAMENTO NORMAL,2010-08-26,1.5,553956292.03,12124044000102,SP,MAPFRE HEDGE PREV CLASSE DE INVESTIMENTO RENDA FIXA - RESPONSABILIDADE LIMITADA,SP,São Paulo
12124044000102,EM FUNCIONAMENTO NORMAL,2010-08-26,1.5,553956292.03,12124044000102,SP,MAPFRE HEDGE PREV CLASSE DE INVESTIMENTO RENDA FIXA - RESPONSABILIDADE LIMITADA,SP,São Paulo
13243834000170,EM FUNCIONAMENTO NORMAL,2011-03-01,,,13243834000170,SP,TENEO FUNDO DE INVESTIMENTO EM PARTICIPACOES - MULTIESTRATEGIA,SP,São Paulo


In [0]:
spark.sql("drop table if exists cvm_tratada")

cvm_tratada.write.mode("overwrite").saveAsTable("cvm_tratada")

In [0]:
%sql
select * from cvm_tratada;

CNPJ_FUNDO,SIT,DT_REG,TAXA_ADM,VL_PATRIM_LIQ,cnpj,uf,razao_social,sigla,nome
41953322000132,EM FUNCIONAMENTO NORMAL,2021-06-07,4.0,173198449.67,41953322000132,MG,INTER INFRA MASTER FIF INCENTIV DE INVESTIMENTO EM INFRA RENDA FIXA CRED PRIV RESP LIMITADA,MG,Minas Gerais
37088071000106,EM FUNCIONAMENTO NORMAL,2020-05-11,,2536455.66,37088071000106,SP,MERU REAL ESTATE III FUNDO DE INVESTIMENTO EM PARTICIPACOES MULTIESTRATEGIA IE RESP LIMITADA,SP,São Paulo
46929994000126,EM FUNCIONAMENTO NORMAL,2022-10-24,,36796854.17,46929994000126,SP,GRATIAM FLOW FUNDO DE INVESTIMENTO EM DIREITOS CREDITORIOS MULTISSETORIAL RESPONSABILIDADE LIMITADA,SP,São Paulo
44680388000194,EM FUNCIONAMENTO NORMAL,2022-03-25,,24838471.92,44680388000194,SP,ACELERA VAREJO FUNDO DE INVESTIMENTO EM DIREITOS CREDITORIOS RESPONSABILIDADE LIMITADA,SP,São Paulo
5754066000190,EM FUNCIONAMENTO NORMAL,2005-01-14,0.04,6196621050.94,5754066000190,SP,CLASSE UNICA DO AGATA FUNDO DE INVESTIMENTO FINANCEIRO MULTIMERCADO CREDITO PRIVADO LONGO PRAZO,SP,São Paulo
50275622000109,EM FUNCIONAMENTO NORMAL,2023-04-11,,13218021.43,50275622000109,SP,ROHT FUNDO DE INVESTIMENTO IMOBILIARIO RESPONSABILIDADE LIMITADA,SP,São Paulo
44680435000108,EM FUNCIONAMENTO NORMAL,2022-09-27,,36780525.58,44680435000108,SP,OCTO FUNDO DE INVESTIMENTO IMOBILIARIO RESPONSABILIDADE LIMITADA,SP,São Paulo
18929680000198,EM FUNCIONAMENTO NORMAL,2013-09-25,,41449354.35,18929680000198,SP,BRIO REAL ESTATE FUNDO DE INVESTIMENTO EM PARTICIPACOES MULTIESTRATEGIA - RESPONSABILIDADE LIMITADA,SP,São Paulo
26845868000186,EM FUNCIONAMENTO NORMAL,2018-02-19,1.515,1265664.58,26845868000186,SP,BNP PARIBAS ACCESS DIVERSIFIED DYNAMIC CLASSE DE INVESTIMENTO MULTIMERCADO - RESP LIMITADA,SP,São Paulo
44108111000191,EM FUNCIONAMENTO NORMAL,2022-10-06,,278867473.82,44108111000191,SP,PCS II HEALTHCARE FUNDO DE INVESTIMENTO EM PARTICIPACOES,SP,São Paulo
