# 3. Análise exploratória de dados
- cria um DataFrame a partir do arquivo metadados.json
- filtra os fundos listados como "ativos" na data da coleta

In [2]:
import sys
sys.path.append('../src')
import pandas as pd
import numpy as np
from IPython.display import display, HTML
import grafico

In [3]:
df = pd.read_json("../data/json/metadados.json") # Cria um dataframe do Pandas
df.set_index('Fundo', inplace=True) # Estabelece a coluna "Fundo" como índice

## Extensão do DF

In [4]:
len(df)

146

## Colunas do DataFrame

In [5]:
display(pd.DataFrame(df.columns)) # Colunas do DataFrame

Unnamed: 0,0
0,CNPJ
1,Código ANBIMA
2,Patrimônio Líquido
3,Taxa de administração ao ano
4,Primeiro aporte
5,Tipo de previdência
6,Classe ANBIMA
7,Tipo ANBIMA
8,Classe CVM
9,Sub Classe CVM


## Proporção de fundos com possibilidade de investimento no exterior

In [6]:
exterior = df['Investimento no exterior'].value_counts(normalize=True) * 100
display(pd.DataFrame(exterior))

Unnamed: 0_level_0,proportion
Investimento no exterior,Unnamed: 1_level_1
Não se Aplica,30.821918
Até 20 %,25.342466
> 67%,19.863014
Até 40 %,15.068493
Até 100%,8.90411


## Proporção de fundos segundo tipo estabelecido pela Anbima

In [7]:
tipo_anbima = df['Tipo ANBIMA'].value_counts(normalize=True) * 100
display(pd.DataFrame(tipo_anbima))

Unnamed: 0_level_0,proportion
Tipo ANBIMA,Unnamed: 1_level_1
Ações Livre,17.123288
Ações Invest. no Exterior,15.753425
Multimercados Invest. no Exterior,12.328767
Renda Fixa Duração Livre Crédito Livre,11.643836
Previdência Ações Ativo,7.534247
Ações Indexados,6.164384
ETF – Renda Variável,5.479452
Previdência Multimercado Livre,4.794521
Multimercados Livre,4.109589
Ações Índice Ativo,2.739726


## Proporção de fundos segundo classe estabelecida pela Anbima

In [8]:
classe_anbima = df['Classe ANBIMA'].value_counts(normalize=True) * 100
display(pd.DataFrame(classe_anbima))

Unnamed: 0_level_0,proportion
Classe ANBIMA,Unnamed: 1_level_1
Ações,43.150685
Multimercados,19.863014
Previdência,16.438356
Renda Fixa,15.068493
ETF,5.479452


## Proporção de fundos classificados como ESG pela Anbima

In [9]:
df.replace("n/d", np.nan, inplace=True) # Substituindo "n/d" por NaN
esg_proportions = df['Fundo ESG'].value_counts(normalize=True) * 100
display(pd.DataFrame(esg_proportions))

Unnamed: 0_level_0,proportion
Fundo ESG,Unnamed: 1_level_1
Sim,60.273973
Não,36.986301
Relacionado,2.739726


## Classe dos fundos considerados ESG pela Anbima


In [10]:
esg_classe = df[df['Fundo ESG'] == 'Sim']['Classe ANBIMA'].value_counts(normalize=True) * 100
display(pd.DataFrame(esg_classe))

Unnamed: 0_level_0,proportion
Classe ANBIMA,Unnamed: 1_level_1
Ações,51.136364
Renda Fixa,23.863636
Previdência,14.772727
Multimercados,5.681818
ETF,4.545455


In [13]:
multimercados = df[df['Classe ANBIMA'] == 'Multimercados']['Fundo ESG'].value_counts()
display(pd.DataFrame(multimercados))


Unnamed: 0_level_0,count
Fundo ESG,Unnamed: 1_level_1
Não,23
Sim,5
Relacionado,1


In [14]:
acoes = df[df['Classe ANBIMA'] == 'Ações']['Fundo ESG'].value_counts()
display(pd.DataFrame(acoes))


Unnamed: 0_level_0,count
Fundo ESG,Unnamed: 1_level_1
Sim,45
Não,15
Relacionado,3


In [15]:
rfixa = df[df['Classe ANBIMA'] == 'Renda Fixa']['Fundo ESG'].value_counts()
display(pd.DataFrame(rfixa))


Unnamed: 0_level_0,count
Fundo ESG,Unnamed: 1_level_1
Sim,21
Não,1


In [16]:
prev = df[df['Classe ANBIMA'] == 'Previdência']['Fundo ESG'].value_counts()
display(pd.DataFrame(prev))

Unnamed: 0_level_0,count
Fundo ESG,Unnamed: 1_level_1
Sim,13
Não,11


## 10 maiores e 10 menores fundos por patrimônio e respectiva classificação Anbima

In [42]:

df_ordenado = df.sort_values(by="Patrimônio Líquido", ascending=False)
pd.options.display.float_format = '{:,.0f}'.format
pd.options.display.float_format = lambda x: '{:,.0f}'.format(x).replace(',', '.')
top_10 = df_ordenado[["Patrimônio Líquido", 'Fundo ESG']].head(10)
display(pd.DataFrame(top_10))
top_10.to_excel("temp.xlsx")

Unnamed: 0_level_0,Patrimônio Líquido,Fundo ESG
Fundo,Unnamed: 1_level_1,Unnamed: 2_level_1
BNPP M.CRED FI RF CRED PRIV LP SUST IS,2.290.067.040,Sim
ITAÚ ACTIVE FIX ESG CRED PRIV MULT FC,1.977.302.010,Não
ITAÚ ACTIVE FIX ESG CRED PRIV MULT FI,1.975.144.954,Não
BNPP CREDITO INSTITUCIONAL SUSTENTAVEL IS FC DE FI RF CRED PRIV LP,1.871.864.285,Sim
SULA PREV CRÉD ESG FIRF CRED PRIV IS,992.973.931,Sim
SULAMERICA CRED ESG FIRF CRED PRIV LP IS,698.571.834,Sim
BB AÇÕES GOVERNANÇA IS FI,668.902.782,Sim
SULA CRED INST ESG FI RF CRED PRIV LP IS,600.194.684,Sim
BB ESPELHO JGP EQUILÍBRIO FUNDO DE INVESTIMENTO EM COTAS DE FUNDO DE INVESTIMENTO FINANCEIRO IS RENDA FIXA CRÉDITO PRIVADO LONGO PRAZO RESP LIMITADA,514.255.266,Sim
JGP EQUILÍBRIO FIF IS RF CRED PRIV LP RESP LIMITADA,499.777.661,Sim


In [44]:
df_ordenado = df.sort_values(by="Patrimônio Líquido", ascending=False)
pd.options.display.float_format = '{:,.0f}'.format
pd.options.display.float_format = lambda x: '{:,.0f}'.format(x).replace(',', '.')
bottom_10 = df_ordenado[["Patrimônio Líquido", 'Fundo ESG']].tail(11)
display(pd.DataFrame(bottom_10))
bottom_10.to_excel("temp.xlsx")

Unnamed: 0_level_0,Patrimônio Líquido,Fundo ESG
Fundo,Unnamed: 1_level_1,Unnamed: 2_level_1
BRB INVESTIMENTO SUSTENTAVEL FUNDO DE INVESTIMENTO EM COTAS DE FUNDO DE INVESTIMENTO EM ACOES I – RESPONSABILIDADE LIMITADA,1.794.550,Sim
JGP ESG INSTITUCIONAL FC DE FIA ÁGORA,1.674.555,Não
BB ASSET AÇÕES EQUIDADE IS FC FI,1.670.684,Não
JGP ESG INST FC DE FIA – FEEDER IX,1.660.295,Não
JGP EQ ESG PV ITAUXP FI MULT IE,1.519.090,Não
BB ASSET AÇÕES NORDEA GLOBAL CLIMATE AND ENVIRONMENT IS IE FC,1.272.780,Sim
JGP ESG INSTITUCIONAL FC FIA,1.208.412,Não
BB MULT BRL ALLSPRING CLI TRA IS IE FI,1.188.261,Sim
ACCESS ENERGY TRANSITION FIA SUS IS IE,1.144.272,Sim
BLAC ESG GL BON INC IE FIC FI MULT AGORA,1.127.240,Não


## 5 fundos mais rentáveis e respectiva classificação Anbima

In [17]:
df['Rentabilidade 12 meses'] = df['Rentabilidade 12 meses'].replace(r'%', '', regex=True).replace(r',', '.', regex=True).astype(float)
df_ordenado = df.sort_values(by="Rentabilidade 12 meses", ascending=False)
top_10 = df_ordenado[["Rentabilidade 12 meses", 'Fundo ESG']].head(10)
display(HTML(top_10.to_html()))

Unnamed: 0_level_0,Rentabilidade 12 meses,Fundo ESG
Fundo,Unnamed: 1_level_1,Unnamed: 2_level_1
Trend ETF MSCI USA ESG FI de Indice IE,34.79,Não
GO GLOBAL EQUITY ESG REAIS MULT IE FI,31.72,Não
BRAD IS MULTIMAN EQUI USD FC DE FIA IE,29.11,Não
Mirova Glob Sust Eqt Dol Adv M FIA IE IS,26.49,Sim
SCHRODER SUST AÇÕES GLOB USD FIA IS IE,26.26,Sim
SCH SUST AÇÕES GLOB USD FC FIA IS IE,25.09,Sim
ITAÚ INDEX ESG ÁGUA AÇÕES FX IE FC DE IS,24.5,Sim
Mirova Glob Sust Equity Adv FIA IE IS,24.43,Sim
IT NOW RUSSELL® 1000 GREEN REVENUES 50 FUNDO DE ÍNDICE IS,24.18,Sim
TREND ESG GLOBAL FI MULT,23.53,Não


### Pergunta: quais os principais gestores? Como seus fundos são classificados pela Anbima?

## Gestores mais frequentes

In [13]:
# Gestor mais frequente
display(pd.DataFrame(df['Gestor'].value_counts()))

Unnamed: 0_level_0,count
Gestor,Unnamed: 1_level_1
BB ASSET MANAGEMENT,29
JGP GESTAO DE RECURSOS LTDA,17
BRAM BRADESCO ASSET MANAGEMENT SA DTVM,16
ITAU UNIBANCO ASSET MANAGEMENT LTDA,14
XP ALLOCATION ASSET MANAGEMENT LTDA,11
BNP PARIBAS ASSET,10
SUL AMERICA INVESTIMENTOS GESTORA DE REC,6
BRADESCO,5
SICREDI,4
BTG PACTUAL,4


## Gestores ordenados segundo patrimônio líquido total

In [21]:
# Conversão da coluna 'Patrimônio Líquido' para numérica
df['Patrimônio Líquido'] = (
    df['Patrimônio Líquido']
    .replace(r'R\$', '', regex=True)
    .replace(r'\.', '', regex=True)
    .replace(',', '.', regex=True)
    .astype(float)
)

# Calculando o 'Patrimônio Líquido Total' por gestor em milhões
patrimonio_total = df.groupby('Gestor')['Patrimônio Líquido'].sum() / 1e6

# Criando a crosstab
gestor_esg_counts = pd.crosstab(df['Gestor'], df['Fundo ESG'])
gestor_esg_counts['Total'] = gestor_esg_counts.sum(axis=1)
gestor_esg_counts['Percentagem ESG'] = (gestor_esg_counts['Sim'] / gestor_esg_counts['Total']) * 100

# Inserindo 'Patrimônio Líquido Total (em milhões de reais)' no DataFrame de contagem
gestor_esg_counts['Patrimônio Líquido Total (em milhões de reais)'] = gestor_esg_counts.index.map(patrimonio_total)

# Ordenando e selecionando colunas
colunas_ordenadas = ['Total', 'Sim', 'Não', 'Relacionado', 'Percentagem ESG', 'Patrimônio Líquido Total (em milhões de reais)']
gestor_esg_counts_sorted = gestor_esg_counts.sort_values('Patrimônio Líquido Total (em milhões de reais)', ascending=False)
gestor_esg_counts_ordenado = gestor_esg_counts_sorted[colunas_ordenadas]

# Aplicando formatação para remover zeros finais e representar em milhões
gestor_esg_counts_ordenado['Percentagem ESG'] = gestor_esg_counts_ordenado['Percentagem ESG'].map(lambda x: f"{x:.2f}".rstrip('0').rstrip('.'))
gestor_esg_counts_ordenado['Patrimônio Líquido Total (em milhões de reais)'] = gestor_esg_counts_ordenado['Patrimônio Líquido Total (em milhões de reais)'].map(lambda x: f"{x:.2f}".rstrip('0').rstrip('.'))


display(gestor_esg_counts_ordenado)
gestor_esg_counts_ordenado.to_clipboard()
gestor_esg_counts_ordenado.to_excel('temp.xlsx')


Fundo ESG,Total,Sim,Não,Relacionado,Percentagem ESG,Patrimônio Líquido Total (em milhões de reais)
Gestor,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
BNP PARIBAS ASSET,10,10,0,0,100.0,5018.92
ITAU UNIBANCO ASSET MANAGEMENT LTDA,14,12,2,0,85.71,4416.2
BB ASSET MANAGEMENT,29,16,9,4,55.17,3067.27
SUL AMERICA INVESTIMENTOS GESTORA DE REC,6,5,1,0,83.33,2871.57
JGP GESTAO DE CREDITO LTDA,4,4,0,0,100.0,808.54
SCHRODER BRASIL,3,3,0,0,100.0,800.57
BRAM BRADESCO ASSET MANAGEMENT SA DTVM,16,8,8,0,50.0,684.09
SANTANDER BRASIL GESTAO DE RECURSOS LTDA,4,3,1,0,75.0,521.37
XP ALLOCATION ASSET MANAGEMENT LTDA,11,2,9,0,18.18,410.27
XP ADVISORY GESTAO DE RECURSOS,1,0,1,0,0.0,356.57


#### Resposta: dos 10 principais gestores, 6 têm mais de 70% dos respectivos fundos considerados ESG pela Anbima. 

#### Patrimônio Líquido Total (todos os fundos): R$ 20,1 bi 

In [15]:
patrimonio_total.sum()

20111.401780740005

In [18]:
len(df)

146

#### Rendimento médio anual: 6%

In [16]:
(df['Rentabilidade 12 meses'].replace(r'%', '', regex=True).replace(r',', '.', regex=True).astype(float)).sum()/len(df)

5.949109589041096