# 4. Pesquisa das metodologias
- Filtra conteúdo de ESG segundo palavras-chave
- Envia trechos filtrados à análise da API da OpenAI
- Sintetiza ao arquivo de metadados informações sobre origem, objetivo, método e referência da metodologia ESG e as consolida em keys específicas
- Cria arquivo dados.json

# Filtra e pesquisa informações sobre a metodologia ESG referidas nos regulamentos

In [1]:
import sys
sys.path.append('../src')
import filtro, json
import random
import analise

## Filtra informações sobre objetivos e metodologias ESG dos fundos.
- Seleciona trechos que contêm os objetivos dos fundos e as metodologias ESG empregadas.
- Registra novo arquivo entre os metadados.

In [2]:
with open('../data/json/metadados.json', 'r', encoding='utf-8') as f:
        metadados = json.load(f)


In [3]:
for fundo in metadados:
    try:
        filtro.metodologias(fundo) # Retorna metadados processados segundo filtros
    except KeyError:
        print(f"Erro. Conferir metadados do fundo {fundo}")

Arquivo processado: SICREDI ESG FIC FIE MULT.txt
Arquivo processado: BB AÇÕES BRL PICT GLOB ENV OPP IS IE FI.txt
Arquivo processado: SICREDI ACOES SUSTENT ESG FIC FI IS.txt
Arquivo processado: SULAMERICA P C ESG I FC RF CRED PRIV I S.txt
Arquivo processado: BRADESCO H FI DE AÇÕES IS SRI.txt
Arquivo processado: BRAD FI RF CRED PRIV LP IS PERF SRI 20.txt
Arquivo processado: COMPASS ESG C SEL FI RF CRED PRIV LP IS.txt
Arquivo processado: CSHG PORT ESG SUST FUT FC FI MULT IE.txt
Arquivo processado: FRAM CAPITAL HANSSEN ESG IS FIA.txt
Arquivo processado: PLURAL ESG IS CRED PRIV 45 FC FI RF LP.txt
Arquivo processado: JGP ESG FC FIA.txt
Arquivo processado: BRAM FIA IS SUST EMPRESARIAL 2.txt
Arquivo processado: PAND LONG BIAS ESG XP SEG FI MULT FIFE.txt
Arquivo processado: IT NOW ISE FUNDO DE INDICE IS.txt
Arquivo processado: ING NI ONE GL EN ESG BRL FIA BDR NIVEL I.txt
Arquivo processado: BB ESPELHO SULAMÉRICA CRÉDITO ASG FUNDO DE INVESTIMENTO EM COTAS DE FUNDO DE INVESTIMENTO FINANCEIRO REND

In [4]:
random.sample(metadados, 15) # Confere integridade da lista

[{'CNPJ': '32.203.262/0001-40',
  'Código ANBIMA': '493661',
  'ISIN': 'BR0199CTF002',
  'Patrimônio Líquido': 'R$ 27.693.617,86',
  'Taxa de administração ao ano': 'Não se aplica',
  'Primeiro aporte': '15/03/2019',
  'Classe ANBIMA': 'Ações',
  'Tipo ANBIMA': 'Ações Livre',
  'Classe CVM': 'Ações',
  'Sub Classe CVM': 'Não se Aplica',
  'Fundo ESG': 'Sim',
  'Composição do fundo': 'FI',
  'Fundo Master': 'Não',
  'Estrutura de gestão': 'Não se aplica',
  'Benchmark': 'IFNC',
  'Foco de atuação': 'Não se aplica',
  'Investimento no exterior': 'Não se Aplica',
  'Credito privado': 'Não',
  'Tipo de investidor': 'Não Há Restrição',
  'Característica do investidor': 'Geral',
  'Cota de abertura': 'Não',
  'Fundo permite alavancagem': 'Não',
  'Aberto estatutariamente': 'Sim',
  'Tributação Alvo': 'Renda Variável',
  'Permite aplicação automática': 'Não',
  'Moeda': 'R$',
  'Administrador': 'BNP PARIBAS',
  'Gestor': 'BNP PARIBAS ASSET',
  'Distribuidor': 'BNP PARIBAS',
  'Custodiante': '

In [4]:
with open('../data/json/metadados.json', 'w', encoding='utf-8') as f: # Salvando os metadados atualizados em um arquivo JSON ao final do processamento
    json.dump(metadados, f, ensure_ascii=False, indent=4)

## Analisa trechos selecionados por meio da API da OpenAI

In [1]:
prompt = """No documento estão trechos relacionados a fundos de investimento. Para cada trecho, realize as seguintes tarefas:

1. Identifique a origem da metodologia ASG, se "interna" ou "externa".
2. Sumarize o objetivo do fundo e os métodos que este emprega para selecionar ativos.
3. Identifique a principal fonte, autoridade certificadora ou referência da metodologia ASG, utilizando NER (Named-Entity Recognition) ou outra técnica de NLP.
4. Extraia a URL da referência.
5. Verifique se o regulamento do fundo menciona a elaboração de relatório sobre os resultados ASG, incluindo forma, conteúdo, periodicidade de divulgação, e o responsável por sua elaboração e auditoria, se disponível.

As respostas devem ser estruturadas como um dicionário Python válido com as chaves: "Origem Metodologia ASG", "Objetivo ASG", "Método ASG", "Referência ASG", "URL Referência ASG", "Relatório ASG". Use 'n/d' para chaves sem informações. Se houver mais de uma resposta, inclua-as em uma lista dentro do dicionário. O dicionário todo deve ser conciso e não exceder 300 tokens.

Utilize palavras-chave específicas para ajudar na pesquisa:

- Para ASG: "verde", "responsável", "melhores práticas", "esg", "asg", "positiva", "raça", "diversidade", "governança", "ambiente", "equidade", "sociais", "gênero", "sustentável", "sustentabilidade", "transição energética", "carbono", "água", "energia", "trabalho escravo", "trabalho infantil", "mudanças climáticas", "biodiversidade", "desmatamento", "eficiência energética", "recursos naturais", "limpa", "poluição", "inclusão", "direitos humanos", "ética", "transparência".

- Para o campo "objetivo": "objetivo do fundo", "estratégia", "compromisso", "política de investimento", "benefício".

- Para o campo "método": "metodologia", "critérios", "método", "abordagem", "avaliação", "índice", "filtro", "parâmetros".

- Para o campo "referências": "princípio", "princípios", "diretrizes", "normas", "formulário", "regra", "decreto", "lei".

- Para o campo "relatório": "relatório", "periódicos", "periodicidade", "parecer", "resultados", "transparência", "diligência", "demonstrativo", "due diligence".

Inclua "dúvida" ao final de substrings incertas. Exemplos de como as respostas devem ser formatadas:

- Trecho completo: "A GESTORA possui uma Estratégia de Sustentabilidade que descreve seus objetivos e metodologia de investimento sustentável, em linha com as Regras e Procedimentos para Investimentos em Ativos Sustentáveis publicada pela Anbima."
  Resposta: {"Origem Metodologia ASG": "interna", "Objetivo ASG": "n/d", "Método ASG": "n/d", "Referência ASG": "Anbima", "URL Referência ASG": "n/d", "Relatório ASG": "n/d"}

- Trecho completo: "O FUNDO tem como OBJETIVO promover a equidade de gênero e proporcionar retornos absolutos no médio e longo prazo, através de investimentos realizados em ativos de renda variável e de engajamento junto às empresas elegíveis."
  Resposta: {"Origem Metodologia ASG": "interna", "Objetivo ASG": "promover a equidade de gênero", "Método ASG": ["filtros positivos", "best in class"], "Referência ASG": "n/d", "URL Referência ASG": "n/d", "Relatório ASG": "n/d"}

- Trecho completo: "O Formulário referente a metodologia ASG do FUNDO pode ser
    encontrada no site da GESTORA, conforme 'link' de acesso abaixo:
    https://www.cognitoforms.com/ANBIMA/FormulárioMetodologiaASG#RVLP8HQMqu
    U4iPNE9euhb3PY7M1jYt-QrtI2x4jKuGQ$*."
    Resposta: {"Origem Metodologia ASG": "interna", "Objetivo ASG": "n/d", "Método ASG": "n/d", "Referência ASG": "Formulário Anbima", "URL referência ASG": "https://www.cognitoforms.com/ANBIMA/FormulárioMetodologiaASG#RVLP8HQMqu
     U4iPNE9euhb3PY7M1jYt-QrtI2x4jKuGQ$*", "Relatório ASG": "n/d"}  

A resposta deve ser precisa e estruturada rigorosamente como um dicionário Python para facilitar a análise e o processamento dos dados.


    """

In [6]:
# Envia prompt à API da OpenAI para cada um dos fundos.
erros = [] 
for fundo in metadados:
    try:
        resultado_analise = analise.analisar_esg(fundo, prompt)
        resultado_analise = eval(resultado_analise)
        fundo.update(resultado_analise) # Grava o resultado entre os metadados
    except Exception as e:
        print(f"Erro ao analisar o fundo {fundo['Fundo']}: {e}")
        erros.append(fundo) # Grava possíveis erros na lista de erros
        continue
    print(f"Fundo {fundo['Fundo']} analisado.")


Fundo SICREDI ESG FIC FIE MULT analisado.
Fundo BB AÇÕES BRL PICT GLOB ENV OPP IS IE FI analisado.
Fundo SICREDI ACOES SUSTENT ESG FIC FI IS analisado.
Fundo SULAMERICA P C ESG I FC RF CRED PRIV I S analisado.
Fundo BRADESCO H FI DE AÇÕES IS SRI analisado.
Fundo BRAD FI RF CRED PRIV LP IS PERF SRI 20 analisado.
Fundo COMPASS ESG C SEL FI RF CRED PRIV LP IS analisado.
Fundo CSHG PORT ESG SUST FUT FC FI MULT IE analisado.
Fundo FRAM CAPITAL HANSSEN ESG IS FIA analisado.
Fundo PLURAL ESG IS CRED PRIV 45 FC FI RF LP analisado.
Fundo JGP ESG FC FIA analisado.
Fundo BRAM FIA IS SUST EMPRESARIAL 2 analisado.
Fundo PAND LONG BIAS ESG XP SEG FI MULT FIFE analisado.
Fundo IT NOW ISE FUNDO DE INDICE IS analisado.
Fundo ING NI ONE GL EN ESG BRL FIA BDR NIVEL I analisado.
Fundo BB ESPELHO SULAMÉRICA CRÉDITO ASG FUNDO DE INVESTIMENTO EM COTAS DE FUNDO DE INVESTIMENTO FINANCEIRO RENDA FIXA CRED PRIV IS RESP LIMITADA analisado.
Fundo SULAMERICA P C E I M FI RF CRED PRIV IS analisado.
Fundo SCHRODER BE

In [10]:
with open('../data/json/dados.json', 'w', encoding='utf-8') as f: # Salva o progresso em dados.json.
    json.dump(metadados, f, ensure_ascii=False, indent=4)

In [9]:
metadados[0].keys()

dict_keys(['CNPJ', 'Código ANBIMA', 'Patrimônio Líquido', 'Taxa de administração ao ano', 'Primeiro aporte', 'Tipo de previdência', 'Classe ANBIMA', 'Tipo ANBIMA', 'Classe CVM', 'Sub Classe CVM', 'Fundo ESG', 'Composição do fundo', 'Fundo Master', 'Estrutura de gestão', 'Benchmark', 'Foco de atuação', 'Investimento no exterior', 'Credito privado', 'Tipo de investidor', 'Característica do investidor', 'Cota de abertura', 'Fundo permite alavancagem', 'Aberto estatutariamente', 'Tributação Alvo', 'Permite aplicação automática', 'Moeda', 'Administrador', 'Gestor', 'Distribuidor', 'Custodiante', 'Controlador de ativos', 'Controlador de passivos', 'Taxa de administração máxima ao ano', 'Unidade da taxa de administração', 'Taxa composta', 'Cobra taxa performance', 'Regras da taxa de performance (não padronizada)', 'Período de cobrança da taxa de performance', 'Taxa de entrada', 'Taxa de saída', 'Regra da taxa de saída', 'Aplicação inicial mínima', 'Aplicação adicional mínima', 'Prazo para emi