# <u>GERADOR MORNING CALLS</u> 

O programa é uma exploração inicial da API da OpenAI. A ideia é gerar um morning call do mercado através de demais fontes

#### O que o programa faz:
1. Acessa o conteúdo das morning calls da Órama e XP;
2. Resume separadamente cada morning call;
3. Usa o ChatGPT para criar um texto no formato de morning call baseado nos tópicos;
4. Separa o texto no contexto do Brasil e exterior e exclui parágrafos não relevantes.

Pontos de atenção:

* O ChatGPT limita cada completion por um número de tokens (acho que 4000, somando perguntas e respostas). Até então este valor nunca foi ultrapassado, provavelmente algo maior que isso é até muita coisa para ler de qualquer forma;
* O ChatGPT limita o número de completions em 3 por minuto, então caso rode mais que isso ele da um erro, é só esperar um tempo e rodar novamente.
* Os resultados ainda estão longe de automatizados, são necessários muitos ajustes manuais de classificação de Brasil/externo e coerência.
* Alguns dados são divulgados depois que as fontes divulgam o morning call. Nestes casos é necessário pesquisar manualmente sobre a divulgação e pode ser inputados na função "one_paragraph_summary" que resume em um parágrafo.

# 0. Import Libraries and Preparation

In [None]:
import re
import time 
import requests

from tqdm import tqdm
from bs4 import BeautifulSoup
from datetime import datetime
from newspaper import Article

## OpenAI Data
import openai
openai.api_key = 'YOUR OPENAI KEY'

## Date
today = datetime.today().strftime('%m/%d/%Y')
print(today)

In [None]:
def get_text_piece(text, starts, ends):
    """
    Get paragraphs from the text that are
    between the string "starts" and "ends"
    (not included)
    
    """
    return text.split(starts)[1].split(ends)[0]

In [None]:
def newspaper_text_extraction(file_url):
    """
    Extract text from URL
    
    """
    article = Article(file_url)
    article.download()
    article.parse()
    
    text = article.text
    
    ## Correction for XP case
    if article.text.startswith('SOBRE O EVENTO') or article.text.startswith('Disclaimer'):
        text = get_text_piece(article.html,
                              '<h2 class="wp-block-heading" id="destaque-do-dia-ou-intertitulo-1">',
                              'Empresas</span></h2>')
        
        text = re.sub(r'<.*?>', '', text)
        text = text.replace('\t', '')
        text = re.sub(r'\n{3,}', '\n\n', text)
    
    return text

## 1. Getting Morning Call Sources

In [None]:
## Extract Órama Morning Call
link_orama = 'https://analise.orama.com.br/panorama-diario-3/'
MC_orama = newspaper_text_extraction(link_orama)


## Extract XP Morning Call
link_xp_base = 'https://conteudos.xpi.com.br/morning-call/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36'}

request = requests.get(link_xp_base, headers=headers)
soup = BeautifulSoup(request.content, 'html.parser')

link_xp = soup.find('a', class_='bloco-materia box-rounded')['href']

MC_xp = newspaper_text_extraction(link_xp)
MC_xp = MC_xp.split('\n\nEmpresas')[0]

# 2. Generate Topics

In [None]:
def extract_interest_topics(text, words_out, range_min, range_max):
    paragraphs = text.split('\n\n')[range_min:range_max]
    final_paragraphs = []
    
    for paragraph in paragraphs:
        keep_paragraph = True
        
        for word in words_out:
            if word in paragraph.lower():
                keep_paragraph = False
        
        if keep_paragraph:
            final_paragraphs.append(paragraph)

    return '\n\n'.join(final_paragraphs)

In [None]:
completion = openai.ChatCompletion.create(model='gpt-3.5-turbo',
                                          messages=[{'role': 'system',
                                                     'content': 'You are an Asset Manager and Investment Advisor'},
                                                    {'role': 'user',
                                                     'content': 'Baseado no texto:\n\n' + MC_orama + '\n\nEscreva um \
                                                                 resumo comentando sobre o cenário de forma completa'}])

summary_orama = completion['choices'][0]['message']['content']
time.sleep(30)

print(summary_orama)

In [None]:
completion = openai.ChatCompletion.create(model='gpt-3.5-turbo',
                                          messages=[{'role': 'system',
                                                     'content': 'You are an Asset Manager and Investment Advisor'},
                                                    {'role': 'user',
                                                     'content': 'Baseado no texto:\n\n' + MC_xp + '\n\nEscreva um \
                                                                 resumo comentando sobre o cenário de forma completa'}])

summary_xp = completion['choices'][0]['message']['content']
time.sleep(30)

print(summary_xp)

In [None]:
completion = openai.ChatCompletion.create(model='gpt-3.5-turbo',
                                          messages=[{'role': 'system',
                                                     'content': 'You are an Asset Manager and Investment Advisor'},
                                                    {'role': 'user',
                                                     'content': 'Baseado nos resumos:\n\n' + summary_orama + '\n\n' +
                                                                 summary_xp + '\n\nEscreva uma carta comentando sobre \
                                                                 o cenário de forma completa'}])

todays_text = completion['choices'][0]['message']['content']
time.sleep(10)

print(todays_text)

In [None]:
todays = extract_interest_topics(todays_text, [], 2, -3)
print(todays)

# 3. Generate Morning Call

In [None]:
def separate_topic_paragraphs(text, BR_keywords):
    paragraphs = text.split('\n\n')
    BR_topics = []
    EX_topics = []
    
    for paragraph in paragraphs:
        keep_paragraph = False
        
        for keyword in BR_keywords:
            if keyword in paragraph.lower():
                keep_paragraph = True
                continue
                
        if keep_paragraph:
            BR_topics.append(paragraph)
        else:
            EX_topics.append(paragraph)
    
    return BR_topics, EX_topics

In [None]:
BR_topics, EX_topics = separate_topic_paragraphs(todays, ['brasil', 'brasília', 'lula', 'bolsonaro', 'pacheco', 'haddad'])
BR_topics = [paragraph.split('No Brasil, ')[1][0].upper() + 
             paragraph.split('No Brasil, ')[1][1:] if paragraph.startswith('No Brasil, ') \
                                                   else paragraph for paragraph in BR_topics]

BR_flag = '\U0001F1E7\U0001F1F7'
globe = '\U0001F310'

BR_text = '\n\n'.join([BR_flag + ' ' + topic for topic in BR_topics])
EX_text = '\n\n'.join([globe  + ' ' + topic for topic in EX_topics])

# Output text
MC = '*Destaques do dia*\n\n' + BR_text + '\n\n' + EX_text
print(MC)