<a href="https://colab.research.google.com/github/BDonadelli/Finance-playground/blob/main/C%C3%B3pia_de_sentiment_analysis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análise de Sentimento de Mercado com IA usando Python


Ler notícias diárias sobre empresas e ações listadas na bolsa pode ser maçante e cansativo. Mas, e se houvesse uma maneira de simplificar todo esse processo? Mostraremos como a IA generativa pode ajudar a captar o sentimento de notícias sobre companhias, automatizando todo o processo com Python e Gemini.

## Introdução

O maior desafio para qualquer analista do mercado de ações é compreender o que uma notícia ou relatório realmente indica. Isso ocorre porque ler muitas páginas ao longo de um dia ou até mesmo durante uma semana inteira pode tornar a interpretação das informações confusa. Além disso, a redação desses comunicados pode não facilitar o trabalho, podendo até mesmo complicá-lo.

É por isso que o uso da técnica de Análise de Sentimentos com IA pode ser extremamente útil para aumentar a produtividade de qualquer profissional, ajudando na compreensão de diversos textos de notícias e relatórios.

## Como funciona a Análise de Sentimentos?

Análise de Sentimentos é uma técnica de Processamento de Linguagem Natural (PLN) usada para identificar e extrair emoções e opiniões expressas em textos. Essa técnica é amplamente utilizada para compreender a atitude emocional de um autor em relação a um tópico específico, seja ele positivo, negativo ou neutro.

Portanto, o objetivo principal deste exercício é capturar notícias sobre empresas, obtidas através do Yahoo Finance, e realizar a análise de sentimento dessas notícias, além de gerar um resumo. Todo o procedimento é realizado utilizando Python, possibilitando a automação da coleta de dados, processamento, formatação e interação com a API.


## Passo 01: bibliotecas de Python

Para quantificar o sentimento das notícias com IA, utilizaremos as seguintes bibliotecas no Python:

- yfinance para conectar com a API do Yahoo Finance
- textwrap para manipular e formatar texto de maneira mais conveniente
- requests para requisitar o link
- BeautifulSoup para realizar o Scrap das notícias
- google.generativeai para conectar o Gemini

In [None]:
!pip install -q -U google-generativeai

In [None]:
import yfinance as yf
import textwrap
import requests
from bs4 import BeautifulSoup
from IPython.display import display
from IPython.display import Markdown
import google.generativeai as genai

## Passo 02: autenticação na API do Google

Para utilizar o modelo de inteligência artificial Gemini, é necessário obter uma chave de token na plataforma Google AI Studio (veja mais informações [aqui](https://analisemacro.com.br/data-science/como-usar-o-google-ai-studio-e-o-gemini/)).

Com a chave de token em mãos, defina uma variável de ambiente com nome GOOGLE_API_KEY para armazenar a chave.

Atenção: a utilização da API do Google pode acarretar custos. Verifique o site da empresa para mais informações.

In [None]:
genai.configure(api_key = "AIzaSyBlpqydzs_bioOgr1gSf2HtysVwNKS5-XE") # COLOQUE AQUI SUA CHAVE TOKEN DO GOOGLE AI STUDIO

## Passo 03: obtenção das noticiais via Yahoo Finance

Para analisar o sentimento das noticiais é necessário obter os textos contidos nas páginas do Yahoo Finance. Para isso, obtemos o acesso a API do Yahoo Finance usando a biblioteca yfinance. Em seguida, requisitamos o acesso a API e extraímos o conteúdo da página.

In [None]:
# Definir uma função para converter texto em formato Markdown
def to_markdown(text):
    # Substituir o marcador '•' por '*', que é o formato de lista no Markdown
    text = text.replace('•', '  *')
    # Escapar o símbolo '$' no texto para evitar que seja interpretado como uma chave no Markdown
    text = text.replace('$', r'\$')
    # Retornar o texto formatado em Markdown, com cada linha indentada com '> '
    return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

In [None]:
# Definir o símbolo do ticker da ação
symbol = 'AAPL'

# Obter informações do ticker usando a biblioteca yfinance
ticker = yf.Ticker(symbol)

# Obter as últimas manchetes de notícias relacionadas ao símbolo da ação especificada
news_data = ticker.news

# Inicializar uma lista para armazenar os links das notícias
links = []

# Iterar sobre os itens de notícias obtidos, começando do índice 1
for idx, news_item in enumerate(news_data, start=1):
    # Obter o título da notícia
    title = news_item['title']
    # Obter o link da notícia
    link = news_item['link']
    # Adicionar o link à lista de links
    links.append(link)
    # Imprimir o título da notícia com o índice
    print(f"Headline {idx}: {title}")
    # Imprimir o link da notícia
    print(f"URL: {link}\n")

Headline 1: Apple iPhone 16, Other Devices in Line With Expectations Leading to Anticlimactic Launch, UBS Says
URL: https://finance.yahoo.com/news/apple-iphone-16-other-devices-163628324.html

Headline 2: European Equities Close Lower in Tuesday Trading; Apple, Google Lose Appeals Against European Commission
URL: https://finance.yahoo.com/news/european-equities-close-lower-tuesday-162613995.html

Headline 3: Top Midday Stories: Apple, Google Dealt Losses by EU's Highest Court; Fed Plans to Lower Capital Hikes for Biggest Banks Under New Rules
URL: https://finance.yahoo.com/news/top-midday-stories-apple-google-162608368.html

Headline 4: Apple Intelligence Won't Be Available For iPhone 16 Launch
URL: https://finance.yahoo.com/m/c093a6af-8920-3f78-b47f-378fc65bc701/apple-intelligence-won%27t-be.html

URL: https://finance.yahoo.com/m/605657ef-f9c9-311f-98eb-c660b8d1ba7f/dow-jones-weighed-down-by.html

Headline 6: These Stocks Are Moving the Most Today: Oracle, Apple, DJT, Goldman, JPMorga

In [None]:
# Definir uma função para fazer scraping do conteúdo de um link
def scrap_content(link):
    # Fazer uma requisição GET para o link fornecido
    response = requests.get(link)

    # Verificar se a requisição foi bem-sucedida (código de status 200)
    if response.status_code == 200:
        # Parsear o conteúdo HTML da resposta
        soup = BeautifulSoup(response.text, 'html.parser')
        # Encontrar a div com a classe 'caas-body' que contém o artigo
        article_content = soup.find('div', {'class': 'caas-body'})
        # Extrair o texto do artigo
        article_text = article_content.get_text()
        # Imprimir o texto do artigo
        print(article_text)
        # Retornar o texto do artigo
        return article_text

    # Caso a requisição não tenha sido bem-sucedida
    else:
        # Imprimir uma mensagem de erro com o link
        print(f'Falha ao buscar o artigo {link}. Verifique a URL ou sua conexão com a internet.')
        # Retornar None para indicar falha
        return None

In [None]:
# Inicializar uma variável para armazenar o texto dos artigos
articles_text = ''

# Iterar sobre os primeiros 8 links da lista de links
for link in links[:7]:
    # Chamar a função scrap_content para obter o conteúdo do link
    content = scrap_content(link)
    # Verificar se o conteúdo não é None (se a função retornou algum texto)
    if content != None:
        # Adicionar o conteúdo do artigo à variável articles_text, com um espaço antes
        articles_text += " " + content

Apple iPhone 16, Other Devices in Line With Expectations Leading to Anticlimactic Launch, UBS Says
European Equities Close Lower in Tuesday Trading; Apple, Google Lose Appeals Against European Commission
Top Midday Stories: Apple, Google Dealt Losses by EU's Highest Court; Fed Plans to Lower Capital Hikes for Biggest Banks Under New Rules
Falha ao buscar o artigo https://finance.yahoo.com/m/c093a6af-8920-3f78-b47f-378fc65bc701/apple-intelligence-won%27t-be.html. Verifique a URL ou sua conexão com a internet.
Falha ao buscar o artigo https://finance.yahoo.com/m/605657ef-f9c9-311f-98eb-c660b8d1ba7f/dow-jones-weighed-down-by.html. Verifique a URL ou sua conexão com a internet.
Oracle stock rises after quarterly earnings and revenue top Wall Street estimates, Apple falls after the European Court of Justice says the tech giant must pay back billions of dollars in taxes, and Trump Media trades higher ahead of the first debate between former President Trump and Vice President Kamala Harris. C

In [None]:
to_markdown(articles_text)

>  Apple iPhone 16, Other Devices in Line With Expectations Leading to Anticlimactic Launch, UBS Says European Equities Close Lower in Tuesday Trading; Apple, Google Lose Appeals Against European Commission Top Midday Stories: Apple, Google Dealt Losses by EU's Highest Court; Fed Plans to Lower Capital Hikes for Biggest Banks Under New Rules Oracle stock rises after quarterly earnings and revenue top Wall Street estimates, Apple falls after the European Court of Justice says the tech giant must pay back billions of dollars in taxes, and Trump Media trades higher ahead of the first debate between former President Trump and Vice President Kamala Harris. Continue reading View comments

## Passo 04: prompt

Para que o modelo de inteligência artificial quantifique o sentimento do texto, é fundamental definir uma instrução clara sobre o que e como deve ser feito. Esse procedimento é feito seguindo estas etapas:

- Definir qual modelo será utilizado e com quais configurações (aqui utilizamos o Gemini Pro).
- Instruir o modelo de inteligência artificial para o que se pede em relação ao texto da notícia. Podemos usar um básico como exemplo:
 "Analise o sentimento do texto a seguir e forneça detalhes

In [None]:
model = genai.GenerativeModel(
  model_name = "gemini-1.0-pro",
)

response = model.generate_content(f"Analise o sentimento do texto a seguir e forneça detalhes:\n {articles_text}")
to_markdown(response.text)

> **Sentimento:** Negativo
> 
> **Detalhes:**
> 
> * O texto menciona uma "lançamento anticlimático" do iPhone 16 da Apple.
> * Menciona que as "ações da Apple caíram" após uma decisão da UE.
> * O texto destaca que a Apple, juntamente com o Google, "sofreu perdas" na decisão da UE.
> * O fato de o texto estar na seção "Top Midday Stories" também sugere que a notícia é significativa e potencialmente negativa para as principais empresas.