# Análise de Ações da S&P 500: Cotação + Notícias

**Objetivo**  
Dado um ticker de empresa listada na S&P 500, extrair:
1. Nome da empresa  
2. Cotação atual  
3. Últimas _n_ notícias (título e resumo)  

E depois fazer uma análise simples (comprimento dos títulos, frequência de palavras nos resumos).


## Introdução

Neste notebook vamos demonstrar como extrair, de forma totalmente automatizada, 
a cotação atual de qualquer ação da S&P 500 diretamente do Yahoo Finance, 
e em seguida fazer _web-scraping_ das últimas notícias relacionadas a essa empresa, 
também no Yahoo. Finalmente, faremos uma pequena análise exploratória de texto.


In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import matplotlib.pyplot as plt
import re
# Importação de bibliotecas
%matplotlib inline

HEADERS = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}

## Metodologia

1. Montar URL base do Yahoo Finance:  
   `https://finance.yahoo.com/quote/{ticker}`  
2. Fazer `requests.get` e parsear com BeautifulSoup.  
3. Extrair:
   - **Nome da empresa** no `<h1>` do topo.
   - **Preço atual** no primeiro `<fin-streamer data-field="regularMarketPrice">`.
   - **Notícias**: nos primeiros `<li>` de classe `js-stream-content`, pegar `<h3>` (título) e `<p>` (resumo).
4. Consolidar em um `dict` + `DataFrame`.
5. Análise simples: histogramas e _word cloud_.


In [3]:
def fetch_page(ticker: str):
    """
    Faz a requisição à página da ação no Yahoo Finance e retorna um objeto BeautifulSoup
    para scraping das informações.
    """
    url = f"https://finance.yahoo.com/quote/{ticker}/"
    headers = {"User-Agent": "Mozilla/5.0"}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, "html.parser")
    return soup

def clean_company_name(name: str) -> str:
    """
    Remove partes extras do nome da empresa, como textos entre parênteses.
    Ex.: "Apple Inc. (AAPL)" → "Apple Inc."
    """
    cleaned_name = re.sub(r"\s*\(.*?\)", "", name)
    return cleaned_name.strip()


def get_company_name(soup):
    """
    Extrai o nome da empresa a partir da tag <h1> no HTML do Yahoo Finance.
    OBS.: a classe CSS pode mudar com atualizações do site, ajuste conforme necessário.
    """
    h1_tag = soup.find("h1", class_="yf-xxbei9")
    if h1_tag:
        raw_name = h1_tag.text.strip()
        return clean_company_name(raw_name)
    return "Nome não encontrado"

# — Cell: extração de preço atual —
def get_current_price(soup):
    """
    Localiza o elemento <span> com data-testid="qsp-price" e retorna o texto com o preço.
    """
    price_span = soup.find("span", {"data-testid": "qsp-price"})
    if price_span:
        return price_span.text.strip()
    return None

def get_latest_news(ticker: str, n: int = 5) -> pd.DataFrame:
    """
    Coleta as últimas notícias via RSS do Yahoo Finance.
    Parâmetros:
      ticker: símbolo da ação (ex.: "AAPL")
      n: número de notícias a retornar
    Retorna:
      DataFrame com colunas 'titulo' e 'resumo'
    """
    rss_url = (
        "https://feeds.finance.yahoo.com/rss/2.0/headline"
        f"?s={ticker}&region=US&lang=en-US"
    )
    r = requests.get(rss_url, headers=HEADERS)
    r.raise_for_status()
    xml = BeautifulSoup(r.text, "xml")
    items = xml.find_all("item")[:n]
    dados = []
    for it in items:
        dados.append({
            "titulo":  it.title.text.strip(),
            "resumo":  it.description.text.strip()
        })
    df = pd.DataFrame(dados, columns=["titulo","resumo"])
    return df


In [4]:
def analyze_stock(ticker: str, n_news: int = 5) -> dict:
    """
    Pipeline completo para uma ação:
      1. fetch_page → obtém o HTML
      2. get_company_name → extrai nome
      3. get_current_price → extrai preço
      4. get_latest_news → extrai últimas notícias
    Retorna um dict com:
      'ticker', 'nome', 'preco_atual' e 'noticias' (DataFrame)
    """
    soup = fetch_page(ticker)
    return {
        "ticker":      ticker,
        "nome":        get_company_name(soup),
        "preco_atual": get_current_price(soup),
        "noticias":    get_latest_news(ticker, n=n_news)
    }

In [5]:
res = analyze_stock("AAPL", n_news=5)
print(f"{res['nome']} ({res['ticker']}) → Cotação: {res['preco_atual']}")
res["noticias"]


Apple Inc. (AAPL) → Cotação: 195.27


Unnamed: 0,titulo,resumo
0,Ex-Apple Engineers Behind $200M Xnor Deal Laun...,"Seattle-based ElastixAI, founded just months a..."
1,Mark Zuckerberg Once Vented Why Apple AirPods ...,Meta Platforms Inc. (NASDAQ:META) CEO Mark Zuc...
2,Dan Ives Fires Back: Trump’s Apple Plan Needs ...,"On Friday, May 23, Wedbush analyst Dan Ives re..."
3,Trump threatens Apple Inc. (AAPL) with New Tar...,President Trump has threatened Apple Inc. (NAS...
4,"Trump Trade: Trump considers 50% tariff on EU,...",Catch up on the top industries and stocks that...


## Extração para vários tickers

Você pode carregar uma lista de tickers da S&P 500 (ex: CSV oficial) ou usar um subset manual abaixo.

In [6]:
tickers = ["AAPL", "MSFT", "GOOGL"]
todos = [analyze_stock(t, n_news=3) for t in tickers]
#Tranformando os retornos da última função em um DataFrame para facilitar a visualização
df_prices = pd.DataFrame([
    {"ticker": r["ticker"], "nome": r["nome"], "preco_atual": r["preco_atual"]}
    for r in todos
])
df_prices

Unnamed: 0,ticker,nome,preco_atual
0,AAPL,Apple Inc.,195.27
1,MSFT,Microsoft Corporation,450.18
2,GOOGL,Alphabet Inc.,168.47


## Análise exploratória de Sentimento
Vamos ver a análise de sentimento da ação baseado nas notícias relacionados ao Ticker da ação.

In [7]:
import openai
from openai import AzureOpenAI
#Importando a biblioteca openai para fazer chamadas à API do Azure OpenAI

In [8]:
client = AzureOpenAI(
    api_key="13JQ7jW0IvRU38ZvFr4WK12I2guNFINq5Xv1dyLxsj6E9HksmNH2JQQJ99BDACfhMk5XJ3w3AAAAACOGLSYU",
    api_version="2024-12-01-preview",
    azure_endpoint="https://valer-m8yo6ng0-swedencentral.cognitiveservices.azure.com/openai/deployments/gpt-4o_MacielVidal_Chave1/chat/completions?api-version=2025-01-01-preview"
)
#Configurando o cliente Azure OpenAI com a chave de API e o endpoint

In [9]:
def sentimento_geral_noticias(df_noticias, cotacao, client, deployment_name="gpt-4o_MacielVidal_Chave1"):
    """
    Analisa o sentimento geral de todas as notícias e da cotação usando a API do ChatGPT.
    Retorna uma string com o sentimento geral e uma breve explicação.

    Parâmetros:
        df_noticias: DataFrame com colunas 'titulo' e 'resumo'
        cotacao: valor atual da cotação da ação (str ou float)
        client: instância do AzureOpenAI já autenticada
        deployment_name: nome do deployment do modelo (default: gpt-4o_MacielVidal_Chave1)
    """
    # Junta todas as notícias em um único texto
    textos = []
    for idx, row in df_noticias.iterrows():
        textos.append(f"Título: {row['titulo']}\nResumo: {row['resumo']}")
    texto_completo = "\n\n".join(textos)

    prompt = (
        "Considere as notícias e a cotação abaixo sobre uma empresa. "
        "Analise o sentimento geral (positivo, negativo ou neutro) e explique brevemente o porquê. "
        "Leve em conta tanto o conteúdo das notícias quanto o valor da cotação. "
        "Responda em português.\n\n"
        f"Cotação atual: {cotacao}\n\n"
        f"{texto_completo}"
    )

    response = client.chat.completions.create(
        model=deployment_name,
        messages=[{"role": "user", "content": prompt}],
        max_tokens=150,
        temperature=0
    )
    return response.choices[0].message.content.strip()

In [10]:
# Lista de tickers das empresas que você quer analisar
tickers = ["AAPL", "MSFT", "GOOGL", "AMZN", "META"]

resultados = []

for ticker in tickers:
    res = analyze_stock(ticker, n_news=5)
    sentimento = sentimento_geral_noticias(res["noticias"], res["preco_atual"], client)
    resultados.append({
        "ticker": ticker,
        "nome": res["nome"],
        "cotacao": res["preco_atual"],
        "sentimento": sentimento
    })

# Exibir os resultados
for r in resultados:
    print(f"\n--- {r['nome']} ({r['ticker']}) ---")
    print(f"Cotação: {r['cotacao']}")
    print(f"\n{r['sentimento']}")


--- Apple Inc. (AAPL) ---
Cotação: 195.27

**Sentimento Geral: Negativo**

**Análise:**

1. **Cotação Atual**: A cotação de 195,27 não fornece, por si só, um indicativo claro de sentimento, mas o contexto das notícias é essencial para interpretar o impacto potencial no preço das ações.

2. **Notícias Positivas**:
   - A primeira notícia sobre a startup ElastixAI, fundada por ex-engenheiros da Apple, é positiva, mas não está diretamente relacionada à Apple. Embora mencione a empresa, o foco está na nova startup e em sua inovação no campo de IA, o que não afeta diretamente o desempenho ou a percepção da Apple.

3. **Notícias Negativas**:
   - As demais

--- Microsoft Corporation (MSFT) ---
Cotação: 450.18

**Sentimento geral: Positivo**

**Análise:**

1. **Notícias relacionadas à Microsoft (MSFT):**
   - A principal notícia destaca que a FTC encerrou sua oposição à aquisição da Activision Blizzard pela Microsoft, consolidando o maior negócio da história da indústria de videogames. Isso 

## Conclusão

- Extraímos nome, preço e notícias de qualquer ação da S&P 500 usando só requests+BS4.  
- Vimos como histogramas e contagem de palavras dão insight rápido sobre o texto.  
- Em próximos passos, poderíamos adicionar análise de sentimento, séries históricas de preço, etc.
