# üé• An√°lise de Sentimentos em Coment√°rios do YouTube

Este notebook coleta coment√°rios de v√≠deos de um canal do YouTube, aplica **an√°lise de sentimentos em portugu√™s** utilizando um modelo pr√©-treinado da HuggingFace e apresenta uma visualiza√ß√£o da distribui√ß√£o dos sentimentos.

## üîß 1. Importa√ß√£o das bibliotecas

In [None]:
from googleapiclient.discovery import build
from transformers import pipeline
import pandas as pd
import matplotlib.pyplot as plt
import time

## ‚öôÔ∏è 2. Configura√ß√µes iniciais

- Substitua `api_key` pela sua chave da API do YouTube.
- `channel_id` define o canal que ser√° analisado.
- `max_videos` define quantos v√≠deos recentes do canal ser√£o processados.

In [None]:
import os
from dotenv import load_dotenv

# üîê Carregar vari√°veis do arquivo .env
load_dotenv()

api_key = os.getenv("YOUTUBE_API_KEY")
channel_id = os.getenv("CHANNEL_ID")
max_videos = int(os.getenv("MAX_VIDEOS", 5))


## üîå 3. Conex√£o com a API do YouTube

In [None]:
youtube = build("youtube", "v3", developerKey=api_key)

## üéØ 4. Buscar v√≠deos do canal

In [None]:
video_ids = []
search_response = youtube.search().list(
    part="id",
    channelId=channel_id,
    maxResults=max_videos,
    order="date",
    type="video"
).execute()

for item in search_response["items"]:
    video_ids.append(item["id"]["videoId"])

video_ids

['TDv56whosPQ', 'R_BmT1OJw98', 'Z4hVGCWH1Kc', 'V6In4tmd-w8', 'c2ukL_zjFCk']

## üí¨ 5. Fun√ß√£o para extrair coment√°rios

A fun√ß√£o abaixo busca at√© 100 coment√°rios do v√≠deo informado.

In [None]:
def extrair_comentarios(video_id):
    comentarios = []
    try:
        response = youtube.commentThreads().list(
            part="snippet",
            videoId=video_id,
            maxResults=100,
            textFormat="plainText"
        ).execute()

        for item in response.get("items", []):
            texto = item["snippet"]["topLevelComment"]["snippet"]["textDisplay"]
            comentarios.append(texto)

    except Exception as e:
        print(f"Erro ao buscar coment√°rios do v√≠deo {video_id}: {e}")
    return comentarios

## üß† 6. Carregar o pipeline de an√°lise de sentimentos

Modelo em portugu√™s dispon√≠vel na HuggingFace.

In [None]:
from transformers import pipeline

# üß† Pipeline de an√°lise de sentimentos em ingl√™s
sentiment_pipeline = pipeline(
    "sentiment-analysis",
    model="distilbert-base-uncased-finetuned-sst-2-english"
)


Device set to use cpu


## üìä 7. Processar coment√°rios de todos os v√≠deos

In [None]:
from transformers import pipeline

sentiment_pipeline = pipeline(
    "sentiment-analysis",
    model="nlptown/bert-base-multilingual-uncased-sentiment"
)


Device set to use cpu


## üßæ 8. Criar DataFrame e salvar resultados

In [None]:
df = pd.DataFrame(todos_dados)
df.to_csv("comentarios_sentimentos_pt.csv", index=False)
df.head()

NameError: name 'todos_dados' is not defined

## üìà 9. Visualiza√ß√£o dos sentimentos

In [None]:
plt.figure(figsize=(10,6))
df["sentimento"].value_counts().plot(kind="bar", color="lightgreen", edgecolor="black")
plt.title("Distribui√ß√£o de Sentimentos nos Coment√°rios")
plt.xlabel("Sentimento")
plt.ylabel("Frequ√™ncia")
plt.grid(True)
plt.tight_layout()
plt.show()

## ‚úÖ 10. Conclus√£o

- O notebook buscou os coment√°rios dos v√≠deos mais recentes do canal.
- Aplicou an√°lise de sentimentos em portugu√™s com modelo BERT.
- Exportou os resultados para CSV.
- Gerou gr√°fico da distribui√ß√£o de sentimentos.

Poss√≠veis melhorias:
- Processar mais v√≠deos e coment√°rios.
- Experimentar diferentes modelos de an√°lise de sentimentos.
- Criar visualiza√ß√µes mais ricas (ex.: nuvem de palavras, s√©ries temporais).