---

# **Processamento de Linguagem Natural (2025-Q3)**

---

Prof. Alexandre Donizeti Alves






---

### **EQUIPE**

---

**INTEGRANTES DO GRUPO:**


**Integrante 01:**

- Vitor Vieira Fernandes
- 11202130698

**Integrante 02:**

- Douglas Rodrigues Costa
-

**Integrante 03:**

- Matheus Calixto Viana
-


---

### **GRANDE MODELO DE LINGUAGEM (*Large Language Model - LLM*)**

---



>


**LLM**: Google Gemini (gemini-flash-latest)

>

**Link para a documenta√ß√£o oficial**: https://ai.google.dev/gemini-api/docs/models?hl=pt-br


---
### **API**
---


**API**: Steam User Reviews API (Parte da Steam Storefront API)

**Site oficial**: https://store.steampowered.com/

**Link para a documenta√ß√£o oficial**: https://partner.steamgames.com/doc/store/getreviews


---
### **DESCRI√á√ÉO**
---

Este projeto implementa um notebook no Google Colab que integra o framework LangChain com o LLM Google Gemini para realizar uma an√°lise aprofundada de reviews de jogos feitas por usu√°rios da plataforma Steam. O sistema processa o texto, e cria uma experi√™ncia multim√≠dia ao converter a an√°lise em √°udio com entona√ß√£o emocional.

O fluxo de trabalho consiste em:

- **Coleta de Dados:** Obten√ß√£o de reviews reais de jogos populares via Steam API.

- **Filtragem Inteligente:** Sele√ß√£o aleat√≥ria de reviews de qualidade (com base no tamanho do texto) para evitar spam ou avalia√ß√µes vazias.

- **Processamento de Linguagem Natural (PLN):** Aplica√ß√£o de m√∫ltiplas t√©cnicas para extrair intelig√™ncia do texto bruto.

T√©cnicas de PLN Utilizadas:

- **An√°lise de Sentimentos:** O modelo classifica a opini√£o do jogador como Positiva, Negativa ou Mista/Neutra, identificando a polaridade emocional do texto.

- **Sumariza√ß√£o de Textos e Extra√ß√£o de T√≥picos:** O sistema gera uma "Breve An√°lise" do review e extrai explicitamente os "Pontos Positivos" e "Pontos Negativos" citados pelo jogador, estruturando dados n√£o estruturados.

- **Gera√ß√£o de Fala (Text-to-Speech) com Emo√ß√£o:** Como diferencial criativo, o projeto utiliza o modelo Gemini TTS para narrar o review original. A narra√ß√£o adapta o tom de voz (animado, cr√≠tico, neutro) automaticamente com base no sentimento detectado na etapa de an√°lise.

Link para o reposit√≥rio no GitHub:

https://github.com/vitimbro/projeto-processamento-linguagem-natural

-----

## 1\. Configura√ß√£o do Ambiente e Chaves de API

---

Para que este notebook funcione, ele precisa se comunicar com a API do Google Gemini. Para isso, √© necess√°rio fornecer uma chave de API pessoal.

**Este notebook foi configurado para N√ÉO salvar sua chave diretamente no c√≥digo, garantindo sua seguran√ßa.**

Siga os passos abaixo para configurar sua chave:

### Passo 1: Obtenha sua Chave da API do Gemini

1.  Acesse o **[Google AI Studio](https://makersuite.google.com/app/apikey)**.
2.  Fa√ßa login com sua conta Google.
3.  Clique em **"Create API key"** (Criar chave de API) para gerar uma nova chave.
4.  Copie a chave gerada. Ela √© uma longa sequ√™ncia de letras e n√∫meros.

### Passo 2: Armazene a Chave no Colab Secrets

1.  Na barra lateral esquerda deste notebook, clique no √≠cone de chave ( **üîë** ) para abrir a aba de **"Secrets"** (Gerenciador de secrets).
2.  Clique em **"+ Adicionar novo secret"**.
3.  No campo `name` (nome), digite exatamente:
    ```
    GOOGLE_API_KEY
    ```
4.  No campo `value` (valor), cole a sua chave de API que voc√™ copiou do Google AI Studio.
5.  Ative o bot√£o (slider) ao lado do nome para permitir que o notebook acesse este secret.

Pronto\! Agora, ao executar as c√©lulas de c√≥digo abaixo, ela ir√° carregar sua chave de forma segura sem nunca exp√¥-la.



---




### 1.1 Instala√ß√£o das Bibliotecas e Depend√™ncias

Esta c√©lula √© respons√°vel por preparar o ambiente de desenvolvimento no Google Colab, instalando todas as ferramentas externas necess√°rias para o funcionamento do projeto.


- `google-generativeai`: O SDK oficial para acessar a API do Google Gemini.

- `langchain` e `langchain-google-genai`: O framework utilizado para orquestrar o fluxo da aplica√ß√£o e integrar o LLM.

- `requests`: Biblioteca utilizada para fazer a conex√£o e baixar os dados da API da Steam.


In [1]:
%%capture
# 1.1 Instala√ß√µes

# Esta c√©lula instala todas as bibliotecas necess√°rias.

# NOTA: √â comum o Colab gerar um AVISO sobre um "conflito de depend√™ncia"
# Este aviso √© esperado e n√£o impede a execu√ß√£o do projeto.

!pip install -q -U google-generativeai langchain-google-genai langchain requests



---




### 1.2 Importa√ß√µes e Configura√ß√£o da API

Esta c√©lula √© o "motor de partida" do nosso projeto. Ela realiza duas fun√ß√µes cr√≠ticas: carrega as ferramentas (bibliotecas) que vamos usar e autentica nossa conex√£o com a Intelig√™ncia Artificial do Google.

**Principais A√ß√µes do C√≥digo:**

- * `google.generativeai`: O SDK que nos permite conversar com o modelo Gemini.

- * `requests`: Permite que o Python "navegue na internet" para buscar os dados da Steam.

- * `google.colab.userdata`: Uma ferramenta espec√≠fica do Colab para acessar dados sens√≠veis de forma segura.

**Seguran√ßa (Secrets)**:

- A linha `userdata.get('GOOGLE_API_KEY')` √© crucial. Ela busca a chave que voc√™ salvou na aba "Secrets" do Colab.

- Isso garante que sua chave de API **nunca fique vis√≠vel** no c√≥digo, prevenindo o uso indevido por terceiros caso voc√™ compartilhe o notebook.


In [2]:
# 1.2 Importa√ß√µes e Configura√ß√£o da API

import os
import requests
import google.generativeai as genai
from google.colab import userdata

from google.genai import types

print("Configurando a chave da API do Google...")
try:
    # Carrega a chave de API a partir do 'Secrets' do Colab
    os.environ['GOOGLE_API_KEY'] = userdata.get('GOOGLE_API_KEY')
    genai.configure(api_key=os.environ['GOOGLE_API_KEY'])
    print("‚úÖ Chave da API configurada com sucesso!")
except Exception as e:
    print(f"üö® Erro ao configurar a chave: {e}")
    print("Verifique se voc√™ criou o secret 'GOOGLE_API_KEY' corretamente.")

Configurando a chave da API do Google...
‚úÖ Chave da API configurada com sucesso!




---




### 1.3 Teste de Conex√£o com o Gemini

Esta etapa √© uma **verifica√ß√£o de seguran√ßa** (sanity check). Seu objetivo √© confirmar se a chave de API fornecida √© v√°lida e se o notebook consegue se comunicar com os servidores do Google antes de iniciarmos a an√°lise de dados.

* **Ping na API:** O c√≥digo executa a fun√ß√£o `genai.list_models()`. Esta fun√ß√£o pede ao Google a lista de todos os modelos de IA dispon√≠veis para a sua conta.

* **Sa√≠da Limpa:** Para evitar poluir a tela, o comando que imprimiria os nomes (`print(model.name)`) foi deixado como um **coment√°rio** (`#`). O loop acontece apenas para testar a conex√£o.


In [14]:
# 1.3 Teste de Conex√£o com o Gemini

print("Testando a conex√£o com a API do Gemini...")
try:
    # O loop abaixo testa a autentica√ß√£o.
    for model in genai.list_models():
        if 'generateContent' in model.supported_generation_methods:
            # Se quiser ver a lista de modelos dispon√≠veis, descomente a linha abaixo:
            # print(model.name)
            pass

    print("\n‚úÖ Conex√£o com o Gemini bem-sucedida!")
except Exception as e:
    print(f"üö® Falha na conex√£o com o Gemini: {e}")

Testando a conex√£o com a API do Gemini...

‚úÖ Conex√£o com o Gemini bem-sucedida!




---




### 1.4 Teste de Conex√£o com a API da Steam

Ap√≥s confirmar o acesso √† IA, esta c√©lula verifica se conseguimos extrair dados da nossa fonte: a loja da Steam. Diferente do Gemini, esta √© uma API p√∫blica que n√£o requer chave de autentica√ß√£o, mas exige uma formata√ß√£o correta da URL.

**O que este c√≥digo faz:**

* **Define um Alvo:** Utilizamos o ID `1086940` (do jogo *Baldur's Gate 3*) como caso de teste.
* **Configura a Requisi√ß√£o:** Monta a URL do endpoint `appreviews` e define par√¢metros vitais:

    * `json=1`: Para receber os dados em formato estruturado.

    * `num_per_page=1`: Solicitamos apenas uma review para economizar banda neste teste.

    * `language='brazilian'`: Filtra apenas reviews em Portugu√™s do Brasil.

* Se tudo der certo, imprime um trecho da review coletada, provando que temos acesso aos dados brutos de texto (nosso *corpus*) para a an√°lise de PLN.

In [4]:
# 1.4 Teste de Conex√£o com a API da Steam

print("Testando a conex√£o com a API da Steam...")
# Usando o appid de 'Baldur's Gate 3' como exemplo
appid_teste = 1086940
url_steam = f"https://store.steampowered.com/appreviews/{appid_teste}"
params = {'json': 1, 'num_per_page': 1, 'language': 'brazilian'}

try:
    response = requests.get(url_steam, params=params)
    if response.status_code == 200:
        review_data = response.json()
        if review_data.get('success') == 1:
            print("‚úÖ Conex√£o com a Steam bem-sucedida!")
            # Imprime um trecho da primeira review encontrada
            print("\nExemplo de review obtida:")
            print(review_data['reviews'][0]['review'][:300] + "...")
        else:
             print(f"üö® A API da Steam respondeu com um erro: {review_data.get('query_summary')}")
    else:
        print(f"üö® Erro na requisi√ß√£o HTTP: Status Code {response.status_code}")
except Exception as e:
    print(f"üö® Falha na conex√£o com a Steam: {e}")

Testando a conex√£o com a API da Steam...
‚úÖ Conex√£o com a Steam bem-sucedida!

Exemplo de review obtida:
Esse jogo √© t√£o bom que eu tinha o pirata e fiz quest√£o de comprar e rejogar ele. 
Isso n√£o √© um jogo, √© uma obra de arte. 
Suga sua vida, voc√™ vai sonhar com a parada e pensar enquanto n√£o tiver jogando. 
Acabei de zerar de novo e j√° to planejando minha pr√≥xima run.
Apenas joguem....


---
# 2. Obten√ß√£o de Dados via API
---


Esta c√©lula define a fun√ß√£o principal do projeto, `obter_reviews_steam`, que atua como a ponte entre o nosso c√≥digo e a base de dados da Steam.

**Destaques da Implementa√ß√£o:**

* **Par√¢metros da Requisi√ß√£o:** Configuramos a chamada √† API com filtros espec√≠ficos:

    * `filter='recent'`: Garante que estamos pegando opini√µes atuais sobre o jogo.

    * `language='brazilian'`: Restringe a busca para reviews em **Portugu√™s do Brasil**, facilitando a an√°lise pelo LLM e a compreens√£o do p√∫blico alvo.

    * `num_per_page`: Define quantos reviews queremos baixar (o padr√£o √© 100).

* **Extra√ß√£o e Simplifica√ß√£o:**

    * O c√≥digo recebe um JSON complexo da Steam contendo muitas informa√ß√µes (autor, tempo de jogo, votos, etc.).

    * Nesta vers√£o simplificada, iteramos sobre os resultados e extra√≠mos **apenas o texto da review** (`review_data['review']`), armazenando-o em uma lista de strings. Isso torna o processamento posterior mais leve.

* **Teste Imediato:** Ao final da c√©lula, executamos um teste pr√°tico buscando reviews do jogo *Stardew Valley* (ID 413150). Isso serve para confirmar visualmente que a conex√£o com a API foi bem-sucedida e que os dados est√£o chegando corretamente.

In [5]:
# 2. Fun√ß√£o para obter reviews da Steam (Vers√£o Simplificada)

def obter_reviews_steam(appid, quantidade=100):
    """
    Busca uma quantidade maior de reviews recentes de um jogo na Steam.
    Retorna uma lista contendo apenas os textos das reviews.
    """
    print(f"Buscando um lote de at√© {quantidade} reviews para o jogo ID: {appid}...")
    url = f"https://store.steampowered.com/appreviews/{appid}"
    params = {
        'json': 1,
        'filter': 'recent',
        'language': 'brazilian',
        'num_per_page': quantidade, # Pede um n√∫mero maior de reviews
        'review_type': 'all'
    }

    try:
        response = requests.get(url, params=params)
        response.raise_for_status()
        data = response.json()

        lista_de_textos = [] # Retornar√° apenas os textos
        if data.get('success') == 1 and 'reviews' in data:
            for review_data in data['reviews']:
                # Adiciona apenas a string de texto da review
                lista_de_textos.append(review_data['review'])

            print(f"‚úÖ {len(lista_de_textos)} reviews obtidas com sucesso!")
            return lista_de_textos
        else:
            print("üö® A API da Steam n√£o retornou reviews para este jogo.")
            return []
    except requests.exceptions.RequestException as e:
        print(f"üö® Erro ao acessar a API da Steam: {e}")
        return []

# --- Exemplo de uso da fun√ß√£o ---
# ID de Stardew Valley: 413150
id_do_jogo_alvo = 413150
lista_de_reviews = obter_reviews_steam(id_do_jogo_alvo, quantidade=5)

# Imprime um trecho da primeira review para verificar
if lista_de_reviews:
    print("\n--- Exemplo de Review ---")
    print(lista_de_reviews[0][:500] + "...")

Buscando um lote de at√© 5 reviews para o jogo ID: 413150...
‚úÖ 5 reviews obtidas com sucesso!

--- Exemplo de Review ---
E liegal cara(a ultima parte ruim e que n√£o podemos pegar casadas)...


---
# 3. Aplica√ß√£o das T√©cnicas de PLN
---

### Configura√ß√£o do LangChain e Defini√ß√£o das Tarefas

Esta c√©lula √© o "c√©rebro" do projeto. Aqui, integramos o poder do Google Gemini com a estrutura do framework LangChain para definir exatamente como as reviews devem ser analisadas.

**O que o c√≥digo faz:**

1.  **Inicializa√ß√£o do Modelo (LLM):**

    * Utilizamos o `ChatGoogleGenerativeAI` para carregar o modelo **`gemini-flash-latest`**.

    * **Por que este modelo?** O modelo "Flash" √© otimizado para velocidade e efici√™ncia, possuindo uma cota gratuita muito maior (1500 requisi√ß√µes/minuto).

    * **`temperature=0.2`**: Definimos uma temperatura baixa. Isso torna o modelo mais "focado" e determin√≠stico, reduzindo a criatividade excessiva (alucina√ß√µes) e garantindo que ele extraia apenas o que est√° realmente no texto.

2.  **Engenharia de Prompt (Prompt Engineering):**

    * O `prompt_unico_template` √© a instru√ß√£o detalhada que enviamos √† IA.

    * Unificamos as tarefas (An√°lise de Sentimentos + Extra√ß√£o de Aspectos) em um √∫nico pedido para economizar recursos.

    * **Regras Estritas:** Inclu√≠mos diretrizes como *"Seja Literal"* e *"N√£o fa√ßa suposi√ß√µes"* para garantir que a an√°lise seja fiel √† opini√£o do jogador.

    * **Formata√ß√£o:** Instru√≠mos o modelo a usar **negrito** nos t√≠tulos, facilitando a leitura da sa√≠da final.

3.  **Cria√ß√£o da "Chain" (Cadeia):**

    * A linha `chain_unica = prompt_unico | llm` utiliza a sintaxe moderna do LangChain (LCEL).

    * Ela conecta o nosso "molde" (o prompt) com o "motor" (o Gemini), criando uma ferramenta pronta para receber o texto de uma review e devolver a an√°lise completa.

In [15]:
# 6. Configura√ß√£o do LangChain e Defini√ß√£o das Tarefas

# Libs do LangChain
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import PromptTemplate
from langchain_core.runnables import RunnableSequence

# ==========================================
#    PAR√ÇMETROS DE CONFIGURA√á√ÉO
# ==========================================

# Escolha o modelo (ex: "gemini-flash-latest", "gemini-pro-latest")
MODELO_ESCOLHIDO = "gemini-pro-latest"

# Temperatura (0.0 = mais preciso/rob√≥tico, 1.0 = mais criativo/aleat√≥rio)
TEMPERATURA = 0.2

# ==========================================

print(f"Inicializando o modelo '{MODELO_ESCOLHIDO}' com temperatura {TEMPERATURA}...")

# Configura a API-KEY para AMBAS as bibliotecas
try:
    API_KEY = os.environ['GOOGLE_API_KEY']
    genai.configure(api_key=API_KEY)
except KeyError:
    print("üö® ERRO: Chave 'GOOGLE_API_KEY' n√£o encontrada nos Secrets. Por favor, configure-a.")

# --- Inicializa√ß√£o do LLM usando os Par√¢metros ---
llm = ChatGoogleGenerativeAI(model=MODELO_ESCOLHIDO,
                             temperature=TEMPERATURA)

print("‚úÖ Modelo LLM pronto para uso!")
print("\nCriando o template de prompt √∫nico com Emo√ß√µes de Ekman...")

# --- PROMPT √öNICO E OTIMIZADO ---
prompt_unico_template = """
Sua tarefa √© fazer uma an√°lise completa da review de um jogo da Steam. Siga as regras e o formato de sa√≠da estritamente.

REGRAS:
1.  **Seja Literal:** Extraia apenas pontos positivos/negativos que foram EXPLICITAMENTE mencionados. N√ÉO fa√ßa suposi√ß√µes.
2.  **Seja Conciso:** A "Breve An√°lise" deve ser um par√°grafo curto resumindo o review. Os pontos devem ser t√≥picos simples (use "-").
3.  **Seja Limpo:** Se n√£o houver pontos positivos ou negativos, escreva "Nenhum ponto mencionado."
4.  **Seja Preciso:** A "Classifica√ß√£o de Sentimento" deve ser apenas uma das tr√™s op√ß√µes: Positivo, Negativo, ou Misto/Neutro.
5.  **Identifique a Emo√ß√£o:** A "Emo√ß√£o Predominante" deve ser uma das 6 emo√ß√µes b√°sicas de Ekman: Felicidade, Tristeza, Raiva, Medo, Surpresa ou Nojo. Escolha a que melhor representa o tom do texto.

Review: "{texto_review}"

Breve An√°lise:
[Escreva um par√°grafo curto aqui]

Pontos Positivos:
- [Liste os t√≥picos aqui]

Pontos Negativos:
- [Liste os t√≥picos aqui]

Classifica√ß√£o de Sentimento:
[Positivo, Negativo, ou Misto/Neutro]

Emo√ß√£o Predominante:
[Felicidade, Tristeza, Raiva, Medo, Surpresa ou Nojo]
"""

# Cria a chain √∫nica que ser√° usada
prompt_unico = PromptTemplate.from_template(prompt_unico_template)
chain_unica = prompt_unico | llm

print("‚úÖ Prompt e Chain criados com sucesso!")

Inicializando o modelo 'gemini-pro-latest' com temperatura 0.2...
‚úÖ Modelo LLM pronto para uso!

Criando o template de prompt √∫nico com Emo√ß√µes de Ekman...
‚úÖ Prompt e Chain criados com sucesso!


---
# 4. Fun√ß√µes Principais
---


### **4.1 An√°lise e Processamento da Review**

Esta c√©lula consolida toda a l√≥gica desenvolvida anteriormente em uma √∫nica fun√ß√£o robusta chamada `analisar_review_steam`. O objetivo √© tornar o c√≥digo reutiliz√°vel, permitindo analisar diferentes jogos apenas chamando esta fun√ß√£o com o ID desejado.

**O que esta fun√ß√£o realiza:**

1.  **Integra√ß√£o Global:** Utiliza `global review_texto_global, sentimento_global` para exportar os resultados. Isso √© essencial para que a **C√©lula de √Åudio** (que vem depois) saiba qual texto ler e com qual emo√ß√£o.

2.  **Coleta e Filtragem:**
    * Busca um lote de reviews (padr√£o: 100).
    * Aplica um **Filtro de Qualidade**: Descarta reviews muito curtas (menores que 30 caracteres) que geralmente n√£o possuem conte√∫do relevante para an√°lise.

3.  **Sele√ß√£o Aleat√≥ria:** Escolhe uma review aleat√≥ria da lista filtrada, garantindo que cada execu√ß√£o traga uma an√°lise nova.

4.  **Intelig√™ncia Artificial:** Envia o texto para o **Gemini** (via LangChain) para gerar o resumo, os pontos positivos/negativos e a classifica√ß√£o.

5.  **Minera√ß√£o de Dados (Regex):** Aplica a l√≥gica robusta que desenvolvemos para encontrar a "Classifica√ß√£o de Sentimento" dentro da resposta do Gemini, limpando formata√ß√µes como negrito (`*`) ou quebras de linha, para garantir que o tom de voz do √°udio seja correto.

6.  **Exibi√ß√£o Rica:** Formata e exibe o resultado final usando Markdown, apresentando o texto original e a an√°lise da IA de forma visualmente organizada.

In [16]:
import time
import random
import textwrap
from IPython.display import display, Markdown
import re

# Inicializa a nova vari√°vel global (caso ainda n√£o exista)
emocao_global = ""

def analisar_review_steam(id_jogo, qtd_busca=100, min_len=30):
    """
    Busca reviews, filtra, seleciona uma aleat√≥ria, analisa com Gemini
    (Sentimento + Emo√ß√£o) e exibe o resultado.
    """
    # Importante: Permite modificar as vari√°veis para a c√©lula de √°udio
    global review_texto_global, sentimento_global, emocao_global

    # --- OBTEN√á√ÉO DOS DADOS ---
    todas_as_reviews = obter_reviews_steam(id_jogo, quantidade=qtd_busca)

    # --- FILTRAGEM ---
    reviews_filtradas = [
        texto for texto in todas_as_reviews
        if len(texto.strip()) >= min_len
    ]

    # --- VERIFICA√á√ÉO ---
    if not reviews_filtradas:
        print(f"üö® N√£o foi poss√≠vel encontrar reviews com mais de {min_len} caracteres para o jogo ID: {id_jogo}.")
        return

    # --- L√ìGICA PRINCIPAL ---
    print(f"Buscando uma review aleat√≥ria de um total de {len(reviews_filtradas)} reviews filtradas...")

    # Sele√ß√£o Aleat√≥ria
    review_texto = random.choice(reviews_filtradas)

    # An√°lise com Gemini
    resultado_completo_obj = chain_unica.invoke({"texto_review": review_texto})
    resultado_completo = resultado_completo_obj.content

    # --- EXTRA√á√ÉO DE DADOS ---
    review_texto_global = review_texto

    # Valores padr√£o caso o parser falhe
    sentimento_encontrado = "Misto/Neutro"
    emocao_encontrada = "Neutro"

    linhas = resultado_completo.split('\n')

    for i, linha in enumerate(linhas):
        linha_lower = linha.lower()

        # --- Extrai o Sentimento ---
        if "classifica√ß√£o de sentimento" in linha_lower:
            if i + 1 < len(linhas):
                # Tenta pegar na pr√≥xima linha (padr√£o do prompt)
                valor = re.sub(r'[\*]', '', linhas[i+1]).strip()
                if valor: sentimento_encontrado = valor

        # --- Extrai a Emo√ß√£o ---
        if "emo√ß√£o predominante" in linha_lower:
            if i + 1 < len(linhas):
                valor = re.sub(r'[\*]', '', linhas[i+1]).strip()
                if valor: emocao_encontrada = valor

    # Atualiza as globais
    sentimento_global = sentimento_encontrado
    emocao_global = emocao_encontrada

    # --- APRESENTA√á√ÉO ---
    markdown_output = (f"""
---
## An√°lise de Review Aleat√≥ria do Jogo: `{id_jogo}`

---

### üìù Texto Original
> {review_texto.strip().replace(chr(10), '  '+chr(10))}

---

### ü§ñ Resultados da An√°lise com Gemini

{resultado_completo.strip()}

---
**Resumo dos Dados Extra√≠dos:**
* **Sentimento:** `{sentimento_global}`
* **Emo√ß√£o:** `{emocao_global}`
""")

    print("‚úÖ An√°lise conclu√≠da!")
    display(Markdown(markdown_output))


---

### **4.2 Gera√ß√£o de √Åudio Emocional (TTS)**

Esta c√©lula √© respons√°vel por transformar o texto da review e a an√°lise de sentimento em um arquivo de √°udio narrado. Ela utiliza o modelo `gemini-2.5-flash-preview-tts`, que √© capaz de modular a entona√ß√£o da voz com base em instru√ß√µes textuais.

**Principais Funcionalidades:**

1.  **Fun√ß√£o Helper `save_audio_file`**:

    * Recebe os dados brutos de √°udio (PCM) gerados pela API.

    * Converte e salva esses dados em um arquivo `.wav` padr√£o (Mono, 24kHz), que pode ser reproduzido no notebook.

2.  **Fun√ß√£o Principal `gerar_audio_review`**:

    * **Entrada de Dados**: L√™ as vari√°veis globais `review_texto_global`, `sentimento_global` e `emocao_global` que foram preenchidas pela c√©lula de an√°lise anterior.

    * **L√≥gica de Persona de Voz**: Baseada na teoria das emo√ß√µes b√°sicas de Ekman, o c√≥digo seleciona dinamicamente uma voz e um tom apropriado:
        * *Felicidade* -> Voz **Puck** (Otimista)
        * *Raiva* -> Voz **Fenrir** (Agitada)
        * *Tristeza* -> Voz **Schedar** (Grave/Lenta)
        * *Surpresa* -> Voz **Autonoe** (Brilhante)
        * *Medo* -> Voz **Enceladus** (Suave)
        * *Nojo* -> Voz **Algenib** (Rouca)

    * **Prompt de √Åudio**: Constr√≥i uma instru√ß√£o para o modelo, ex: *"Leia a seguinte review de jogo de forma triste, desanimado e lento: [Texto da Review]"*.

    * **Configura√ß√£o da API**: Envia a requisi√ß√£o para o Google Gemini, especificando o modelo de voz escolhido.

    * **Reprodu√ß√£o**: Se a gera√ß√£o for bem-sucedida, exibe um player de √°udio interativo (`IPython.display.Audio`) para que o usu√°rio possa ouvir o resultado imediatamente.

In [20]:
import wave
from IPython.display import Audio, display
import os
import google.generativeai as genai
from google.genai import types

# --- FUN√á√ÉO HELPER: SALVAR ARQUIVO ---
def save_audio_file(audio_data, filename="review_audio.wav"):
    """Salva os dados de √°udio brutos (PCM) em um arquivo .wav."""
    try:
        with wave.open(filename, "wb") as wf:
            wf.setnchannels(1)       # Mono
            wf.setsampwidth(2)       # 16-bit PCM
            wf.setframerate(24000)   # 24kHz (Padr√£o Gemini)
            wf.writeframes(audio_data)
        return True
    except Exception as e:
        print(f"üö® Erro ao salvar arquivo: {e}")
        return False

# --- FUN√á√ÉO PRINCIPAL: GERAR √ÅUDIO ---
def gerar_audio_review():
    """
    L√™ as vari√°veis globais (texto e emo√ß√£o) e gera um √°udio narrado
    com a entona√ß√£o apropriada usando o Gemini TTS.
    """
    # Acessa as vari√°veis globais definidas na etapa de an√°lise
    texto = globals().get('review_texto_global')
    sentimento = globals().get('sentimento_global')
    emocao = globals().get('emocao_global', '') # Padr√£o vazio

    if not texto:
        print("üö® Nenhuma review encontrada na mem√≥ria. Rode a fun√ß√£o 'analisar_review_steam' primeiro.")
        return

    try:
        # --- 1. DEFINI√á√ÉO DA PERSONA DE VOZ ---

        # Padr√µes
        nome_da_voz = "Kore"
        tom_da_voz = "calmo e neutro"

        # Normaliza para min√∫sculas para facilitar a compara√ß√£o
        emo_lower = emocao.lower()
        sent_lower = sentimento.lower() if sentimento else ""

        # L√≥gica de Decis√£o (Baseada em Ekman)
        if "felicidade" in emo_lower:
            nome_da_voz = "Puck"      # Voz otimista
            tom_da_voz = "feliz e satisfeito"
        elif "raiva" in emo_lower:
            nome_da_voz = "Fenrir"    # Voz excit√°vel
            tom_da_voz = "irritado, agressivo e frustrado"
        elif "tristeza" in emo_lower:
            nome_da_voz = "Schedar"   # Voz grave/lenta
            tom_da_voz = "triste e desanimado"
        elif "surpresa" in emo_lower:
            nome_da_voz = "Autonoe"   # Voz brilhante
            tom_da_voz = "surpreso e chocado"
        elif "medo" in emo_lower:
            nome_da_voz = "Enceladus" # Voz suave
            tom_da_voz = "assustado, nervoso e hesitante"
        elif "nojo" in emo_lower:
            nome_da_voz = "Algenib"   # Voz rouca
            tom_da_voz = "com nojo, desprezo e sarcasmo"

        # Fallback para Polaridade simples se nenhuma emo√ß√£o espec√≠fica for forte
        elif "positivo" in sent_lower:
            nome_da_voz = "Aoede"
            tom_da_voz = "positivo e satisfeito"
        elif "negativo" in sent_lower:
            nome_da_voz = "Orus"
            tom_da_voz = "cr√≠tico e insatisfeito"

        # --- 2. CHAMADA DA API ---
        print(f"üé≠ Emo√ß√£o Base: {emocao} (Sentimento: {sentimento})")
        print(f"üéôÔ∏è Gerando √°udio com voz '{nome_da_voz}' e tom '{tom_da_voz}'...")

        tts_prompt = f"Leia a seguinte review de jogo de forma {tom_da_voz}: {texto}"

        tts_model = genai.GenerativeModel(model_name="gemini-2.5-flash-preview-tts")

        response = tts_model.generate_content(
            contents=tts_prompt,
            generation_config={
                "response_modalities": ["AUDIO"],
                "speech_config": {
                    "voice_config": {
                        "prebuilt_voice_config": {
                            "voice_name": nome_da_voz
                        }
                    }
                }
            }
        )

        # --- 3. REPRODU√á√ÉO ---
        if response.candidates and response.candidates[0].content.parts:
            audio_data = response.candidates[0].content.parts[0].inline_data.data
            if save_audio_file(audio_data, "review_audio.wav"):
                print("‚úÖ √Åudio gerado com sucesso!")
                display(Audio("review_audio.wav"))
        else:
            print("üö® A API n√£o retornou dados de √°udio.")

    except Exception as e:
        print(f"üö® Falha na gera√ß√£o de √°udio: {e}")

---
### 4.3. C√©lulas de Execu√ß√£o das Fun√ß√µes Principais



### Execu√ß√£o do Pipeline

Agora que todas as ferramentas est√£o configuradas, utilize as c√©lulas abaixo para testar o projeto.

1.  **An√°lise de Texto:** Na primeira c√©lula, defina o `id_do_jogo` (voc√™ pode consultar a lista) e execute. O sistema buscar√° uma review, far√° a an√°lise de sentimentos/emo√ß√µes e exibir√° o resultado.

2.  **Gera√ß√£o de √Åudio:** Logo em seguida, execute a segunda c√©lula para ouvir a narra√ß√£o dessa review. O √°udio ser√° gerado com a entona√ß√£o baseada na emo√ß√£o detectada na etapa anterior.

In [28]:
# --- PAR√ÇMETROS ---
id_do_jogo = 3527290  # (Exemplos: 730, 570, 1086940, 1245620)
quantidade = 100
tamanho_minimo = 30

# --- CHAMADA DA FUN√á√ÉO ---
# Isso far√° todo o processo: busca, an√°lise e exibi√ß√£o
analisar_review_steam(id_do_jogo, quantidade, tamanho_minimo)

Buscando um lote de at√© 100 reviews para o jogo ID: 3527290...
‚úÖ 100 reviews obtidas com sucesso!
Buscando uma review aleat√≥ria de um total de 53 reviews filtradas...
‚úÖ An√°lise conclu√≠da!



---
## An√°lise de Review Aleat√≥ria do Jogo: `3527290`

---

### üìù Texto Original
> n da pra empurrar o amigo do penhasco

---

### ü§ñ Resultados da An√°lise com Gemini

Breve An√°lise:
O autor da review expressa de forma concisa sua insatisfa√ß√£o com a aus√™ncia de uma mec√¢nica espec√≠fica no jogo: a impossibilidade de empurrar um amigo de um penhasco.

Pontos Positivos:
Nenhum ponto mencionado.

Pontos Negativos:
- N√£o √© poss√≠vel empurrar um amigo de um penhasco.

Classifica√ß√£o de Sentimento:
Negativo

Emo√ß√£o Predominante:
Tristeza

---
**Resumo dos Dados Extra√≠dos:**
* **Sentimento:** `Negativo`
* **Emo√ß√£o:** `Tristeza`


In [29]:
# --- EXECU√á√ÉO ---
# Gera o √°udio da √∫ltima review analisada
gerar_audio_review()

üé≠ Emo√ß√£o Base: Tristeza (Sentimento: Negativo)
üéôÔ∏è Gerando √°udio com voz 'Schedar' e tom 'triste e desanimado'...
‚úÖ √Åudio gerado com sucesso!




---


## üéÆ IDs de Jogos na Steam

Aqui est√° uma lista de refer√™ncia r√°pida com os IDs de alguns jogos populares e aclamados na Steam, que podem ser usados para testar o analisador de reviews:

* **Counter-Strike 2:** `730`
* **Elden Ring:** `1245620`
* **Grand Theft Auto V:** `271590`
* **Cyberpunk 2077:** `1091500`
* **Red Dead Redemption 2:** `1174180`
* **Stardew Valley:** `413150`
* **Megabonk:** `3405340`
* **Cuphead:** `268910`
* **Lethal Company:** `1966720`
* **PEAK:** `3527290`


---
**Como encontrar o ID de qualquer jogo:**
1.  V√° para a p√°gina do jogo na Loja Steam.
2.  Olhe a URL no seu navegador.
3.  O n√∫mero no meio da URL √© o ID.
*Exemplo: `https://store.steampowered.com/app/`**`413150`**`/Stardew_Valley/`*

---