<a href="https://colab.research.google.com/github/elMimu/pln-project/blob/main/main.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Processamento de Linguagem Natural [2025-Q3]**
Prof. Alexandre Donizeti Alves

### **EQUIPE**

---

**POR FAVOR, PREENCHER OS INTEGRANDES DA SUA EQUIPE:**


**Integrante 01:**

`Pedro Ives Silva Santos - RA: 11201920234`

**Integrante 02:**

`Michel Munhoz - RA: 11017916`

### **GRANDE MODELO DE LINGUAGEM (*Large Language Model - LLM*)**

---

>


**LLM**: Google Gemini 2.5 Flash

>

**Link para a documenta√ß√£o oficial**: https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash



### **API (Opcional)**
---

**API**: TMDB API

**Site oficial**: https://www.themoviedb.org/

**Link para a documenta√ß√£o oficial**: https://developer.themoviedb.org/docs/getting-started

### **IMPLEMENTA√á√ÉO**
---

# üì¶ Instala√ß√£o de Depend√™ncias e Importa√ß√µes

Antes de iniciarmos o projeto, precisamos preparar o ambiente do Google Colab.

**O que esta c√©lula faz:**
1.  **Instala√ß√£o (`pip install`):** Baixa as vers√µes mais recentes do `langchain`, `langchain-google-genai` e utilit√°rios.
2.  **Importa√ß√µes:** Carrega os m√≥dulos necess√°rios para conex√£o com APIs, manipula√ß√£o de vari√°veis de ambiente e cria√ß√£o dos templates de prompt.

In [None]:
# Instala√ß√£o de depend√™ncias
!pip install -q langchain langchain-google-genai google-genai python-dotenv requests

In [None]:
# --- IMPORTS ---
import os
import requests
from getpass import getpass

# Utilit√°rios do Google Colab e Ambiente
from google.colab import drive
from dotenv import load_dotenv

# Componentes do LangChain
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser

print("‚úÖ Depend√™ncias instaladas e bibliotecas importadas com sucesso!")

‚úÖ Depend√™ncias instaladas e bibliotecas importadas com sucesso!


# üîí Configura√ß√£o Segura de Ambiente

Esta etapa realiza a autentica√ß√£o segura do projeto utilizando o recurso nativo **Google Colab Secrets**.

**Como funciona:**
1.  **Recupera√ß√£o Segura:** O script acessa o cofre de credenciais do Colab (√≠cone üîë) para buscar as chaves `GOOGLE_API_KEY` e `TMDB_API_KEY`.
2.  **Vari√°veis de Ambiente:** As chaves s√£o injetadas diretamente na mem√≥ria (`os.environ`), simulando o comportamento de um arquivo `.env`.
3.  **Seguran√ßa:** Nenhuma chave √© exposta no c√≥digo ou salva em arquivos de texto, garantindo que o notebook possa ser compartilhado sem riscos de vazamento de credenciais.

In [None]:
from google.colab import userdata

def load_colab_secrets():
    try:
        # Recupera as chaves do cofre do Colab
        google_key = userdata.get('GOOGLE_API_KEY')
        tmdb_key = userdata.get('TMDB_API_KEY')

        # Define como vari√°veis de ambiente
        os.environ["GOOGLE_API_KEY"] = google_key
        os.environ["TMDB_API_KEY"] = tmdb_key

        print("‚úî Chaves carregadas com sucesso via Colab Secrets!")
        print(f"‚úî GOOGLE_API_KEY definida? {bool(os.getenv('GOOGLE_API_KEY'))}")
        print(f"‚úî TMDB_API_KEY definida? {bool(os.getenv('TMDB_API_KEY'))}")

    except userdata.SecretNotFoundError as e:
        print("‚ö† Erro: Uma das chaves n√£o foi encontrada nos Segredos.")
        print("Certifique-se de adicionar 'GOOGLE_API_KEY' e 'TMDB_API_KEY' no √≠cone de chave (üîë) na barra lateral.")
    except Exception as e:
        print(f"‚ö† Erro inesperado: {e}")

# Executa a configura√ß√£o
load_colab_secrets()

‚úî Chaves carregadas com sucesso via Colab Secrets!
‚úî GOOGLE_API_KEY definida? True
‚úî TMDB_API_KEY definida? True


# ü§ñ Inicializa√ß√£o do Modelo LLM (Gemini)

Nesta etapa, instanciamos o cliente da Intelig√™ncia Artificial que ser√° o "c√©rebro" da aplica√ß√£o.

**Detalhes da Configura√ß√£o:**
* **Modelo (`gemini-2.5-flash`):** Escolhido por ser r√°pido e eficiente, ideal para tarefas que exigem baixa lat√™ncia.
* **Temperatura (`0.3`):** Define a "criatividade" do modelo.
    * Um valor baixo (0.3) torna as respostas mais determin√≠sticas, focadas e diretas.
    * Valores altos (perto de 1.0) tornam o modelo mais criativo e variado.
* **Teste de Sanidade:** Ao final, fazemos uma pergunta simples ("invoke") apenas para garantir que a conex√£o com a API do Google est√° ativa e respondendo corretamente.

In [None]:
# Criando o modelo do Gemini
llm = ChatGoogleGenerativeAI(
    # √© poss√≠vel trocar pro gemini-2.5-pro, por√©m o rate limit ser√° menor
    model="gemini-2.5-flash",
    temperature=0.3,
)

print("ü§ñ Modelo Gemini inicializado com sucesso!")

# Teste R√°pido de Conex√£o
try:
    print("‚è≥ Enviando pergunta de teste...")
    resposta_teste = llm.invoke("Explique em uma frase o que √© o TMDB.")

    print("\n--- Resposta do Gemini ---")
    print(resposta_teste.content)
    print("--------------------------")

except Exception as e:
    print(f"‚ùå Erro ao conectar com o Gemini: {e}")

ü§ñ Modelo Gemini inicializado com sucesso!
‚è≥ Enviando pergunta de teste...

--- Resposta do Gemini ---
O TMDB √© um banco de dados que oferece informa√ß√µes detalhadas sobre filmes, s√©ries de TV, elenco e equipe.
--------------------------


# üì° Cliente HTTP para a API do TMDB

Esta c√©lula define uma fun√ß√£o auxiliar (`wrapper`) chamada `tmdb_get`. O objetivo dela √© simplificar todas as chamadas futuras que faremos ao banco de dados de filmes.

**Funcionalidades:**
* **Autentica√ß√£o Autom√°tica:** Insere a `api_key` em todas as requisi√ß√µes, para que voc√™ n√£o precise repeti-la.
* **Idioma Padr√£o:** Define `pt-BR` (Portugu√™s) como padr√£o, mas permite que voc√™ sobrescreva se quiser dados em ingl√™s.
* **Tratamento de Erros:** Utiliza `raise_for_status()` para avisar imediatamente caso a API retorne um erro (como 404 ou 401).
* **Formato JSON:** J√° retorna os dados prontos para uso em Python (dicion√°rios/listas).

In [None]:
TMDB_BASE_URL = "https://api.themoviedb.org/3"

def tmdb_get(endpoint, params=None):
    if params is None:
        params = {}

    # Recupera a chave do ambiente (configurada na etapa anterior)
    params["api_key"] = os.environ.get("TMDB_API_KEY")

    # Define o idioma padr√£o como Portugu√™s do Brasil, se n√£o informado
    params.setdefault("language", "pt-BR")

    # Monta a URL completa
    url = f"{TMDB_BASE_URL}{endpoint}"

    # Faz a requisi√ß√£o
    response = requests.get(url, params=params)

    # Verifica se houve erro (4xx ou 5xx) e retorna o JSON
    response.raise_for_status()
    return response.json()

print("‚úî Fun√ß√£o 'tmdb_get' definida e pronta para uso!")

‚úî Fun√ß√£o 'tmdb_get' definida e pronta para uso!


# üîé Fun√ß√£o de Busca de Filmes

Esta fun√ß√£o abstrai a pesquisa no cat√°logo do TMDB.

**Como funciona:**
* **Par√¢metros:** Recebe o nome do filme (`query`), n√∫mero da p√°gina e idioma.
* **Retorno:** Devolve uma lista de dicion√°rios, onde cada item √© um filme encontrado.
* **Filtro:** A fun√ß√£o j√° descarta os metadados da API (como total de p√°ginas) e retorna direto a lista `['results']`.

In [None]:
def search_movie(query, page=1, language="pt-BR"):
    # Usa a fun√ß√£o auxiliar tmdb_get definida anteriormente
    data = tmdb_get("/search/movie", params={
        "query": query,
        "page": page,
        "language": language
    })
    return data["results"]

# --- Teste da Fun√ß√£o ---
filme = input()
print(f"üîé Buscando por '{filme}'...\n")

filmes = search_movie(filme, language="en-US")

# Exibe os 5 primeiros resultados de forma formatada
if filmes:
    for f in filmes[:5]:
        title = f.get('title', 'Sem t√≠tulo')
        date = f.get('release_date', 'Data desconhecida')
        rating = f.get('vote_average', 0)
        print(f"üé¨ {title} ({date}) - Nota: {rating}")
else:
    print("‚ùå Nenhum filme encontrado.")

Batman: The Killing Joke
üîé Buscando por 'Batman: The Killing Joke'...

üé¨ Batman: The Killing Joke (2016-07-24) - Nota: 6.614
üé¨ AFSOS's "Batman: The Killing Joke" () - Nota: 0.0


# üìù Obten√ß√£o de Detalhes e Avalia√ß√µes

A partir da escolha do filme, √© necess√°ria a extra√ß√£o de informa√ß√µes profundas para alimentar o modelo.

**As Fun√ß√µes:**
1.  **`get_movie_details`:** A busca retorna apenas o b√°sico. Esta fun√ß√£o vai buscar a ficha t√©cnica completa (or√ßamento, g√™neros, dura√ß√£o, status).
2.  **`get_movie_reviews`:** Busca opini√µes de usu√°rios reais.
    * *Estrat√©gia:* No exemplo abaixo, optamos por buscar reviews em **Ingl√™s (`en-US`)**, pois a grande maioria das cr√≠ticas textuais no TMDB n√£o est√° em portugu√™s. O Gemini pode traduzi-las ou analis√°-las facilmente depois.

In [None]:
def get_movie_details(movie_id, language="pt-BR"):
    data = tmdb_get(f"/movie/{movie_id}", params={"language": language})
    return data

def get_movie_reviews(movie_id, page=1, language="en-US"):
    data = tmdb_get(f"/movie/{movie_id}/reviews", params={
        "page": page,
        "language": language
    })
    return data["results"]

# --- Teste das Fun√ß√µes ---

# Verifica se a vari√°vel 'filmes' da c√©lula anterior existe e tem conte√∫do
if 'filmes' in globals() and filmes:
    filme_escolhido = filmes[0] # Pega o primeiro filme da lista
    print(f"üéØ Filme Selecionado: {filme_escolhido['title']} (ID: {filme_escolhido['id']})\n")

    # Pega detalhes em PT-BR
    detalhes = get_movie_details(filme_escolhido["id"], language="pt-BR")

    # Pega reviews em Ingl√™s (maior volume de dados)
    reviews = get_movie_reviews(filme_escolhido["id"], language="en-US")

    print(f"üìú T√≠tulo Oficial: {detalhes['title']}")
    print(f"‚è±  Dura√ß√£o: {detalhes.get('runtime', '?')} minutos")
    print(f"üìù Sinopse: {detalhes.get('overview', 'Sem sinopse.')}\n")

    print(f"üí¨ Total de reviews encontradas: {len(reviews)}")
    if reviews:
        autor = reviews[0].get('author', 'An√¥nimo')
        trecho = reviews[0].get('content', '')[:100]
        print(f"   Exemplo ({autor}): \"{trecho}...\"")

else:
    print("‚ö† A lista 'filmes' est√° vazia ou n√£o foi definida.")
    print("Por favor, rode a c√©lula de busca (search_movie) anterior primeiro.")

üéØ Filme Selecionado: Batman: The Killing Joke (ID: 382322)

üìú T√≠tulo Oficial: Batman: A Piada Mortal
‚è±  Dura√ß√£o: 72 minutos
üìù Sinopse: Do produtor executivo Bruce Timm e baseado na aclamada graphic novel da DC Comics, ‚ÄúBatman: A Piada Mortal‚Äù √© uma jornada adentro da sombria psique do Pr√≠ncipe Palha√ßo do Crime. Acompanhando desde o seu humilde come√ßo, quando era um comediante esfor√ßado, at√© seu fat√≠dico encontro com o Cavaleiro das Trevas, que mudou tudo. Agora fugitivo do Asilo Arkham, o Coringa planeja provar para todos que um dia ruim √© capaz de tornar qualquer um t√£o insano quanto ele.

üí¨ Total de reviews encontradas: 5
   Exemplo (Austin Singleton): "Not even the voice acting could save this movie. Check out my full review here.

http://www.hweird..."


# üß† An√°lise de Sentimento com LangChain

Selecionadas as cr√≠ticas (reviews), utilizaremos a Intelig√™ncia Artificial para ler e classificar a opini√£o das pessoas.

**Conceitos T√©cnicos:**
* **PromptTemplate:** O "molde" que instrui a IA sobre como se comportar (neste caso, um classificador especializado em cinema).
* **JsonOutputParser:** For√ßa a IA a responder *exatamente* no formato JSON. Isso √© fundamental para transformar texto livre em dados estruturados (tabelas).
* **LCEL (LangChain Expression Language):** A sintaxe `prompt | llm | parser` cria um "tubo" onde os dados entram de um lado e saem estruturados do outro.

In [None]:
import pandas as pd

# Configura√ß√£o do Parser
sentiment_parser = JsonOutputParser()

# Prompt Template"
prompt_template_str = """
Voc√™ √© um classificador de sentimentos de alta precis√£o especializado em cinema.
Sua tarefa √© ler a cr√≠tica abaixo e extrair dados estruturados.

Siga estritamente estes passos:
1. Identifique as palavras-chave de emo√ß√£o (adjetivos, verbos).
2. Verifique se h√° sarcasmo (ex: elogios exagerados para filmes ruins).
3. Pese os pontos positivos vs. negativos.
4. Classifique seguindo estas regras R√çGIDAS:
   - "positivo": O autor recomenda o filme ou elogia a maioria dos aspectos.
   - "negativo": O autor n√£o recomenda ou critica a maioria dos aspectos.
   - "neutro": A cr√≠tica √© informativa, ou os pontos bons e ruins se anulam.

Cr√≠tica para an√°lise:
'''
{review_text}
'''

Retorne APENAS um JSON com o seguinte esquema (sem markdown, sem texto extra):
{{
  "key_points": "Liste 2 ou 3 pontos principais citados (ex: Atua√ß√£o ruim, √ìtima fotografia)",
  "sentiment": "positivo, negativo ou neutro",
  "confidence": "Alta, M√©dia ou Baixa",
  "explanation": "Uma frase curta justificando a escolha baseada nos pontos levantados."
}}
"""

sentiment_prompt = ChatPromptTemplate.from_template(prompt_template_str)

# Recriando a Chain
sentiment_chain = sentiment_prompt | llm | sentiment_parser

# --- Execu√ß√£o Otimizada ---

analise_sentimentos = []
# Rate Limit
reviews_para_analisar = reviews[:10] if 'reviews' in globals() else []

print(f"üî¨ Iniciando an√°lise de precis√£o em {len(reviews_para_analisar)} cr√≠ticas...\n")

for i, r in enumerate(reviews_para_analisar):
    try:
        # Dica visual para saber que est√° rodando
        print(f"   [{i+1}/{len(reviews_para_analisar)}] Analisando opini√£o de '{r.get('author', 'An√¥nimo')}'...")

        result = sentiment_chain.invoke({"review_text": r["content"]})

        analise_sentimentos.append({
            "author": r["author"],
            "sentiment": result.get("sentiment"),
            "confidence": result.get("confidence"), # Novo campo √∫til
            "key_points": result.get("key_points"),
            "explanation": result.get("explanation"),
            "original_text": r["content"][:100] + "..." # Limite para a review
        })

    except Exception as e:
        print(f"   ‚ùå Erro ao processar cr√≠tica {i+1}: {e}")

# Exibi√ß√£o dos Resultados
if analise_sentimentos:
    df_sentimentos = pd.DataFrame(analise_sentimentos)

    # Fun√ß√£o de estiliza√ß√£o para destacar resultados
    def style_table(val):
        color = 'black'
        if val == 'positivo': color = 'green'
        elif val == 'negativo': color = 'red'
        elif val == 'neutro': color = 'orange'
        return f'color: {color}; font-weight: bold'

    print("\n‚úÖ Tabela de Sentimentos Gerada:")
    # Aplicando estilo na coluna 'sentiment'
    display(df_sentimentos.style.applymap(style_table, subset=['sentiment']))
else:
    print("\n‚ö† Nenhuma cr√≠tica dispon√≠vel para analisar.")

üî¨ Iniciando an√°lise de precis√£o em 5 cr√≠ticas...

   [1/5] Analisando opini√£o de 'Austin Singleton'...
   [2/5] Analisando opini√£o de 'Gimly'...
   [3/5] Analisando opini√£o de 'Peter89Spencer'...
   [4/5] Analisando opini√£o de 'GenerationofSwine'...
   [5/5] Analisando opini√£o de 'Murp'...

‚úÖ Tabela de Sentimentos Gerada:


  display(df_sentimentos.style.applymap(style_table, subset=['sentiment']))


Unnamed: 0,author,sentiment,confidence,key_points,explanation,original_text
0,Austin Singleton,negativo,Alta,"Filme ruim, Atua√ß√£o de voz n√£o foi suficiente para salvar o filme","A frase indica que o filme √© ruim, pois nem mesmo um aspecto potencialmente positivo (atua√ß√£o de voz) foi capaz de salv√°-lo.",Not even the voice acting could save this movie. Check out my full review here. http://www.hweird...
1,Gimly,negativo,Alta,"Falta de coes√£o devido √† adi√ß√£o for√ßada de uma nova hist√≥ria, falha em atender √†s altas expectativas apesar da boa atua√ß√£o de voz de Hamill, e o filme 'n√£o funcionou bem como um todo'.","A cr√≠tica aponta diversas fraquezas, falta de coes√£o e decep√ß√£o geral, superando os poucos pontos positivos espec√≠ficos.","Shares the few weaknesses of the short comic it is based on, but adds a bunch of its own new weaknes..."
2,Peter89Spencer,negativo,Alta,"Primeiros 30 minutos desperdi√ßados e irritantes, A atua√ß√£o de Mark Hamill n√£o salvou o filme, Hist√≥ria poderia ter sido melhor.","A cr√≠tica aponta m√∫ltiplos aspectos negativos, como o in√≠cio desperdi√ßado e a hist√≥ria fraca, com apenas um ponto positivo m√≠nimo para uma piada.",The first 30 minutes was wasted with Barbara being so annoying! I just didn't see why that whole bit...
3,GenerationofSwine,positivo,Alta,"A adapta√ß√£o diverge do material original, mas √© considerada melhor que a maioria dos outros filmes do Batman e consegue contar uma boa hist√≥ria.","Apesar da decep√ß√£o inicial com a fidelidade √† graphic novel, a cr√≠tica elogia o filme por ser superior a outros filmes do Batman e por sua narrativa eficaz.","OK, so I'll admit I was expecting something closer to the graphic novel, and I was pretty disappoint..."
4,Murp,neutro,Alta,"Primeira metade √© irrelevante e filler, A adapta√ß√£o principal (segunda metade) √© √≥tima com atua√ß√µes cl√°ssicas, O filme √© uma mistura de aspectos amados e odiados","A cr√≠tica explicitamente divide o filme em partes amadas e odiadas ('Half of this movie I despise and half of this I love'), com a nota 5/10 refor√ßando o equil√≠brio.",_The Killing Joke_ deserved a better adaptation. Not even that. Just re-edit this to cut out the fir...


# üè∑Ô∏è Extra√ß√£o H√≠brida: T√≥picos e Elenco

Ajustamos o modelo para realizar uma tarefa dupla. Agora ele busca tanto a **opini√£o** quanto os **sujeitos** da cr√≠tica.

**O que ele vai extrair agora:**
1.  **Sentimentos (Bigramas):** "Atua√ß√£o Incr√≠vel", "Ritmo Lento".
2.  **Entidades (Nomes):** Nomes de atores, diretor e personagens principais citados na cr√≠tica.

**Regra de Ouro:**
* Conceitos s√£o traduzidos para PT-BR.
* Nomes pr√≥prios (Atores/Personagens) s√£o mantidos no original para evitar confus√£o.

In [None]:
import pandas as pd
from collections import Counter

# --- CONFIGURA√á√ÉO DO PROMPT H√çBRIDO ---
keywords_parser = JsonOutputParser()

keywords_prompt = ChatPromptTemplate.from_template("""
Voc√™ √© um analista de metadados de cinema.
Analise a cr√≠tica e extraia uma lista mista de tags relevantes.

Siga estas 3 regras de extra√ß√£o:
1. **SENTIMENTOS (Bigramas):** Identifique pontos fortes/fracos combinando Aspecto + Adjetivo (ex: "Roteiro Confuso", "Visual Sombrio").
2. **ENTIDADES (Nomes):** Identifique os principais Atores, Diretor ou Personagens citados.
3. **IDIOMA:** - Conceitos gerais: Traduza para Portugu√™s.
   - Nomes Pr√≥prios: MANTENHA O ORIGINAL (ex: "Joker", "Phoenix", "Gaga").

Cr√≠tica:
'''{review_text}'''

Retorne JSON:
{{
  "keywords": ["tag1", "tag2", "tag3", "tag4", "tag5"]
}}
""")

keywords_chain = keywords_prompt | llm | keywords_parser

# --- EXECU√á√ÉO ---

analise_keywords = []
lista_reviews = reviews[:10] if 'reviews' in globals() else []
total = len(lista_reviews)

print(f"üöÄ Extraindo T√≥picos de {total} cr√≠ticas...\n")

for i, r in enumerate(lista_reviews):
    try:
        print(f"   [{i+1}/{total}] Analisando '{r.get('author', 'An√¥nimo')}'...")

        result = keywords_chain.invoke({"review_text": r["content"]})
        tags_brutas = result.get("keywords", [])

        # Cleaning
        tags_limpas = [tag.strip().title() for tag in tags_brutas]

        analise_keywords.append({
            "author": r["author"],
            "keywords": tags_limpas
        })

    except Exception as e:
        print(f"   ‚ùå Erro na cr√≠tica {i+1}: {e}")

# --- AN√ÅLISE DE RESULTADOS ---

print("\n‚úÖ Extra√ß√£o H√≠brida Conclu√≠da!")

if analise_keywords:
    df_keywords = pd.DataFrame(analise_keywords)

    todas_tags = [k for lista in df_keywords['keywords'] for k in lista]
    contagem = Counter(todas_tags)

    print(f"\nüìä Total de tags: {len(todas_tags)}")
    print("üèÜ Top 10 Tags:")

    for tag, qtd in contagem.most_common(15):
        tipo = "üìù" if " " in tag else "üë§"
        print(f"   {tipo} {tag}: {qtd}")
else:
    print("‚ö† Nenhuma tag extra√≠da.")

üöÄ Extraindo T√≥picos de 5 cr√≠ticas...

   [1/5] Analisando 'Austin Singleton'...
   [2/5] Analisando 'Gimly'...
   [3/5] Analisando 'Peter89Spencer'...
   [4/5] Analisando 'GenerationofSwine'...
   [5/5] Analisando 'Murp'...

‚úÖ Extra√ß√£o H√≠brida Conclu√≠da!

üìä Total de tags: 41
üèÜ Top 10 Tags:
   üë§ Joker: 4
   üìù Mark Hamill: 3
   üìù The Killing Joke: 2
   üìù Kevin Conroy: 2
   üë§ Barbara: 2
   üë§ Batman: 2
   üìù Atua√ß√£o De Voz Insuficiente: 1
   üìù Recep√ß√£o Negativa: 1
   üìù Expectativas N√£o Atendidas: 1
   üìù Filme N√£o Coeso: 1
   üìù Hist√≥ria For√ßada: 1
   üìù Conte√∫do Grotesco: 1
   üìù Cena Final Fant√°stica: 1
   üìù Hamill √ìtimo: 1
   üìù Performance Vocal Imperfeita: 1


# üì¢ O Veredito (Sumariza√ß√£o)

**O Processo:**
1.  **Agrega√ß√£o:** Juntamos todos os textos das cr√≠ticas em uma √∫nica string gigante.
2.  **S√≠ntese:** Pedimos para a IA ignorar ru√≠dos e focar no consenso: o que a maioria amou e o que a maioria odiou?

In [None]:
from IPython.display import Markdown, display

# Prepara√ß√£o dos Dados
# Verifica se temos reviews carregadas
if 'reviews' in globals() and reviews:

    # 10 primeiras reviews como amostra
    amostra_reviews = reviews[:10]

    all_reviews_text = "\n\n--- NOVA CR√çTICA ---\n\n".join([r["content"] for r in amostra_reviews])

    print(f"üìö Lendo e sintetizando {len(amostra_reviews)} opini√µes dos usu√°rios...\n")

    # Configura√ß√£o do Prompt
    summary_prompt = ChatPromptTemplate.from_template("""
    Voc√™ √© um editor s√™nior de um portal de cinema.
    Sua tarefa √© ler as opini√µes do p√∫blico abaixo e criar um RESUMO EXECUTIVO.

    Instru√ß√µes:
    1. Ignore opini√µes extremas isoladas (outliers). Foque no consenso.
    2. Identifique padr√µes: O que a maioria elogia? O que a maioria critica?
    3. Escreva em Portugu√™s do Brasil, de forma fluida e jornal√≠stica.
    4. N√£o fa√ßa listas de t√≥picos, escreva 2 ou 3 par√°grafos bem conectados.

    Cr√≠ticas dos usu√°rios:
    '''{all_reviews}'''
    """)

    summary_chain = summary_prompt | llm

    # Execu√ß√£o
    try:
        resumo_opinioes = summary_chain.invoke({"all_reviews": all_reviews_text})

        # Exibi√ß√£o Formatada
        print("‚úÖ Resumo Gerado:\n")
        display(Markdown(resumo_opinioes.content))

    except Exception as e:
        print(f"‚ùå Erro ao gerar resumo: {e}")

else:
    print("‚ö† Nenhuma cr√≠tica encontrada para resumir. Rode as etapas anteriores.")

üìö Lendo e sintetizando 5 opini√µes dos usu√°rios...

‚úÖ Resumo Gerado:



A aguardada adapta√ß√£o de "A Piada Mortal" para o cinema gerou expectativas alt√≠ssimas entre o p√∫blico, impulsionadas pelo retorno de Kevin Conroy e Mark Hamill aos seus ic√¥nicos pap√©is e pela rever√™ncia √† aclamada graphic novel. Contudo, a recep√ß√£o geral foi de grande decep√ß√£o, com a maioria dos espectadores apontando a falta de coes√£o e a inser√ß√£o de material extra como os principais problemas. O primeiro ato do filme, focado em Barbara Gordon, √© unanimemente criticado como desnecess√°rio, mal-executado e um "enchimento" que n√£o se conecta com a trama principal, prejudicando a fluidez e a fidelidade √† obra original. Muitos sentiram que essa por√ß√£o inicial transformou o filme em duas hist√≥rias distintas, em vez de uma narrativa √∫nica e bem integrada.

Apesar das fortes cr√≠ticas √† estrutura, h√° um consenso quase absoluto sobre a excel√™ncia das performances vocais, especialmente a de Mark Hamill como Coringa. Sua interpreta√ß√£o √© consistentemente elogiada como ic√¥nica e um dos grandes pontos altos da produ√ß√£o. Kevin Conroy tamb√©m √© reconhecido por entregar uma performance cl√°ssica como Batman, embora alguns poucos tenham notado pequenas inconsist√™ncias. A parte do filme que se dedica √† adapta√ß√£o direta da graphic novel original, ap√≥s o controverso primeiro ato, √© geralmente vista como bem-sucedida, com muitos a descrevendo como "fant√°stica" e o ponto onde a adapta√ß√£o realmente brilha.

Em resumo, "A Piada Mortal" √© percebida como uma obra de duas metades: uma primeira frustrante e desconexa que falha em justificar sua exist√™ncia, e uma segunda que, ao se ater ao material-fonte, entrega momentos de brilho e as atua√ß√µes esperadas dos lend√°rios dubladores. A adapta√ß√£o, no entanto, falha em ser um todo coeso e em corresponder plenamente ao legado da aclamada hist√≥ria em quadrinhos, deixando um gosto amargo de oportunidade perdida para muitos f√£s.

# ü§ñ Chatbot Especialista

Nesta etapa final, consolidamos todo o conhecimento gerado em um **Assistente Virtual Interativo**.

**Como funciona (Context Injection):**
1.  **Constru√ß√£o do Contexto:** O c√≥digo re√∫ne os dados t√©cnicos, as estat√≠sticas de sentimento, as palavras-chave mais citadas e o resumo textual que geramos anteriormente.
2.  **O Prompt do Sistema:** Dizemos √† IA: *"Responda √†s perguntas do usu√°rio baseando-se EXCLUSIVAMENTE nestes dados que coletei."*
3.  **Intera√ß√£o:** Voc√™ pode fazer perguntas complexas como *"O filme √© muito longo?"* ou *"Vale a pena ver se eu gosto de a√ß√£o?"* e ele responder√° usando as evid√™ncias das cr√≠ticas reais.

In [None]:
from langchain_core.output_parsers import StrOutputParser
from IPython.display import display, Markdown

# --- Cria√ß√£o do Contexto ---

contexto_dados = f"""
DADOS T√âCNICOS DO FILME:
- T√≠tulo: {detalhes.get('title')}
- Nota M√©dia (TMDB): {detalhes.get('vote_average')}
- Dura√ß√£o: {detalhes.get('runtime')} minutos
- Sinopse: {detalhes.get('overview')}

ESTAT√çSTICAS DAS CR√çTICAS PROCESSADAS:
"""

# Adiciona dados de sentimento se existirem
if 'df_sentimentos' in globals() and not df_sentimentos.empty:
    pos = len(df_sentimentos[df_sentimentos['sentiment'] == 'positivo'])
    total = len(df_sentimentos)
    contexto_dados += f"- Aprova√ß√£o nesta amostra: {pos}/{total} cr√≠ticas positivas.\n"

# Adiciona Top Keywords se existirem
if 'contagem' in globals() and contagem:
    top_tags = [k for k, v in contagem.most_common(10)]
    contexto_dados += f"- Principais T√≥picos Comentados: {', '.join(top_tags)}.\n"

# Adiciona o Resumo Textual gerado na etapa anterior
if 'resumo_opinioes' in globals():
    contexto_dados += f"\nRESUMO QUALITATIVO DA AUDI√äNCIA:\n{resumo_opinioes.content}\n"

# --- Configura√ß√£o do Chatbot ---

chat_prompt = ChatPromptTemplate.from_template("""
Voc√™ √© um assistente de cinema especializado no filme '{titulo}'.
Sua fonte de verdade √© o CONTEXTO abaixo.

CONTEXTO (Dados reais analisados):
{contexto}

Instru√ß√µes:
1. Responda √† pergunta do usu√°rio usando as evid√™ncias do contexto.
2. Se a informa√ß√£o n√£o estiver no contexto, diga "N√£o tenho dados suficientes nas cr√≠ticas analisadas para afirmar isso".
3. Seja prestativo, curto e direto.

Pergunta do Usu√°rio: {pergunta}
""")

chat_chain = chat_prompt | llm | StrOutputParser()

# --- Loop de Intera√ß√£o ---
print(f"üí¨ Chatbot iniciado para o filme: {detalhes.get('title')}")
print("Digite 'sair' para encerrar.\n")

while True:
    pergunta_user = input("ü§î Voc√™: ")

    if pergunta_user.lower() in ['sair', 'exit', 'fim']:
        print("üëã Chat encerrado.")
        break

    if pergunta_user.strip() == "":
        continue

    # Resposta
    print("ü§ñ Gemini pensando...", end="\r")
    resposta = chat_chain.invoke({
        "titulo": detalhes.get('title'),
        "contexto": contexto_dados,
        "pergunta": pergunta_user
    })

    # Formata√ß√£o
    display(Markdown(f"**ü§ñ Gemini:** {resposta}"))
    print("-" * 50)

üí¨ Chatbot iniciado para o filme: Batman: A Piada Mortal
Digite 'sair' para encerrar.

ü§î Voc√™: O que voce diria para mim sobre esse filme?


**ü§ñ Gemini:** "Batman: A Piada Mortal" √© uma adapta√ß√£o da aclamada graphic novel, com 72 minutos de dura√ß√£o e uma nota m√©dia de 6.614 no TMDB. A sinopse descreve uma jornada pela psique do Coringa, desde seu come√ßo como comediante at√© seu plano de provar que um dia ruim pode levar qualquer um √† insanidade.

Apesar das altas expectativas, impulsionadas pelo retorno de Kevin Conroy e Mark Hamill, a recep√ß√£o geral foi de grande decep√ß√£o. O principal problema apontado √© a falta de coes√£o e a inser√ß√£o de material extra, especialmente o primeiro ato focado em Barbara Gordon, que foi amplamente criticado como desnecess√°rio e desconexo.

Por outro lado, as performances vocais s√£o unanimemente elogiadas, com Mark Hamill como Coringa sendo considerado ic√¥nico e Kevin Conroy entregando uma performance cl√°ssica como Batman. A parte do filme que adapta diretamente a graphic novel original √© vista como bem-sucedida e brilhante.

Em resumo, o filme √© percebido como uma obra de duas metades: uma primeira frustrante e uma segunda que brilha ao se ater ao material-fonte, mas que falha em ser um todo coeso e em corresponder plenamente ao legado da hist√≥ria em quadrinhos.

--------------------------------------------------
ü§î Voc√™: Vale a pena eu assistir esse filme?


**ü§ñ Gemini:** Com base nas cr√≠ticas analisadas, o filme "Batman: A Piada Mortal" gerou grande decep√ß√£o, com apenas 1 de 5 cr√≠ticas positivas nesta amostra.

**Pontos negativos:**
*   A maioria dos espectadores aponta falta de coes√£o e material extra (especialmente o primeiro ato focado em Barbara Gordon) como desnecess√°rio e mal-executado, prejudicando a fluidez e fidelidade √† graphic novel.
*   Muitos sentiram que o filme se tornou duas hist√≥rias distintas.

**Pontos positivos:**
*   H√° um consenso quase absoluto sobre a excel√™ncia das performances vocais, especialmente Mark Hamill como Coringa e Kevin Conroy como Batman.
*   A parte do filme que se dedica √† adapta√ß√£o direta da graphic novel original √© geralmente vista como bem-sucedida e "fant√°stica".

Em resumo, o filme √© percebido como uma obra de duas metades: uma primeira frustrante e desconexa, e uma segunda que brilha ao se ater ao material-fonte e √†s atua√ß√µes dos dubladores. Se voc√™ valoriza as atua√ß√µes de voz e a adapta√ß√£o fiel da graphic novel na segunda metade, pode valer a pena, mas esteja ciente da recep√ß√£o negativa e da falta de coes√£o geral.

--------------------------------------------------
ü§î Voc√™: Sair
üëã Chat encerrado.
