### Unindo a pr√°tica de criar chains com os conectores 
___

## =============================================================================
## CONCEITOS FUNDAMENTAIS DO LANGCHAIN
## =============================================================================

"""
üéØ CORE COMPONENTS DE UMA APLICA√á√ÉO LANGCHAIN:

1. ENTRADA (Input) - Dicion√°rio simples com os dados de entrada
2. PROMPT - Template formatado usando ChatPromptTemplate.from_messages
3. MODELO - LLM (Large Language Model) - OpenAI no nosso caso
4. PARSER DE SA√çDA - StrOutputParser() ou with_structured_output()

üîó LCEL (LangChain Expression Language):
- Sintaxe: input | prompt | llm | output_parser
- O operador "|" (pipe) conecta os componentes em sequ√™ncia
- Cada componente processa a sa√≠da do anterior
"""
---
#### Langchain Conectores


* RunnableLambda
* RunnableParallel
* RunnablePassThrough


#### Setup do ambiente

In [1]:
# --- C√âLULA 1: Setup do ambiente ---
import os
from dotenv import find_dotenv, load_dotenv

# Carregar vari√°veis do .env
if not load_dotenv(find_dotenv()):
    print("‚ö†Ô∏è Arquivo .env n√£o encontrado. Verificando vari√°veis do sistema.")

# Verificar TODAS as vari√°veis necess√°rias
required_vars = ["OPENAI_API_KEY", "LANGCHAIN_API_KEY"]
missing_vars = []

for var in required_vars:
    if not os.getenv(var):
        missing_vars.append(var)

if missing_vars:
    raise ValueError(f"‚ùå Vari√°veis n√£o encontradas: {missing_vars}")

print("‚úÖ Vari√°veis de ambiente carregadas com sucesso!")
print(f"üîë OPENAI_API_KEY: {'‚úì' if os.getenv('OPENAI_API_KEY') else '‚úó'}")
print(f"üîë LANGCHAIN_API_KEY: {'‚úì' if os.getenv('LANGCHAIN_API_KEY') else '‚úó'}")
print(f"üìä LANGCHAIN_TRACING: {os.getenv('LANGCHAIN_TRACING_V2', 'Not set')}")
print(f"üéØ LANGCHAIN_PROJECT: {os.getenv('LANGCHAIN_PROJECT', 'Not set')}")

‚úÖ Vari√°veis de ambiente carregadas com sucesso!
üîë OPENAI_API_KEY: ‚úì
üîë LANGCHAIN_API_KEY: ‚úì
üìä LANGCHAIN_TRACING: true
üéØ LANGCHAIN_PROJECT: Langchain studies - FabioLima


#### Configura√ß√£o do LangChain e LangSmith

In [2]:
# --- C√âLULA 2: Configura√ß√£o do LangChain + LangSmith ---
from langchain_openai import ChatOpenAI

# IMPORTANTE: N√ÉO sobrescreva as vari√°veis do .env aqui!
# Apenas verifique se est√£o definidas
print("\nüîç Verificando configura√ß√µes LangSmith:")
print(f"LANGCHAIN_TRACING_V2: {os.getenv('LANGCHAIN_TRACING_V2')}")
print(f"LANGCHAIN_ENDPOINT: {os.getenv('LANGCHAIN_ENDPOINT')}")
print(f"LANGCHAIN_PROJECT: {os.getenv('LANGCHAIN_PROJECT')}")
print(f"LANGCHAIN_API_KEY: {'SET' if os.getenv('LANGCHAIN_API_KEY') else 'NOT SET'}")

# Instanciando o LLM
llm = ChatOpenAI(model="gpt-4o-mini")

print("‚úÖ LLM configurado com sucesso!")



üîç Verificando configura√ß√µes LangSmith:
LANGCHAIN_TRACING_V2: true
LANGCHAIN_ENDPOINT: https://api.smith.langchain.com
LANGCHAIN_PROJECT: Langchain studies - FabioLima
LANGCHAIN_API_KEY: SET
‚úÖ LLM configurado com sucesso!


#### --- Bibliotecas Iniciais para LCEL ---

In [3]:
# --- C√âLULA 3: Imports Essenciais para LCEL ---
from langchain_core.prompts import ChatPromptTemplate # type: ignore
from langchain_core.output_parsers import StrOutputParser # type: ignore
from langchain.schema.runnable import (
    RunnableLambda,# type: ignore
    RunnableParallel,# type: ignore
    RunnablePassthrough) # type: ignore

from langchain_core.runnables import Runnable, RunnableSerializable
from pydantic import BaseModel, Field
from typing import List, Dict, Any


**-- Teste r√°pido do LLM --**

In [4]:
# --- C√âLULA 4: Teste com debugging melhorado ---
def test_langsmith_connection():
    """Testa a conex√£o com LangSmith de forma mais detalhada"""
    print("üß™ Iniciando teste de conex√£o com LangSmith...")
    
    try:
        resposta = llm.invoke("Diga 'Ol√° mundo' em portugu√™s.")
        print("‚úÖ Resposta do modelo:", resposta.content)
        print("üéØ Se voc√™ n√£o viu erros acima, o LangSmith est√° funcionando!")
        return True
    except Exception as e:
        print(f"‚ùå Erro durante a execu√ß√£o: {e}")
        return False

# Execute o teste
test_langsmith_connection()

üß™ Iniciando teste de conex√£o com LangSmith...
‚ùå Erro durante a execu√ß√£o: Connection error.


False

Failed to get info from https://api.smith.langchain.com: LangSmithConnectionError('Connection error caused failure to GET /info in LangSmith API. Please confirm your internet connection. ConnectionError(MaxRetryError(\'HTTPSConnectionPool(host=\\\'api.smith.langchain.com\\\', port=443): Max retries exceeded with url: /info (Caused by NameResolutionError("<urllib3.connection.HTTPSConnection object at 0x7f2854327ed0>: Failed to resolve \\\'api.smith.langchain.com\\\' ([Errno -3] Temporary failure in name resolution)"))\'))\nContent-Length: None\nAPI Key: lsv2_********************************************40')


`Exerc√≠cio: Extrair o nome de um diretor dado o nome do filme`

In [5]:
# --- C√âLULA 5: Seu exerc√≠cio com melhor debugging ---
class DirectorMovie(BaseModel):
    nome: str = Field(..., description="Nome do diretor do filme")

# Modelo com temperatura para precis√£o
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.3)

# Entrada
input_data = {"filme": "O Poderoso Chef√£o"} 

# Prompt
prompt = ChatPromptTemplate([
    ("system", "Voc√™ √© um especialista em filmes."),
    ("user", "Quem √© o diretor do filme : {filme}? Responda apenas com o nome.")
])

# Parser estruturado
llm_structured = llm.with_structured_output(DirectorMovie)

# Chain
chain = prompt | llm_structured

print("üöÄ Executando chain com LangSmith tracking...")

try:
    # Execute a chain
    result = chain.invoke(input_data)
    
    # Resultado
    print(f"üîç Entrada: {input_data}, type: {type(input_data)}")
    print(f"üîÑ Processamento: Prompt ‚Üí LLM ‚Üí Parser")
    print(f"‚ú® Resultado: {result.nome}")
    
    print("\nüéâ Sucesso! Verifique no LangSmith:")
    print(f"üåê https://smith.langchain.com/projects/{os.getenv('LANGCHAIN_PROJECT', '').replace(' ', '%20')}")
    
except Exception as e:
    print(f"‚ùå Erro na execu√ß√£o: {e}")
    print("üí° Dica: Verifique se todas as vari√°veis de ambiente est√£o corretas")

üöÄ Executando chain com LangSmith tracking...
‚ùå Erro na execu√ß√£o: Connection error.
üí° Dica: Verifique se todas as vari√°veis de ambiente est√£o corretas


`Exerc√≠cio: **fazer a sa√≠da da primeira chain com letras ma√≠sculas`**

In [6]:
class DirectorMovie(BaseModel):
    nome: str = Field(..., description="Nome do diretor do filme")

# Modelo com temperatura para precis√£o
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.1)

# Entrada
input_data = {"filme": "O Poderoso Chef√£o"} 

# Prompt
prompt = ChatPromptTemplate([
    ("system", "Voc√™ √© um especialista em filmes."),
    ("user", "Quem √© o diretor do filme : {filme}? Responda apenas com o nome.")
])

# Parser estruturado
llm_structured = llm.with_structured_output(DirectorMovie)

# Chain
chain_movie_director = prompt | llm_structured

print("üöÄ Executando chain com LangSmith tracking...")

# Transformar a sa√≠da da primeira chain com letras ma√≠sculas
to_upper = RunnableLambda(lambda input_str: input_str.upper())

# Chain composta
#* input_dicionario -> Prompt -> LLM(Pydantic) -> extrai nome do diretor do filme -> Converte para ma√≠sculas
chain_upper = chain_movie_director | to_upper
try:
    # Execute a chain
    result = chain.invoke(input_data)
    
    # Resultado
    print(f"üîç Entrada: {input_data['filme']}, type: {type(input_data)}")
    print(f"üîÑ Processamento: Prompt ‚Üí LLM ‚Üí Parser ‚Üí to_upper")
    print(f"‚ú® Resultado:(String em ma√≠uscula) {result}")
    
    print("\nüéâ Sucesso! Verifique no LangSmith:")
    print(f"üåê https://smith.langchain.com/projects/{os.getenv('LANGCHAIN_PROJECT', '').replace(' ', '%20')}")
    
except Exception as e:
    print(f"‚ùå Erro na execu√ß√£o: {e}")
    print("üí° Dica: Verifique se todas as vari√°veis de ambiente est√£o corretas")

üöÄ Executando chain com LangSmith tracking...
üîç Entrada: O Poderoso Chef√£o, type: <class 'dict'>
üîÑ Processamento: Prompt ‚Üí LLM ‚Üí Parser ‚Üí to_upper
‚ú® Resultado:(String em ma√≠uscula) nome='Francis Ford Coppola'

üéâ Sucesso! Verifique no LangSmith:
üåê https://smith.langchain.com/projects/Langchain%20studies%20-%20FabioLima


Exerc√≠cio: Utilizar o pydantic para extrair mais informa√ß√µes.

In [7]:
class MovieInfo(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")
    genero: str = Field(..., description="G√™nero principal do filme")

# Modelo com temperatura para precis√£o
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)

# Entrada
input_data = {"filme": "Lord of the Rings"} 

# Prompt
prompt = ChatPromptTemplate([
    ("system", 
     "Voc√™ √© um especialista em cinema. "
     "Responda sempre com informa√ß√µes confi√°veis. "
     "Se n√£o souber, use 'N√£o encontrado'."),
    ("user", "Forne√ßa informa√ß√µes sobre o filme {filme}.")
])

# Parser estruturado
llm_structured = llm.with_structured_output(MovieInfo)

# Chain
chain_movie_info = prompt | llm_structured

print("üöÄ Executando chain com LangSmith tracking...")

# Chain composta
#* input_dicionario -> Prompt -> LLM(Pydantic) -> extrai informa√ß√µes definidas sobre o filme

try:
    # Execute a chain
    result = chain_movie_info.invoke(input_data)
    
    # Resultado
    print(f"üîç Entrada: {input_data['filme']}, type: {type(input_data)}")
    print(f"üîÑ Processamento: Prompt ‚Üí LLM ‚Üí Parser(structured output)")
    print(f"‚ú® Diretor:{result.diretor}")
    print(f"‚ú® Ano de lan√ßamento:{result.ano}")
    print(f"‚ú® G√™nero:{result.genero}")
    
    print("\nüéâ Sucesso! Verifique no LangSmith:")
    print(f"üåê https://smith.langchain.com/projects/{os.getenv('LANGCHAIN_PROJECT', '').replace(' ', '%20')}")
    
except Exception as e:
    print(f"‚ùå Erro na execu√ß√£o: {e}")
    print("üí° Dica: Verifique se todas as vari√°veis de ambiente est√£o corretas")

üöÄ Executando chain com LangSmith tracking...
üîç Entrada: Lord of the Rings, type: <class 'dict'>
üîÑ Processamento: Prompt ‚Üí LLM ‚Üí Parser(structured output)
‚ú® Diretor:Peter Jackson
‚ú® Ano de lan√ßamento:2001
‚ú® G√™nero:Fantasia

üéâ Sucesso! Verifique no LangSmith:
üåê https://smith.langchain.com/projects/Langchain%20studies%20-%20FabioLima


Vamos retirar outras informa√ß√µes utilizando os dados anteriores.

In [8]:
class MovieInfo(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")
    genero: str = Field(..., description="G√™nero principal do filme")

# Modelo com temperatura para precis√£o
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)
llm_structured = llm.with_structured_output(MovieInfo)

# Entrada
input_data = {"filme": "The Hobbit"} 

#* Chain principal que usar√° a nova estrutura
#* Prompt mais poderoso para extrair a informa√ß√£o do filme
prompt_movie = ChatPromptTemplate([
    ("system", 
     "Voc√™ √© um especialista em cinema. "
     "Responda sempre com informa√ß√µes confi√°veis. "
     "Se n√£o souber, use 'N√£o encontrado'."),
    ("user", "Forne√ßa informa√ß√µes sobre o filme {filme}.")
])

chain_movie_info = ( # type: ignore
   prompt_movie | llm_structured
) 

#* Crie uma chain paralela
#* Utilizando o nome do filme como entrada
#* Criando o prompt para extrair a cr√≠tica ficticia
prompt_critica = ChatPromptTemplate([
    ("system", 
     "Voc√™ √© um especialista em cinema. "
     "Responda sempre com informa√ß√µes confi√°veis. "
     "Se n√£o souber, use 'N√£o encontrado'."),
    ("user", "Escreva uma cr√≠tica de uma linha para o filme {filme}.")
])

#* A runnable parallel recebe um dicion√°rio de runnables
chain_critica_ficticia = prompt_critica | llm | StrOutputParser() # type: ignore

parallel_chains = RunnableParallel({ # type: ignore
    "info_movie" : chain_movie_info,
    "critica_ficticia" : chain_critica_ficticia 
})

#* Executando a chain paralela
resultado_paralelo = parallel_chains.invoke(input_data) # type: ignore

info_movie = resultado_paralelo['info_movie']
critica = resultado_paralelo['critica_ficticia']

print(f"Filme: {input_data['filme']}")
print(f"Diretor: {info_movie.diretor}")
print(f"Ano: {info_movie.ano}")
print(f"G√™nero: {info_movie.genero}")
print(f"Cr√≠tica Fict√≠cia: {critica}")



Filme: The Hobbit
Diretor: Peter Jackson
Ano: 2012
G√™nero: Aventura
Cr√≠tica Fict√≠cia: "The Hobbit" oferece uma jornada visualmente deslumbrante, mas se estende demais ao tentar replicar a grandiosidade de "O Senhor dos An√©is" em tr√™s partes.


Usando a `RunnablePassthrough` para enriquecer a entrada inicial do fluxo

1. `RunnablePassthrough()`: recebe o dicion√°rio de entrada ({"filme" : "The Hobbit"}) e o passa adiante intacto.

2. `.assign`(**movie_info = chain_movie_info**): Executa a chain_movie_info e adiciona o seu resultado (o objeto `MovieInfo`) ao dicion√°rio, sobe nova chave - 
`"movie_info"`.

In [9]:
from langchain_core.runnables import RunnablePassthrough

#* Reutilizamos a sua chain que j√° busca as informa√ß√µes do filme
#* chain_movie_info = prompt_movie | llm_structured

#* primeira parte da chain final 
chain_enriched = RunnablePassthrough.assign(
    # A chave 'movie_info' guardar√° o resultado de chain_movie_info
    movie_info = chain_movie_info
)

#* Criamos um prompt simples para a sugest√£o 
prompt_sugestao = ChatPromptTemplate([
    ("system", """Voc√™ √© um especialista em cinema. Responda de forma concisa e direta. Usando no m√°ximo 5 palavras."""),
    ("user",   """Sugira um outro filme famoso do mesmo diretor {diretor}.""")
])

#* Criamos a chain completa, adicionando a segunda "parada"

chain_final = chain_enriched | RunnablePassthrough.assign(
    sugestao_movie = (
                    # Esta lambda extrai o nome do diretor do passo anterior
                    # e o formata para o pr√≥ximo prompt.
                    (lambda x: {"diretor": x['movie_info'].diretor})
                    | prompt_sugestao
                    | llm
                    | StrOutputParser()
                )
             )

In [10]:
chain_final_sequencial = (RunnablePassthrough.assign(
    movie_info = chain_movie_info
)
| RunnablePassthrough.assign(   
    sugestao_movie = (
        (lambda x: {"diretor": x['movie_info'].diretor})
        | prompt_sugestao
        | llm
        | StrOutputParser()
      )
    )
)

In [11]:
# --- Execu√ß√£o e Resultado ---
resultado_final = chain_final_sequencial.invoke(input_data)

print("--- An√°lise Sequencial do Filme ---")
print(f"Filme Analisado: {resultado_final['filme']}")
print(f"Diretor: {resultado_final['movie_info'].diretor}")
print(f"Ano: {resultado_final['movie_info'].ano}")
print("\n--- Informa√ß√£o Adicional Gerada ---")
print(f"Sugest√£o de outro filme do mesmo diretor: {resultado_final['sugestao_movie']}")

--- An√°lise Sequencial do Filme ---
Filme Analisado: The Hobbit
Diretor: Peter Jackson
Ano: 2012

--- Informa√ß√£o Adicional Gerada ---
Sugest√£o de outro filme do mesmo diretor: "O Senhor dos An√©is".


## Exerc√≠cios de fixa√ß√£o: 
____

Objetivo: Obter informa√ß√µes b√°sicas sobre um filme:

1. `input_data` = {"movie": "Um Sonho de Liberdade"}

2. `movie_info_data`= {

    "Diretor" : str,

    "Atores": list[str],

    "Ano": int
}

In [12]:
import json

class MovieInfoData(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    atores: list[str] = Field(..., description="Lista de atores do filme")
    roteiristas: list[str] = Field(..., description="Lista de roteiristas do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")
    genero: str = Field(..., description="G√™nero do filme")

#* Definindo a llm que ser√° usada para extrair as informa√ß√µes
# Modelo com temperatura para precis√£o
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)
llm_structured = llm.with_structured_output(MovieInfoData) # type: ignore

#* Criando o prompt para instruir o LLM a extrair as informa√ß√µes 
prompt_movie_data = ChatPromptTemplate([    
    ("system", """Voc√™ √© um especialista em cinema. 
     Responda sempre com informa√ß√µes confi√°veis. Se n√£o souber, use 'N√£o encontrado'."""),
    ("user", """Forne√ßa informa√ß√µes sobre o filme {movie}.""")
])

#* Criando a chain principal
chain_movie_data = prompt_movie_data | llm_structured # type: ignore

#* Input data
input_data = {"movie": "Um Sonho de Liberdade"}

#* Executando a chain
result = chain_movie_data.invoke(input_data) # type: ignore

#* Exibindo o resultado
print("---- Resultado da chain  ----")
print(f"Diretor: {result.diretor}")
print(f"Atores: {result.atores[:3]}")
print(f"Ano: {result.ano}")
print(f"G√™nero: {result.genero}")
print(f"Roteiristas: {result.roteiristas}")

---- Resultado da chain  ----
Diretor: Frank Darabont
Atores: ['Tim Robbins', 'Morgan Freeman', 'Bob Gunton']
Ano: 1994
G√™nero: Drama
Roteiristas: ['Frank Darabont']


Na tarefa anterior, extra√≠mos algumas informa√ß√µes a partir do dicion√°rio:

    * input_data = {"movie": "Um Sonho de Liberdade"}

    * output_data: result = {
        diretor: ...,
        atores: ...,
        ano: ...,
        g√™nero: ...,
        roteiristas: ...
    }

A nova tarefa consiste em conseguir o nome do filme na lingua inglesa, n√£o √© uma tradu√ß√£o √© uma busca do nome do filme, portanto o input da segunda tarefa √© o mesmo que da primeira, dessa forma podemos usar um `RunnableParallel`, para executar as duas tarefas ao mesmo tempo.

Para manter a estrutura system/user, a forma correta √© usar o `system`para definir a persona e o comportamento e o `user`para fazer a pergunta.

In [13]:
# Prompt espec√≠fico para a nova tarefa
prompt_titulo_ingles = ChatPromptTemplate([
    ("system", "Voc√™ √© um pesquisador especialista em cinema que responde de forma direta. Com apenas o t√≠tulo do filme."),
    ("user", "Qual √© o t√≠tulo original em ingl√™s do filme '{movie}'?")
])

# Chain para a nova tarefa
chain_titulo_ingles = prompt_titulo_ingles | llm | StrOutputParser()

In [14]:
from langchain_core.runnables import RunnableParallel

# Sua chain original que busca os dados
# chain_movie_data = prompt_movie_data | llm_structured

# Juntando as duas tarefas independentes
tarefas_paralelas = RunnableParallel({
    "dados_filme": chain_movie_data,      # Tarefa 1
    "titulo_ingles": chain_titulo_ingles, # Tarefa 2
})

In [15]:
# O mesmo input de antes
input_data = {"movie": "Um Sonho de Liberdade"}

# Executa as duas tarefas ao mesmo tempo
resultado_final = tarefas_paralelas.invoke(input_data)

# Extrai os resultados de cada chave
dados = resultado_final['dados_filme']
titulo_en = resultado_final['titulo_ingles']

# Exibe o resultado combinado
print(f"--- An√°lise do Filme: {input_data['movie']} ---")
print(f"T√≠tulo Original: {titulo_en}")
print(f"Diretor: {dados.diretor}")
print(f"Atores: {dados.atores}")
print(f"Ano: {dados.ano}")

--- An√°lise do Filme: Um Sonho de Liberdade ---
T√≠tulo Original: The Shawshank Redemption.
Diretor: Frank Darabont
Atores: ['Tim Robbins', 'Morgan Freeman', 'Bob Gunton', 'William Sadler', 'Clancy Brown', 'Gil Bellows', 'James Whitmore']
Ano: 1994


Exerc√≠cio adicional ao anterior: Incluir filmografia do ator principal

1. As informa√ß√µes originais do filme(MovieInfoData)
2. extrair do MovieInfoData - o ator principal que deve ser o primeiro da lista do objeto de sa√≠da
3. montar prompt pra extrair filmografia


Como o fluxo acima √© sequencial, podemos usar o RunnablePassthrough.assign() para orquestrar o processo


In [1]:
import os
import datetime
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
from pydantic import BaseModel, Field
from typing import List
from dotenv import load_dotenv, find_dotenv

# Carregar vari√°veis de ambiente (necess√°rio para a chave da API)
load_dotenv(find_dotenv())

# --- PASSO 0: DEFINI√á√ÉO DAS ESTRUTURAS DE DADOS (Modelos Pydantic) ---
# Estrutura para os dados iniciais do filme
class MovieInfoData(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    atores: List[str] = Field(..., description="Lista de atores principais do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")

# Estrutura para a sa√≠da da filmografia
class Filmografia(BaseModel):
    filmes: List[str] = Field(description="Lista de filmes not√°veis em que o ator participou")

# --- PASSO 1: CONSTRU√á√ÉO DAS "FERRAMENTAS" (As Sub-Chains Isoladas) ---

# Configura√ß√£o do LLM
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)

# Ferramenta 1: Chain para buscar os dados iniciais do filme
prompt_movie_data = ChatPromptTemplate.from_template(
    """Voc√™ √© um especialista em cinema. 
    Forne√ßa o diretor, o ano e a lista dos 3 atores principais do filme {movie}."""
)
chain_busca_dados_filme = prompt_movie_data | llm.with_structured_output(MovieInfoData)

# Ferramenta 2: Chain para buscar a filmografia de um ator
ano_atual = datetime.datetime.now().year
prompt_filmografia = ChatPromptTemplate.from_template(
    """Voc√™ √© um especialista em filmografia de atores.
    Liste filmes not√°veis em que o ator {ator} participou, lan√ßados estritamente depois do ano {ano_inicio} at√© o ano {ano_corrente}.
    N√£o inclua o filme do ano {ano_inicio}. Responda apenas com a lista de filmes."""
)
chain_busca_filmografia = prompt_filmografia | llm.with_structured_output(Filmografia)

# --- PASSO 2: MONTAGEM DA LINHA DE PRODU√á√ÉO (Pipeline Sequencial) ---

# Esta√ß√£o 1: Pega o nome do filme e adiciona os dados completos.
# Sa√≠da deste pipeline: {'movie': ..., 'dados_filme': MovieInfoData(...)}
pipeline_passo_1_info_filme = RunnablePassthrough.assign(
    dados_filme=chain_busca_dados_filme
)

# Esta√ß√£o 2: Pega o resultado anterior e adiciona o ator principal e o ano.
# Sa√≠da deste pipeline: {'movie': ..., 'dados_filme': ..., 'ator_principal': ..., 'ano_filme': ...}
pipeline_passo_2_ator_e_ano = pipeline_passo_1_info_filme | RunnablePassthrough.assign(
    ator_principal=(lambda x: x["dados_filme"].atores[0]),
    ano_filme=(lambda x: x["dados_filme"].ano)
)

# Esta√ß√£o 3: Pega o resultado anterior e adiciona a filmografia.
# Primeiro, criamos o "adaptador" para a Ferramenta 2.
adaptador_para_filmografia = lambda x: {
    "ator": x["ator_principal"],
    "ano_inicio": x["ano_filme"],
    "ano_corrente": ano_atual
}
# E agora, a pipeline final
pipeline_final_com_filmografia = pipeline_passo_2_ator_e_ano | RunnablePassthrough.assign(
    filmografia_resultado=(adaptador_para_filmografia | chain_busca_filmografia)
)


# --- PASSO 3: EXECU√á√ÉO E EXIBI√á√ÉO ---
input_data = {"movie": "Um Sonho de Liberdade"}
resultado_final = pipeline_final_com_filmografia.invoke(input_data)

print(f"--- An√°lise para o filme: {resultado_final['movie']} ---")
print(f"Ator principal identificado: {resultado_final['ator_principal']} (do filme de {resultado_final['ano_filme']})")
print("\n--- Filmografia do ator desde ent√£o ---")
# Acessamos o resultado final e o atributo .filmes do objeto Pydantic
for filme in resultado_final['filmografia_resultado'].filmes:
    print(f"- {filme}")

--- An√°lise para o filme: Um Sonho de Liberdade ---
Ator principal identificado: Tim Robbins (do filme de 1994)

--- Filmografia do ator desde ent√£o ---
- Dead Man Walking (1995)
- Arlington Road (1999)
- The Shawshank Redemption (1994)
- High Fidelity (2000)
- Antitrust (2001)
- The Truth About Charlie (2002)
- Mystic River (2003)
- Code 46 (2003)
- War of the Worlds (2005)
- Zathura: A Space Adventure (2005)
- Catch a Fire (2006)
- Noise (2007)
- City of Ember (2008)
- Green Lantern (2011)
- Back to 1942 (2012)
- A Perfect Day (2015)
- Marjorie Prime (2017)
- Dark Waters (2019)
- VHYes (2019)
- Here and Now (2018)


# Nossa meta: definir esta pipeline completa.
# Ela representa a sequ√™ncia de TODAS as nossas opera√ß√µes.
pipeline_completa = (
    etapa_1_busca_paralela_de_dados
    |
    etapa_2_extracao_de_ator_e_ano
    |
    etapa_3_busca_de_filmografia
)

### Contrato de dados que ser√£o usados no pipeline

In [2]:
from pydantic import BaseModel, Field
from typing import List

# Contrato para os dados principais do filme
class MovieInfoData(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    atores: List[str] = Field(..., description="Lista de atores principais do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")

# Contrato para o resultado da filmografia
class Filmografia(BaseModel):
    filmes: List[str] = Field(description="Lista de filmes not√°veis em que o ator participou")

`Passo 3: Construir Cada Etapa (Preenchendo o Esqueleto)`

Agora, vamos criar as pe√ßas para preencher nosso esqueleto do Passo 1.

    3.A - Construindo a etapa_1_busca_paralela_de_dados

        Objetivo: Buscar os dados do filme e o t√≠tulo em ingl√™s ao mesmo tempo.

        Ferramenta: RunnableParallel.

    C√≥digo:

Pense no .assign() n√£o como algo que vem depois da primeira etapa, mas como a ferramenta que constr√≥i cada etapa sequencial que adiciona dados, incluindo a primeira.

No nosso exemplo "Top-Down":

etapa_1_busca_paralela_de_dados foi a primeira etapa, e ela n√£o usou .assign porque era um RunnableParallel.

etapa_2_extracao_de_ator_e_ano foi a segunda etapa, e ela foi constru√≠da com um .assign.

`A regra √©: sempre que voc√™ quiser pegar o dicion√°rio que est√° fluindo na pipeline e adicionar uma nova chave a ele, voc√™ constr√≥i essa etapa com um RunnablePassthrough.assign()`

Vamos formalizar o seu modelo, que √© um resumo fant√°stico:

`chain = prompt | llm | output_parser`

Onde:

    1. A chain (A Ferramenta Completa): √â a unidade de trabalho que resolve um problema espec√≠fico. Ex: chain_busca_dados_filme.

    2. O prompt (O Manual de Instru√ß√µes): Exatamente como voc√™ disse, √© a "ferramenta para o problema a resolver". Ele define a tarefa, o contexto, as regras e o que se espera do motor.

    3. O llm (O Motor / A CPU): √â o componente que processa as instru√ß√µes do manual e gera o resultado bruto. √â a for√ßa de trabalho intelectual.

    4. O output_parser (O Molde / O Acabamento): √â a etapa final que pega o resultado bruto do motor e o formata exatamente "como queremos que o output saia", seja transformando-o em um objeto Pydantic, uma string limpa, uma lista, etc.

In [3]:
# --- CONSTRU√á√ÉO DA FERRAMENTA 1: chain_busca_dados_filme ---

# 1. Defini√ß√£o do LLM (corrigindo o nome do modelo para 'gpt-4o')
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)

# 2. Vinculando o LLM √† nossa estrutura de dados Pydantic
llm_structured = llm.with_structured_output(MovieInfoData)

# 3. Defini√ß√£o do Prompt (Manual de Instru√ß√µes)
# Corrigindo a sintaxe para uma lista de tuplas: [ ("role", "message") ]
prompt_movie_data = ChatPromptTemplate([
    ("system", "Voc√™ √© um especialista em cinema. Responda com as informa√ß√µes solicitadas."),
    ("user", "Forne√ßa o diretor, o ano e a lista dos 3 atores principais do filme {movie}.")
])

# 4. Montagem final da Ferramenta/Chain
# Usando o nome da vari√°vel que planejamos na nossa arquitetura
chain_busca_dados_filme = prompt_movie_data | llm_structured

# --- TESTE ISOLADO DA FERRAMENTA ---
# Corrigindo a sintaxe do dicion√°rio (chaves e valores de texto precisam de aspas)
input_teste = {"movie": "Um Sonho de Liberdade"}

print("Executando teste da Ferramenta 1: chain_busca_dados_filme...")
resultado_ferramenta_1 = chain_busca_dados_filme.invoke(input_teste)

# Imprime o objeto Pydantic resultante
print(resultado_ferramenta_1)

Executando teste da Ferramenta 1: chain_busca_dados_filme...
diretor='Frank Darabont' atores=['Tim Robbins', 'Morgan Freeman', 'Bob Gunton'] ano=1994


In [4]:
# --- CONSTRU√á√ÉO DA FERRAMENTA 2: chain_busca_titulo_en ---

from langchain_core.output_parsers import StrOutputParser

# 1. Defini√ß√£o do Prompt (Manual de Instru√ß√µes)
prompt_titulo_en = ChatPromptTemplate([
    ("system", "Voc√™ √© um pesquisador especialista em cinema que responde de forma concisa, direta e apenas com a informa√ß√£o solicitada."),
    ("user", "Qual √© o t√≠tulo original em ingl√™s do filme '{movie}'?")
])

# 2. Montagem final da Ferramenta/Chain
#    Usando o mesmo llm que j√° definimos antes.
chain_busca_titulo_en = prompt_titulo_en | llm | StrOutputParser()


# --- TESTE ISOLADO DA FERRAMENTA ---
input_teste = {"movie": "Um Sonho de Liberdade"}

print("Executando teste da Ferramenta 2: chain_busca_titulo_en...")
resultado_ferramenta_2 = chain_busca_titulo_en.invoke(input_teste)

# Imprime o resultado e o tipo para confirmar que √© uma string
print(f"Resultado do teste: '{resultado_ferramenta_2}'")
print(f"Tipo do resultado: {type(resultado_ferramenta_2)}")

Executando teste da Ferramenta 2: chain_busca_titulo_en...
Resultado do teste: 'O t√≠tulo original em ingl√™s do filme "Um Sonho de Liberdade" √© "The Shawshank Redemption".'
Tipo do resultado: <class 'str'>


In [5]:
# --- MONTAGEM DA ETAPA 1: A Busca Paralela ---

from langchain_core.runnables import RunnableParallel

# Nossas duas ferramentas j√° foram definidas nos passos anteriores:
# chain_busca_dados_filme  -> Retorna um objeto MovieInfoData
# chain_busca_titulo_en    -> Retorna uma string

# Agora, criamos a etapa que executa as duas em paralelo
etapa_1_busca_paralela_de_dados = RunnableParallel({
    "dados_filme": chain_busca_dados_filme,
    "titulo_en": chain_busca_titulo_en,
})


# --- TESTE ISOLADO DA ETAPA 1 ---
input_teste = {"movie": "Um Sonho de Liberdade"}

print("Executando teste da Etapa 1: Busca Paralela...")
resultado_etapa_1 = etapa_1_busca_paralela_de_dados.invoke(input_teste)

# Exibindo o resultado completo da etapa
print("\n--- Resultado da Etapa Paralela ---")
# O resultado √© um dicion√°rio com as sa√≠das de cada ferramenta
print(resultado_etapa_1)

print("\n--- Detalhes do Resultado ---")
print(f"Dados do Filme (tipo: {type(resultado_etapa_1['dados_filme'])}): {resultado_etapa_1['dados_filme']}")
print(f"T√≠tulo em Ingl√™s (tipo: {type(resultado_etapa_1['titulo_en'])}): '{resultado_etapa_1['titulo_en']}'")

Executando teste da Etapa 1: Busca Paralela...

--- Resultado da Etapa Paralela ---
{'dados_filme': MovieInfoData(diretor='Frank Darabont', atores=['Tim Robbins', 'Morgan Freeman', 'Bob Gunton'], ano=1994), 'titulo_en': 'O t√≠tulo original em ingl√™s do filme "Um Sonho de Liberdade" √© "The Shawshank Redemption".'}

--- Detalhes do Resultado ---
Dados do Filme (tipo: <class '__main__.MovieInfoData'>): diretor='Frank Darabont' atores=['Tim Robbins', 'Morgan Freeman', 'Bob Gunton'] ano=1994
T√≠tulo em Ingl√™s (tipo: <class 'str'>): 'O t√≠tulo original em ingl√™s do filme "Um Sonho de Liberdade" √© "The Shawshank Redemption".'


In [None]:
# Precisamos das duas "ferramentas" que esta etapa vai executar em paralelo
chain_busca_dados_filme = ... # (vamos definir isso em breve)
chain_busca_titulo_en = ...   # (vamos definir isso em breve)

etapa_1_busca_paralela_de_dados = RunnableParallel({
    "dados_filme": chain_busca_dados_filme,
    "titulo_en": chain_busca_titulo_en,
})

# A SA√çDA DESTA ETAPA SER√Å UM DICION√ÅRIO:
# {'dados_filme': MovieInfoData(...), 'titulo_en': 'The Shawshank Redemption'}

3.B - Construindo a etapa_2_extracao_de_ator_e_ano

    * Objetivo: Extrair o ator e o ano do resultado da etapa anterior.

    * Ferramenta: RunnablePassthrough.assign com lambdas simples.

    * C√≥digo:

In [None]:
etapa_2_extracao_de_ator_e_ano = RunnablePassthrough.assign(
    ator_principal=(lambda x: x["dados_filme"].atores[0]),
    ano_filme=(lambda x: x["dados_filme"].ano)
)

# A SA√çDA DESTA ETAPA SER√Å O DICION√ÅRIO ANTERIOR, ENRIQUECIDO:
# {'dados_filme': ..., 'titulo_en': ..., 'ator_principal': 'Tim Robbins', 'ano_filme': 1994}

In [8]:
# Assumindo que a 'etapa_1_busca_paralela_de_dados' j√° foi criada
# Sa√≠da da Etapa 1: {'dados_filme': MovieInfoData(...), 'titulo_en': '...'}
import json

etapa_2_extracao_de_ator_e_ano = etapa_1_busca_paralela_de_dados | RunnablePassthrough.assign(
    ator_principal=(lambda x: x["dados_filme"].atores[0]),
    ano_filme=(lambda x: x["dados_filme"].ano)
)

# --- TESTE ISOLADO DA ETAPA 2 ---
input_teste = {"movie": "Um Sonho de Liberdade"}

print("Executando teste da Etapa 2: Extra√ß√£o de Dados...")
resultado_etapa_2 = etapa_2_extracao_de_ator_e_ano.invoke(input_teste)

print("\n--- Resultado ap√≥s a Etapa 2 ---")
# O dicion√°rio agora est√° mais rico
print(resultado_etapa_2)

Executando teste da Etapa 2: Extra√ß√£o de Dados...

--- Resultado ap√≥s a Etapa 2 ---
{'dados_filme': MovieInfoData(diretor='Frank Darabont', atores=['Tim Robbins', 'Morgan Freeman', 'Bob Gunton'], ano=1994), 'titulo_en': 'O t√≠tulo original em ingl√™s √© "The Shawshank Redemption".', 'ator_principal': 'Tim Robbins', 'ano_filme': 1994}


3.C - Construindo a etapa_3_busca_de_filmografia

    * Objetivo: Usar os dados extra√≠dos para buscar a filmografia.
    * Ferramenta: RunnablePassthrough.assign com uma sub-chain mais complexa.
    * C√≥digo:

In [None]:
# Precisamos da "ferramenta" de busca de filmografia
chain_busca_filmografia = ... # (vamos definir isso em breve)

# E do "adaptador" para preparar os dados para essa ferramenta
adaptador_para_filmografia = ... # (vamos definir isso em breve)

etapa_3_busca_de_filmografia = RunnablePassthrough.assign(
    filmografia_resultado=(adaptador_para_filmografia | chain_busca_filmografia)
)

# A SA√çDA FINAL SER√Å O DICION√ÅRIO COMPLETO:
# {'dados_filme': ..., 'titulo_en': ..., 'ator_principal': ..., 'ano_filme': ..., 'filmografia_resultado': Filmografia(...)}

Com prazer! Sua √∫ltima frase √© a conclus√£o perfeita de todo o nosso exerc√≠cio. Voc√™ resumiu a fun√ß√£o e a import√¢ncia do RunnablePassthrough.assign de forma brilhante.

"...sempre que formos precisar de que os dados sejam preservados entre uma chain e outro √© necess√°rio usar RunnablePassthrough.assign, pois ele √© um sequencial de chains, conservando os dados de entrada naquela sequ√™ncia espec√≠fica."

Exatamente: o | (pipe) cria a sequ√™ncia, e o .assign() em cada passo garante a conserva√ß√£o e o enriquecimento dos dados para a etapa seguinte.

Chegou a hora de juntar tudo. Abaixo est√° o c√≥digo completo da nossa arquitetura final. Ele est√° autocontido e pronto para rodar. Logo em seguida, apresento a sa√≠da detalhada, explicando a origem de cada parte do resultado, como voc√™ pediu.

In [None]:
import os
import datetime
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough, RunnableParallel
from langchain_core.output_parsers import StrOutputParser
from pydantic import BaseModel, Field
from typing import List
from dotenv import load_dotenv, find_dotenv

# Carregar vari√°veis de ambiente (necess√°rio para a chave da API)
# Certifique-se de que seu .env est√° configurado para o LangSmith
load_dotenv(find_dotenv())

# --- ATO I: DEFINI√á√ÉO DAS ESTRUTURAS DE DADOS (Nossos "Contratos") ---
class MovieInfoData(BaseModel):
    diretor: str = Field(..., description="Nome do diretor do filme")
    atores: List[str] = Field(..., description="Lista dos 3 atores principais do filme")
    ano: int = Field(..., description="Ano de lan√ßamento do filme")

class Filmografia(BaseModel):
    filmes: List[str] = Field(description="Lista de filmes not√°veis em que o ator participou")

# --- ATO II: CONSTRU√á√ÉO DAS "FERRAMENTAS" (Nossas Chains Independentes) ---

# Configura√ß√£o do LLM que ser√° usado por todas as ferramentas
llm = ChatOpenAI(model="gpt-4o", temperature=0.0)

# Ferramenta 1: Chain para buscar os dados iniciais do filme
prompt_movie_data = ChatPromptTemplate.from_template(
    "Voc√™ √© um especialista em cinema. Forne√ßa o diretor, o ano e a lista dos 3 atores principais do filme {movie}."
)
chain_busca_dados_filme = prompt_movie_data | llm.with_structured_output(MovieInfoData)

# Ferramenta 2: Chain para buscar o t√≠tulo em ingl√™s
prompt_titulo_en = ChatPromptTemplate.from_template(
    "Voc√™ √© um pesquisador especialista em cinema. Qual √© o t√≠tulo original em ingl√™s do filme '{movie}'? Responda apenas com o t√≠tulo, nada mais."
)
chain_busca_titulo_en = prompt_titulo_en | llm | StrOutputParser()

# Ferramenta 3: Chain para buscar a filmografia de um ator
ano_atual = datetime.datetime.now().year
prompt_filmografia = ChatPromptTemplate.from_template(
    """Voc√™ √© um especialista em filmografia de atores.
    Liste filmes not√°veis em que o ator {ator} participou, lan√ßados estritamente depois do ano {ano_inicio} at√© o ano {ano_corrente}.
    N√£o inclua o filme do ano {ano_inicio}. Responda apenas com a lista de filmes."""
)
chain_busca_filmografia = prompt_filmografia | llm.with_structured_output(Filmografia)

# --- ATO III: MONTAGEM DA LINHA DE PRODU√á√ÉO (A Pipeline Completa) ---

# Etapa 1: Busca paralela dos dados iniciais e do t√≠tulo em ingl√™s
etapa_1_busca_paralela = RunnableParallel({
    "dados_filme": chain_busca_dados_filme,
    "titulo_en": chain_busca_titulo_en,
})

# Etapa 2: Extra√ß√£o sequencial do ator e ano a partir dos dados da Etapa 1
etapa_2_extracao = RunnablePassthrough.assign(
    ator_principal=(lambda x: x["dados_filme"].atores[0]),
    ano_filme=(lambda x: x["dados_filme"].ano)
)

# Etapa 3: Busca sequencial da filmografia usando os dados extra√≠dos na Etapa 2
adaptador_para_filmografia = lambda x: {
    "ator": x["ator_principal"],
    "ano_inicio": x["ano_filme"],
    "ano_corrente": ano_atual
}
etapa_3_filmografia = RunnablePassthrough.assign(
    filmografia_resultado=(adaptador_para_filmografia | chain_busca_filmografia)
)

# Montagem da Pipeline Completa (O Gerente Geral)
pipeline_completa = etapa_1_busca_paralela | etapa_2_extracao | etapa_3_filmografia


# --- ATO IV: EXECU√á√ÉO E AN√ÅLISE DO RESULTADO ---
input_data = {"movie": "Um Sonho de Liberdade"}
resultado_final = pipeline_completa.invoke(input_data)


# --- AN√ÅLISE DETALHADA DO RESULTADO FINAL ---
print("="*60)
print("IN√çCIO DA AN√ÅLISE DA PIPELINE")
print("="*60)

print(f"\n‚û°Ô∏è 1. DADO DE ENTRADA (INPUT)")
print(f"   - {input_data}")

print("\n\n‚úÖ 2. DICION√ÅRIO FINAL (OUTPUT ENRIQUECIDO)")

# Iterando sobre o dicion√°rio final para explicar a origem de cada chave
for chave, valor in resultado_final.items():
    if chave == "dados_filme":
        print(f"\n   - Chave '{chave}':")
        print(f"     - Origem: Gerado pela 'chain_busca_dados_filme' dentro da Etapa 1 (Paralela).")
        print(f"     - Valor: {valor}")
    elif chave == "titulo_en":
        print(f"\n   - Chave '{chave}':")
        print(f"     - Origem: Gerado pela 'chain_busca_titulo_en' dentro da Etapa 1 (Paralela).")
        print(f"     - Valor: '{valor}'")
    elif chave == "ator_principal":
        print(f"\n   - Chave '{chave}':")
        print(f"     - Origem: Extra√≠do por uma 'lambda' do campo 'atores' na Etapa 2 (Sequencial).")
        print(f"     - Valor: '{valor}'")
    elif chave == "ano_filme":
        print(f"\n   - Chave '{chave}':")
        print(f"     - Origem: Extra√≠do por uma 'lambda' do campo 'ano' na Etapa 2 (Sequencial).")
        print(f"     - Valor: {valor}")
    elif chave == "filmografia_resultado":
        print(f"\n   - Chave '{chave}':")
        print(f"     - Origem: Gerado pela 'chain_busca_filmografia' na Etapa 3 (Sequencial).")
        print(f"     - Valor: {valor.filmes}")

print("\n" + "="*60)
print("FIM DA AN√ÅLISE")
print("="*60)