# Ciclo de Vida da Engenharia de Prompts

### Configuração

In [None]:
# Você pode defini-las diretamente
import os
os.environ["GOOGLE_API_KEY"] = ""
os.environ["LANGSMITH_API_KEY"] = ""
os.environ["LANGSMITH_TRACING"] = "true"
os.environ["LANGSMITH_PROJECT"] = "langsmith-academy"

In [None]:
# Ou você pode usar um arquivo .env
from dotenv import load_dotenv
load_dotenv(dotenv_path="../../.env", override=True)

### Registrar um rastreamento

In [None]:
from app import langsmith_rag

question = "Como configurar rastreamento para LangSmith com @traceable?"
langsmith_rag(question)

### Criar um Dataset

Vamos criar um dataset para avaliar esta etapa específica de nossa aplicação

In [None]:
from langsmith import Client

example_dataset = [
    (
        "Como configurar rastreamento para LangSmith com @traceable?",
        """ 2. Registrar um rastreamento​\nUma vez que você configurou seu ambiente, pode chamar executáveis do LangChain normalmente.\nLangSmith inferirá a configuração de rastreamento adequada:\n\nComo registrar e visualizar rastreamentos no LangSmith | 🦜️🛠️ LangSmith\n\n2. Registrar um rastreamento​\nUma vez que você configurou seu ambiente, envolva ou decore as funções/SDKs personalizados que você quer rastrear.\nLangSmith então inferirá a configuração de rastreamento adequada:\n\nIr para conteúdo principalIr para Docs da APIBuscarRegiãoUSEUIr para AppInício rápidoObservabilidadeGuia ConceitualGuias Como FazerRastreamentoAnotar código para rastreamentoAtivar e desativar rastreamentoFazer upload de arquivos com rastreamentosRegistrar rastreamentos para projeto específicoDefinir taxa de amostragem para rastreamentosAdicionar metadados e tags aos rastreamentosImplementar rastreamento distribuídoAcessar a execução atual (span) dentro de uma função rastreadaRegistrar rastreamentos multimodaisRegistrar rastreamentos de retrieverRegistrar rastreamentos LLM personalizadosEvitar registro de dados sensíveis em rastreamentosConsultar rastreamentosCompartilhar ou descompartilhar um rastreamento publicamenteComparar rastreamentosRastrear funções geradorasRastrear com LangChain (Python e JS/TS)Rastrear com LangGraph (Python e JS/TS)Rastrear com Instructor (apenas Python)Rastrear com Vercel AI SDK (apenas JS/TS)Rastrear sem definir variáveis de ambienteRastrear usando a API REST do LangSmithCalcular custos baseados em tokens para rastreamentosResolução de problemas de aninhamento de rastreamento[Beta] Exportação em lote de dados de rastreamentoRastrear funções JS em ambientes serverlessMonitoramento e automaçõesTutoriaisAdicionar observabilidade à sua aplicação LLMAvaliaçãoEngenharia de PromptsImplantação (LangGraph Cloud)AdministraçãoAuto-hospedagemReferênciaObservabilidadeGuias Como FazerRastreamentoAnotar código para rastreamentoNesta páginaAnotar código para rastreamento\nExistem várias maneiras de registrar rastreamentos no LangSmith.\ndicaSe você está usando LangChain (Python ou JS/TS), pode pular esta seção e ir diretamente para as instruções específicas do LangChain.\nUsar @traceable / traceable​\nLangSmith facilita o registro de rastreamentos com mudanças mínimas ao seu código existente com o decorador @traceable em Python e função traceable em TypeScript.\nnotaA variável de ambiente LANGSMITH_TRACING deve estar definida como 'true' para que os rastreamentos sejam registrados no LangSmith, mesmo ao usar @traceable ou traceable. Isso permite ativar e desativar o rastreamento sem mudar seu código.Além disso, você precisará definir a variável de ambiente LANGSMITH_API_KEY com sua chave de API (veja Configuração para mais informações).Por padrão, os rastreamentos serão registrados em um projeto chamado default.\nPara registrar rastreamentos em um projeto diferente, veja esta seção. \n\n""",
        "Para configurar rastreamento no LangSmith usando o decorador `@traceable` em Python, primeiro certifique-se de ter a variável de ambiente `LANGSMITH_TRACING` definida como 'true' e a `LANGSMITH_API_KEY` definida com sua chave de API. Então, você pode simplesmente decorar suas funções assim:\n\n```python\nfrom langsmith import traceable\n\n@traceable\ndef minha_funcao():\n    # Seu código aqui\n    pass\n```\n\nIsso registrará rastreamentos para `minha_funcao` automaticamente uma vez que as variáveis de ambiente necessárias estejam configuradas."
    ),
    (
        "Como posso usar o gerenciador de contexto de rastreamento?",
        """Usar o gerenciador de contexto trace (apenas Python)​\nEm Python, você pode usar o gerenciador de contexto trace para registrar rastreamentos no LangSmith. Isso é útil em situações onde:\n\nVocê quer registrar rastreamentos para um bloco específico de código.\nVocê quer controle sobre as entradas, saídas e outros atributos do rastreamento.\nNão é viável usar um decorador ou wrapper.\nQualquer um ou todos os itens acima.\n\nEm alguns ambientes, não é possível definir variáveis de ambiente. Nesses casos, você pode definir a configuração de rastreamento programaticamente.\nComportamento recentemente alteradoDevido a várias solicitações para controle mais fino do rastreamento usando o gerenciador de contexto trace,\nmudamos o comportamento do with trace para honrar a variável de ambiente LANGSMITH_TRACING na versão 0.1.95 do SDK Python. Você pode encontrar mais detalhes nas notas de lançamento.\nA maneira recomendada de desabilitar/habilitar rastreamento sem definir variáveis de ambiente é usar o gerenciador de contexto with tracing_context, como mostrado no exemplo abaixo.\nPythonTypeScriptA maneira recomendada de fazer isso em Python é usar o gerenciador de contexto tracing_context. Isso funciona tanto para código anotado com traceable quanto para código dentro do gerenciador de contexto trace.\n\nIr para conteúdo principalIr para Docs da APIBuscarRegiãoUSEUIr para AppInício rápidoObservabilidadeGuia ConceitualGuias Como FazerRastreamentoAnotar código para rastreamentoAtivar e desativar rastreamentoFazer upload de arquivos com rastreamentosRegistrar rastreamentos para projeto específicoDefinir taxa de amostragem para rastreamentosAdicionar metadados e tags aos rastreamentosImplementar rastreamento distribuídoAcessar a execução atual (span) dentro de uma função rastreadaRegistrar rastreamentos multimodaisRegistrar rastreamentos de retrieverRegistrar rastreamentos LLM personalizadosEvitar registro de dados sensíveis em rastreamentosConsultar rastreamentosCompartilhar ou descompartilhar um rastreamento publicamenteComparar rastreamentosRastrear funções geradorasRastrear com LangChain (Python e JS/TS)Rastrear com LangGraph (Python e JS/TS)Rastrear com Instructor (apenas Python)Rastrear com Vercel AI SDK (apenas JS/TS)Rastrear sem definir variáveis de ambienteRastrear usando a API REST do LangSmithCalcular custos baseados em tokens para rastreamentosResolução de problemas de aninhamento de rastreamento[Beta] Exportação em lote de dados de rastreamentoRastrear funções JS em ambientes serverlessMonitoramento e automaçõesTutoriaisAdicionar observabilidade à sua aplicação LLMAvaliaçãoEngenharia de PromptsImplantação (LangGraph Cloud)AdministraçãoAuto-hospedagemReferênciaObservabilidadeGuias Como FazerRastreamentoResolução de problemas de aninhamento de rastreamentoNesta páginaResolução de problemas de aninhamento de rastreamento\nAo rastrear com o SDK LangSmith, LangGraph e LangChain, o rastreamento deve propagar automaticamente o contexto correto para que o código executado dentro de um rastreamento pai seja renderizado no local esperado na UI.\nSe você vir uma execução filha ir para um rastreamento separado (e aparecer no nível superior), pode ser causado por um dos seguintes 'casos extremos' conhecidos.\nPython​\nO seguinte descreve causas comuns para rastreamentos 'divididos' ao construir com python.\nPropagação de contexto usando asyncio​\nAo usar chamadas assíncronas (especialmente com streaming) em versões do Python < 3.11, você pode encontrar problemas com aninhamento de rastreamento. Isso é porque o asyncio do Python só adicionou suporte completo para passar contexto na versão 3.11.\nPor que​\nLangChain e LangSmith SDK usam contextvars para propagar informações de rastreamento implicitamente. No Python 3.11 e acima, isso funciona perfeitamente. No entanto, em versões anteriores (3.8, 3.9, 3.10), tarefas asyncio carecem de suporte adequado a contextvar, o que pode levar a rastreamentos desconectados.\nPara resolver​\n\nPropagação de contexto usando threading​\nÉ comum começar o rastreamento e querer aplicar algum paralelismo em tarefas filhas, tudo dentro de um único rastreamento. O ThreadPoolExecutor do stdlib do Python por padrão quebra o rastreamento.\nPor que​\nAs contextvars do Python começam vazias dentro de novas threads. Aqui estão duas abordagens para lidar com a manutenção da continuidade do rastreamento:\nPara resolver​\n\n\nUsando ContextThreadPoolExecutor do LangSmith\nLangSmith fornece um ContextThreadPoolExecutor que automaticamente lida com propagação de contexto:\nfrom langsmith.utils import ContextThreadPoolExecutorfrom langsmith import traceable@traceabledef outer_func():    with ContextThreadPoolExecutor() as executor:        inputs = [1, 2]        r = list(executor.map(inner_func, inputs))@traceabledef inner_func(x):    print(x)outer_func()\n\n\nFornecendo manualmente a árvore de execução pai\nAlternativamente, você pode passar manualmente a árvore de execução pai para a função interna:\nfrom langsmith import traceable, get_current_run_treefrom concurrent.futures import ThreadPoolExecutor@traceabledef outer_func():    rt = get_current_run_tree()    with ThreadPoolExecutor() as executor:        r = list(            executor.map(                lambda x: inner_func(x, langsmith_extra={\"parent\": rt}), [1, 2]            )        )@traceabledef inner_func(x):    print(x)outer_func()\nNesta abordagem, usamos get_current_run_tree() para obter a árvore de execução atual e passá-la para a função interna usando o parâmetro langsmith_extra. \n\n """,
        "Você pode usar o gerenciador de contexto de rastreamento envolvendo o código que você quer rastrear com a declaração `with trace_context:`. Aqui está um exemplo simples:\n\n```python\nfrom langsmith import trace_context\n\nwith trace_context:\n    # Seu código rastreável aqui\n    print(\"Rastreando este bloco de código.\")\n``` \n\nIsso registrará rastreamentos no LangSmith para o bloco de código especificado."
    ),
    (
        "Como posso usar RunTree?",
        """PythonTypeScriptimport sys\nsys.path.append('../../')\nfrom gemini_utils import call_gemini_chat\nfrom langsmith.run_trees import RunTree# Isso pode ser uma entrada do usuário para sua appquestion = \"Você pode resumir as reuniões desta manhã?\"# Criar uma execução de nível superiortípeline = RunTree(  name=\"Pipeline de Chat\",  run_type=\"chain\",  inputs={\"question\": question})# Isso pode ser recuperado em uma etapa de recuperaçãocontext = \"Durante a reunião desta manhã, resolvemos todos os conflitos mundiais.\"messages = [  { \"role\": \"system\", \"content\": \"Você é um assistente útil. Por favor, responda à solicitação do usuário apenas com base no contexto fornecido.\" },  { \"role\": \"user\", \"content\": f\"Pergunta: {question}\\nContexto: {context}\"}]# Criar uma execução filhachild_llm_run = pipeline.create_child(  name=\"Chamada Gemini\",  run_type=\"llm\",  inputs={\"messages\": messages},)# Gerar uma conclusãochat_completion = call_gemini_chat(\"gemini-1.5-flash\", messages, 0.0)# Finalizar as execuções e registrá-laschild_llm_run.end(outputs=chat_completion)child_llm_run.postRun()pipeline.end(outputs={\"answer\": chat_completion})pipeline.postRun()import { ChatGoogleGenerativeAI } from \"@langchain/google-genai\";import { RunTree } from \"langsmith\";// Isso pode ser uma entrada do usuário para sua appconst question = \"Você pode resumir as reuniões desta manhã?\";const pipeline = new RunTree({  name: \"Pipeline de Chat\",  run_type: \"chain\",  inputs: { question }});await pipeline.postRun();// Isso pode ser recuperado em uma etapa de recuperaçãoconst context = \"Durante a reunião desta manhã, resolvemos todos os conflitos mundiais.\";const messages = [  { role: \"system\", content: \"Você é um assistente útil. Por favor, responda à solicitação do usuário apenas com base no contexto fornecido.\" },  { role: \"user\", content: `Pergunta: ${question}Contexto: ${context}` }];// Criar uma execução filhaconst childRun = await pipeline.createChild({  name: \"Chamada Gemini\",\n\nAlternativamente, você pode converter o RunnableConfig do LangChain para um objeto RunTree equivalente usando RunTree.fromRunnableConfig ou passar o RunnableConfig como o primeiro argumento da função envolvida por traceable.\n\nfrom langchain_google_genai import ChatGoogleGenerativeAI\nfrom langchain_core.prompts import ChatPromptTemplate\nfrom langchain_core.output_parsers import StrOutputParser\nprompt = ChatPromptTemplate.from_messages([(\"system\", \"Você é uma IA útil.\"),(\"user\", \"{input}\")])\nchat_model = ChatGoogleGenerativeAI(model=\"gemini-1.5-flash\")\noutput_parser = StrOutputParser()\n# Tags e metadados podem ser configurados com RunnableConfig\nchain = (prompt | chat_model | output_parser).with_config({\"tags\": [\"tag-de-nível-superior\"], \"metadata\": {\"chave-de-nível-superior\": \"valor-de-nível-superior\"}})\n# Tags e metadados também podem ser passados em tempo de execução\nchain.invoke({\"input\": \"Qual é o sentido da vida?\"}, {\"tags\": [\"tags-compartilhadas\"], \"metadata\": {\"chave-compartilhada\": \"valor-compartilhado\"}})\nimport { ChatGoogleGenerativeAI } from \"@langchain/google-genai\";\nimport { ChatPromptTemplate } from \"@langchain/core/prompts\";\nimport { StringOutputParser } from \"@langchain/core/output_parsers\";\nconst prompt = ChatPromptTemplate.fromMessages([[\"system\", \"Você é uma IA útil.\"],[\"user\", \"{input}\"])\nconst model = new ChatGoogleGenerativeAI({ modelName: \"gemini-1.5-flash\" });\nconst outputParser = new StringOutputParser();\n// Tags e metadados podem ser configurados com RunnableConfig\nconst chain = (prompt.pipe(model).pipe(outputParser)).withConfig({\"tags\": [\"tag-de-nível-superior\"], \"metadata\": {\"chave-de-nível-superior\": \"valor-de-nível-superior\"}});\n// Tags e metadados também podem ser passados em tempo de execução\n\n""",
        "Você pode usar `RunTree` criando um pipeline onde você define seu nome, tipo e entradas. Por exemplo:\n\n```python\nfrom langsmith.run_trees import RunTree\n\npipeline = RunTree(name=\"Meu Pipeline\", run_type=\"chain\", inputs={\"question\": \"Sua pergunta aqui\"})\n```\n\nVocê pode então criar execuções filhas e gerenciá-las adequadamente dentro do pipeline."
    ),
]

client = Client()
dataset_name = "Perguntas Técnicas"

# Criar dataset
dataset = client.create_dataset(
    dataset_name=dataset_name, description="Perguntas técnicas sobre LangSmith"
)

# Preparar entradas e saídas
inputs = [{"question": q, "context": c} for q, c, _ in example_dataset]
outputs = [{"output": o} for _, _, o in example_dataset]

# Criar exemplos no dataset
client.create_examples(
    inputs=inputs,
    outputs=outputs,
    dataset_id=dataset.id,
)

### Atualizar nossa Aplicação para usar Prompt Hub

Vamos definir praticamente a mesma aplicação RAG de antes - com uma melhoria crucial.

Em vez de puxar nosso `RAG_PROMPT` do utils.py, vamos nos conectar ao Prompt Hub no LangSmith.

Vamos adicionar o trecho de código que puxará nosso prompt no qual acabamos de iterar!

In [None]:
import os
import tempfile
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders.sitemap import SitemapLoader
from langchain_community.vectorstores import SKLearnVectorStore
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langsmith import traceable
from langsmith.client import convert_prompt_to_openai_format
import sys
sys.path.append('../../')
from gemini_utils import call_gemini_chat
from typing import List
import nest_asyncio

MODEL_NAME = "gemini-1.5-flash"
MODEL_PROVIDER = "google"
APP_VERSION = 1.0

# TODO: Remover este prompt hard-coded e substituí-lo por Prompt Hub
RAG_SYSTEM_PROMPT = """Você é um assistente para tarefas de perguntas e respostas.
Use as seguintes partes do contexto recuperado para responder à pergunta mais recente na conversa.
Se você não souber a resposta, apenas diga que não sabe.
Use no máximo três frases e mantenha a resposta concisa.
"""

def get_vector_db_retriever():
    persist_path = os.path.join(tempfile.gettempdir(), "union.parquet")
    embd = GoogleGenerativeAIEmbeddings(model="models/embedding-001")

    # Se o armazenamento vetorial existir, então carregá-lo
    if os.path.exists(persist_path):
        vectorstore = SKLearnVectorStore(
            embedding=embd,
            persist_path=persist_path,
            serializer="parquet"
        )
        return vectorstore.as_retriever(lambda_mult=0)

    # Caso contrário, indexar documentos LangSmith e criar novo armazenamento vetorial
    ls_docs_sitemap_loader = SitemapLoader(web_path="https://docs.smith.langchain.com/sitemap.xml", continue_on_failure=True)
    ls_docs = ls_docs_sitemap_loader.load()

    text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
        chunk_size=500, chunk_overlap=0
    )
    doc_splits = text_splitter.split_documents(ls_docs)

    vectorstore = SKLearnVectorStore.from_documents(
        documents=doc_splits,
        embedding=embd,
        persist_path=persist_path,
        serializer="parquet"
    )
    vectorstore.persist()
    return vectorstore.as_retriever(lambda_mult=0)

nest_asyncio.apply()
retriever = get_vector_db_retriever()

"""
retrieve_documents
- Retorna documentos buscados de um armazenamento vetorial baseado na pergunta do usuário
"""
@traceable(run_type="chain")
def retrieve_documents(question: str):
    return retriever.invoke(question)

"""
generate_response
- Chama `call_gemini` para gerar uma resposta do modelo após formatar entradas
"""
@traceable(run_type="chain")
def generate_response(question: str, documents):
    formatted_docs = "\n\n".join(doc.page_content for doc in documents)
    # TODO: Vamos usar nosso prompt puxado do Prompt Hub em vez de formatar manualmente aqui!
    messages = [
        {
            "role": "system",
            "content": RAG_SYSTEM_PROMPT
        },
        {
            "role": "user",
            "content": f"Contexto: {formatted_docs} \n\n Pergunta: {question}"
        }
    ]
    # formatted_prompt = prompt.invoke({"context":formatted_docs, "question": question})
    # messages = convert_prompt_to_openai_format(formatted_prompt)["messages"]
    return call_gemini(messages)

"""
call_gemini
- Retorna a saída de conclusão de chat do Google Gemini
"""
@traceable(
    run_type="llm",
    metadata={
        "ls_provider": MODEL_PROVIDER,
        "ls_model_name": MODEL_NAME
    }
)
def call_gemini(messages: List[dict]) -> str:
    return call_gemini_chat(MODEL_NAME, messages, 0.0)

"""
langsmith_rag
- Chama `retrieve_documents` para buscar documentos
- Chama `generate_response` para gerar uma resposta baseada nos documentos buscados
- Retorna a resposta do modelo
"""
@traceable(run_type="chain")
def langsmith_rag(question: str):
    documents = retrieve_documents(question)
    response = generate_response(question, documents)
    return response

In [None]:
question = "Como configurar rastreamento para LangSmith com @traceable?"
langsmith_rag(question)