# Introdução ao LangSmith

O LangSmith é uma plataforma para testar, depurar e avaliar aplicativos baseados em LLM.
Neste notebook, vamos explorar os conceitos fundamentais:
1. **Tracing**: Como visualizar o fluxo de execução das suas chains.
2. **Datasets**: Como criar conjuntos de dados para testes.
3. **Avaliação**: Como rodar testes automatizados nos seus datasets.


# Explicação Detalhada do Assunto

# Introdução ao LangSmith

Bem-vindo ao fascinante mundo do LangSmith, a plataforma essencial para transformar seus aplicativos baseados em LLM de protótipos promissores em soluções robustas e confiáveis. Neste notebook, embarcaremos em uma jornada prática para desvendar os segredos do LangSmith e capacitá-lo a dominar o teste, a depuração e a avaliação de seus projetos de IA Generativa.

## Resumo Executivo

Este notebook serve como um guia introdutório ao LangSmith, explorando seus conceitos fundamentais e demonstrando como utilizá-lo para aprimorar a qualidade e a confiabilidade de seus aplicativos de linguagem. Através de exemplos práticos, você aprenderá a rastrear execuções, criar datasets para testes e avaliar o desempenho de seus modelos.

## Conceitos Chave

Antes de mergulharmos no código, é importante compreender alguns conceitos-chave que permeiam o LangSmith e o ecossistema LangChain:

*   **Tracing:** O tracing permite visualizar o fluxo de execução do seu aplicativo LangChain, desde a entrada até a saída final, revelando insights valiosos sobre o comportamento do seu modelo e identificando gargalos de desempenho. Pense nisso como um raio-x do seu aplicativo!
*   **Datasets:** Datasets são coleções de exemplos cuidadosamente selecionados que representam os diferentes cenários que seu aplicativo precisa lidar. Eles são cruciais para testar a robustez e a precisão do seu modelo em uma variedade de situações.
*   **Avaliação:** A avaliação é o processo de medir o desempenho do seu modelo em relação a um dataset, fornecendo métricas quantitativas e insights qualitativos que ajudam a identificar áreas de melhoria.

## Objetivos de Aprendizado

Ao concluir este notebook, você será capaz de:

*   Configurar o LangSmith e ativar o tracing em seus aplicativos LangChain.
*   Navegar na interface do LangSmith e interpretar os traces de execução.
*   Criar datasets personalizados para testar e avaliar seus modelos.
*   Executar avaliações automatizadas e analisar os resultados no painel do LangSmith.
*   Compreender o papel do LangSmith no ciclo de vida de desenvolvimento de aplicativos de IA Generativa.

## Importância no Ecossistema LangChain

O LangSmith é uma peça fundamental do ecossistema LangChain, preenchendo uma lacuna crítica no desenvolvimento de aplicativos baseados em LLM. Ao fornecer ferramentas poderosas para teste, depuração e avaliação, o LangSmith permite que você:

*   **Reduza o tempo de desenvolvimento:** Identifique e corrija erros mais rapidamente, acelerando o ciclo de desenvolvimento.
*   **Melhore a qualidade do seu aplicativo:** Garanta que seu modelo funcione de forma confiável e precisa em uma variedade de cenários.
*   **Aumente a confiança:** Valide o desempenho do seu modelo e tome decisões informadas sobre como otimizá-lo.

Prepare-se para dominar o LangSmith e elevar seus projetos de IA Generativa a um novo patamar! Vamos começar explorando o tracing básico.

---


In [1]:
import os
from dotenv import load_dotenv
load_dotenv()

%pip install -qU langsmith langchain langchain-openai langchain-google-genai


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.3[0m[39;49m -> [0m[32;49m26.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Note: you may need to restart the kernel to use updated packages.


In [2]:
import os
import getpass
from dotenv import load_dotenv

# LangSmith Config
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_ENDPOINT"] = "https://api.smith.langchain.com"

load_dotenv()

if not os.environ.get("LANGCHAIN_API_KEY"):
    print("Procurando LANGCHAIN_API_KEY no ambiente...")
    if os.getenv("LANGCHAIN_API_KEY"):
         os.environ["LANGCHAIN_API_KEY"] = os.getenv("LANGCHAIN_API_KEY")
    else:
         print("Chave LangSmith NÃO ENCONTRADA. O tracing não funcionará.")

if not os.environ.get("LANGCHAIN_PROJECT"):
    os.environ["LANGCHAIN_PROJECT"] = "curso-langsmith-intro" # Nome do projeto no LangSmith

# GoogleGenerativeAI API Key
if not os.environ.get("GOOGLE_API_KEY"):
    os.environ["GOOGLE_API_KEY"] = os.getenv("GOOGLE_API_KEY")

Procurando LANGCHAIN_API_KEY no ambiente...
Chave LangSmith NÃO ENCONTRADA. O tracing não funcionará.


## 1. Tracing Básico

O tracing já está ativo porque definimos `LANGCHAIN_TRACING_V2="true"`. Qualquer chamada feita com componentes do LangChain será registrada automaticamente.

In [3]:
from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash")

# Simples chamada, isso vai gerar um trace
try:
    response = llm.invoke("Explique o que é LangSmith em uma frase.")
    print(response.content)
except Exception as e:
    print(f"Erro ao chamar o LLM: {e}")



Failed to multipart ingest runs: langsmith.utils.LangSmithAuthError: Authentication failed for https://api.smith.langchain.com/runs/multipart. HTTPError('401 Client Error: Unauthorized for url: https://api.smith.langchain.com/runs/multipart', '{"error":"Unauthorized"}\n')trace=019c3332-9e0e-7872-aa73-02884105ac1f,id=019c3332-9e0e-7872-aa73-02884105ac1f


LangSmith é uma plataforma de desenvolvimento que ajuda você a depurar, testar, avaliar e monitorar seus aplicativos construídos com LLMs e cadeias LangChain.


Vá para [smith.langchain.com](https://smith.langchain.com) e verifique o projeto `curso-langsmith-intro`. Você deve ver o trace da execução acima.

## 2. Datasets

Datasets são coleções de exemplos (entradas e saídas esperadas) usados para testar e avaliar seu aplicativo.

In [4]:
from langsmith import Client

client = Client()

dataset_name = "Perguntas de Exemplo"

# Criar Dataset se não existir
try:
    if not client.has_dataset(dataset_name=dataset_name):
        dataset = client.create_dataset(
            dataset_name=dataset_name,
            description="Um dataset de exemplo com perguntas e respostas."
        )
        
        # Adicionar exemplos
        client.create_examples(
            inputs=[
                {"pergunta": "Qual é a capital da França?"},
                {"pergunta": "Quanto é 2 + 2?"},
                {"pergunta": "Quem escreveu Dom Casmurro?"}
            ],
            outputs=[
                {"resposta": "Paris"},
                {"resposta": "4"},
                {"resposta": "Machado de Assis"}
            ],
            dataset_id=dataset.id
        )
        print("Dataset criado!")
    else:
        print("Dataset já existe.")
except Exception as e:
    print(f"Erro ao acessar LangSmith: {e}")



Erro ao acessar LangSmith: Authentication failed for /datasets. HTTPError('401 Client Error: Unauthorized for url: https://api.smith.langchain.com/datasets?limit=1&name=Perguntas+de+Exemplo', '{"detail":"Invalid token"}')


## 3. Avaliação

Agora vamos usar o dataset criado para avaliar nosso modelo.

In [5]:
from langsmith import evaluate
from langsmith.schemas import Run, Example

# 1. Definir o que vamos testar (nosso "sistema")
def meu_app(inputs):
    # O input vem do dataset com chave 'pergunta'
    text_input = inputs["pergunta"]
    return llm.invoke(text_input).content

# 2. Definir um Avaliador Customizado
# Como a API de avaliadores prontos mudou, vamos criar um simples que verifica se a resposta contém a esperada.
def contains_answer(run: Run, example: Example) -> dict:
    aluno = run.outputs.get("output", "").lower()
    gabarito = example.outputs.get("resposta", "").lower()
    return {
        "key": "contains",
        "score": 1 if gabarito in aluno else 0
    }

try:
    # 3. Rodar Avaliação
    results = evaluate(
        meu_app,
        data=dataset_name,
        evaluators=[contains_answer],
        experiment_prefix="teste-custom"
    )
    
    print("Avaliação concluída!")
    print(results)
except Exception as e:
    print(f"Erro na avaliação: {e}")

Erro na avaliação: Authentication failed for /datasets. HTTPError('401 Client Error: Unauthorized for url: https://api.smith.langchain.com/datasets?limit=1&name=Perguntas+de+Exemplo', '{"detail":"Invalid token"}')


Agora você pode visualizar os resultados da avaliação no painel do LangSmith.