
# Agente Explicador de Regras do Futebol com RAG (LangChain)

## Curso: LangChain — Criando Chatbots Inteligentes com RAG (Foundation)

### Objetivo
Construir um agente conversacional simples utilizando **Retrieval-Augmented Generation (RAG)** para responder perguntas sobre **regras do futebol**, com base em **documentos oficiais**.

---

### Conceitos abordados
- Definição do problema
- Seleção da base de conhecimento
- Preparação dos documentos
- Embeddings e banco vetorial
- Recuperação de contexto (Retriever)
- Integração com LLM
- Testes e validação das respostas



## Dependências

Execute no terminal antes de rodar o notebook:

```bash
# pip install langchain langchain-community langchain-openai chromadb pypdf
# Ative o ambiente Virtual
source $HOME/.venv/bin/activate
python3 -m pip uninstall langchain langchain-community langchain-core langchain-ollama langchain-classic langgraph-prebuilt langgraph 
python3 -m pip install \
  "langchain==0.2.17" \
  "langchain-community==0.2.19" \
  "langchain-core==0.2.43" \
  "langchain-ollama==0.1.0"
# python3 -m pip uninstall langchain langchain-community langchain-openai
# python3 -m pip install "langchain<0.3.0" "langchain-community<0.3.0" "langchain-core<0.3.0" langchain-ollama chromadb pypdf
# No futuro use: python3 -m pip install --upgrade langchain langchain-community langchain-openai chromadb pypdf
```

In [1]:

# Importações básicas
import os

# Loader de documentos PDF
from langchain_community.document_loaders import PyPDFLoader

# Divisão de texto em blocos
from langchain_text_splitters import RecursiveCharacterTextSplitter

# Embeddings
# from langchain_openai import OpenAIEmbeddings
from langchain_ollama import OllamaEmbeddings

# Banco vetorial
from langchain_community.vectorstores import Chroma

# LLM
# from langchain_openai import ChatOpenAI

# Cadeia RAG
# from langchain.chains import RetrievalQA
# Reclama do seguinte: ModuleNotFoundError: No module named 'langchain_core.pydantic_v1'


## 1️⃣ Definição do Problema

LLMs possuem conhecimento estático e podem alucinar.
O objetivo aqui é garantir **respostas confiáveis**, conectando o modelo
a documentos oficiais sobre regras do futebol.


In [2]:

# Caminho do PDF com regras oficiais do futebol
CAMINHO_PDF = "regras_futebol.pdf"  # ajuste o caminho se necessário

# Carrega o PDF
loader = PyPDFLoader(CAMINHO_PDF)
documents = loader.load()

# Quantidade de páginas carregadas
len(documents)


232

In [3]:
# documents ## O que é ?


## 2️⃣ Preparação dos Documentos

Os documentos precisam ser divididos em pequenos blocos
para facilitar a recuperação de contexto.


In [4]:
# Divide os documentos em chunks menores
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=100
)

chunks = text_splitter.split_documents(documents)

len(chunks)

654

In [5]:
# chunks ## mostrar 3 pedaços


## 3️⃣ Embeddings e Banco Vetorial

Cada bloco de texto será convertido em vetores semânticos
e armazenado em um banco vetorial.


In [6]:
# Inicializa embeddings
# embeddings = OpenAIEmbeddings(
#     model="text-embedding-3-small",
#     openai_api_key="sk-MHZB..." # OPENAI_API_KEY=?
# )

# 1. Inicializa embeddings locais via Ollama
# Não precisa de API_KEY, pois o servidor roda em http://localhost:11434
embeddings = OllamaEmbeddings(
    model="nomic-embed-text"
)

# Remove o anterior, se existir, usando o Terminal bash
# rm -rf Projeto1/chroma_regras_futebol

# Cria o banco vetorial
vectorstore = Chroma.from_documents(
    documents=chunks,
    embedding=embeddings,
    persist_directory="./chroma_regras_futebol"
)

In [7]:
embeddings


OllamaEmbeddings(model='nomic-embed-text')


## 4️⃣ Recuperação de Contexto (Retriever)

O retriever busca os trechos mais relevantes
para cada pergunta do usuário.


In [8]:

# Cria o retriever
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 4}
)


In [9]:
retriever


VectorStoreRetriever(tags=['Chroma', 'OllamaEmbeddings'], vectorstore=<langchain_community.vectorstores.chroma.Chroma object at 0x10afdaba0>, search_kwargs={'k': 4})


## 5️⃣ Integração com o LLM (RAG)

O contexto recuperado será injetado no prompt
enviado ao modelo de linguagem.


In [10]:
# ollama pull llama3.2 no Terminal Bash
from langchain_ollama import ChatOllama

# Inicializa o modelo de linguagem
# llm = ChatOpenAI(
#     model="gpt-4o-mini",
#     openai_api_key="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"
# )

# 1. Inicializa o modelo local via Ollama
# O Llama 3.2 rodará de forma nativa na GPU do seu chip M3
llm = ChatOllama(
    model="llama3.2",
    temperature=0  # Mantemos 0 para respostas mais factuais baseadas nas regras de futebol
)

In [11]:
from langchain.chains import RetrievalQA
# 2. Cria a cadeia RAG (RetrievalQA)
# O código permanece idêntico, apenas trocamos o objeto 'llm'
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True
)

# Cria a cadeia RAG
# qa_chain = RetrievalQA.from_chain_type(
#     llm=llm,
#     chain_type="stuff",
#     retriever=retriever,
#     return_source_documents=True
# )


## 6️⃣ Testes e Validação

Agora podemos testar perguntas reais
e validar se as respostas estão baseadas nos documentos.


In [12]:
# Pergunta de teste
pergunta = "Um jogador pode usar a mão para marcar um gol?"

# Executa a pergunta no agente RAG
resposta = qa_chain(pergunta)

print("Pergunta:")
print(pergunta)

print("\nResposta do Agente:")
print(resposta["result"])

print("\nTrechos utilizados como contexto:\n")

for i, doc in enumerate(resposta["source_documents"], start=1):
    print(f"--- Trecho {i} ---")
    print(f"Fonte: {doc.metadata.get('source', 'Documento desconhecido')}")
    print(f"Página: {doc.metadata.get('page', 'N/A')}")
    print("Conteúdo:")
    print(doc.page_content)
    print("\n")


  resposta = qa_chain(pergunta)


Pergunta:
Um jogador pode usar a mão para marcar um gol?

Resposta do Agente:
Não, segundo as regras do Jogo 2023/24, não é permitido usar a mão para marcar um gol. A Regra 12, item 7, especifica que o árbitro deve validar se a pessoa extra que entrou no campo de jogo influenciou a jogada e, se sim, ordenar sua retirada do campo.

Trechos utilizados como contexto:

--- Trecho 1 ---
Fonte: regras_futebol.pdf
Página: 156
Conteúdo:
membro da comissão técnica da equipe que sofreu o gol.
 · um agente externo que não interferiu no jogo.
Explicação
Esclarecimento sobre o fato de que o árbitro deve tomar medidas contra uma 
pessoa extra no campo de jogo quando um gol for marcado somente se essa 
pessoa tiver influenciado a jogada — a Regra não espera que o árbitro puna uma 
invasão do campo de jogo se isso não tiver impacto sobre a jogada, por exemplo.
Regras do Jogo 2023/24  |  Alterações nas Regras 2023/24


--- Trecho 2 ---
Fonte: regras_futebol.pdf
Página: 102
Conteúdo:
(com ou sem a mão o

In [13]:
# Pergunta de teste 2
pergunta = "O que caracteriza a posição de impedimento no futebol?"

# Executa a pergunta no agente RAG
resposta = qa_chain(pergunta)

print("Pergunta:")
print(pergunta)

print("\nResposta do Agente:")
print(resposta["result"])

print("\nTrechos utilizados como contexto:\n")

for i, doc in enumerate(resposta["source_documents"], start=1):
    print(f"--- Trecho {i} ---")
    print(f"Fonte: {doc.metadata.get('source', 'Documento desconhecido')}")
    print(f"Página: {doc.metadata.get('page', 'N/A')}")
    print("Conteúdo:")
    print(doc.page_content)
    print("\n")


Pergunta:
O que caracteriza a posição de impedimento no futebol?

Resposta do Agente:
Não sei exatamente qual é a caracterização da posição de impedimento no futebol, mas posso dizer que a IFAB (International Football Association Board) estabelece regras específicas para essa situação. Você mencionou que a infração por impedimento será punida por ser anterior à disputa brusca, mas não sei se isso é uma caracterização da posição de impedimento em si.

Trechos utilizados como contexto:

--- Trecho 1 ---
Fonte: regras_futebol.pdf
Página: 13
Conteúdo:
processo decisório devem estar convencidos de que sua alteração beneficiará o 
futebol. Isso, às vezes, significa que é necessário testar uma possível alteração. 
 Em cada proposta de alteração, o foco da análise recai sobre a equidade, a 
integridade, o respeito, a segurança, o divertimento dos participantes e dos 
espectadores e, quando for o caso, o uso da tecnologia para melhorar o jogo. 
 A IFAB continuará colaborando com a comunidade gl


## ✅ Conclusão

Este notebook demonstrou, de forma prática:
- Como o RAG melhora a confiabilidade das respostas
- Como conectar LLMs a documentos oficiais
- Como construir um agente conversacional simples com LangChain
