
# Agente Explicador de Regras do Futebol com RAG (LangChain)

## Curso: LangChain — Criando Chatbots Inteligentes com RAG (Foundation)

### Objetivo
Construir um agente conversacional simples utilizando **Retrieval-Augmented Generation (RAG)** para responder perguntas sobre **regras do futebol**, com base em **documentos oficiais**.

---

### Conceitos abordados
- Definição do problema
- Seleção da base de conhecimento
- Preparação dos documentos
- Embeddings e banco vetorial
- Recuperação de contexto (Retriever)
- Integração com LLM
- Testes e validação das respostas



## Dependências

Execute no terminal antes de rodar o notebook:

```bash
pip install langchain langchain-community langchain-openai chromadb pypdf
```


In [2]:

# Importações básicas
import os

# Loader de documentos PDF
from langchain_community.document_loaders import PyPDFLoader

# Divisão de texto em blocos
from langchain_text_splitters import RecursiveCharacterTextSplitter

# Embeddings
from langchain_openai import OpenAIEmbeddings

# Banco vetorial
from langchain_community.vectorstores import Chroma

# LLM
from langchain_openai import ChatOpenAI

# Cadeia RAG
from langchain.chains import RetrievalQA



## 1️⃣ Definição do Problema

LLMs possuem conhecimento estático e podem alucinar.
O objetivo aqui é garantir **respostas confiáveis**, conectando o modelo
a documentos oficiais sobre regras do futebol.


In [3]:

# Caminho do PDF com regras oficiais do futebol
CAMINHO_PDF = "regras_futebol.pdf"  # ajuste o caminho se necessário

# Carrega o PDF
loader = PyPDFLoader(CAMINHO_PDF)
documents = loader.load()

# Quantidade de páginas carregadas
len(documents)


232

In [4]:
documents ## O que é ?

[Document(page_content='1\nRegras \ndo Jogo\n23/24Baixe o app\ndas Regras do Jogo', metadata={'source': 'regras_futebol.pdf', 'page': 0}),
 Document(page_content='2\n', metadata={'source': 'regras_futebol.pdf', 'page': 1}),
 Document(page_content='3\n', metadata={'source': 'regras_futebol.pdf', 'page': 2}),
 Document(page_content='4\nEntrada em vigor: 1º de julho de 2023\nEsta publicação não pode ser reproduzida nem traduzida integral ou parcialmente de nenhuma maneira sem a \nautorização de The International Football Association Board.\nThe International Football Association Board\nMünstergasse 9, 8001 Zurique, Suíça\nTel.: +41 (0)44 245 1886, Fax: +41 (0)44 245 1887\nwww.theifab.com ', metadata={'source': 'regras_futebol.pdf', 'page': 3}),
 Document(page_content='5\nRegras \ndo Jogo\n2023/24', metadata={'source': 'regras_futebol.pdf', 'page': 4}),
 Document(page_content='6\nÍndice\nSobre as Regras\nNotas e modificações\nNotas sobre as Regras do Jogo\nModificações gerais\nOrientações 


## 2️⃣ Preparação dos Documentos

Os documentos precisam ser divididos em pequenos blocos
para facilitar a recuperação de contexto.


In [5]:

# Divide os documentos em chunks menores
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=100
)

chunks = text_splitter.split_documents(documents)

len(chunks)


654

In [6]:
chunks ## mostrar 3 pedaços

[Document(page_content='1\nRegras \ndo Jogo\n23/24Baixe o app\ndas Regras do Jogo', metadata={'source': 'regras_futebol.pdf', 'page': 0}),
 Document(page_content='2', metadata={'source': 'regras_futebol.pdf', 'page': 1}),
 Document(page_content='3', metadata={'source': 'regras_futebol.pdf', 'page': 2}),
 Document(page_content='4\nEntrada em vigor: 1º de julho de 2023\nEsta publicação não pode ser reproduzida nem traduzida integral ou parcialmente de nenhuma maneira sem a \nautorização de The International Football Association Board.\nThe International Football Association Board\nMünstergasse 9, 8001 Zurique, Suíça\nTel.: +41 (0)44 245 1886, Fax: +41 (0)44 245 1887\nwww.theifab.com', metadata={'source': 'regras_futebol.pdf', 'page': 3}),
 Document(page_content='5\nRegras \ndo Jogo\n2023/24', metadata={'source': 'regras_futebol.pdf', 'page': 4}),
 Document(page_content='6\nÍndice\nSobre as Regras\nNotas e modificações\nNotas sobre as Regras do Jogo\nModificações gerais\nOrientações sobre


## 3️⃣ Embeddings e Banco Vetorial

Cada bloco de texto será convertido em vetores semânticos
e armazenado em um banco vetorial.


In [8]:

# Inicializa embeddings
embeddings = OpenAIEmbeddings(
    model="text-embedding-3-small",
    openai_api_key="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"
)

# Cria o banco vetorial
vectorstore = Chroma.from_documents(
    documents=chunks,
    embedding=embeddings,
    persist_directory="./chroma_regras_futebol"
)



## 4️⃣ Recuperação de Contexto (Retriever)

O retriever busca os trechos mais relevantes
para cada pergunta do usuário.


In [9]:

# Cria o retriever
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 3}
)



## 5️⃣ Integração com o LLM (RAG)

O contexto recuperado será injetado no prompt
enviado ao modelo de linguagem.


In [12]:

# Inicializa o modelo de linguagem
llm = ChatOpenAI(
    model="gpt-4o-mini",
    openai_api_key="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"
)

# Cria a cadeia RAG
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True
)



## 6️⃣ Testes e Validação

Agora podemos testar perguntas reais
e validar se as respostas estão baseadas nos documentos.


In [15]:
# Pergunta de teste
pergunta = "Um jogador pode usar a mão para marcar um gol?"

# Executa a pergunta no agente RAG
resposta = qa_chain(pergunta)

print("Pergunta:")
print(pergunta)

print("\nResposta do Agente:")
print(resposta["result"])

print("\nTrechos utilizados como contexto:\n")

for i, doc in enumerate(resposta["source_documents"], start=1):
    print(f"--- Trecho {i} ---")
    print(f"Fonte: {doc.metadata.get('source', 'Documento desconhecido')}")
    print(f"Página: {doc.metadata.get('page', 'N/A')}")
    print("Conteúdo:")
    print(doc.page_content)
    print("\n")


Pergunta:
Um jogador pode usar a mão para marcar um gol?

Resposta do Agente:
Não, um jogador não pode usar a mão para marcar um gol. Se a bola tocar na mão ou no braço de um jogador, mesmo que acidentalmente, isso constitui uma infração.

Trechos utilizados como contexto:

--- Trecho 1 ---
Fonte: regras_futebol.pdf
Página: 101
Conteúdo:
de forma antinatural quando a posição de sua mão ou seu braço não for 
consequência do movimento do corpo nessa ação específica ou não puder ser 
justificada por esse movimento. Ao colocar a mão ou o braço nessa posição, o 
jogador assume o risco de que a bola acerte essa parte de seu corpo e de que isso 
constitua uma infração;
• marcar um gol no adversário: 
 •
 diretamente com a mão ou o braço, mesmo que em uma ação acidental, 
incluindo por parte do goleiro da equipe atacante;


--- Trecho 2 ---
Fonte: regras_futebol.pdf
Página: 102
Conteúdo:
(com ou sem a mão ou o braço) após o reinício do jogo e antes que ela toque em 
outro jogador, o goleiro de

In [16]:
# Pergunta de teste 2
pergunta = "O que caracteriza a posição de impedimento no futebol?"

# Executa a pergunta no agente RAG
resposta = qa_chain(pergunta)

print("Pergunta:")
print(pergunta)

print("\nResposta do Agente:")
print(resposta["result"])

print("\nTrechos utilizados como contexto:\n")

for i, doc in enumerate(resposta["source_documents"], start=1):
    print(f"--- Trecho {i} ---")
    print(f"Fonte: {doc.metadata.get('source', 'Documento desconhecido')}")
    print(f"Página: {doc.metadata.get('page', 'N/A')}")
    print("Conteúdo:")
    print(doc.page_content)
    print("\n")


Pergunta:
O que caracteriza a posição de impedimento no futebol?

Resposta do Agente:
A posição de impedimento no futebol é caracterizada por duas condições principais:

1. Um jogador está em posição de impedimento se qualquer parte de sua cabeça, corpo ou pés estiver no campo do adversário (excluindo a linha de meio de campo) e se qualquer parte de sua cabeça, corpo ou pés estiver mais próxima da linha de fundo do campo adversário do que a bola e o penúltimo adversário.

2. Estar em posição de impedimento não é uma infração em si, mas a infração ocorre se o jogador em posição de impedimento afetar a capacidade do adversário de tocar na bola ou disputá-la, como obstruir seu caminho ou se deslocar em direção à bola com a intenção de tocá-la.

Trechos utilizados como contexto:

--- Trecho 1 ---
Fonte: regras_futebol.pdf
Página: 94
Conteúdo:
95
11
Regras do Jogo 2023/24  |  Regra 11  |  O impedimento
1. Posição de impedimento
Encontrar-se em posição de impedimento não é uma infração.
Um j


## ✅ Conclusão

Este notebook demonstrou, de forma prática:
- Como o RAG melhora a confiabilidade das respostas
- Como conectar LLMs a documentos oficiais
- Como construir um agente conversacional simples com LangChain
