
# Projeto NLP: Adeus manual chato! RAG chatbot para motoristas.

üéØ **Objetivo:**  criar um assistente de carro que explique avisos do painel e recomende a√ß√µes durante a condu√ß√£o, desenvolvendo um chatbot com reconhecimento de contexto. Esse chatbot ser√° integrado ao manual do carro por meio de um LLM, utilizando LangChain e a t√©cnica de Gera√ß√£o Aumentada por Recupera√ß√£o (RAG) para fornecer respostas precisas e contextuais. Diga adeus aos manuais chatos!

üîó**Fonte:** Esse projeto foi proposto pela trilha de aprendizados do DataCamp sobre aplicativos LLM com LangChain

üì∞ **Dados:** Manual adaptado do MG ZS, um SUV compacto, armazenado como um arquivo HTML nomeado como `mg-zs-warning-messages.html`.

üî¢ **Passos:**
0. Preparativos iniciais
1. Divis√£o do documento
2. Armazenamento das representa√ß√µes vetoriais (embeddings)
3. Cria√ß√£o do recuperador
4. Definindo o modelo LLM e o prompt template
5. Definindo a cadeia RAG
6. Executando a cadeia RAG


üõ†Ô∏è **Detalhes t√©cnicos:** Python, LLM, LangChain, OpenAI, Chroma, RAG.


____

## 0. Preparativos iniciais

Para iniciar o projeto, √© preciso obter uma conta de **desenvolvedor com a OpenAI** e **criar uma chave API** como uma vari√°vel de ambiente segura e **atualizar as bibliotecas** necess√°rias. As instru√ß√µes para esses passos est√£o descritas abaixo.

*  Crie uma conta de desenvolvedor com a OpenAI:
  1. V√° para a p√°gina de [inscri√ß√£o na API](https://platform.openai.com/).
  2. Crie sua conta (voc√™ precisar√° fornecer seu endere√ßo de e-mail e seu n√∫mero de telefone).
  3. V√° para a [p√°gina de chaves API](https://platform.openai.com/settings/profile?tab=api-keys).
  4. Crie uma nova chave secreta. (As vezes √© preciso pagar)
  5. Fa√ßa uma c√≥pia dela.

* Atualizar as bibliotecas


In [1]:
import subprocess
import pkg_resources

In [5]:
def install_if_needed(package, version):
    '''Fun√ß√£o para garantir que o pacote especificado esteja instalado com a vers√£o necess√°ria.'''
    try:
        # Verifique se o pacote est√° instalado e qual a sua vers√£o
        pkg = pkg_resources.get_distribution(package)
        if pkg.version != version:
            # Se a vers√£o n√£o corresponder, desinstale a vers√£o existente e instale a vers√£o correta
            subprocess.check_call(["pip", "install", f"{package}=={version}"])
    except pkg_resources.DistributionNotFound:
        # Se o pacote n√£o for encontrado, instale a vers√£o necess√°ria
        subprocess.check_call(["pip", "install", f"{package}=={version}"])
    except pkg_resources.VersionConflict as e:
        print(f"Version conflict: {e}")

# Primeiro, trate o problema da vers√£o do `tenacity`
try:
    subprocess.check_call(["pip", "uninstall", "-y", "tenacity"])
    subprocess.check_call(["pip", "install", "tenacity==8.2.2"])
    subprocess.check_call(["pip", "install", "--force-reinstall", "tenacity==8.2.2"])
except subprocess.CalledProcessError as e:
    print(f"Erro durante a instala√ß√£o do `tenacity`: {e}")

# Em seguida, instale os outros pacotes
install_if_needed("langchain", "0.2.2")
install_if_needed("langchain-openai", "0.1.8")
install_if_needed("langchain-community", "0.2.3")
install_if_needed("unstructured", "0.14.4")
install_if_needed("chromadb", "0.5.0")
install_if_needed("python-dotenv", "1.0.1")

In [6]:
# Definindo a chave API em uma vari√°vel"
import os
from dotenv import load_dotenv

load_dotenv('/content/token.env')

os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# Importando as bibliotecas necess√°rias
import langchain
from langchain import PromptTemplate
from langchain_openai import ChatOpenAI
from langchain.document_loaders import UnstructuredHTMLLoader
from langchain_openai import OpenAIEmbeddings
from langchain.schema.runnable import RunnablePassthrough
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain_community.document_loaders import UnstructuredHTMLLoader

In [7]:
# Carregando o HTML como um load de documentos LangChain
loader = UnstructuredHTMLLoader(file_path="/content/mg-zs-warning-messages.html")
car_docs = loader.load()




## 1. Divis√£o o documento

Um processo fundamental na implementa√ß√£o do Retrieval Augmented Generation (RAG) √© dividir os documentos em partes para armazenamento em um banco de dados vetorial.

* **Divisor de texto de caracteres**: que divide documentos com base em caracteres e mede o comprimento do bloco pelo n√∫mero de caracteres.

* **Divis√£o recursiva por caracteres** : o texto √© inicialmente dividido em grandes blocos e depois esses blocos s√£o subdivididos em partes menores de acordo com um crit√©rio espec√≠fico. Por exemplo, o texto √© dividido em blocos de 1000 caracteres com uma sobreposi√ß√£o de 200 caracteres, preservando parte do contexto entre os segmentos

In [61]:
# Define variables
chunk_size=1000
chunk_overlap=200

# Split the HTML
splitter = RecursiveCharacterTextSplitter(
    chunk_size = chunk_size,
    chunk_overlap = chunk_overlap
)



# Split the document and print the chunks
docs = splitter.split_documents(car_docs)
print(docs)



In [35]:
car_docs[0].page_content



## 2. Armazenamento das representa√ß√µes vetoriais (embeddings)

Com os dados chunckerizados (dividindos em partes), partimos para opara armazenamento e o ingest√£o em um banco de dados vetorial do Chroma.


Definindo um prompt tenplate para conectar os documentos recuperados e a entrada do usu√°rio e criando uma cadeia de recupera√ß√£o para que o LLM acesse esses dados externos.

In [41]:
openai_api_key = os.getenv("OPENAI_API_KEY")

In [62]:
# Incorpore os documentos em um banco de dados vetorial Chroma persistente
embedding_function = OpenAIEmbeddings(openai_api_key=openai_api_key)
vectorstore = Chroma.from_documents(
    docs,
    embedding=embedding_function,
    persist_directory=os.getcwd()
)

## 3. Cria√ß√£o do recuperador (retriever)

In [63]:
# Configure o armazenamento vetorial como um recuperador
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k":3}
)

## 4. Inicialize o LLM e o prompt template


In [64]:
# Definindo o modelo llm
llm = ChatOpenAI(model_name="gpt-4o", temperature=0, openai_api_key=openai_api_key)

In [73]:
#Criando um prompt template
prompt_template =PromptTemplate( template = """
Voc√™ √© um assistente para tarefas de perguntas e respostas.
Utilize os seguintes trechos do retrieved context para responder √† pergunta.
Se n√£o souber a resposta, diga apenas que n√£o sabe.
Use no m√°ximo tr√™s frases e mantenha a resposta concisa.
{context}

Question: {question}
""",input_variable = ['context', 'question'] )

## 5. Defina a cadeia RAG


In [74]:
# Crie uma cadeia para vincular o recuperador (retriever), o prompt template e o modelo llm
rag_chain = ({"context": retriever, "question": RunnablePassthrough()}
            | prompt_template
            | llm)


## 6. Execute a cadeia RAG

In [75]:
# Converse com o RAG
response_1 = rag_chain.invoke("O que devo fazer se a mensagem 'Engine Coolant Temperature High' aparecer no painel do meu carro?")
response_2 = rag_chain.invoke("Como devo reagir se a luz de advert√™ncia 'Low Oil Pressure' acender no painel?")
response_3 = rag_chain.invoke("O que significa a mensagem 'ABS Fault' e o que devo fazer?")


In [76]:
response_1.content

"Se a mensagem 'Engine Coolant Temperature High' aparecer no painel do seu carro, voc√™ deve parar o ve√≠culo em seguran√ßa assim que poss√≠vel, desligar o motor e contatar imediatamente um reparador autorizado da MG."

In [71]:
response_2.content

"Se a luz de advert√™ncia 'Low Oil Pressure' acender no painel, voc√™ deve, assim que for seguro, parar o carro, desligar o motor e verificar o n√≠vel de √≥leo do motor. Em seguida, entre em contato com um Reparador Autorizado MG o mais r√°pido poss√≠vel."

In [72]:
response_3.content

"A mensagem 'ABS Fault' indica que o sistema de freio anti-bloqueio (ABS) falhou e a fun√ß√£o ABS est√° prestes a ser desativada. Voc√™ deve consultar um reparador autorizado da MG imediatamente."