<a href="https://colab.research.google.com/github/ArthurRosin/Projeto-Processamento-de-Linguagem-Natural/blob/main/pnlProject.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Processamento de Linguagem Natural [2024-Q2]**
Prof. Alexandre Donizeti Alves

### **PROJETO PRÁTICO** [LangChain + Grandes Modelos de Linguagem + API]


O **PROJETO PRÁTICO** deve ser feito utilizando o **Google Colab** com uma conta sua vinculada ao Gmail. O link do seu notebook, armazenado no Google Drive, o link de um repositório no GitHub e o link de um vídeo do projeto em execução detalhando os principais resultados da atividade, devem ser enviados usando o seguinte formulário:


> Adicionar blockquote


> https://forms.gle/D4gLqP1iGgyn2hbH8


**IMPORTANTE**: A submissão deve ser feita até o dia **08/09 (domingo)** APENAS POR UM INTEGRANTE DA EQUIPE, até às 23h59. Por favor, lembre-se de dar permissão de ACESSO IRRESTRITO para o professor da disciplina de PLN.

### **EQUIPE**

---

**POR FAVOR, PREENCHER OS INTEGRANDES DA SUA EQUIPE:**


**Integrante 01:** Arthur Rio Verde Melo Rosin - 11202020257


**Integrante 02:** Davi Nunes de Paiva - 11202231636


**Integrante 03:** Lucas Tanino Pellegrini - 11202232020


### **GRANDE MODELO DE LINGUAGEM (*Large Language Model - LLM*)**

---

Cada equipe deve selecionar um Grande Modelo de Linguagem (*Large Language Model - LMM*). Cada modelo pode ser escolhido por até 5 equipes.



Por favor, informe os dados do LLM selecionada:

>


**LLM**: ChatGPT 4.0

>

**Link para a documentação oficial**: [Site documentação oficial ChatGPT 4.0](https://platform.openai.com/docs/models)



### **API**
---

Por favor, informe os dados da API selecionada:

**API**: OpenAI API

**Site oficial**: [Site oficial OpenIA](https://platform.openai.com/docs/overview)

**Link para a documentação oficial**: [Site documentação oficial OpenIA API](https://platform.openai.com/docs/overview)






**IMPORTANTE**: cada **API** pode ser usada por até 4 equipes.

### **DESCRIÇÃO**
---

Implementar um `notebook` no `Google Colab` que faça uso do framework **`LangChain`** (obrigatório) e de um **LLM** aplicando, no mínimo, DUAS técnicas de PLN. As técnicas podem ser aplicada em qualquer córpus obtido a partir de uma **API** ou a partir de uma página Web.

O **LLM** e a **API** selecionados devem ser informados na seguinte planilha:

> https://docs.google.com/spreadsheets/d/1iIUZcwnywO7RuF6VEJ8Rx9NDT1cwteyvsnkhYr0NWtU/edit?usp=sharing

>
As seguintes técnicas de PLN podem ser usadas:

*   Correção Gramatical
*   Classificação de Textos
*   Análise de Sentimentos
*   Detecção de Emoções
*   Extração de Palavras-chave
*   Tradução de Textos
*   Sumarização de Textos
*   Similaridade de Textos
*   Reconhecimento de Entidades Nomeadas
*   Sistemas de Perguntas e Respostas
>

**IMPORTANTE:** É obrigatório usar o e-mail da UFABC.


Serão considerados como critérios de avaliação os seguintes pontos:

* Uso do framework **`LangChain`**.

* Escolha e uso de um **LLM**.

* Escolha e uso de uma **API**.

* Vídeo (5 a 10 minutos).

* Criatividade no uso do framework **`LangChain`** em conjunto com o **LLM** e a **API**.




**IMPORTANTE**: todo o código do notebook deve ser executado. Código sem execução não será considerado.

### **IMPLEMENTAÇÃO**
---

O código tem como objetivo a criação de um agente de RAG (Retrieval-Augmented Generation) usando LangChain, que utiliza um modelo de linguagem para interagir com várias ferramentas e fontes externas para melhorar a qualidade das respostas geradas.

O que são agentes LangChain?

Um agente LangChain é um componente que utiliza um modelo de linguagem para interagir com outras ferramentas e realizar ações para cumprir uma tarefa ou objetivo.

Como funcionam os agentes LangChain?

Os agentes utilizam um Modelo de Linguagem como um mecanismo de raciocínio para determinar quais ações ou ferramentas usar e em que ordem para alcançar o resultado desejado.

Os agentes têm acesso a um conjunto de ferramentas que fornecem diferentes capacidades como pesquisa na web, consulta de banco de dados, chamadas de API, cálculos, etc.

O agente utiliza o LM para analisar a tarefa dada, decidir quais ferramentas são necessárias, executar as ferramentas, observar os resultados e repetir o processo até que a tarefa seja concluída.

Demonstrando o conceito de agentes Langchain, que usam um modelo de linguagem como um mecanismo de raciocínio para selecionar e executar ferramentas de um conjunto predefinido, como pesquisa na web, consulta de banco de dados e chamadas de API.

O agente RAG (Retrieval Augmented Generation) é capaz de determinar dinamicamente as ações necessárias para completar uma tarefa.Também apresenta a criação de um agente ReAct (Reasoning and Action) que pode invocar ferramentas como SerpAPI, ArXiv e Wikipedia para responder a consultas.

Por que utilizar os Modelos Rag?

Os modelos RAG, que combinam a recuperação de informações externas com as capacidades do modelo de linguagem, superam as limitações dos dados de treinamento iniciais. Eles sugerem que o processo de tomada de decisão dinâmico dos agentes LangChain é superior às sequências predefinidas de ações, oferecendo maior flexibilidade e adaptabilidade. O uso de agentes LangChain pode levar a saídas mais precisas e confiáveis, especialmente para tarefas intensivas em conhecimento.

Primeiramente, vamos instalar algumas das bibliotecas que serão utilizadas ao longo do código:

In [None]:
%%capture --no-stderr
%pip install -U langgraph langchain langchain-openai langchainhub langchain-community pypdf faiss-cpu arxiv wikipedia tavily-python google-search-results httpx

Agora, iremos preparar a chave API da OpenIA, para que seja acessível para o atual sistema.

In [None]:
import os
import getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass()

Carregando o LLM e o modelo de Embeddings.

Em seguida, carregaremos o último modelo GPT-4o da OpenAI e seu modelo de embeddings. Definiremos a temperatura para zero.

In [None]:
## Loading model and embedder
from langchain_openai import ChatOpenAI, OpenAIEmbeddings

model = ChatOpenAI(model="gpt-4o", temperature=0)
embedder = OpenAIEmbeddings()

Criando um Retriever

Agora, carregaremos um artigo do repositório Arxiv que fornece uma pesquisa sobre os diversos algoritmos RAG. Em seguida, dividiremos este documento em pedaços menores usando o "RecursiveCharacterTextSplitter", armazenaremos os embeddings em um armazenamento vetorial "FAISS" usando o embedder e, criaremos um objeto retriever retriever_paper.

Também converteremos este retriever em uma ferramenta usando "create_retriever_tool" para que possa ser usado por um agente mais tarde.

In [None]:
from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader("https://arxiv.org/pdf/2312.10997")
paper = loader.load()

In [None]:
from langchain.vectorstores import FAISS
from langchain.text_splitter import RecursiveCharacterTextSplitter
# splitting text from the PDF document into smaller chunks
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
)

chunks_paper = text_splitter.split_documents(paper)


In [None]:
# storing in vector store
faiss_db_paper = FAISS.from_documents(chunks_paper, embedder)
# creating retriever
retriever_paper = faiss_db_paper.as_retriever()

Carregando Ferramentas

Agora, carregaremos várias ferramentas para pesquisa na web, incluindo SerpAPI, ArXiv e Wikipedia. OBS: será necessario adquirir uma chave de API para SerpAPI(gratuita).

In [None]:
## converting the retriever to a Tool

from langchain.tools.retriever import create_retriever_tool

retriever_tool = create_retriever_tool(retriever_paper, "RAG doc", "Search for info on RAG")

In [None]:
## Load multiple tools

from langchain_community.utilities import ArxivAPIWrapper
from langchain_community.tools.wikipedia.tool import WikipediaQueryRun
from langchain_community.utilities import WikipediaAPIWrapper

# arxiv tool
arxiv =  ArxivAPIWrapper()

# wikipedia tool
wikipedia = WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper())

In [None]:
## api key for tools

# serpapi
os.environ['SERPAPI_API_KEY']=getpass.getpass()
# tavily perai
os.environ['TAVILY_API_KEY']=getpass.getpass()

In [None]:
## Langchain api key
LANGCHAIN_TRACING_V2="true"
os.environ["LANGCHAIN_ENDPOINT"] = "https://api.smith.langchain.com"
os.environ['LANGCHAIN_API_KEY']=getpass.getpass()

In [None]:

from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_community.utilities import SerpAPIWrapper

# tavily tool
tavily = TavilySearchResults(max_results=1)

# serpapi tool
serpapi = SerpAPIWrapper()

Criando um Executor de Ferramentas

Iremos definir essas ferramentas de acordo com um modelo específico. O modelo permite que o ToolExecutor do LangGraph execute essas ferramentas. Ele requer três parâmetros: func, name e description.

func é a função que será chamada quando a ferramenta for invocada. name é uma string representando o nome da ferramenta. description é uma breve descrição da funcionalidade da ferramenta. Este parâmetro é muito importante, pois o raciocínio sobre qual ferramenta será usada depende da descrição. Adotando este modelo, podemos integrar perfeitamente nossas ferramentas ao fluxo de trabalho do LangGraph e utilizar o ToolExecutor para executá-las conforme necessário. Na lista de ferramentas, também incluiremos o retriever_tool que criamos anteriormente.

In [None]:
from langchain.tools import Tool

## A proper name and a good description helps to know on how to use the tools, otherwise ToolExecutor will not work
wiki_tool = Tool.from_function(
    func=wikipedia.run,
    name="wiki",
    description="useful for when you need to search certain topic on Wikipedia, aka wiki")

arxiv_tool = Tool.from_function(
    func=arxiv.run,
    name="arxiv",
    description="useful for querying from arxiv repository")

tavily_tool = Tool.from_function(
    func= tavily.invoke,
    name = 'tavily',
    description = 'Search Engine'
)

serpapi_tool = Tool.from_function(
    func= serpapi.run,
    name = 'serpapi',
    description = 'Search Engine'
)



# List of all tools
tools = [wiki_tool, arxiv_tool, tavily_tool, serpapi_tool, retriever_tool]

In [None]:
from langgraph.prebuilt.tool_executor import ToolExecutor, ToolInvocation # reinstall langgraph if fails!

# This a helper class we have that is useful for running tools
# It takes in an agent action and calls that tool and returns the result
tool_executor = ToolExecutor(tools)

In [None]:
## PROMPT TEMPLATE

from langchain.memory import ConversationBufferMemory
from langchain_core.prompts import PromptTemplate

## set up memory
memory = ConversationBufferMemory(memory_key="chat_history", input_key='input', output_key="output")

prompt_template = """
### [INST]

Assistant is a large language model to answer questions on Retrieval Augmented Generation.


Context:
------

Assistant has access to the following tools:

{tools}

To use a tool, please use the following format:

'''
Thought: Do I need to use a tool? Yes
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
'''

When you have a response to say to the Human, or if you do not need to use a tool, you MUST use the format:

'''
Thought: Do I need to use a tool? No
Final Answer: [your response here]
'''

Begin!

Previous conversation history:
{chat_history}

New input: {input}

Current Scratchpad:
{agent_scratchpad}

[/INST]
 """

# Create prompt from prompt template
prompt = PromptTemplate(
    input_variables=['agent_scratchpad', 'chat_history', 'input', 'tool_names', 'tools'],
    template=prompt_template,
)

prompt = prompt.partial(
    tools=[t.name for t in tools],
    tool_names=", ".join([t.name for t in tools]),
)
print("prompt ---> \n", prompt)

Criando um Agente ReAct

Esta parte do código demonstra como criar um Agente ReAct, que é um agente LangChain que segue o framework de Razão e Ação (ReAct) para resolver tarefas complexas selecionando e executando ferramentas apropriadas com base em suas descrições.

Os aspectos principais de um Agente ReAct são:

Razão: O agente utiliza um LLM (Modelo de Linguagem Grande) para raciocinar sobre qual ferramenta é apropriada para o passo atual da tarefa, com base nas descrições das ferramentas.

Ação: O agente executa a ferramenta selecionada com a entrada especificada. Observação: O agente observa a saída da ferramenta executada.

Prompt ReAct

Vamos primeiro importar um modelo de prompt ReAct do LangChain Hub. O modelo aceita os seguintes valores de entrada:

agent_scratchpad: Provavelmente uma string que representa os pensamentos iniciais ou o contexto do agente antes de iniciar o processo de raciocínio.

input: É a consulta original ou a tarefa que o agente precisa resolver.

tool_names: Uma lista de nomes das ferramentas disponíveis que o agente pode usar.

tools: Uma lista de descrições das ferramentas, fornecendo informações sobre a funcionalidade de cada uma.

Ele especifica o formato em que o agente deve estruturar sua resposta, incluindo seções para:

Pergunta: A pergunta original de entrada.

Pensamento: Os pensamentos iniciais ou raciocínio do agente.

Ação: A ação a ser tomada, que deve ser uma das ferramentas disponíveis.

Entrada de Ação: A entrada a ser fornecida à ferramenta selecionada.

Observação: A saída ou resultado da execução da ferramenta selecionada.

Resposta Final: A resposta final à pergunta original de entrada.

In [None]:
## Creating React Agent
from langchain import hub

# Get the prompt to use - you can modify this!
prompt = hub.pull("hwchase17/react")
print(prompt)

Agora, iremos criar a instância do agente ReAct usando "create_react_agent" que recebe um LLM, um conjunto de ferramentas e o prompt, enquanto AgentExecutor fornece uma maneira de executar essa instância do agente com as ferramentas e entrada especificadas. Os dois componentes trabalham juntos para criar e executar um agente ReAct no LangChain.

In [None]:
from langchain.agents import AgentExecutor, create_react_agent

# Construct the ReAct agent
agent = create_react_agent(model, tools, prompt)

# Create an agent executor by passing in the agent and tools
agent_executor = AgentExecutor(agent=agent,
                               tools=tools,
                               verbose=True,
                               handle_parsing_errors=True,
                               max_iterations=3,
                               return_intermediate_steps=True,
                               early_stopping_method="generate")

Agora, vamos fazer uma pergunta sobre RAG. O agente agora está usando a ferramenta RAG doc.

In [None]:
# test it !
agent_outcome = agent_executor.invoke({"input": "what is Adaptive RAG?","chat_history": []})
agent_outcome

Assim como a função run_agent, esta função também recebe dados como entrada, que é o estado atual do gráfico. Ela recupera o agent_outcome do estado, que contém as ações ou etapas intermediárias sugeridas pelo agente.

Se houver etapas intermediárias (ações) no agent_outcome, a função extrai a primeira ação (agent_action) e invoca o tool_executor com essa ação. A saída da execução da ferramenta é então retornada como parte do novo estado sob a chave "intermediate_steps", juntamente com a ação original.

Se não houver etapas intermediárias no agent_outcome, a função simplesmente retorna uma lista vazia para "intermediate_steps".

In [None]:
agent_action = agent_outcome['intermediate_steps'][0][0]
output = tool_executor.invoke(agent_action)
agent_action

Estado do Agente:

No LangGraph, o estado do agente é representado por um objeto que contém todas as informações e dados relevantes à situação ou contexto atual do agente. Este objeto de estado é passado para cada nó no gráfico.

Agora, quando um nó é executado, ele pode atualizar ou modificar o estado de duas maneiras:

SET (Definir): O nó pode sobrescrever ou substituir atributos específicos (propriedades) do objeto de estado por novos valores. Isso é como mudar completamente certas partes do estado do agente.ADD (Adicionar): O nó pode adicionar novas informações ou dados a atributos existentes do objeto de estado, sem sobrescrever os valores anteriores. Isso é como anexar ou estender o estado atual do agente com detalhes adicionais. Se um nó deve SET (sobrescrever) ou ADD (anexar) aos atributos do objeto de estado é determinado por como você define ou anota o objeto de estado quando constrói o gráfico.

Vamos definir o estado para o Agente LangChain.

In [None]:
# create agent state class

from typing import TypedDict, Annotated, List, Union
from langchain_core.agents import AgentAction, AgentFinish
from langchain_core.messages import BaseMessage
import operator


class AgentState(TypedDict):
    # The input string
    input: str
    # The list of previous messages in the conversation
    chat_history: list[BaseMessage]
    # The outcome of a given call to the agent
    # Needs `None` as a valid type, since this is what this will start as
    agent_outcome: Union[AgentAction, AgentFinish, None]
    # List of actions and corresponding observations
    # Here we annotate this with `operator.add` to indicate that operations to
    # this state should be ADDED to the existing values (not overwrite it)
    intermediate_steps: Annotated[list[tuple[AgentAction, str]], operator.add]

Agora, vamos definir os dois nós principais em nosso gráfico; o nó do agente e o nó de execução da ferramenta.

Primeiro, o nó do agente contém a função run_agent que define o comportamento do nó "agente" no LangGraph. Seu objetivo é invocar o agente (neste caso, agent_executor) com o texto de entrada dado e recuperar o resultado do agente. O resultado do agente normalmente inclui as ações que o agente deseja realizar ou o resultado final.

In [None]:
# Define the nodes
from langchain_core.agents import AgentActionMessageLog

def run_agent(data):
    inputs = data.copy()
    text = inputs['input']
    # chat_history = inputs['chat_history']
    agent_outcome = agent_executor.invoke({"input":text}) #, "chat_history": chat_history
    return {"agent_outcome": agent_outcome}

# Define the function to execute tools
def execute_tools(data):
    # Get the most recent agent_outcome - this is the key added in the `agent` above
    agent_output = data["agent_outcome"]
    if len(agent_output['intermediate_steps'])>=1 :
        agent_action = agent_output['intermediate_steps'][0][0]
        output = tool_executor.invoke(agent_action)
        return {"intermediate_steps": [(agent_action, str(output))]}
    else:
        return {"intermediate_steps":[]}

# Define logic that is used to determine which conditional edge to go down
def should_continue(data):
    # If the agent outcome is an AgentFinish, then we return `exit` string
    # This will be used when setting up the graph to define the flow
    if data["agent_outcome"]["output"] is not None:
        print(" **AgentFinish** " )
        return "end"
    # Otherwise, an AgentAction is returned
    # Here we return `continue` string
    # This will be used when setting up the graph to define the flow
    else:
        print(" **continue** " )
        return "continue"

Este código define um fluxo de trabalho LangGraph que cicla entre um nó "agente" e um nó "ação" (execução de ferramenta), com uma borda condicional que determina se o fluxo de trabalho deve continuar ou terminar com base no resultado do agente.

In [None]:
from langgraph.graph import END, StateGraph

# Define a new graph
workflow = StateGraph(AgentState)

# Define the two nodes we will cycle between
workflow.add_node("agent", run_agent)
workflow.add_node("action", execute_tools)

# Set the entrypoint as `agent`
# This means that this node is the first one called
workflow.set_entry_point("agent")

# We now add a conditional edge
workflow.add_conditional_edges(
    # First, we define the start node. We use `agent`.
    # This means these are the edges taken after the `agent` node is called.
    "agent",
    # Next, we pass in the function that will determine which node is called next.
    should_continue,
    # Finally we pass in a mapping.
    # The keys are strings, and the values are other nodes.
    # END is a special node marking that the graph should finish.
    # What will happen is we will call `should_continue`, and then the output of that
    # will be matched against the keys in this mapping.
    # Based on which one it matches, that node will then be called.
    {
        # If `tools`, then we call the tool node.
        "continue": "action",
        # Otherwise we finish.
        "end": END,
    },
)

# We now add a normal edge from `tools` to `agent`.
# This means that after `tools` is called, `agent` node is called next.
workflow.add_edge("action", "agent")

# Finally, we compile it!
# This compiles it into a LangChain Runnable,
# meaning you can use it as you would any other runnable
app = workflow.compile()

Agora vamos testar o código.




In [None]:
inputs = {"input": "Explain Adaptive Retrieval methods"} # ,"chat_history": []
outputs = app.invoke(inputs)

In [None]:
outputs['agent_outcome']['output']