# Tools padrão do LangChain

A biblioteca LangChain já possui diversas ferramentas padrão construídas que podemos utilizar. Elas podem ser verificadas neste link: https://python.langchain.com/v0.1/docs/integrations/tools/.
Vamos mostrar como utilizar algumas.

## ArXiv

Esta ferramenta utiliza a biblioteca do arXiv para retornar resumos de artigos científicos de um determinado tema solicitado.

https://python.langchain.com/v0.1/docs/integrations/tools/arxiv/

Temos três formas em geral para chamar uma tool, da mais baixo a mais alto nível:
- Criando a tool utilziando o Wrapper: no LangChain foram criados diferentes wrappers para apis e bibliotecas externas que facilitam a utilização das mesmas e permitem uma rápida criação de uma nova tool. Ela é mais customizável, pois podemos modificar as descrições e argumentos da tool às nossa necessidades, além de podermos modificar facilmente os parâmetros do wrapper
- Instanciando a tool já criada: em geral, uma tool pronta já está criada dentro da biblioteca e podemos acessá-la diretamente
- Utilizando o load_tools: o LangChain possui uma ferramnta especial chamada load_tools que permite o carregamento de diversas ferramentas ao mesmo tempo

Vamos explorar os três métodos agora:

### Criando tool manualmente através do Wrapper

In [1]:
from dotenv import load_dotenv, find_dotenv

_ = load_dotenv(find_dotenv())

In [2]:
from langchain_community.utilities.arxiv import ArxivAPIWrapper
from langchain.pydantic_v1 import BaseModel, Field
from langchain.tools import StructuredTool

class ArxivArgs(BaseModel):
    query:str = Field(description='Qyuery de busca no ArXiv')

tool_arxiv = StructuredTool.from_function(
    func=ArxivAPIWrapper(top_k_results=2).run,
    args_schema=ArxivArgs,
    name='arxiv',
    description = (
        "Uma ferramenta em torno do Arxiv.org. "
        "Útil para quando você precisa responder a perguntas sobre Física, Matemática, "
        "Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, "
        "Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. "
        "A entrada deve ser uma consulta de pesquisa em inglês."
    ),
    return_direct=True
)


In [3]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: arxiv(query: str) -> str - Uma ferramenta em torno do Arxiv.org. Útil para quando você precisa responder a perguntas sobre Física, Matemática, Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. A entrada deve ser uma consulta de pesquisa em inglês.
Args: {'query': {'title': 'Query', 'description': 'Qyuery de busca no ArXiv', 'type': 'string'}}


In [4]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-12-23\nTitle: Trustworthy and Efficient LLMs Meet Databases\nAuthors: Kyoungmin Kim, Anastasia Ailamaki\nSummary: In the rapidly evolving AI era with large language models (LLMs) at the core,\nmaking LLMs more trustworthy and efficient, especially in output generation\n(inference), has gained significant attention. This is to reduce plausible but\nfaulty LLM outputs (a.k.a hallucinations) and meet the highly increased\ninference demands. This tutorial explores such efforts and makes them\ntransparent to the database community. Understanding these efforts is essential\nin harnessing LLMs in database tasks and adapting database techniques to LLMs.\nFurthermore, we delve into the synergy between LLMs and databases, highlighting\nnew opportunities and challenges in their intersection. This tutorial aims to\nshare with database researchers and practitioners essential concepts and\nstrategies around LLMs, reduce the unfamiliarity of LLMs, and inspire joining\nin the intersec

### Instanciando tool já criada no LangChain

In [5]:
from langchain_community.tools.arxiv.tool import ArxivQueryRun

tool_arxiv = ArxivQueryRun(api_wrapper=ArxivAPIWrapper(top_k_results=2))

In [6]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'title': 'Query', 'description': 'search query to look up', 'type': 'string'}}


### Criando tool através do load_tools

In [7]:
from langchain.agents import load_tools

In [8]:
tools = load_tools(['arxiv'])
tools

[ArxivQueryRun()]

In [9]:
tool_arxiv = tools[0]
tool_arxiv

ArxivQueryRun()

In [10]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'title': 'Query', 'description': 'search query to look up', 'type': 'string'}}


In [11]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-12-23\nTitle: Trustworthy and Efficient LLMs Meet Databases\nAuthors: Kyoungmin Kim, Anastasia Ailamaki\nSummary: In the rapidly evolving AI era with large language models (LLMs) at the core,\nmaking LLMs more trustworthy and efficient, especially in output generation\n(inference), has gained significant attention. This is to reduce plausible but\nfaulty LLM outputs (a.k.a hallucinations) and meet the highly increased\ninference demands. This tutorial explores such efforts and makes them\ntransparent to the database community. Understanding these efforts is essential\nin harnessing LLMs in database tasks and adapting database techniques to LLMs.\nFurthermore, we delve into the synergy between LLMs and databases, highlighting\nnew opportunities and challenges in their intersection. This tutorial aims to\nshare with database researchers and practitioners essential concepts and\nstrategies around LLMs, reduce the unfamiliarity of LLMs, and inspire joining\nin the intersec

## Python REPL

https://python.langchain.com/v0.1/docs/integrations/tools/python/

In [12]:
from langchain_experimental.tools.python.tool import PythonREPLTool

tool_repl = PythonREPLTool()
print('Descrição:', tool_repl.description)
print('Args:', tool_repl.args)

Descrição: A Python shell. Use this to execute python commands. Input should be a valid python command. If you want to see the output of a value, you should print it out with `print(...)`.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [13]:
tool_repl.run({'query': 'print("oi")'})

Python REPL can execute arbitrary code. Use with caution.


'oi\n'

## StackOverflow

https://python.langchain.com/v0.1/docs/integrations/tools/stackexchange/

In [14]:
from langchain.agents import load_tools

tools = load_tools(['stackexchange'])
tool_stack = tools[0]
print('Descrição:', tool_stack.description)
print('Args:', tool_stack.args)

Descrição: A wrapper around StackExchange. Useful for when you need to answer specific programming questionscode excerpts, code examples and solutionsInput should be a fully formed question.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [15]:
tool_stack.run({'query': 'LangChain Agents'})

'Question: Problem Generating SQL Script with SQL LangChain Agent\nI&#39;m trying to implement an SQL <span class="highlight">LangChain</span> <span class="highlight">agent</span> to process an existing SQLite database. &hellip; \n\nQuestion: Tool Methods in Python Class Missing self Argument When Used in Custom Agents\nI am working on a custom implementation of AI <span class="highlight">agents</span> using Python, where the <span class="highlight">agents</span> rely on <span class="highlight">langchain</span> tools (methods) for interacting with a PostgreSQL database. &hellip; These tools are later used by CrewAI <span class="highlight">agents</span> to perform various tasks. &hellip; \n\nQuestion: How do I pipe an Output Parser to Langchain&#39;s agent?\nThis is possible with non-<span class="highlight">agent</span>, but I can&#39;t find any documents on piping Output Parser to <span class="highlight">agent</span>.\nimport { TavilySearchResults } from &quot;@<span class="highlight">

## File System

https://python.langchain.com/v0.1/docs/integrations/tools/filesystem/

In [16]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos'
)
tools = tool_kit.get_tools()
for tool in tools:
    print('Name:', tool.name)
    print('Descrição:', tool.description)
    print('Args:', tool.args) 
    print()


Name: copy_file
Descrição: Create a copy of a file in a specified location
Args: {'source_path': {'title': 'Source Path', 'description': 'Path of the file to copy', 'type': 'string'}, 'destination_path': {'title': 'Destination Path', 'description': 'Path to save the copied file', 'type': 'string'}}

Name: file_delete
Descrição: Delete a file
Args: {'file_path': {'title': 'File Path', 'description': 'Path of the file to delete', 'type': 'string'}}

Name: file_search
Descrição: Recursively search for files in a subdirectory that match the regex pattern
Args: {'dir_path': {'title': 'Dir Path', 'description': 'Subdirectory to search in.', 'default': '.', 'type': 'string'}, 'pattern': {'title': 'Pattern', 'description': 'Unix shell regex, where * matches everything.', 'type': 'string'}}

Name: move_file
Descrição: Move or rename a file from one location to another
Args: {'source_path': {'title': 'Source Path', 'description': 'Path of the file to move', 'type': 'string'}, 'destination_path':

## Dando um exemplo de aplicação

In [23]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='files',
    selected_tools=['write_file', 'read_file', 'file_search','list_directory']
)
tools = tool_kit.get_tools()

In [24]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.utils.function_calling import convert_to_openai_function

tools_json = [convert_to_openai_function(tool) for tool in tools]
tool_run = {tool.name: tool for tool in tools}

prompt = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente amigável chamado Isaac capaz de gerenciar arquivos'),
    ('user', '{input}')
])
chat = ChatOpenAI()

In [25]:
from langchain.agents.agent import AgentFinish

def roteamento(resultado):
    if isinstance(resultado, AgentFinish):
        return resultado.return_values['output']
    else:
        return tool_run[resultado.tool].run(resultado.tool_input)
    

In [26]:
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser


chain = prompt | chat.bind(functions=tools_json) | OpenAIFunctionsAgentOutputParser() | roteamento

In [27]:
chain.invoke({'input': 'O que você é capaz de fazer?'})

'Olá! Eu sou um assistente chamado Isaac e sou capaz de gerenciar arquivos. Posso escrever texto em arquivos, ler arquivos do disco, procurar arquivos que correspondam a um padrão específico e listar arquivos e diretórios em uma pasta especificada. Se precisar de ajuda com alguma dessas tarefas, fique à vontade para me pedir!'

In [28]:
chain.invoke({'input': 'Quais arquivos pdf você tem na pasta?'})

'Explorando o Universo das IAs com Hugging Face.pdf'

In [29]:
chain.invoke({'input': 'Quais arquivos txt você tem na pasta?'})

'No files found for pattern *.txt in directory .'

In [30]:
chain.invoke({'input': 'Crie um arquivo txt chamado notas com o seguinte conteúdo "Isso foi feito por uma LLM"'})

'File written successfully to notas.txt.'

In [31]:
chain.invoke({'input': 'Leia o arquivo notas.txt'})

'Isso foi feito por uma LLM'