# Tools padrão do LangChain

A biblioteca LangChain já possui diversas ferramentas padrão construídas que podemos utilizar. Elas podem ser verificadas neste link: https://python.langchain.com/docs/integrations/tools/.
Vamos mostrar como utilizar algumas.

## ArXiv

Esta ferramenta utiliza a biblioteca do arXiv para retornar resumos de artigos científicos de um determinado tema solicitado.

https://python.langchain.com/v0.1/docs/integrations/tools/arxiv/

Temos três formas em geral para chamar uma tool, da mais baixo a mais alto nível:
- Criando a tool utilziando o Wrapper: no LangChain foram criados diferentes wrappers para apis e bibliotecas externas que facilitam a utilização das mesmas e permitem uma rápida criação de uma nova tool. Ela é mais customizável, pois podemos modificar as descrições e argumentos da tool às nossa necessidades, além de podermos modificar facilmente os parâmetros do wrapper
- Instanciando a tool já criada: em geral, uma tool pronta já está criada dentro da biblioteca e podemos acessá-la diretamente
- Utilizando o load_tools: o LangChain possui uma ferramnta especial chamada load_tools que permite o carregamento de diversas ferramentas ao mesmo tempo

Vamos explorar os três métodos agora:

### Criando tool manualmente através do Wrapper

In [4]:
from langchain_community.utilities.arxiv import ArxivAPIWrapper
from pydantic import BaseModel, Field #Importação atualizada
from langchain.tools import StructuredTool

class ArxivArgs(BaseModel):
    query:str = Field(description='Qyuery de busca no ArXiv')

tool_arxiv = StructuredTool.from_function(
    func=ArxivAPIWrapper(top_k_results=3).run,
    args_schema=ArxivArgs,
    name='arxiv',
    description = (
        "Uma ferramenta em torno do Arxiv.org. "
        "Útil para quando você precisa responder a perguntas sobre Física, Matemática, "
        "Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, "
        "Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. "
        "A entrada deve ser uma consulta de pesquisa em inglês."
    ),
    return_direct=True
)


In [5]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: Uma ferramenta em torno do Arxiv.org. Útil para quando você precisa responder a perguntas sobre Física, Matemática, Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. A entrada deve ser uma consulta de pesquisa em inglês.
Args: {'query': {'description': 'Qyuery de busca no ArXiv', 'title': 'Query', 'type': 'string'}}


In [6]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-12-23\nTitle: Trustworthy and Efficient LLMs Meet Databases\nAuthors: Kyoungmin Kim, Anastasia Ailamaki\nSummary: In the rapidly evolving AI era with large language models (LLMs) at the core,\nmaking LLMs more trustworthy and efficient, especially in output generation\n(inference), has gained significant attention. This is to reduce plausible but\nfaulty LLM outputs (a.k.a hallucinations) and meet the highly increased\ninference demands. This tutorial explores such efforts and makes them\ntransparent to the database community. Understanding these efforts is essential\nin harnessing LLMs in database tasks and adapting database techniques to LLMs.\nFurthermore, we delve into the synergy between LLMs and databases, highlighting\nnew opportunities and challenges in their intersection. This tutorial aims to\nshare with database researchers and practitioners essential concepts and\nstrategies around LLMs, reduce the unfamiliarity of LLMs, and inspire joining\nin the intersec

### Instanciando tool já criada no LangChain

In [7]:
from langchain_community.tools.arxiv.tool import ArxivQueryRun

tool_arxiv = ArxivQueryRun(api_wrapper=ArxivAPIWrapper(top_k_results=2))

In [8]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'description': 'search query to look up', 'title': 'Query', 'type': 'string'}}


### Criando tool através do load_tools

In [9]:
from langchain.agents import load_tools

In [10]:
tools = load_tools(['arxiv'])
tools

[ArxivQueryRun(api_wrapper=ArxivAPIWrapper(arxiv_search=<class 'arxiv.Search'>, arxiv_exceptions=(<class 'arxiv.ArxivError'>, <class 'arxiv.UnexpectedEmptyPageError'>, <class 'arxiv.HTTPError'>), top_k_results=3, ARXIV_MAX_QUERY_LENGTH=300, continue_on_failure=False, load_max_docs=100, load_all_available_meta=False, doc_content_chars_max=4000))]

In [11]:
tool_arxiv = tools[0]
tool_arxiv

ArxivQueryRun(api_wrapper=ArxivAPIWrapper(arxiv_search=<class 'arxiv.Search'>, arxiv_exceptions=(<class 'arxiv.ArxivError'>, <class 'arxiv.UnexpectedEmptyPageError'>, <class 'arxiv.HTTPError'>), top_k_results=3, ARXIV_MAX_QUERY_LENGTH=300, continue_on_failure=False, load_max_docs=100, load_all_available_meta=False, doc_content_chars_max=4000))

In [12]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'description': 'search query to look up', 'title': 'Query', 'type': 'string'}}


In [13]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-12-23\nTitle: Trustworthy and Efficient LLMs Meet Databases\nAuthors: Kyoungmin Kim, Anastasia Ailamaki\nSummary: In the rapidly evolving AI era with large language models (LLMs) at the core,\nmaking LLMs more trustworthy and efficient, especially in output generation\n(inference), has gained significant attention. This is to reduce plausible but\nfaulty LLM outputs (a.k.a hallucinations) and meet the highly increased\ninference demands. This tutorial explores such efforts and makes them\ntransparent to the database community. Understanding these efforts is essential\nin harnessing LLMs in database tasks and adapting database techniques to LLMs.\nFurthermore, we delve into the synergy between LLMs and databases, highlighting\nnew opportunities and challenges in their intersection. This tutorial aims to\nshare with database researchers and practitioners essential concepts and\nstrategies around LLMs, reduce the unfamiliarity of LLMs, and inspire joining\nin the intersec

## Python REPL

https://python.langchain.com/v0.1/docs/integrations/tools/python/

In [14]:
from langchain_experimental.tools.python.tool import PythonREPLTool

tool_repl = PythonREPLTool()
print('Descrição:', tool_repl.description)
print('Args:', tool_repl.args)

Descrição: A Python shell. Use this to execute python commands. Input should be a valid python command. If you want to see the output of a value, you should print it out with `print(...)`.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [15]:
tool_repl.run({'query': 'print("oi")'})

Python REPL can execute arbitrary code. Use with caution.


'oi\n'

## StackOverflow

https://python.langchain.com/v0.1/docs/integrations/tools/stackexchange/

In [20]:
from langchain.agents import load_tools

tools = load_tools(['stackexchange'])
tool_stack = tools[0]
print('Descrição:', tool_stack.description)
print('Args:', tool_stack.args)


Descrição: A wrapper around StackExchange. Useful for when you need to answer specific programming questionscode excerpts, code examples and solutionsInput should be a fully formed question.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [22]:
tool_stack.run({'query': 'LangChain Agents Python'})

'Question: LangGraph deployment with docker-compose\nsslmode=disable\n\nWhen I run docker-compose up, I get the following error:\nFileNotFoundError: [Errno 2] No such file or directory: &#39;/deps/__outer_src/src/<span class="highlight">agent</span>\\\\agent.py&#39;\nCould not find <span class="highlight">python</span> file for &hellip; /src/<span class="highlight">agent</span>/agent.py file? I tried moving <span class="highlight">Python</span> source from the src to root folder, but it didn&#39;t help. There&#39;s very little info about what langgraph CLI tool does and how. &hellip; \n\nQuestion: Tool Methods in Python Class Missing self Argument When Used in Custom Agents\nI am working on a custom implementation of AI <span class="highlight">agents</span> using <span class="highlight">Python</span>, where the <span class="highlight">agents</span> rely on <span class="highlight">langchain</span> tools (methods) for interacting with a PostgreSQL database. &hellip; These tools are later

## File System

https://python.langchain.com/v0.1/docs/integrations/tools/filesystem/

In [32]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos'
)
tools = tool_kit.get_tools()
for tool in tools:
    print('Name:', tool.name)
    print('Descrição:', tool.description)
    print('Args:', tool.args) 
    print()


Name: copy_file
Descrição: Create a copy of a file in a specified location
Args: {'source_path': {'description': 'Path of the file to copy', 'title': 'Source Path', 'type': 'string'}, 'destination_path': {'description': 'Path to save the copied file', 'title': 'Destination Path', 'type': 'string'}}

Name: file_delete
Descrição: Delete a file
Args: {'file_path': {'description': 'Path of the file to delete', 'title': 'File Path', 'type': 'string'}}

Name: file_search
Descrição: Recursively search for files in a subdirectory that match the regex pattern
Args: {'dir_path': {'default': '.', 'description': 'Subdirectory to search in.', 'title': 'Dir Path', 'type': 'string'}, 'pattern': {'description': 'Unix shell regex, where * matches everything.', 'title': 'Pattern', 'type': 'string'}}

Name: move_file
Descrição: Move or rename a file from one location to another
Args: {'source_path': {'description': 'Path of the file to move', 'title': 'Source Path', 'type': 'string'}, 'destination_path':

## Dando um exemplo de aplicação

In [33]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos',
    selected_tools=['write_file', 'read_file', 'file_search','list_directory']
)
tools = tool_kit.get_tools()

In [18]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.utils.function_calling import convert_to_openai_function

tools_json = [convert_to_openai_function(tool) for tool in tools]
tool_run = {tool.name: tool for tool in tools}

prompt = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente amigável chamado Isaac capaz de gerenciar arquivos'),
    ('user', '{input}')
])
chat = ChatOpenAI()

In [19]:
from langchain_core.agents import AgentFinish #Importação do AgentFinish atualizada

def roteamento(resultado):
    if isinstance(resultado, AgentFinish):
        return resultado.return_values['output']
    else:
        return tool_run[resultado.tool].run(resultado.tool_input)
    

In [20]:
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser


chain = prompt | chat.bind(functions=tools_json) | OpenAIFunctionsAgentOutputParser() | roteamento

In [None]:
# === IMPORTAÇÕES NECESSÁRIAS ===
from langchain_core.utils.function_calling import convert_to_openai_function
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import ChatPromptTemplate
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser
from langchain_core.agents import AgentFinish

# === TOOL:  ===

from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos',
    selected_tools=['write_file', 'read_file', 'file_search','list_directory']
)
tools = tool_kit.get_tools()

# === DEFININDO TOOLS ===
# tools = [tool_kit.get_tools()]
tools_json = [convert_to_openai_function(tool) for tool in tools]
tool_run = {tool.name: tool for tool in tools}


# === MODELO ===
model = ChatGoogleGenerativeAI(model="gemini-2.0-flash-lite")  # ou gemini-1.5-pro, gemini-1.5-flash

# === PROMPT ===
prompt = ChatPromptTemplate.from_messages([
    ('system', 'Pense com cuidado ao categorizar o texto conforme as instruções'),
    ('user', '{input}')
])


# === AGENTE COMBINADO COM TOOLS ===
chain = (
    prompt
    | model.bind(functions=tools_json)
    | OpenAIFunctionsAgentOutputParser()
)

# === GERENCIADOR DE EXECUÇÃO ===
def roteamento(resultado):
    if isinstance(resultado, AgentFinish):
        return resultado.return_values['output']
    else:
        return tool_run[resultado.tool].invoke(resultado.tool_input)


# === CADEIA FINAL ===
final_chain = chain | roteamento


# === EXEMPLO DE USO ===
resposta = final_chain.invoke({'input': 'O que você é capz de fazer?'})
print(resposta)

resposta2 = final_chain.invoke({'input': 'Quais arquivos pdf você tem na pasta?'})
print(resposta2)

resposta3 = final_chain.invoke({'input': 'Quais arquivos txt você tem na pasta?'})
print(resposta3)

resposta4 = final_chain.invoke({'input': 'Crie um arquivo txt chamado notas com o seguinte conteúdo "Isso foi feito por uma LLM"'})
print(resposta4)

resposta5 = final_chain.invoke({'input': 'Crie um arquivo txt chamado notas com o seguinte conteúdo "Isso foi feito por uma LLM"'})
print(resposta5)

resposta6 = final_chain.invoke({'input': 'Leia o arquivo notas.txt'})
print(resposta6)

Eu sou um modelo de linguagem grande, treinado pelo Google. Eu posso escrever e executar código.
Eu posso procurar por arquivos pdf, mas preciso de um diretório para procurar. Você poderia me dizer qual diretório você gostaria que eu procurasse?
Eu posso procurar arquivos txt para você. Em qual pasta você gostaria que eu procurasse?
File written successfully to notas.txt.
File written successfully to notas.txt.
Isso foi feito por uma LLM
