# Tools padrão do LangChain

A biblioteca LangChain já possui diversas ferramentas padrão construídas que podemos utilizar. Elas podem ser verificadas neste link: https://python.langchain.com/v0.1/docs/integrations/tools/.
Vamos mostrar como utilizar algumas.

## ArXiv

Esta ferramenta utiliza a biblioteca do arXiv para retornar resumos de artigos científicos de um determinado tema solicitado.

https://python.langchain.com/v0.1/docs/integrations/tools/arxiv/

Temos três formas em geral para chamar uma tool, da mais baixo a mais alto nível:
- Criando a tool utilziando o Wrapper: no LangChain foram criados diferentes wrappers para apis e bibliotecas externas que facilitam a utilização das mesmas e permitem uma rápida criação de uma nova tool. Ela é mais customizável, pois podemos modificar as descrições e argumentos da tool às nossa necessidades, além de podermos modificar facilmente os parâmetros do wrapper
- Instanciando a tool já criada: em geral, uma tool pronta já está criada dentro da biblioteca e podemos acessá-la diretamente
- Utilizando o load_tools: o LangChain possui uma ferramnta especial chamada load_tools que permite o carregamento de diversas ferramentas ao mesmo tempo

Vamos explorar os três métodos agora:

### Criando tool manualmente através do Wrapper

In [5]:
from langchain_community.utilities.arxiv import ArxivAPIWrapper
from langchain.pydantic_v1 import BaseModel, Field
from langchain.tools import StructuredTool

class ArxivArgs(BaseModel):
    query:str = Field(description='Qyuery de busca no ArXiv')

tool_arxiv = StructuredTool.from_function(
    func=ArxivAPIWrapper(top_k_results=2).run,
    args_schema=ArxivArgs,
    name='arxiv',
    description = (
        "Uma ferramenta em torno do Arxiv.org. "
        "Útil para quando você precisa responder a perguntas sobre Física, Matemática, "
        "Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, "
        "Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. "
        "A entrada deve ser uma consulta de pesquisa em inglês."
    ),
    return_direct=True
)


In [6]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: arxiv(query: str) -> str - Uma ferramenta em torno do Arxiv.org. Útil para quando você precisa responder a perguntas sobre Física, Matemática, Ciência da Computação, Biologia Quantitativa, Finanças Quantitativas, Estatística, Engenharia Elétrica e Economia utilizando artigos científicos do arxiv.org. A entrada deve ser uma consulta de pesquisa em inglês.
Args: {'query': {'title': 'Query', 'description': 'Qyuery de busca no ArXiv', 'type': 'string'}}


In [7]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-01-08\nTitle: A Survey of Large Language Models for Code: Evolution, Benchmarking, and Future Trends\nAuthors: Zibin Zheng, Kaiwen Ning, Yanlin Wang, Jingwen Zhang, Dewu Zheng, Mingxi Ye, Jiachi Chen\nSummary: General large language models (LLMs), represented by ChatGPT, have\ndemonstrated significant potential in tasks such as code generation in software\nengineering. This has led to the development of specialized LLMs for software\nengineering, known as Code LLMs. A considerable portion of Code LLMs is derived\nfrom general LLMs through model fine-tuning. As a result, Code LLMs are often\nupdated frequently and their performance can be influenced by the base LLMs.\nHowever, there is currently a lack of systematic investigation into Code LLMs\nand their performance. In this study, we conduct a comprehensive survey and\nanalysis of the types of Code LLMs and their differences in performance\ncompared to general LLMs. We aim to address three questions: (1) What LLMs are

### Instanciando tool já criada no LangChain

In [8]:
from langchain_community.tools.arxiv.tool import ArxivQueryRun

tool_arxiv = ArxivQueryRun(api_wrapper=ArxivAPIWrapper(top_k_results=2))

In [9]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'title': 'Query', 'description': 'search query to look up', 'type': 'string'}}


### Criando tool através do load_tools

In [10]:
from langchain.agents import load_tools

In [11]:
tools = load_tools(['arxiv'])
tools

[ArxivQueryRun()]

In [12]:
tool_arxiv = tools[0]
tool_arxiv

ArxivQueryRun()

In [13]:
print('Descrição:', tool_arxiv.description)
print('Args:', tool_arxiv.args)

Descrição: A wrapper around Arxiv.org Useful for when you need to answer questions about Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance, Statistics, Electrical Engineering, and Economics from scientific articles on arxiv.org. Input should be a search query.
Args: {'query': {'title': 'Query', 'description': 'search query to look up', 'type': 'string'}}


In [14]:
tool_arxiv.run({'query': 'llm'})

"Published: 2024-01-08\nTitle: A Survey of Large Language Models for Code: Evolution, Benchmarking, and Future Trends\nAuthors: Zibin Zheng, Kaiwen Ning, Yanlin Wang, Jingwen Zhang, Dewu Zheng, Mingxi Ye, Jiachi Chen\nSummary: General large language models (LLMs), represented by ChatGPT, have\ndemonstrated significant potential in tasks such as code generation in software\nengineering. This has led to the development of specialized LLMs for software\nengineering, known as Code LLMs. A considerable portion of Code LLMs is derived\nfrom general LLMs through model fine-tuning. As a result, Code LLMs are often\nupdated frequently and their performance can be influenced by the base LLMs.\nHowever, there is currently a lack of systematic investigation into Code LLMs\nand their performance. In this study, we conduct a comprehensive survey and\nanalysis of the types of Code LLMs and their differences in performance\ncompared to general LLMs. We aim to address three questions: (1) What LLMs are

## Python REPL

https://python.langchain.com/v0.1/docs/integrations/tools/python/

In [15]:
from langchain_experimental.tools.python.tool import PythonREPLTool

tool_repl = PythonREPLTool()
print('Descrição:', tool_repl.description)
print('Args:', tool_repl.args)

Descrição: A Python shell. Use this to execute python commands. Input should be a valid python command. If you want to see the output of a value, you should print it out with `print(...)`.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [18]:
tool_repl.run({'query': 'print("oi")'})

'oi\n'

## StackOverflow

https://python.langchain.com/v0.1/docs/integrations/tools/stackexchange/

In [19]:
from langchain.agents import load_tools

tools = load_tools(['stackexchange'])
tool_stack = tools[0]
print('Descrição:', tool_stack.description)
print('Args:', tool_stack.args)

Descrição: A wrapper around StackExchange. Useful for when you need to answer specific programming questionscode excerpts, code examples and solutionsInput should be a fully formed question.
Args: {'query': {'title': 'Query', 'type': 'string'}}


In [21]:
tool_stack.run({'query': 'LangChain Agents'})

'Question: While using groq for my project im getting this error\ndef claim_agent(user_question):\n    memory = ConversationBufferWindowMemory(ai_prefix=&quot;Insurance <span class="highlight">Agent</span>&quot;, k=20)\n    prompt_template = PromptTemplate(\n        input_variables=[&#39;history&#39;, &#39;input&#39;], &hellip; &quot;D:\\Project_tests.venv\\Lib\\site-packages\\<span class="highlight">langchain</span>\\chains\\base.py&quot;, line 163, in invoke\nraise e\nFile &quot;D:\\Project_tests.venv\\Lib\\site-packages\\<span class="highlight">langchain</span>\\chains\\base.py&quot;, line 153, in invoke\nself. &hellip; \n\nQuestion: NL2SQL Chatbot - Output Formatting Issue\nI&#39;m utilizing the <span class="highlight">Langchain</span> SQL <span class="highlight">agent</span> for this purpose. However, the output I&#39;m receiving contains some formatting errors that I aim to rectify. &hellip; I tried using <span class="highlight">Langchain</span> SQL <span class="highlight">agent<

## File System

https://python.langchain.com/v0.1/docs/integrations/tools/filesystem/

In [22]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos'
)
tools = tool_kit.get_tools()
for tool in tools:
    print('Name:', tool.name)
    print('Descrição:', tool.description)
    print('Args:', tool.args) 
    print()


Name: copy_file
Descrição: Create a copy of a file in a specified location
Args: {'source_path': {'title': 'Source Path', 'description': 'Path of the file to copy', 'type': 'string'}, 'destination_path': {'title': 'Destination Path', 'description': 'Path to save the copied file', 'type': 'string'}}

Name: file_delete
Descrição: Delete a file
Args: {'file_path': {'title': 'File Path', 'description': 'Path of the file to delete', 'type': 'string'}}

Name: file_search
Descrição: Recursively search for files in a subdirectory that match the regex pattern
Args: {'dir_path': {'title': 'Dir Path', 'description': 'Subdirectory to search in.', 'default': '.', 'type': 'string'}, 'pattern': {'title': 'Pattern', 'description': 'Unix shell regex, where * matches everything.', 'type': 'string'}}

Name: move_file
Descrição: Move or rename a file from one location to another
Args: {'source_path': {'title': 'Source Path', 'description': 'Path of the file to move', 'type': 'string'}, 'destination_path':

## Dando um exemplo de aplicação

In [23]:
from langchain_community.agent_toolkits.file_management.toolkit import FileManagementToolkit

tool_kit = FileManagementToolkit(
    root_dir='arquivos',
    selected_tools=['write_file', 'read_file', 'file_search','list_directory']
)
tools = tool_kit.get_tools()

In [25]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.utils.function_calling import convert_to_openai_function

tools_json = [convert_to_openai_function(tool) for tool in tools]
tool_run = {tool.name: tool for tool in tools}

prompt = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente amigável chamado Isaac capaz de gerenciar arquivos'),
    ('user', '{input}')
])
chat = ChatOpenAI()

In [27]:
from langchain.agents.agent import AgentFinish

def roteamento(resultado):
    if isinstance(resultado, AgentFinish):
        return resultado.return_values['output']
    else:
        return tool_run[resultado.tool].run(resultado.tool_input)
    

In [28]:
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser


chain = prompt | chat.bind(functions=tools_json) | OpenAIFunctionsAgentOutputParser() | roteamento

In [29]:
chain.invoke({'input': 'O que você é capz de fazer?'})

'Olá! Eu sou um assistente amigável chamado Isaac e sou capaz de gerenciar arquivos. Posso escrever texto em arquivos, ler o conteúdo de arquivos, pesquisar arquivos com base em padrões de regex e listar arquivos e diretórios em uma pasta específica. Se precisar de ajuda com alguma dessas tarefas, fique à vontade para me pedir! Como posso ajudar você hoje?'

In [30]:
chain.invoke({'input': 'Quais arquivos pdf você tem na pasta?'})

'Explorando o Universo das IAs com Hugging Face.pdf'

In [31]:
chain.invoke({'input': 'Quais arquivos txt você tem na pasta?'})

'No files found for pattern *.txt in directory .'

In [32]:
chain.invoke({'input': 'Crie um arquivo txt chamado notas com o seguinte conteúdo "Isso foi feito por uma LLM"'})

'File written successfully to notas.txt.'

In [33]:
chain.invoke({'input': 'Leia o arquivo notas.txt'})

'Isso foi feito por uma LLM'