## Configura√ß√£o do Modelo de Linguagem (LLM)

In [2]:
# Importa configura√ß√µes padr√£o do LlamaIndex
from llama_index.core import Settings
# Importa o LLM (modelo de linguagem) Groq, que ser√° usado para processar as perguntas
from llama_index.llms.groq import Groq

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Importa biblioteca padr√£o para acessar vari√°veis de ambiente
import os
# Instancia o modelo de linguagem LLaMA 3.3 com 70 bilh√µes de par√¢metros, usando a chave da API armazenada no sistema
llm = Groq(model="llama-3.3-70b-versatile", api_key=os.environ.get("GROQ_API_KEY"))

## Fun√ß√£o para C√°lculo de Imposto de Renda


In [3]:
# Fun√ß√£o que calcula o imposto de renda com base no rendimento anual informado
def calcular_imposto_renda(rendimento:float) -> str:
    """ 
    Calcula o imposto de renda com base no rendimento anual.
    Args:
        rendimento (float): Rendimento anual do contribuinte.
    Returns:
        str: O valor do imposto devido com base no rendimento.
    """
    if rendimento <= 2000:
        return "Isento de imposto de renda."
    elif 2000 < rendimento <= 5000:
        imposto = (rendimento - 2000) * 0.10
        return f"Imposto devido √© de: R$ {imposto:.2f}, base em um rendimento de R$ {rendimento:.2f}."
    elif 5000 < rendimento <= 10000:
        imposto = (rendimento - 5000) * 0.15 + 300
        return f"Imposto devido √© de: R$ {imposto:.2f}, base em um rendimento de R$ {rendimento:.2f}."
    else:
        imposto = (rendimento - 10000) * 0.20 + 1050
        return f"Imposto devido √© de: R$ {imposto:.2f}, base em um rendimento de R$ {rendimento:.2f}."

## Transformando Fun√ß√£o em Ferramenta de Agente

In [4]:
# Transforma a fun√ß√£o de c√°lculo de imposto em uma ferramenta utiliz√°vel por um agente
from llama_index.core.tools import FunctionTool

In [5]:
ferramenta_imposto_renda = FunctionTool.from_defaults(
    fn=calcular_imposto_renda,
    name="Calcular Imposto de Renda",
    description=(
    "Calcula o imposto de renda com base no rendimento anual do contribuinte."
    "Argumento: rendimento (float)."
    "Retorna o valor do imposto devido de acordo com faixas de rendimento."
    )
)

## Cria√ß√£o e Execu√ß√£o de Agente com a Ferramenta

In [6]:
# Cria um agente com capacidade de chamar fun√ß√µes (FunctionCallingAgentWorker)
from llama_index.core.agent import FunctionCallingAgentWorker 

In [7]:
agent_worker_imposto = FunctionCallingAgentWorker.from_tools(
    tools=[ferramenta_imposto_renda],
    verbose=True,
    allow_parallel_tool_calls=True,
    llm=llm
)

In [8]:
# Envolve o agente anterior com uma interface de conversa√ß√£o
from llama_index.core.agent import AgentRunner

In [9]:
agent_imposto= AgentRunner(agent_worker_imposto)

In [10]:
# Realiza a consulta ao agente: o agente vai identificar a fun√ß√£o adequada e cham√°-la com os argumentos corretos
response = agent_imposto.chat("""
    Qual √© o imposto de renda devido por uma pessoa com rendimento anual de R$ 7500?
"""
)

Added user message to memory: 
    Qual √© o imposto de renda devido por uma pessoa com rendimento anual de R$ 7500?

=== Calling Function ===
Calling function: Calcular Imposto de Renda with args: {"rendimento": 7500}
=== Function Output ===
Imposto devido √© de: R$ 675.00, base em um rendimento de R$ 7500.00.
=== LLM Response ===
O imposto de renda devido por uma pessoa com rendimento anual de R$ 7500 √© de R$ 675,00.


## Consulta de Artigos Cient√≠ficos no arXiv

In [11]:
# Importa biblioteca para buscar artigos cient√≠ficos no arXiv
import arxiv 

# Fun√ß√£o que realiza a busca de artigos pelo t√≠tulo no arXiv
def consulta_artigos(titulo: str) -> str:
    """ Consulta artigos na base de dados arXiv e retorna resultados formatados."""
    busca = arxiv.Search(
        query=titulo,
        max_results=5,
        sort_by=arxiv.SortCriterion.Relevance
    )
    # Monta uma lista com os principais dados de cada artigo encontrado
    resultados = [
        f"T√≠tulo: {artigo.title}\n"
        f"Categoria: {artigo.primary_category}\n"
        f"Link: {artigo.entry_id}\n"
        for artigo in busca.results()
    ]

    return "\n\n".join(resultados)

In [12]:
# Transforma a fun√ß√£o de busca de artigos em ferramenta compat√≠vel com agente
consulta_artigos_tool = FunctionTool.from_defaults(fn=consulta_artigos)

In [13]:
# Cria um novo agente que usa duas ferramentas: c√°lculo de imposto e busca de artigos
agent_worker = FunctionCallingAgentWorker.from_tools(
    [ferramenta_imposto_renda, consulta_artigos_tool],
    verbose=True,
    allow_parallel_tool_calls=False, # N√£o permite chamadas paralelas neste caso
    llm=llm
)

In [14]:
# Cria um agente completo com as ferramentas acima
agent = AgentRunner(agent_worker)
# Exemplo de consulta ao agente: busca por artigos sobre LangChain na educa√ß√£o
response = agent.chat("Me retorne artigos sobre LangChain na educa√ß√£o")

Added user message to memory: Me retorne artigos sobre LangChain na eeduca√ß√£o
=== Calling Function ===
Calling function: consulta_artigos with args: {"titulo": "LangChain na educa\u00e7\u00e3o"}


  for artigo in busca.results()


=== Function Output ===
T√≠tulo: Development and Testing of Retrieval Augmented Generation in Large Language Models -- A Case Study Report
Categoria: cs.CL
Link: http://arxiv.org/abs/2402.01733v1


T√≠tulo: From Prompt Injections to SQL Injection Attacks: How Protected is Your LLM-Integrated Web Application?
Categoria: cs.CR
Link: http://arxiv.org/abs/2308.01990v4


T√≠tulo: Automating Customer Service using LangChain: Building custom open-source GPT Chatbot for organizations
Categoria: cs.CL
Link: http://arxiv.org/abs/2310.05421v1


T√≠tulo: Poisoned LangChain: Jailbreak LLMs by LangChain
Categoria: cs.CL
Link: http://arxiv.org/abs/2406.18122v1


T√≠tulo: Breast Ultrasound Report Generation using LangChain
Categoria: eess.IV
Link: http://arxiv.org/abs/2312.03013v1

=== Calling Function ===
Calling function: consulta_artigos with args: {"titulo": "LangChain e educa\u00e7\u00e3o"}
=== Function Output ===
T√≠tulo: From Prompt Injections to SQL Injection Attacks: How Protected is Your LLM

## Integra√ß√£o com Tavily para Busca Cient√≠fica

In [15]:
# Carrega vari√°veis de ambiente a partir de um arquivo `.env`
import os
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())


In [16]:
# Obt√©m chave da API Tavily
tavily_key = os.environ.get("TAVILY_API_KEY")

In [17]:
# Importa ferramenta de busca da Tavily
from llama_index.tools.tavily_research import TavilyToolSpec
# Cria uma especifica√ß√£o da ferramenta Tavily com a chave da API
tavily_tool = TavilyToolSpec(
    api_key=tavily_key
)

In [18]:
# Converte para uma lista de ferramentas compat√≠veis com agentes
tavily_tool_list = tavily_tool.to_tool_list()
# Mostra o nome de cada ferramenta gerada pela Tavily
for tool in tavily_tool_list:
    print(tool.metadata.name)
    

search


In [19]:
# Faz uma busca por artigos cient√≠ficos sobre LangChain usando Tavily
tavily_tool.search("Me rteorne artigos cient√≠ficos sobre LangChain", max_results=3)

[Document(id_='29cb1e12-0732-4fcc-ba58-101ad8f4f339', embedding=None, metadata={'url': 'https://community.revelo.com.br/faca-perguntas-ao-seu-pdf-usando-langchain-llama-2-e-python/'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='Durante 2023, a Meta anunciou o LLaMA 2 (de agora em diante vou cham√°-lo simplesmente de Llama 2), um LLM de c√≥digo aberto que √© a evolu√ß√£o de seu modelo anterior (LLaMA 1), que pode ser usado para criar aplica√ß√µes para fins comerciais. Para carregar o modelo Llama 2, como aconteceu com o carregamento de PDF e Pinecode, LangChain tamb√©m nos fornece uma interface (que f√°cil!). Isto n√£o significa que devolva dois par√°grafos ou duas palavras, mas tem a ver com os textos que o modelo considera significativos para fornecer uma resposta: e um documento pode conter v√°rios par√°grafos. O que se v√™ n

#### Defini√ß√£o de ferramentas externas e integra√ß√£o com o agente  
Criamos uma ferramenta utilizando a API do Tavily para realizar buscas sobre um determinado t√≥pico.  
Essa ferramenta ser√° incorporada ao agente para permitir pesquisas contextuais.  

In [22]:
# Transforma a fun√ß√£o Tavily em uma ferramenta diretamente utiliz√°vel
from llama_index.core.tools import FunctionTool
tavily_tool_function = FunctionTool.from_defaults(
    fn=tavily_tool.search,
    name="Tavily Search",
    description=(
        "Busca artigos com Tavily sobre um determinado t√≥pico"
    )
)

In [24]:
# Cria agente com suporte √† ferramenta Tavily
agent_worker = FunctionCallingAgentWorker.from_tools(
    tools=[tavily_tool_function],
    verbose=True,
    allow_parallel_tool_calls=False,
    llm=llm
)

In [25]:
agent = AgentRunner(agent_worker)

In [26]:
# Consulta feita ao agente usando Tavily
response = agent.chat("Me retorne artigos sobre LLM e LangChain")

Added user message to memory: Me retorne artigos sobre LLM e LangChain
=== Calling Function ===
Calling function: Tavily Search with args: {"max_results": 6, "query": "LLM e LangChain"}
=== Function Output ===
[Document(id_='8c34e89a-924c-43fc-bd19-0d50e14e8d26', embedding=None, metadata={'url': 'https://www.techtarget.com/searchenterpriseai/tip/How-to-use-LangChain-for-LLM-application-development'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='[LangChain](https://www.techtarget.com/searchenterpriseai/definition/LangChain), an open source framework for building AI applications, has become a de facto standard for working with LLMs and integrating [APIs](https://www.techtarget.com/searchapparchitecture/definition/application-program-interface-API). The tool serves as a critical intermediary, enabling a targeted LLM to interface wi

In [27]:
print(response)

Os artigos sobre LLM e LangChain abordam a integra√ß√£o de modelos de linguagem grandes (LLMs) com a framework LangChain para desenvolver aplica√ß√µes de intelig√™ncia artificial (IA) mais avan√ßadas. A LangChain fornece uma estrutura para gerenciar workflows de LLMs e integr√°-los com APIs, ferramentas e utilit√°rios de software, permitindo que os desenvolvedores criem aplica√ß√µes de IA mais complexas e escal√°veis.

Os artigos destacam a import√¢ncia da LangChain para simplificar a integra√ß√£o de LLMs em aplica√ß√µes, fornecendo abstra√ß√µes para tarefas comuns como gerenciamento de prompts, execu√ß√£o de chains e gerenciamento de mem√≥ria. Al√©m disso, a combina√ß√£o da LangChain com bancos de dados de vetores permite a realiza√ß√£o de buscas sem√¢nticas eficientes, permitindo que os LLMs acessem e processem grandes quantidades de dados n√£o estruturados.

Os artigos tamb√©m discutem a diferen√ßa entre LLM Chains e LLM Agent Executors, dois conceitos fundamentais na LangChain, e c

## Indexa√ß√£o e Consulta de PDFs Locais

In [1]:
# Importa leitor de arquivos para leitura de PDFs locais
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

In [29]:
# L√™ dois arquivos PDF com conte√∫dos sobre LLM
url = "files/LLM.pdf"
artigo = SimpleDirectoryReader(input_files=[url]).load_data()

Ignoring wrong pointing object 16 0 (offset 0)
Ignoring wrong pointing object 18 0 (offset 0)
Ignoring wrong pointing object 20 0 (offset 0)
Ignoring wrong pointing object 22 0 (offset 0)
Ignoring wrong pointing object 42 0 (offset 0)
Ignoring wrong pointing object 50 0 (offset 0)
Ignoring wrong pointing object 52 0 (offset 0)
Ignoring wrong pointing object 54 0 (offset 0)
Ignoring wrong pointing object 56 0 (offset 0)
Ignoring wrong pointing object 58 0 (offset 0)
Ignoring wrong pointing object 70 0 (offset 0)
Ignoring wrong pointing object 72 0 (offset 0)
Ignoring wrong pointing object 89 0 (offset 0)
Ignoring wrong pointing object 91 0 (offset 0)
Ignoring wrong pointing object 103 0 (offset 0)
Ignoring wrong pointing object 108 0 (offset 0)
Ignoring wrong pointing object 149 0 (offset 0)
Ignoring wrong pointing object 155 0 (offset 0)
Ignoring wrong pointing object 158 0 (offset 0)
Ignoring wrong pointing object 160 0 (offset 0)
Ignoring wrong pointing object 163 0 (offset 0)
Ignori

In [31]:
url = "files/LLM_2.pdf"
tutorial = SimpleDirectoryReader(input_files=[url]).load_data()

### Gerar os Embeddings

In [32]:
# Configura modelo de embeddings para indexa√ß√£o dos textos
from llama_index.embeddings.huggingface import HuggingFaceEmbedding

In [36]:
Settings.embed_model = HuggingFaceEmbedding(
    model_name= "inTfloat/multilingual-e5-large"
)

In [37]:
# Cria √≠ndice vetorial para pesquisa sem√¢ntica dos documentos

artigo_index = VectorStoreIndex.from_documents(artigo)
tutorial_index = VectorStoreIndex.from_documents(tutorial)

In [38]:
# Persiste os √≠ndices localmente para reutiliza√ß√£o futura
artigo_index.storage_context.persist(persist_dir="artigo")
tutorial_index.storage_context.persist(persist_dir="tutorial")

### Engine de Busca

In [39]:
# Carrega os √≠ndices previamente salvos do disco
from llama_index.core import StorageContext, load_index_from_storage    

In [40]:
storage_context = StorageContext.from_defaults(
    persist_dir="artigo"
)
artigo_index = load_index_from_storage(storage_context)

storage_context = StorageContext.from_defaults(
    persist_dir="tutorial"
)
tutorial_index = load_index_from_storage(storage_context)

In [42]:
# Cria motores de consulta com suporte ao modelo de linguagem para os dois √≠ndices
artigo_engine = artigo_index.as_query_engine(similary_top_k=3, llm=llm)
tutorial_engine = tutorial_index.as_query_engine(similary_top_k=3, llm=llm)

## Cria√ß√£o de Agentes com Busca em Documentos

In [43]:
# Cria ferramentas de consulta sem√¢ntica para os documentos
from llama_index.core.tools import QueryEngineTool, ToolMetadata

In [45]:
query_engine_tools = [
    QueryEngineTool(
        query_engine=artigo_engine,
        metadata=ToolMetadata(
            name="artigo_engine",
            description=(
                "Fornece informa√ß√µe4s sobre LLM e LangChain."
                "Use uma pergunta detalhada em texto simples como entrada para a ferramenta"
            )
        )
    ),
    QueryEngineTool(
        query_engine=tutorial_engine,
        metadata=ToolMetadata(
            name="tutorial_engine",
            description=(
                "Fornece informa√ß√µe4s sobre casos de uso e aplica√ß√µes em LLMs."
                "Use uma pergunta detalhada em texto simples como entrada para a ferramenta"
            )
        )
    )
]

In [46]:
# Cria agente que pode consultar os dois motores de busca sem√¢ntica
agent_worker = FunctionCallingAgentWorker.from_tools(
    query_engine_tools,
    verbose=True,
    allow_parallel_tool_calls=True,
    llm=llm
)
agent_document = AgentRunner(agent_worker)

In [47]:
# Consulta ao agente: pergunta sobre aplica√ß√µes de LLMs e LangChain
response = agent_document.chat(
    "Quais as principais aplica√ß√µes posso construir com LLMs e LangChain?"
)

Added user message to memory: Quais as principais aplica√ß√µes posso construir com LLMs e LangChain?
=== Calling Function ===
Calling function: artigo_engine with args: {"input": "Quais as principais aplica\u00e7\u00f5es posso construir com LLMs e LangChain?"}
=== Function Output ===
Com LLMs, voc√™ pode desenvolver aplicativos prontos para produ√ß√£o, como modelos de linguagem personalizados para atender √†s necessidades espec√≠ficas do seu dom√≠nio. Al√©m disso, voc√™ pode ajustar os modelos de c√≥digo aberto para melhorar o desempenho em seu dom√≠nio espec√≠fico. Isso inclui a capacidade de treinar os modelos com seus dados espec√≠ficos, permitindo uma maior precis√£o e controle sobre os resultados. Com a combina√ß√£o de LLMs e ferramentas como a Databricks, voc√™ pode criar solu√ß√µes personalizadas para suas necessidades, desde a cria√ß√£o de modelos de linguagem at√© a implementa√ß√£o de solu√ß√µes de dados.
=== Calling Function ===
Calling function: tutorial_engine with args: {"

In [48]:
response = agent_document.chat(
    "Quais as principais tend√™ncias em LangChain e LLM?"
)

Added user message to memory: Quais as principais tend√™ncias em LangChain e LLM?
=== Calling Function ===
Calling function: artigo_engine with args: {"input": "Quais as principais tend\u00eancias em LangChain e LLM?"}
=== Function Output ===
N√£o h√° informa√ß√µes sobre tend√™ncias em LangChain e LLM. No entanto, para come√ßar a usar LLMs, existem algumas op√ß√µes dispon√≠veis, como assistir a apresenta√ß√µes sob demanda, participar de cursos sobre LLMs ou explorar exemplos de c√≥digo para desenvolver aplicativos prontos para produ√ß√£o com LLMs.
=== Calling Function ===
Calling function: tutorial_engine with args: {"input": "Quais as principais tend\u00eancias em LangChain e LLM?"}
=== Function Output ===
As principais tend√™ncias em LangChain e LLM incluem a prolifera√ß√£o de LLMs de c√≥digo aberto, que democratizou o acesso √† tecnologia de ponta de processamento de linguagem, permitindo que pesquisadores, desenvolvedores e amadores experimentassem, personalizassem e implantassem s

## Uso de Agente do Tipo ReAct

In [49]:
# Utiliza√ß√£o de outro tipo de agente: ReActAgent, que combina racioc√≠nio com a√ß√£o
from llama_index.core.agent import ReActAgent 

In [50]:
agent = ReActAgent.from_tools(
    query_engine_tools,
    verbose=True,
    llm=llm
)

In [51]:
# Pergunta feita ao agente com racioc√≠nio + ferramenta
response = agent.chat(
    "Quais as principais ferramentas usadas em LAngChain?"
)

> Running step d4cc8851-0099-47c0-8dd2-1a880635fed8. Step input: Quais as principais ferramentas usadas em LAngChain?
[1;3;38;5;200mThought: The current language of the user is: Portuguese. I need to use a tool to help me answer the question.
Action: artigo_engine
Action Input: {'input': 'Quais as principais ferramentas usadas em LangChain?'}
[0m[1;3;34mObservation: N√£o h√° men√ß√£o √†s ferramentas usadas em LangChain no texto fornecido. O texto discute grandes modelos de linguagem (LLM), servi√ßos propriet√°rios como o ChatGPT e modelos de c√≥digo aberto, mas n√£o menciona LangChain ou suas ferramentas.
[0m> Running step aa623f1b-2b32-4852-8e25-ab4b6e3fbf16. Step input: None
[1;3;38;5;200mThought: A ferramenta artigo_engine n√£o forneceu informa√ß√µes suficientes sobre as principais ferramentas usadas em LangChain. Vou tentar novamente com a ferramenta tutorial_engine.
Action: tutorial_engine
Action Input: {'input': 'Quais as principais ferramentas usadas em LangChain?'}
[0m[1

In [52]:
response = agent.chat(
    "Quais as principais tend√™ncias em LAngChain que eu deveria estudar?"
)

> Running step a0c4c1e6-6b3a-4252-b55a-866e30553cff. Step input: Quais as principais tend√™ncias em LAngChain que eu deveria estudar?
[1;3;38;5;200mThought: O usu√°rio est√° procurando por tend√™ncias em LangChain. Eu posso usar o artigo_engine para obter informa√ß√µes sobre as principais tend√™ncias em LangChain.
Action: artigo_engine
Action Input: {'input': 'principais tend√™ncias em LangChain'}
[0m[1;3;34mObservation: N√£o h√° men√ß√£o espec√≠fica √†s principais tend√™ncias em LangChain no texto fornecido. O texto discute os grandes modelos de linguagem (LLM), a import√¢ncia de ter controle sobre os dados e a capacidade de ajustar modelos de c√≥digo aberto para melhorar o desempenho em dom√≠nios espec√≠ficos, mas n√£o aborda o t√≥pico de LangChain.
[0m> Running step dc43290c-1f27-4c96-b92c-032b5fcb1e51. Step input: None
[1;3;38;5;200mThought: O artigo_engine n√£o forneceu informa√ß√µes sobre as principais tend√™ncias em LangChain. Vou tentar usar o tutorial_engine para obter in