In [1]:
from llama_index.core import Settings
from llama_index.llms.groq import Groq

In [18]:
import os
from dotenv import load_dotenv

load_dotenv()

llm = Groq(
    model="llama-3.3-70b-versatile",
    api_key=os.environ.get("GROQ_API_KEY")    
)

### Setting tools

In [10]:
from llama_index.core.tools import FunctionTool
from llama_index.core.agent import FunctionCallingAgentWorker, AgentRunner

In [None]:
import arxiv # arxiv.org (archive of articles)

def article_search(title: str):
    search = arxiv.Search(
        query=title,
        max_results=5,
        sort_by=arxiv.SortCriterion.Relevance
    )

    results = [
        f"Title: {article.title}\n"
        f"Category: {article.primary_category}\n"
        f"Link: {article.entry_id}\n"
        for article in search.results()
    ]

    return f"\n\n".join(results)

In [5]:
article_search_tool = FunctionTool.from_defaults(fn=article_search)

In [8]:
agent_worker = FunctionCallingAgentWorker.from_tools(
    tools=[article_search_tool],
    verbose=True,
    allow_parallel_tool_calls=False,
    llm=llm
)

In [None]:
agent = AgentRunner(agent_worker)

response = agent.chat(
    "Me retorne artigos sobre langchain na educação"
)

### With Tavily

In [20]:
from llama_index.tools.tavily_research import TavilyToolSpec

tavily_tool = TavilyToolSpec(
    api_key=os.environ.get("TAVILY_API_KEY")
)

In [21]:
tavily_tool_list = tavily_tool.to_tool_list()

for tool in tavily_tool_list:
    print(tool.metadata.name)

search


In [22]:
tavily_tool.search("Me retorne artigos cientificos sobre LangChain", max_results=3)

[Document(id_='d7a8999c-e23b-41d8-bbd7-e1c50a6fb00a', embedding=None, metadata={'url': 'https://medium.com/fretebras-tech/langchain-construindo-um-chatpdf-com-rag-retrieval-augmented-generation-openai-e-streamlit-61125e2122de'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='Por conta desses acontecimentos, fiquei por um tempo afastado dos meus estudos. Mas por meio desse artigo compartilho meu retorno e comprometimento com os estudos, que sempre gosto de compartilhar por aqui, por meio de artigos, um pouco sobre eles.\n\nObrigado pela sua atenção! E até breve 😄\n\n--\n\n--\n\n1\n\nPublished in Fretebras Tech [...] LangChain é uma biblioteca open-source que tem como objetivo facilitar a criação de aplicações utilizando LLMs, ou seja, modelos de linguagem.\n\nDessa forma, o LangChain disponibiliza diversos tipos de componentes e fu

In [23]:
tavily_tool_function = FunctionTool.from_defaults(
    fn=tavily_tool.search,
    name="Tavily search",
    description="Busca artigos com Tavily sobre um determinado tópico"
)

In [26]:
agent_worker = FunctionCallingAgentWorker.from_tools(
    tools=[tavily_tool_function],
    verbose=True,
    allow_parallel_tool_calls=False,
    llm=llm
)

In [27]:
agent = AgentRunner(agent_worker)

agent.chat("Me retorne artigos sobre LLM e LangChain")

Added user message to memory: Me retorne artigos sobre LLM e LangChain
=== Calling Function ===
Calling function: Tavily search with args: {"query": "LLM e LangChain", "max_results": 10}
=== Function Output ===
[Document(id_='d6efca82-107d-47ac-95a7-511a7f467aee', embedding=None, metadata={'url': 'https://python.langchain.com/v0.1/docs/modules/model_io/llms/'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='On this page\nLLMs\nLarge Language Models (LLMs) are a core component of LangChain. LangChain does not serve its own LLMs, but rather provides a standard interface for interacting with many different LLMs. To be specific, this interface is one that takes as input a string and returns a string.\nThere are lots of LLM providers (OpenAI, Cohere, Hugging Face, etc) - the LLM class is designed to provide a standard interface for all

AgentChatResponse(response='Aqui estão alguns artigos sobre LLM e LangChain:\n\n1. "LLMs" da documentação do LangChain: https://python.langchain.com/v0.1/docs/modules/model_io/llms/\n2. "LLM Chain" da documentação do LangChain: https://js.langchain.com/v0.1/docs/modules/chains/foundational/llm_chain/\n3. "Designing LLM Applications with Knowledge Graphs and LangChain" do blog da Stardog: https://www.stardog.com/blog/designing-llm-applications-with-knowledge-graphs-and-langchain/\n4. "LangChain" do site oficial do LangChain: https://www.langchain.com/\n5. "LLM Project | End to End Gen AI Project Using LangChain, Google Palm In Ed-Tech Industry" do YouTube: https://www.youtube.com/watch?v=AjQPRomyd-k\n6. "LangChain for LLM" do Reddit: https://www.reddit.com/r/LangChain/comments/1al25wz/langchain_for_llm/\n7. "LLMChain" da documentação do LangChain: https://python.langchain.com/api_reference/langchain/chains/langchain.chains.llm.LLMChain.html\n\nEsses artigos fornecem informações sobre co

In [28]:
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

In [31]:
url = "../../data/LLM.pdf"
article = SimpleDirectoryReader(input_files=[url]).load_data()

Ignoring wrong pointing object 16 0 (offset 0)
Ignoring wrong pointing object 18 0 (offset 0)
Ignoring wrong pointing object 20 0 (offset 0)
Ignoring wrong pointing object 22 0 (offset 0)
Ignoring wrong pointing object 42 0 (offset 0)
Ignoring wrong pointing object 50 0 (offset 0)
Ignoring wrong pointing object 52 0 (offset 0)
Ignoring wrong pointing object 54 0 (offset 0)
Ignoring wrong pointing object 56 0 (offset 0)
Ignoring wrong pointing object 58 0 (offset 0)
Ignoring wrong pointing object 70 0 (offset 0)
Ignoring wrong pointing object 72 0 (offset 0)
Ignoring wrong pointing object 89 0 (offset 0)
Ignoring wrong pointing object 91 0 (offset 0)
Ignoring wrong pointing object 103 0 (offset 0)
Ignoring wrong pointing object 108 0 (offset 0)
Ignoring wrong pointing object 149 0 (offset 0)
Ignoring wrong pointing object 155 0 (offset 0)
Ignoring wrong pointing object 158 0 (offset 0)
Ignoring wrong pointing object 160 0 (offset 0)
Ignoring wrong pointing object 163 0 (offset 0)
Ignori

In [32]:
url = "../../data/LLM_2.pdf"
tutorial = SimpleDirectoryReader(input_files=[url]).load_data()

### Generate Embeddings

In [33]:
from llama_index.embeddings.huggingface import HuggingFaceEmbedding

In [34]:
Settings.embed_model = HuggingFaceEmbedding(
    model_name="intfloat/multilingual-e5-large"
)

modules.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/160k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/57.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/690 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/418 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/280 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/201 [00:00<?, ?B/s]

In [35]:
article_index = VectorStoreIndex.from_documents(article)
tutorial_index = VectorStoreIndex.from_documents(tutorial)

In [None]:
article_index.storage_context.persist(persist_dir="embedding/article")
tutorial_index.storage_context.persist(persist_dir="embedding/tutorial")

### Search Engine

In [41]:
from llama_index.core import StorageContext, load_index_from_storage
from llama_index.core.tools import QueryEngineTool,ToolMetadata

In [39]:
article_storage_context = StorageContext.from_defaults(
    persist_dir="embedding/article"
)

article_index = load_index_from_storage(article_storage_context)

tutorial_storage_context = StorageContext.from_defaults(
    persist_dir="embedding/tutorial"
)

tutorial_index = load_index_from_storage(tutorial_storage_context)


In [40]:
article_engine = article_index.as_query_engine(similarity_top_k=3, llm=llm)
tutorial_engine = tutorial_index.as_query_engine(similarity_top_k=3, llm=llm)

In [55]:
query_engine_tools = [
    QueryEngineTool(
        query_engine=article_engine,
        metadata=ToolMetadata(
            name="article_engine",
            description=(
                "Fornece informações sobre LLM e LangChain"
                "Use uma pergunta detalhada em texto simples como entrada para a ferramenta"
            )
        )
    ),
    QueryEngineTool(
        query_engine=tutorial_engine,
        metadata=ToolMetadata(
            name="tutorial_engine",
            description=(
                "Fornece informações sobre casos de uso e aplicações em LLMs"
                "Use uma pergunta detalhada em texto simples como entrada para a ferramenta"
            )
        )
    )
]

In [56]:
agent_worker = FunctionCallingAgentWorker.from_tools(
    query_engine_tools,
    verbose=True,
    allow_parallel_tool_calls=True,
    llm=llm
)

agent_document = AgentRunner(agent_worker)

In [57]:
response = agent_document.chat(
    "Quais as principais aplicações que posso construir com LLM e LangChain?"
)

Added user message to memory: Quais as principais aplicações que posso construir com LLM e LangChain?
=== Calling Function ===
Calling function: tutorial_engine with args: {"input": "Quais as principais aplica\u00e7\u00f5es que posso construir com LLM e LangChain?"}
=== Function Output ===
As principais aplicações que você pode construir com LLM (Large Language Models) e LangChain incluem:

1. **Criação e aprimoramento de conteúdo**: Geração automática de texto, assistência na redação, tradução automática, resumo de textos, planejamento e roteiro de conteúdo, brainstorming e programação.
2. **Análise e organização de informações**: Análise de sentimento, extração de informações, classificação de textos, revisão técnica e outras aplicações de processamento de linguagem natural.
3. **Interação e automação**: Chatbots, perguntas e respostas, geração de respostas a perguntas com base em um corpus, e outras aplicações de interação com usuários.
4. **Desenvolvimento de software**: Uso de LLM

### Agent ReAct

In [58]:
from llama_index.core.agent import ReActAgent

In [59]:
agent = ReActAgent.from_tools(
    query_engine_tools,
    verbose=True,
    llm=llm
)

In [60]:
agent.chat("Quais são as principais ferramentas usadas em LangChain?")

> Running step 12d49f0a-c40d-41b2-824f-fc450374a2ac. Step input: Quais são as principais ferramentas usadas em LangChain?
[1;3;38;5;200mThought: O usuário está perguntando sobre as principais ferramentas usadas em LangChain. Eu preciso usar a ferramenta article_engine para obter informações sobre as ferramentas usadas em LangChain.
Action: article_engine
Action Input: {'input': 'Quais são as principais ferramentas usadas em LangChain?'}
[0m[1;3;34mObservation: Não há menção às principais ferramentas usadas em LangChain no contexto fornecido. O contexto discute o desenvolvimento e a aplicação de grandes modelos de linguagem (LLM), incluindo serviços proprietários e modelos de código aberto, mas não fornece informações sobre LangChain ou suas ferramentas.
[0m> Running step ef32f74f-9567-4ee5-ad6a-e7043b63f5a3. Step input: None
[1;3;38;5;200mThought: A ferramenta article_engine não forneceu informações suficientes sobre as principais ferramentas usadas em LangChain. Eu preciso tentar

AgentChatResponse(response='Infelizmente, não consegui encontrar informações sobre as principais ferramentas usadas em LangChain com as ferramentas disponíveis. Se você tiver mais contexto ou detalhes, posso tentar ajudar novamente.', sources=[ToolOutput(content='Não há menção às principais ferramentas usadas em LangChain no contexto fornecido. O contexto discute o desenvolvimento e a aplicação de grandes modelos de linguagem (LLM), incluindo serviços proprietários e modelos de código aberto, mas não fornece informações sobre LangChain ou suas ferramentas.', tool_name='article_engine', raw_input={'input': 'Quais são as principais ferramentas usadas em LangChain?'}, raw_output=Response(response='Não há menção às principais ferramentas usadas em LangChain no contexto fornecido. O contexto discute o desenvolvimento e a aplicação de grandes modelos de linguagem (LLM), incluindo serviços proprietários e modelos de código aberto, mas não fornece informações sobre LangChain ou suas ferramenta

In [None]:
agent.chat("Quais as principais tendencias em LangChain que eu deveria estudar?")

> Running step 8b9057b8-8345-4947-b124-4bd447c467b2. Step input: Quais as principais tendencias em LangChain que eu deveria estudar?
