### install libraries
```bash
pip install -U \
    openai \
    langchain \
    langchain_openai \
    langchain-community \
    python-dotenv \
    datasets \
    qdrant-client \
    tiktoken
```

In [42]:
import os
from dotenv import load_dotenv
from dotenv import dotenv_values
from langchain_openai import ChatOpenAI
load_dotenv('../.env')
config = dotenv_values("../.env")

In [35]:
chat = ChatOpenAI(
    model='gpt-4o-mini',
)

In [36]:
from langchain.schema import (
    SystemMessage,
    HumanMessage,
    AIMessage
)

messages = [
    SystemMessage(content="Você é um assistente útil que responde perguntas."),
    HumanMessage(content="Olá Bot, como você está hoje?"),
    AIMessage(content="Estou bem, obrigado. Como posso ajudar?"),
    HumanMessage(content="Gostaria de entender o que é machine learning.")
]

In [37]:
res = chat.invoke(messages)
res

RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}

In [5]:
print(res.content)

Machine learning é um subcampo da inteligência artificial que se concentra no desenvolvimento de algoritmos e técnicas que permitem que os computadores aprendam a partir de dados e façam previsões ou tomem decisões sem serem explicitamente programados para isso. Em essência, o objetivo do machine learning é permitir que os computadores aprendam automaticamente e melhorem seu desempenho ao longo do tempo, com base na experiência adquirida através dos dados. Isso é feito através do treinamento de modelos de machine learning com conjuntos de dados e algoritmos apropriados, para que possam aprender padrões e fazer previsões ou tomar decisões com base nesses padrões.


In [6]:
messages.append(res)

In [7]:
messages

[SystemMessage(content='Você é um assistente útil que responde perguntas.'),
 HumanMessage(content='Olá Bot, como você está hoje?'),
 AIMessage(content='Estou bem, obrigado. Como posso ajudar?'),
 HumanMessage(content='Gostaria de entender o que é machine learning.'),
 AIMessage(content='Machine learning é um subcampo da inteligência artificial que se concentra no desenvolvimento de algoritmos e técnicas que permitem que os computadores aprendam a partir de dados e façam previsões ou tomem decisões sem serem explicitamente programados para isso. Em essência, o objetivo do machine learning é permitir que os computadores aprendam automaticamente e melhorem seu desempenho ao longo do tempo, com base na experiência adquirida através dos dados. Isso é feito através do treinamento de modelos de machine learning com conjuntos de dados e algoritmos apropriados, para que possam aprender padrões e fazer previsões ou tomar decisões com base nesses padrões.', response_metadata={'token_usage': {'co

In [49]:
prompt = HumanMessage(
    content="Qual é a diferença entre supervisionado e não supervisionado?"
)
messages.append(prompt)

In [50]:
res = chat.invoke(messages)
print(res.content)

AuthenticationError: Error code: 401 - {'error': {'message': 'Invalid API Key', 'type': 'invalid_request_error', 'code': 'invalid_api_key'}}

## Hallucination

In [10]:
# add latest response to messages
messages.append(res)

# create a new user prompt
prompt = HumanMessage(
    content="O que tem de tão especial no Mistral 7B?"
)
# append to messages
messages.append(prompt)

# send to GPT
res = chat.invoke(messages)

In [11]:
print(res.content)

O Mistral 7B é uma linha de vinhos produzida pela vinícola chilena Viña Montes. Essa linha é conhecida por sua qualidade e sabor distintivo, resultante da combinação de uvas cuidadosamente selecionadas e técnicas de vinificação sofisticadas. O Mistral 7B destaca-se por sua riqueza de aromas e sabores, resultando em vinhos complexos e elegantes. Além disso, a Viña Montes é uma vinícola premiada, reconhecida internacionalmente pela excelência de seus vinhos, o que contribui para a reputação especial do Mistral 7B. Se você é um apreciador de vinhos, vale a pena experimentar o Mistral 7B para descobrir por si mesmo o que o torna tão especial.


In [12]:
# add latest response to messages
messages.append(res)

# create a new user prompt
prompt = HumanMessage(
    content="Você pode me falar sobre o LLMChain no LangChain?"
)
# append to messages
messages.append(prompt)

# send to GPT
res = chat.invoke(messages)

In [13]:
print(res.content)

Peço desculpas, mas não possuo informações específicas sobre o "LLMChain" no "LangChain". Se você puder fornecer mais detalhes ou contexto sobre o que você gostaria de saber, ficarei feliz em tentar ajudar da melhor forma possível.


### Context injection

In [51]:
llmchain_information = [
    "A LLMChain is the most common type of chain. It consists of a PromptTemplate, a model (either an LLM or a ChatModel), and an optional output parser. This chain takes multiple input variables, uses the PromptTemplate to format them into a prompt. It then passes that to the model. Finally, it uses the OutputParser (if provided) to parse the output of the LLM into a final format.",
    "Chains is an incredibly generic concept which returns to a sequence of modular components (or other chains) combined in a particular way to accomplish a common use case.",
    "LangChain is a framework for developing applications powered by language models. We believe that the most powerful and differentiated applications will not only call out to a language model via an api, but will also: (1) Be data-aware: connect a language model to other sources of data, (2) Be agentic: Allow a language model to interact with its environment. As such, the LangChain framework is designed with the objective in mind to enable those types of applications."
]

source_knowledge = "\n".join(llmchain_information)

In [47]:
query = "Você pode me falar sobre o LLMChain no LangChain?"

augmented_prompt = f"""Use o contexto abaixo para responder à pergunta.

Contexto:
{source_knowledge}

Pergunta: {query}"""

In [48]:
prompt = HumanMessage(
    content=augmented_prompt
)

messages.append(prompt)

res = chat.invoke(messages)
print(res.content)

AuthenticationError: Error code: 401 - {'error': {'message': 'Invalid API Key', 'type': 'invalid_request_error', 'code': 'invalid_api_key'}}

### Embeddings

In [52]:
from langchain_openai import OpenAIEmbeddings
embed_model = OpenAIEmbeddings(model="text-embedding-3-small")

In [53]:
texts = [
    'this is one chunk',
    'this is the second chunk of text'
]

res = embed_model.embed_documents(texts)
len(res), len(res[0])

RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}

### RAG

In [19]:
from datasets import load_dataset
dataset = load_dataset("infoslack/mistral-7b-arxiv-paper-chunked", split="train")
dataset

Dataset({
    features: ['doi', 'chunk-id', 'chunk', 'id', 'title', 'summary', 'source', 'authors', 'categories', 'comment', 'journal_ref', 'primary_category', 'published', 'updated', 'references'],
    num_rows: 25
})

In [20]:
dataset[0]

{'doi': '2310.06825',
 'chunk-id': '0',
 'chunk': 'Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford,\nDevendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel,\nGuillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux,\nPierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix,\nWilliam El Sayed\nAbstract\nWe introduce Mistral 7B, a 7–billion-parameter language model engineered for\nsuperior performance and efficiency. Mistral 7B outperforms the best open 13B\nmodel (Llama 2) across all evaluated benchmarks, and the best released 34B\nmodel (Llama 1) in reasoning, mathematics, and code generation. Our model\nleverages grouped-query attention (GQA) for faster inference, coupled with sliding\nwindow attention (SWA) to effectively handle sequences of arbitrary length with a\nreduced inference cost. We also provide a model fine-tuned to follow instructions,\nMistral 7B – Instruct, that surpasses Llama 2

In [21]:
data = dataset.to_pandas()
data.head()

Unnamed: 0,doi,chunk-id,chunk,id,title,summary,source,authors,categories,comment,journal_ref,primary_category,published,updated,references
0,2310.06825,0,"Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayr...",2310.06825,Mistral 7B,"We introduce Mistral 7B v0.1, a 7-billion-para...",http://arxiv.org/pdf/2310.06825,"[Albert Q. Jiang, Alexandre Sablayrolles, Arth...","[cs.CL, cs.AI, cs.LG]",Models and code are available at\n https://mi...,,cs.CL,20231010,20231010,"[{'id': '1808.07036'}, {'id': '1809.02789'}, {..."
1,2310.06825,1,automated benchmarks. Our models are released ...,2310.06825,Mistral 7B,"We introduce Mistral 7B v0.1, a 7-billion-para...",http://arxiv.org/pdf/2310.06825,"[Albert Q. Jiang, Alexandre Sablayrolles, Arth...","[cs.CL, cs.AI, cs.LG]",Models and code are available at\n https://mi...,,cs.CL,20231010,20231010,"[{'id': '1808.07036'}, {'id': '1809.02789'}, {..."
2,2310.06825,2,GQA significantly accelerates the inference sp...,2310.06825,Mistral 7B,"We introduce Mistral 7B v0.1, a 7-billion-para...",http://arxiv.org/pdf/2310.06825,"[Albert Q. Jiang, Alexandre Sablayrolles, Arth...","[cs.CL, cs.AI, cs.LG]",Models and code are available at\n https://mi...,,cs.CL,20231010,20231010,"[{'id': '1808.07036'}, {'id': '1809.02789'}, {..."
3,2310.06825,3,Mistral 7B takes a significant step in balanci...,2310.06825,Mistral 7B,"We introduce Mistral 7B v0.1, a 7-billion-para...",http://arxiv.org/pdf/2310.06825,"[Albert Q. Jiang, Alexandre Sablayrolles, Arth...","[cs.CL, cs.AI, cs.LG]",Models and code are available at\n https://mi...,,cs.CL,20231010,20231010,"[{'id': '1808.07036'}, {'id': '1809.02789'}, {..."
4,2310.06825,4,parameters of the architecture are summarized ...,2310.06825,Mistral 7B,"We introduce Mistral 7B v0.1, a 7-billion-para...",http://arxiv.org/pdf/2310.06825,"[Albert Q. Jiang, Alexandre Sablayrolles, Arth...","[cs.CL, cs.AI, cs.LG]",Models and code are available at\n https://mi...,,cs.CL,20231010,20231010,"[{'id': '1808.07036'}, {'id': '1809.02789'}, {..."


In [22]:
docs = data[['chunk', 'source']]
docs.head()

Unnamed: 0,chunk,source
0,"Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayr...",http://arxiv.org/pdf/2310.06825
1,automated benchmarks. Our models are released ...,http://arxiv.org/pdf/2310.06825
2,GQA significantly accelerates the inference sp...,http://arxiv.org/pdf/2310.06825
3,Mistral 7B takes a significant step in balanci...,http://arxiv.org/pdf/2310.06825
4,parameters of the architecture are summarized ...,http://arxiv.org/pdf/2310.06825


In [23]:
from langchain_community.document_loaders import DataFrameLoader

loader = DataFrameLoader(docs, page_content_column="chunk")
documents = loader.load()

In [24]:
documents[0]

Document(metadata={'source': 'http://arxiv.org/pdf/2310.06825'}, page_content='Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford,\nDevendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel,\nGuillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux,\nPierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix,\nWilliam El Sayed\nAbstract\nWe introduce Mistral 7B, a 7–billion-parameter language model engineered for\nsuperior performance and efficiency. Mistral 7B outperforms the best open 13B\nmodel (Llama 2) across all evaluated benchmarks, and the best released 34B\nmodel (Llama 1) in reasoning, mathematics, and code generation. Our model\nleverages grouped-query attention (GQA) for faster inference, coupled with sliding\nwindow attention (SWA) to effectively handle sequences of arbitrary length with a\nreduced inference cost. We also provide a model fine-tuned to follow instructions,\nMistral 7B – Inst

In [25]:
documents[0].page_content

'Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford,\nDevendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel,\nGuillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux,\nPierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix,\nWilliam El Sayed\nAbstract\nWe introduce Mistral 7B, a 7–billion-parameter language model engineered for\nsuperior performance and efficiency. Mistral 7B outperforms the best open 13B\nmodel (Llama 2) across all evaluated benchmarks, and the best released 34B\nmodel (Llama 1) in reasoning, mathematics, and code generation. Our model\nleverages grouped-query attention (GQA) for faster inference, coupled with sliding\nwindow attention (SWA) to effectively handle sequences of arbitrary length with a\nreduced inference cost. We also provide a model fine-tuned to follow instructions,\nMistral 7B – Instruct, that surpasses Llama 2 13B – chat model both on human and\nautomated ben

In [26]:
documents[0].metadata

{'source': 'http://arxiv.org/pdf/2310.06825'}

In [27]:
from langchain_community.vectorstores import Qdrant
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

qdrant = Qdrant.from_documents(
    documents=documents,
    embedding=embeddings,
    location=":memory:",
    collection_name="chatbot"
)

In [28]:
query = "O que tem de tão especial no Mistral 7B?"
qdrant.similarity_search(query, k=3)

[Document(metadata={'source': 'http://arxiv.org/pdf/2310.06825', '_id': 'c79e41f564c44208871be12ce47fad5a', '_collection_name': 'chatbot'}, page_content='Mistral 7B\nAlbert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford,\nDevendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel,\nGuillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux,\nPierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix,\nWilliam El Sayed\nAbstract\nWe introduce Mistral 7B, a 7–billion-parameter language model engineered for\nsuperior performance and efficiency. Mistral 7B outperforms the best open 13B\nmodel (Llama 2) across all evaluated benchmarks, and the best released 34B\nmodel (Llama 1) in reasoning, mathematics, and code generation. Our model\nleverages grouped-query attention (GQA) for faster inference, coupled with sliding\nwindow attention (SWA) to effectively handle sequences of arbitrary length with a\nreduced inference cost. We

In [29]:
def custom_prompt(query: str):
    results = qdrant.similarity_search(query, k=3)
    source_knowledge = "\n".join([x.page_content for x in results])
    augment_prompt = f"""Use o contexto abaixo para responder à pergunta.

    Contexto:
    {source_knowledge}

    Pergunta: {query}"""
    return augment_prompt

In [30]:
print(custom_prompt(query))

Use o contexto abaixo para responder à pergunta.

    Contexto:
    Mistral 7B
Albert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford,
Devendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel,
Guillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux,
Pierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix,
William El Sayed
Abstract
We introduce Mistral 7B, a 7–billion-parameter language model engineered for
superior performance and efficiency. Mistral 7B outperforms the best open 13B
model (Llama 2) across all evaluated benchmarks, and the best released 34B
model (Llama 1) in reasoning, mathematics, and code generation. Our model
leverages grouped-query attention (GQA) for faster inference, coupled with sliding
window attention (SWA) to effectively handle sequences of arbitrary length with a
reduced inference cost. We also provide a model fine-tuned to follow instructions,
Mistral 7B – Instruct, that surpasses Llam

In [31]:
prompt = HumanMessage(
    content=custom_prompt(query)
)

messages.append(prompt)

res = chat.invoke(messages)

print(res.content)

O Mistral 7B é um modelo de linguagem com 7 bilhões de parâmetros projetado para oferecer desempenho superior e eficiência. Ele se destaca por superar o melhor modelo aberto de 13 bilhões de parâmetros (Llama 2) em todos os benchmarks avaliados, bem como o melhor modelo lançado de 34 bilhões de parâmetros (Llama 1) em raciocínio, matemática e geração de código. O Mistral 7B utiliza atenção de consulta agrupada (GQA) para acelerar a inferência, em conjunto com atenção de janela deslizante (SWA) para lidar efetivamente com sequências de comprimento arbitrário com um custo de inferência reduzido. Além disso, o modelo inclui uma versão fina-tunada para seguir instruções, chamada Mistral 7B - Instruct, que supera o modelo de chat Llama 2 de 13 bilhões de parâmetros em benchmarks humanos e automatizados. O Mistral 7B é lançado sob a licença Apache 2.0 e disponibiliza implementações de referência para facilitar a implantação local ou em plataformas de nuvem como AWS, GCP ou Azure. O modelo é 

## Groq

```bash
pip install langchain-groq
```

In [39]:
%pip install langchain-groq

Collecting langchain-groq
  Downloading langchain_groq-0.2.2-py3-none-any.whl.metadata (3.0 kB)
Collecting groq<1,>=0.4.1 (from langchain-groq)
  Downloading groq-0.13.1-py3-none-any.whl.metadata (14 kB)
Downloading langchain_groq-0.2.2-py3-none-any.whl (14 kB)
Downloading groq-0.13.1-py3-none-any.whl (109 kB)
Installing collected packages: groq, langchain-groq
Successfully installed groq-0.13.1 langchain-groq-0.2.2
Note: you may need to restart the kernel to use updated packages.


In [44]:

from langchain_groq import ChatGroq

chat = ChatGroq(temperature=0, model_name="llama-3.1-70b-versatile")

In [45]:
prompt = HumanMessage(
    content=custom_prompt(query)
)

messages.append(prompt)
res = chat.invoke(messages)
print(res.content)

NameError: name 'custom_prompt' is not defined