<a href="https://colab.research.google.com/github/gabrielblins/palestra_gdg/blob/main/notebooks/GoogleExtended_MaritacaLangChain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Integração Maritaca - Langchain

Temos um LLM para chamar de nosso! Os desenvolvedores da https://www.maritaca.ai estão de parabéns pelo excelente trabalho desenvolvido.

O objetivo deste notebook é demonstrar como integrar o LLM ao Langchain considerando as chamadas a API que estão disponíveis no momento, que é a inferência apenas, não há possibilidade de obter os embeddings, mas acho que é uma questão de tempo até o time disponibilizar essa funcionalidade.

Vamos ao que interessa.

### Software base
Vamos instalar o langchain e algumas outras coisas

In [1]:
!pip install -U -q langchain unstructured pinecone-client openai tiktoken python-dotenv faiss-cpu

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.3 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m49.8 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.4/1.4 MB[0m [31m61.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m179.1/179.1 kB[0m [31m19.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m73.6/73.6 kB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m67.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m17.6/17.6 MB[0m [31m82.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m90.0/90.0 kB[0m [31m10.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

### Passo 1 - Criar um custom LLM

Para mais informações sobre como o Langchain funciona, sugiro ler a documentação do produto. Aqui vamos focar na integração com o Maritaca.

De todo o modo, o primeiro passo é criar uma extensão da classe LLM e assim entregar ao ambiente do langchain um objeto que "sabe" fazer chamadas ao Maritaca. Segundo a documentação, é preciso implementar o método _call que recebe uma string, executa a chamada ao LLM e retorna outra string como saída.

Já que o nome do modelo é MariTalk, vamos usar esse nome para nossa classe especial.

In [2]:
from dotenv import load_dotenv

load_dotenv()

True

In [3]:
from typing import Any, List, Mapping, Optional

from langchain.callbacks.manager import CallbackManagerForLLMRun
from requests.adapters import HTTPAdapter, Retry
from langchain.llms.base import LLM

import requests

class MaritalkLLM(LLM):

  @property
  def _llm_type(self) -> str:
    return "custom"

  def _call(
    self,
    prompt: str,
    stop: Optional[List[str]] = None,
    run_manager: Optional[CallbackManagerForLLMRun] = None,
  ) -> str:
    session = self.retry_request_session()
    payload = {
        "messages": [
          {
            "role": "human",
            "content": prompt
          }
      ],
      "model": 'Maritalk',
      "do_sample": True,
      "max_tokens": 2048,
      "temperature": 0.5,
      "top_p": 0.95,
      "repetition_penalty": 1,
      "use_chat_template": True,
      "stopping_tokens": ['string']
    }
    res = session.post('https://chat.maritaca.ai/api/chat/inference',
                       json=payload)

    if res.status_code == 200:
      return res.json()['answer']
    else:
      print(f'oops... status code {res.status_code}')
      return ''

  def retry_request_session(self, retries: Optional[int] = 3):
    # we setup retry strategy to retry on common errors
    retries = Retry(
        total=retries,
        backoff_factor=0.1,
        status_forcelist=[
            408,  # request timeout
            429,  # too many requests
            500,  # internal server error
            502,  # bad gateway
            503,  # service unavailable
            504   # gateway timeout
        ]
    )
    # we setup a session with the retry strategy
    session = requests.Session()
    session.mount('https://', HTTPAdapter(max_retries=retries))
    return session

  @property
  def _identifying_params(self) -> Mapping[str, Any]:
    """Get the identifying parameters."""
    return {"n": 1}

### Explicação

A classe acima extende LLM da Langchain para que possamos implementar nossa lógica.

O método retry_request_session é um helper que vai resolver pequenos problemas de comunicação que podem acontecer e retomar a chamada fazendo 3 tentativas.

Em _call realizamos a chamada a API passando o prompt e os demais parâmetros.

A seguir, o teste!

In [4]:
llm = MaritalkLLM()

In [5]:
llm('Me explique como funciona o SUS')

'O SUS (Sistema Único de Saúde) é um sistema de saúde pública no Brasil que tem como objetivo garantir o acesso universal e igualitário à saúde para todos os brasileiros. Ele é financiado por recursos do governo federal, estadual e municipal, além de contribuições da população por meio de impostos.\n\nO SUS é composto por uma rede de serviços de saúde que inclui hospitais, postos de saúde, clínicas, laboratórios, entre outros. Ele é organizado em três níveis de atenção à saúde: a atenção básica, a atenção de média complexidade e a atenção de alta complexidade.\n\nA atenção básica é o primeiro contato da população com o sistema de saúde e é responsável por atender as necessidades de saúde mais comuns, como consultas médicas, exames preventivos e tratamento de doenças crônicas. Ela é realizada em postos de saúde e clínicas da família e é coordenada por equipes de saúde da família.\n\nA atenção de média complexidade é responsável por atender casos que exigem uma maior especialização e tec

O SUS (Sistema Único de Saúde) é um sistema de saúde pública no Brasil que tem como objetivo garantir o acesso universal e igualitário à saúde para todos os brasileiros. Ele é financiado por recursos do governo federal, estadual e municipal, além de contribuições da população por meio de impostos.

O SUS é composto por uma rede de serviços de saúde que inclui hospitais, postos de saúde, clínicas, laboratórios, entre outros. Ele é organizado em três níveis de atenção à saúde: a atenção básica, a atenção de média complexidade e a atenção de alta complexidade.

A atenção básica é o primeiro contato da população com o sistema de saúde e é responsável por atender as necessidades de saúde mais comuns, como consultas médicas, exames preventivos e tratamento de doenças crônicas. Ela é realizada em postos de saúde e clínicas da família e é coordenada por equipes de saúde da família.

A atenção de média complexidade é responsável por atender casos que exigem uma maior especialização e tecnologia, como exames de imagem, consultas com especialistas e cirurgias eletivas. Ela é realizada em hospitais e clínicas especializadas.

A atenção de alta complexidade é responsável por atender casos que exigem alta tecnologia e recursos especializados, como transplantes, tratamento de câncer e traumas graves. Ela é realizada em hospitais de referência e centros de excelência em saúde.

O SUS também tem programas de prevenção e controle de doenças, como o Programa Nacional de Imunizações, que oferece vacinas gratuitas para a população, e o Programa Nacional de DST/AIDS, que promove a prevenção e o tratamento da AIDS e outras doenças sexualmente transmissíveis.

Em resumo, o SUS é um sistema de saúde público que tem como objetivo garantir o acesso universal e igualitário à saúde para todos os brasileiros, por meio de uma rede de serviços de saúde organizada em três níveis de atenção à saúde: a atenção básica, a atenção de média complexidade e a atenção de alta complexidade. Ele também tem programas de prevenção e controle de doenças.

### Prompts mais elaborados

Agora que conseguimos integrar, vamos usar um prompt mais sofisticado e ver como o modelo se comporta. A idea a seguir é pedir ao modelo para entender um contexto, extrarir perguntas dele e nos entregar a resposta em um determinado padrão.

In [6]:
prompt = """
O trecho a seguir contem fatos sobre o assunto que ele trata. Sua missão é extrair dele 3 perguntas e organizar a resposta em formato JSON da seguinte maneira:
[{"pergunta1": "aqui vai a pergunta extraída"},{"pergunta2": "aqui vai a pergunta extraída"}].

Contexto:
A revolta começou como uma série de protestos contra a cobrança de impostos e a falta de autonomia política para a província do Rio Grande do Sul.
Em 1835, Bento Gonçalves liderou uma rebelião que resultou na proclamação da República Rio-Grandense, um governo independente que se opunha ao governo central brasileiro.
"""

llm(prompt)

'[\n{"pergunta1": "Quando começou a Revolução Farroupilha?"},\n{"pergunta2": "Quem liderou a Revolução Farroupilha?"},\n{"pergunta3": "O que a Revolução Farroupilha buscava?"}\n]'

# Integração com Pinecone

Para realizar uma integração completa usando exclusivamente o Maritaca, a API precisaria de um endpoint para captura dos embeddings, mas isso ainda não está disponível, então, a seguir iremos utilizar a OpenAI para criar as representações dos textos, enviar para o Pinecone e usar o Maritaca no final do fluxo. Funciona assim:

1. Capturamos os textos que queremos trabalhar, neste caso, a Portaria de Consolidação N 1 do Ministério da Saúde.

2. Vamos quebrar o texto em pequenas partes.

3. Interagir com a OpenAI e capturar os embeddings dos trechos criados.

4. Enviar esses trechos para o Pinecone.

Perceba que os passos acima são executados uma só vez ou sempre que houver necessidade de atualizar a estrutura. O resultado é uma base com diversos vetores que representam cada um dos trechos que criamos. O Pinecone, ou qualquer banco do mesmo tipo, viabiliza que sejam executadas consultas por similaridade. Dessa forma:

1. Agora que temos a base podemos enviar uma pergunta ou um texto qualquer, mas temos que criar a representação da pergunta e neste momento iremos chamar novamente a OpenAI para captura dos embeddings.

2. Em seguida, a Langchain interage com o Pinecone e pede para retornar os N vetores que mais se parecem com a pergunta/texto que enviamos.

Deste ponto em diante, já temos acesso aos N trechos semelhantes e, portanto, são os que possívelmente respondem a nossa pergunta. Vamos usar eles como contexto do prompt final com Maritaca.

In [16]:
import urllib.request

url = "https://github.com/free-educa/books/blob/main/books/Data%20Science%20do%20zero_%20Primeiras%20-%20Joel%20Grus.pdf"
file_name = "data_science.pdf"

urllib.request.urlretrieve(url, file_name)

('data_science.pdf', <http.client.HTTPMessage at 0x78e3e74d72e0>)

In [21]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import UnstructuredFileLoader

loader = UnstructuredFileLoader("https://github.com/free-educa/books/blob/main/books/Data%20Science%20do%20zero_%20Primeiras%20-%20Joel%20Grus.pdf")

In [22]:
data = loader.load()

PDFSyntaxError: ignored

In [None]:
print (f'Você tem {len(data)} documento(s) na base')
print (f'Há {len(data[0].page_content)} caracteres no documento')

Você tem 1 documento(s) na base
Há 58236 caracteres no documento


In [None]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=100, separators=['\n', ' ', ''])
texts = text_splitter.split_documents(data)

In [None]:
print (f'Agora há {len(texts)} documentos')

Agora há 152 documentos


In [None]:
texts[50].page_content

'1.3.1 Sacadas e microssacadas\n\nAs sacadas e microssacadas são tipos de movimentos oculares. As sacadas são\n\nmovimentos simultâneos de ambos os olhos em duas ou mais fases para fixação na mesma\n\ndireção (CASSIN; SOLOMON, 1990). As sacadas podem ser usadas para estudar o\n\ncomportamento ocular, os Movimentos Rápidos dos Olhos, tradicionalmente denominados\n\npela sigla em inglês de Rapid Eye Movements (REM) durante o estágio do sono, além de'

### Configuração da OpenAI e Pinecone

Recomendo ler como o Pinecone funciona, há muita documentação pela internet.

O código a seguir realiza a integração entre Pinecone e OpenAI e para isso você vai precisar de chaves. Para manter as que uso de forma privada, criei um arquivo com o seguinte formato:

```
{
    "openai": "key",
    "pinecone_key": "key",
    "pinecone_env": "env",
    "index_name": "idx"
}
```

Chamei de keys.json e coloquei na raiz do colab. Você pode fazer o mesmo para testar este notebook.

In [None]:
from langchain.vectorstores import Pinecone
from langchain.embeddings.openai import OpenAIEmbeddings
import pinecone
import json
import os

  from tqdm.autonotebook import tqdm


In [None]:
import openai

embed_model = "text-embedding-ada-002"

res = openai.Embedding.create(
    input=texts[200].page_content, engine=embed_model
)

In [None]:
res.keys()

dict_keys(['object', 'data', 'model', 'usage'])

In [None]:
OPENAI_API_KEY = os.environ['OPENAI_API_KEY']
PINECONE_API_KEY = os.environ['PINECONE_API_KEY']
PINECONE_API_ENV = os.environ['PINECONE_API_ENV']
INDEX_NAME = 'compilers-book'

In [None]:
embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)

In [None]:
# initialize pinecone
pinecone.init(
    api_key=PINECONE_API_KEY,
    environment=PINECONE_API_ENV
)
index_name = INDEX_NAME

In [None]:
Pinecone.from_existing_index()

In [None]:
# Use o código a seguir para criar a base
docsearch = Pinecone.from_texts([t.page_content for t in texts], embeddings, index_name=index_name, namespace='compilers_book_p1')

# Use o código a seguir se já tiver um índice criado
# docsearch = Pinecone.from_existing_index(index_name=index_name, embedding=embeddings)



In [None]:
import faiss
from langchain.vectorstores import FAISS
import pickle

def store_embeddings(docs, embeddings, sotre_name, path):

    vectorStore = FAISS.from_documents(docs, embeddings)

    with open(f"{path}/faiss_{sotre_name}.pkl", "wb") as f:
        pickle.dump(vectorStore, f)

def load_embeddings(sotre_name, path):
    with open(f"{path}/faiss_{sotre_name}.pkl", "rb") as f:
        VectorStore = pickle.load(f)
    return VectorStore


In [None]:
docsearch = FAISS.from_texts([t.page_content for t in texts], embeddings)

### Base construída

Agora temos nossa base vetorizada! Nosso PDF contendo os dados da Portaria de Consolidação já está no Pinecone, vamos testar!

A variável query vai armazenar o texto que será usado para a pesquisa por similaridade. Note que ao criar o objeto docsearch a variável embeddings foi passada como parâmetro. Ela será usada para criar uma representação da query e comparar com os dados contidos no Pinecone. Até o momento, a Maritaca não tem essa opção de criar embeddings, então vamos usar a OpenAI mesmo.

In [None]:
query = "Como é a bandeira do SUS?" # faça uma pergunta ou escreva um texto.
docs = docsearch.similarity_search(query)

In [None]:
docs

[Document(page_content='§ 2º A Bandeira do SUS poderá ser confeccionada em quaisquer dimensões, desde que obedecidas as características e proporções estabelecidas no modelo aprovado por este Capítulo. (Origem: PRT MS/GM 82/2014, Art. 2º, § 2º)\n\nArt. 13. A Bandeira do SUS será hasteada diariamente em todos os prédios dos órgãos e entidades integrantes da estrutura regimental do Ministério da Saúde, em todo o território nacional. (Origem: PRT MS/GM 82/2014, Art. 3º)\n\nParágrafo Único. As esferas estaduais, do Distrito Federal e municipais do SUS poderão adotar o mesmo procedimento de que trata o "caput" em seus estabelecimentos de saúde, desde que obedecidos os critérios estabelecidos neste Capítulo. (Origem: PRT MS/GM 82/2014, Art. 3º, Parágrafo Único)\n\nCAPÍTULO II DA RELAÇÃO NACIONAL DE AÇÕES E SERVIÇOS DE SAÚDE (RENASES)', metadata={}),
 Document(page_content='Art. 10. Os direitos e deveres dispostos neste Título constituem a Carta dos Direitos dos Usuários da\n\nSaúde. (Origem: 

### Integração final

Agora vamos usar os textos vindos do Pinecone e pedir para nosso LLM, o MariTalk, criar uma resposta adequada.

In [None]:
from langchain.chains.question_answering import load_qa_chain
from langchain.prompts.prompt import PromptTemplate

PROMPT = """
Use os trechos a seguir para responder a pergunta no final. Se você não souber a resposta, apenas diga que não sabe, não tente criar uma resposta.

{context}

Pergunta: {question}
Resposta:
"""

chain_prompt = PromptTemplate(input_variables=["context", "question"], template=PROMPT)

# note a variável llm sendo passada abaixo, ela é o Maritaca
chain = load_qa_chain(llm, chain_type="stuff", verbose=True, prompt=chain_prompt)

In [None]:
query = "Como foi realizado o processamento de sinais?" # faça uma pergunta ou escreva um texto.

# no exemplo abaixo reduzimos o número de documentos para caber na janela do
# Maritaca
docs = docsearch.similarity_search(query, k=5)
chain.run(input_documents=docs, question=query)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
Use os trechos a seguir para responder a pergunta no final. Se você não souber a resposta, apenas diga que não sabe, não tente criar uma resposta.

foram usados métodos de análise computacional na linguagem Python, inicialmente fazendo o

pré-processamento desses dados, para em seguida encontrar dois tipos de movimentos

característicos de sinais eletrooculográficos: piscadas e sacadas. Para detecção desses eventos

utilizamos um algoritmo de código aberto e semi-automático. Foram avaliadas as correlações

de Spearman entre a quantidade total de eventos oculares e as pontuações obtidas. A partir

3.3

Seleção e tratamento dos dados......................................................................... 24

3.4

Algoritmo para detecção de piscadas e sacadas..............................................

26

3.5

Ferramenta de seleção de dados para o tr

'Os sinais foram processados por meio de técnicas de análise computacional na linguagem Python. Inicialmente, houve pré-processamento dos dados, que incluiu a aplicação de um algoritmo de código aberto e semi-automático para a detecção de dois tipos de movimentos característicos de sinais eletrooculográficos: piscadas e sacadas. Foram avaliadas as correlações de Spearman entre a quantidade total de eventos oculares e as pontuações obtidas. Além disso, foram utilizados filtros para suavizar os sinais, como o filtro FIR da biblioteca MNE e a função eog\\_clean com filtro Butterworth da biblioteca Neurokit. Foi possível observar a diferença entre o sinal original, o sinal após a primeira filtragem e o sinal após a aplicação do método de suavização do neurokit.'

Os sinais foram processados por meio de técnicas de análise computacional na linguagem Python. Inicialmente, houve pré-processamento dos dados, que incluiu a aplicação de um algoritmo de código aberto e semi-automático para a detecção de dois tipos de movimentos característicos de sinais eletrooculográficos: piscadas e sacadas. Foram avaliadas as correlações de Spearman entre a quantidade total de eventos oculares e as pontuações obtidas. Além disso, foram utilizados filtros para suavizar os sinais, como o filtro FIR da biblioteca MNE e a função eog\_clean com filtro Butterworth da biblioteca Neurokit. Foi possível observar a diferença entre o sinal original, o sinal após a primeira filtragem e o sinal após a aplicação do método de suavização do neurokit.

In [None]:
query = "O que são sacadas?" # faça uma pergunta ou escreva um texto.

docs = docsearch.similarity_search(query, k=5)
chain.run(input_documents=docs, question=query)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
Use os trechos a seguir para responder a pergunta no final. Se você não souber a resposta, apenas diga que não sabe, não tente criar uma resposta.

1.3.1 Sacadas e microssacadas

As sacadas e microssacadas são tipos de movimentos oculares. As sacadas são

movimentos simultâneos de ambos os olhos em duas ou mais fases para fixação na mesma

direção (CASSIN; SOLOMON, 1990). As sacadas podem ser usadas para estudar o

comportamento ocular, os Movimentos Rápidos dos Olhos, tradicionalmente denominados

pela sigla em inglês de Rapid Eye Movements (REM) durante o estágio do sono, além de

consolidado no meio acadêmico, possuir diversas bibliotecas para análise, o laboratório já

17

possui equipamentos para esse tipo de análise, e, ainda, os dados que serão utilizados já foram

coletados usando EOG.

1.3 Padrões oculares

Existem alguns padrões oculares de i

'As sacadas são movimentos simultâneos de ambos os olhos em duas ou mais fases para fixação na mesma direção. Elas podem ser usadas para estudar o comportamento ocular, os Movimentos Rápidos dos Olhos (REM) durante o estágio do sono, além de serem usadas para análise de dados coletados usando EOG.'

As sacadas são movimentos simultâneos de ambos os olhos em duas ou mais fases para fixação na mesma direção. Elas podem ser usadas para estudar o comportamento ocular, os Movimentos Rápidos dos Olhos (REM) durante o estágio do sono, além de serem usadas para análise de dados coletados usando EOG.

In [None]:
query = "Quais os métodos utilizados?" # faça uma pergunta ou escreva um texto.

docs = docsearch.similarity_search(query, k=5)
chain.run(input_documents=docs, question=query)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
Use os trechos a seguir para responder a pergunta no final. Se você não souber a resposta, apenas diga que não sabe, não tente criar uma resposta.

18

2

OBJETIVOS.......................................................................................................

19

3

METODOLOGIA............................................................................................... 20

3.1

O experimento..................................................................................................... 20

3.2

Software usado para as análises........................................................................ 22

3.3

Os modelos de RO podem ser usados em tela ou por meio de dispositivos vestíveis,

como por exemplo um equipamento de RO semelhante a uma armação de óculos. Como

citado anteriormente, o RO pode ser utilizado para estudar padrões ocular

'Os métodos utilizados foram o Registro Ocular (RO) e a Eletro-oculografia (EOG). O RO é um método que capta dados de sacadas, piscadas, microssacadas e fixação, enquanto o EOG mede a diferença de potencial elétrico fisiológico entre a córnea e a retina. Ambos os métodos têm vantagens e desvantagens, como a falta de dados durante as piscadas no RO e a falta de dados durante o fechamento dos olhos no EOG.'

As três abstrações críticas que os procedimentos oferecem para permitir a construção de programas não triviais são:

1. Abstração de chamada de procedimento: As linguagens procedurais admitem uma abstração para chamadas de procedimento. Cada linguagem tem um mecanismo padrão para chamar um procedimento e mapear um conjunto de argumentos, ou parâmetros, do espaço de nomes do chamador para o espaço de nomes do chamado. Esta abstração normalmente inclui um mecanismo para retornar o controle ao chamador e continuar a execução no ponto imediatamente após a chamada. A maioria das linguagens permite que um procedimento retorne um ou mais valores ao chamador. O uso de convenções de ligação padrão, às vezes chamadas sequências de chamada, permite que o programador chame código escrito e compilado por outras pessoas e em outras ocasiões, o que, por sua vez, permite que a aplicação chame rotinas de biblioteca e serviços de sistema.
2. Abstração de armazenamento: Procedimentos criam um ambiente de execução controlado; cada procedimento tem seu próprio espaço de armazenamento nomeado privado. Isso significa que as variáveis e parâmetros utilizados por um procedimento não são acessíveis a outros procedimentos, a menos que explicitamente compartilhados. Isso torna possível a modularidade, permitindo que os programadores dividam um grande sistema em componentes menores e mais gerenciáveis.
3. Abstração de interface: Procedimentos ajudam a definir interfaces entre componentes do sistema; interações entre componentes normalmente são estruturadas por meio de chamadas de procedimento. Isso permite que os programadores possam escrever código que interage com outros componentes sem precisar conhecer detalhes internos desses componentes. Em vez disso, eles podem se concentrar em entender a interface pública do componente, que é definida por meio de chamadas de procedimento.

In [None]:
docsearch.similarity_search("livre de contexto", k=5)

[]