# Início Rápido Haystack

## 1. Iniciar

Haystack é um framework Python de código aberto que ajuda os desenvolvedores a construir aplicativos personalizados com tecnologia LLM. Em março de 2024, lançaram o Haystack 2.0, uma atualização significativa. Para obter mais informações sobre o Haystack 2.0, é possível ler o [post de anúncio](https://haystack.deepset.ai/blog/haystack-2-release).

## 2. Instalação

Use pip para instalar o Haystack:

In [2]:
pip install haystack-ai

Note: you may need to restart the kernel to use updated packages.


Para mais detalhes, consulte a [documentação da instalação](https://docs.haystack.deepset.ai/docs/installation?utm_campaign=developer-relations&utm_source=haystack&utm_medium=website).

## 3. Fazer perguntas a uma página da web

Este é um pipeline muito simples que pode responder perguntas sobre o conteúdo de uma página web. Ele usa GPT-3.5-Turbo com o OpenAIGenerator.

Primeiro, instale o Haystack:

In [3]:
pip install haystack-ai

Note: you may need to restart the kernel to use updated packages.


### Formas de Usar o Haystack (Simplicidade vs. Flexibilidade)

#### Simplicidade

In [4]:
# SIMPLICIDADE

import os
from dotenv import load_dotenv
from haystack import Pipeline, PredefinedPipeline

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

pipeline = Pipeline.from_template(PredefinedPipeline.CHAT_WITH_WEBSITE)
result = pipeline.run({
    "fetcher": {"urls": ["https://haystack.deepset.ai/overview/quick-start"]},
    "prompt": {"query": "Responda em português, como eu posso instalar o Haystack?"}}
)
print(result["llm"]["replies"][0])

Você pode instalar o Haystack utilizando o comando 'pip install haystack-ai'. Certifique-se de ter o Python e o pip instalados em seu ambiente antes de executar este comando."


#### Flexibilidade

In [8]:
# FLEXIBILIDADE

import os
from dotenv import load_dotenv
from haystack import Pipeline
from haystack.components.fetchers import LinkContentFetcher
from haystack.components.converters import HTMLToDocument
from haystack.components.builders import PromptBuilder

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

fetcher = LinkContentFetcher()
converter = HTMLToDocument()
prompt_template = """
According to the contents of this website:
{% for document in documents %}
  {{document.content}}
{% endfor %}
Answer the given question: {{query}}
Answer:
"""
prompt_builder = PromptBuilder(template=prompt_template)
llm = OpenAIGenerator()

pipeline = Pipeline()
pipeline.add_component("fetcher", fetcher)
pipeline.add_component("converter", converter)
pipeline.add_component("prompt", prompt_builder)
pipeline.add_component("llm", llm)

pipeline.connect("fetcher.streams", "converter.sources")
pipeline.connect("converter.documents", "prompt.documents")
pipeline.connect("prompt.prompt", "llm.prompt")

result = pipeline.run({"fetcher": {"urls": ["https://haystack.deepset.ai/overview/quick-start"]},
              "prompt": {"query": "Responda em português, como posso construir meu primeiro pipeline RAG?"}})

print(result["llm"]["replies"][0])


Para construir seu primeiro pipeline RAG com o Haystack, você precisa de três componentes principais: um Retriever, um PromptBuilder e um Generator. Você pode conectar esses componentes para criar um pipeline de Recuperação com Geração Aprimorada (RAG) que permitirá que você faça perguntas sobre documentos e obtenha respostas baseadas em modelos de linguagem. Siga as instruções fornecidas acima para instalar o Haystack, indexar seus documentos e executar consultas usando a abordagem RAG.


#### Fluxograma

<p align="center">
  <img src="../../data/docs-data/overview/faca-perguntas-a-uma-pagina-da-web.png" alt="Faça perguntas a uma página da web">
</p>

Os dois códigos demonstram diferentes maneiras de usar o framework Haystack para processar informações de páginas da web e gerar respostas baseadas nessas informações. Eles têm algumas diferenças fundamentais na abordagem e na complexidade.

#### Simplicidade (Código 1): Uso de PredefinedPipeline

- **Simplicidade**: Este código utiliza a classe PredefinedPipeline para criar uma pipeline pré-definida com o mínimo de configuração necessária. Ele é mais direto e fácil de usar para casos de uso comuns.
- **Configuração de Pipeline**: A pipeline é criada com o método from_template(), usando uma pipeline pré-definida (CHAT_WITH_WEBSITE). Isso significa que a estrutura da pipeline (fetching, conversão, geração) já está definida pela template, e o usuário não precisa configurar manualmente cada componente.
- **Foco**: Este código é focado em extrair informações de URLs específicas para responder a uma pergunta, sem a necessidade de detalhar cada etapa do processo.

#### Flexibilidade (Código 2): Construção Manual da Pipeline

- **Flexibilidade**: Este código demonstra uma abordagem mais granular e flexível, construindo a pipeline componente por componente. Isso permite uma personalização mais detalhada de cada etapa do processo.
- **Componentes Personalizados**: Aqui, os componentes são explicitamente criados e adicionados à pipeline (LinkContentFetcher, HTMLToDocument, PromptBuilder, OpenAIGenerator). Isso dá ao usuário controle total sobre o comportamento de cada componente.
- **Conexões Explícitas**: O código faz uso do método connect() para definir explicitamente como os dados fluem entre os componentes da pipeline. Isso oferece clareza sobre como as informações são processadas e transformadas ao longo da pipeline.
- **Template de Prompt Customizado**: Utiliza um template personalizado para construir o prompt enviado ao modelo de linguagem, dando ao usuário a capacidade de influenciar diretamente a formatação do prompt e, consequentemente, a qualidade da resposta gerada.

#### Diferenças
- **Simplicidade vs. Flexibilidade**: O primeiro código é mais simples e direto, ideal para quem quer uma solução rápida e padronizada. O segundo oferece mais flexibilidade e controle, adequado para usuários que precisam de configurações específicas ou querem otimizar o processo detalhadamente.
- **Configuração da Pipeline**: No primeiro código, a pipeline é predefinida, enquanto no segundo, o usuário constrói e configura cada componente da pipeline manualmente.
- **Personalização do Prompt**: O segundo código permite uma personalização detalhada do prompt enviado ao modelo de linguagem, o que pode ser crucial para casos de uso específicos onde a formatação do prompt afeta significativamente a resposta gerada.
Cada abordagem tem seus benefícios e escolher entre elas depende das necessidades específicas do projeto e da preferência do desenvolvedor.

## 4. Crie seu primeiro aplicativo RAG

É possível construir um pipeline de geração aumentada de recuperação (RAG) e ver como o Haystack responde às perguntas.

Primeiro, é necessário instalar a forma mínima do Haystack:

In [None]:
pip install haystack-ai

Note: you may need to restart the kernel to use updated packages.


O código a seguir carregará os dados no Document Store, criará um pipeline RAG e fará uma pergunta com base nos dados. É necessário uma chave API da OpenAI em OPENAI_API_KEYcomo variável de ambiente, para que o código funcione.

Como alternativa, você pode começar usando um dos [modelos de pipeline prontos](https://docs.haystack.deepset.ai/docs/pipeline-templates).

In [None]:
# Importação dos componentes e do InMemoryDocumentStore.
import os
from dotenv import load_dotenv
from haystack import Pipeline, Document
from haystack.document_stores.in_memory import InMemoryDocumentStore
from haystack.components.retrievers.in_memory import InMemoryBM25Retriever
from haystack.components.generators import OpenAIGenerator
from haystack.components.builders.answer_builder import AnswerBuilder
from haystack.components.builders.prompt_builder import PromptBuilder

# Definição das variáveis ​​de ambiente necessárias
load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

# Uso do DocumentStore
# Inicialização do InMemoryDocumentStore simples 
# e, em seguida, escrita do texto em cada documento no Store.
document_store = InMemoryDocumentStore()
document_store.write_documents([
    Document(content="My name is Jean and I live in Paris."), 
    Document(content="My name is Mark and I live in Berlin."), 
    Document(content="My name is Giorgio and I live in Rome.")
])

# Escrita de um modelo de prompt
# O prompt corresponde a uma tarefa de PLN e contém instruções para o modelo. 
# O pipeline percorrerá cada documento para descobrir a resposta.
prompt_template = """
Given these documents, answer the question.
Documents:
{% for doc in documents %}
    {{ doc.content }}
{% endfor %}
Question: {{question}}
Answer:
"""

# Criação do dos componentes
# Além disso, insira sua chave de API OpenAI para o OpenAIGenerator.
# É possível passar quaisquer parâmetros para os componentes neste estágio.
retriever = InMemoryBM25Retriever(document_store=document_store)
prompt_builder = PromptBuilder(template=prompt_template)
llm = OpenAIGenerator()

# Criação de uma instância de pipeline
rag_pipeline = Pipeline()
# Adição dos componentes ao pipeline
# Adição de cada componente, um por um, ao pipeline. A ordem não importa.
# Nesta fase, o Pipeline valida os componentes sem executá-los ainda.
rag_pipeline.add_component("retriever", retriever)
rag_pipeline.add_component("prompt_builder", prompt_builder)
rag_pipeline.add_component("llm", llm)
# Conexão dos componentes individuais
# Organização dos componentes do pipeline na ordem necessária. Se um componente 
# tiver mais de uma entrada ou saída, é necessário indicar qual entrada é desejavel 
# conectar a qual saída usando o formato("component_name.output_name", "component_name, input_name")
rag_pipeline.connect("retriever", "prompt_builder.documents")
rag_pipeline.connect("prompt_builder", "llm")

# Pergunta e definição dos resultados
question = "Quem vive em Paris?"
results = rag_pipeline.run(
    {
        "retriever": {"query": question},
        "prompt_builder": {"question": question},
    }
)

# Exibição da resposta
print(results["llm"]["replies"])

Ranking by BM25...: 100%|██████████| 3/3 [00:00<00:00, 18641.35 docs/s]




['Jean vive em Paris.']


### Adicionando dados
Em vez de executar o pipeline RAG em dados de exemplo, é possível adicionar dados customizados usando [Document Stores](https://docs.haystack.deepset.ai/docs/document-store).

## 5. Construa seu primeiro pipeline RAG

Para construir pipelines de pesquisa modernos com LLMs, você precisa de duas coisas: componentes poderosos e uma maneira fácil de reuni-los. O pipeline Haystack foi criado para essa finalidade e permite projetar e dimensionar suas interações com LLMs. Aprenda como criar pipelines aqui .

Ao conectar três componentes, um Retriever, um PromptBuilder e um Generator , você pode construir seu primeiro pipeline de Retrieval Augmented Generation (RAG) com Haystack.

Experimente como o Haystack responde a perguntas sobre os documentos fornecidos usando a abordagem RAG 👇

Primeiro, instale o Haystack e a integração do Chroma (vamos usá-lo como nosso armazenamento de documentos):

In [7]:
pip install haystack-ai chroma-haystack

Note: you may need to restart the kernel to use updated packages.


In [9]:
import os
import urllib.request
from dotenv import load_dotenv
from haystack import Pipeline, PredefinedPipeline

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

urllib.request.urlretrieve("https://www.gutenberg.org/cache/epub/7785/pg7785.txt", "davinci.txt")  

indexing_pipeline =  Pipeline.from_template(PredefinedPipeline.INDEXING)
indexing_pipeline.run(data={"sources": ["davinci.txt"]})

rag_pipeline =  Pipeline.from_template(PredefinedPipeline.RAG)

query = "How old was he when he died?"
result = rag_pipeline.run(data={"prompt_builder": {"query":query}, "text_embedder": {"text": query}})
print(result["llm"]["replies"][0])

Calculating embeddings: 100%|██████████| 2/2 [00:01<00:00,  1.19it/s]
Add of existing embedding ID: d33987463a24c325ea594307e4da30102305c09b5a529056b7c1c2db5677d833
Insert of existing embedding ID: d33987463a24c325ea594307e4da30102305c09b5a529056b7c1c2db5677d833
Add of existing embedding ID: e471effeb69e7c686510df375987a20824475332fbeeef16842549414ff173e0
Insert of existing embedding ID: e471effeb69e7c686510df375987a20824475332fbeeef16842549414ff173e0
Add of existing embedding ID: 2fe49708b8bdade00e8ef589035917254c5d18914cfedeee1ac053e7f9372d75
Insert of existing embedding ID: 2fe49708b8bdade00e8ef589035917254c5d18914cfedeee1ac053e7f9372d75
Add of existing embedding ID: 59f1aaf910fd118d6f9157454b75a356b44489bf2993d2ecbf6e5813da31996f
Insert of existing embedding ID: 59f1aaf910fd118d6f9157454b75a356b44489bf2993d2ecbf6e5813da31996f
Add of existing embedding ID: 2a175620e921b84aeaec6a6fb9faa18d2526c46bb1faac083cc273519b717d59
Insert of existing embedding ID: 2a175620e921b84aeaec6a6fb9faa1

He was 67 years old when he died.


In [11]:
import os
import urllib.request
from haystack import Pipeline
from dotenv import load_dotenv
from haystack_integrations.document_stores.chroma import ChromaDocumentStore
from haystack.components.converters import TextFileToDocument
from haystack.components.preprocessors import DocumentCleaner, DocumentSplitter
from haystack.components.embedders import OpenAIDocumentEmbedder, OpenAITextEmbedder
from haystack.components.writers import DocumentWriter
from haystack_integrations.components.retrievers.chroma import ChromaEmbeddingRetriever
from haystack.components.builders import PromptBuilder
from haystack.components.generators import OpenAIGenerator

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

urllib.request.urlretrieve("https://www.gutenberg.org/cache/epub/7785/pg7785.txt", "davinci.txt")  

document_store = ChromaDocumentStore(persist_path=".")

text_file_converter = TextFileToDocument()
cleaner = DocumentCleaner()
splitter = DocumentSplitter()
embedder = OpenAIDocumentEmbedder()
writer = DocumentWriter(document_store)

indexing_pipeline = Pipeline()
indexing_pipeline.add_component("converter", text_file_converter)
indexing_pipeline.add_component("cleaner", cleaner)
indexing_pipeline.add_component("splitter", splitter)
indexing_pipeline.add_component("embedder", embedder)
indexing_pipeline.add_component("writer", writer)

indexing_pipeline.connect("converter.documents", "cleaner.documents")
indexing_pipeline.connect("cleaner.documents", "splitter.documents")
indexing_pipeline.connect("splitter.documents", "embedder.documents")
indexing_pipeline.connect("embedder.documents", "writer.documents")
indexing_pipeline.run(data={"sources": ["davinci.txt"]})

text_embedder = OpenAITextEmbedder()
retriever = ChromaEmbeddingRetriever(document_store)
template = """Given these documents, answer the question.
              Documents:
              {% for doc in documents %}
                  {{ doc.content }}
              {% endfor %}
              Question: {{query}}
              Answer:"""
prompt_builder = PromptBuilder(template=template)
llm = OpenAIGenerator()

rag_pipeline = Pipeline()
rag_pipeline.add_component("text_embedder", text_embedder)
rag_pipeline.add_component("retriever", retriever)
rag_pipeline.add_component("prompt_builder", prompt_builder)
rag_pipeline.add_component("llm", llm)

rag_pipeline.connect("text_embedder.embedding", "retriever.query_embedding")
rag_pipeline.connect("retriever.documents", "prompt_builder.documents")
rag_pipeline.connect("prompt_builder", "llm")

query = "How old was he when he died?"
result = rag_pipeline.run(data={"prompt_builder": {"query":query}, "text_embedder": {"text": query}})
print(result["llm"]["replies"][0])

Calculating embeddings: 100%|██████████| 2/2 [00:42<00:00, 21.41s/it]
Add of existing embedding ID: d33987463a24c325ea594307e4da30102305c09b5a529056b7c1c2db5677d833
Insert of existing embedding ID: d33987463a24c325ea594307e4da30102305c09b5a529056b7c1c2db5677d833
Add of existing embedding ID: e471effeb69e7c686510df375987a20824475332fbeeef16842549414ff173e0
Insert of existing embedding ID: e471effeb69e7c686510df375987a20824475332fbeeef16842549414ff173e0
Add of existing embedding ID: 2fe49708b8bdade00e8ef589035917254c5d18914cfedeee1ac053e7f9372d75
Insert of existing embedding ID: 2fe49708b8bdade00e8ef589035917254c5d18914cfedeee1ac053e7f9372d75
Add of existing embedding ID: 59f1aaf910fd118d6f9157454b75a356b44489bf2993d2ecbf6e5813da31996f
Insert of existing embedding ID: 59f1aaf910fd118d6f9157454b75a356b44489bf2993d2ecbf6e5813da31996f
Add of existing embedding ID: 2a175620e921b84aeaec6a6fb9faa18d2526c46bb1faac083cc273519b717d59
Insert of existing embedding ID: 2a175620e921b84aeaec6a6fb9faa1

Leonardo da Vinci was 67 years old when he died.


<p align="center">
  <img src="../../data/docs-data/overview/construa-seu-primeiro-pipeline-rag-indexacao.png" alt="Construa seu primeiro pipeline RAG - Pipeline de indexação">
  <img src="../../data/docs-data/overview/construa-seu-primeiro-pipeline-rag-rag.png" alt="Construa seu primeiro pipeline RAG - Pipeline de RAG">
</p>