# Fazer perguntas a uma página da web

Este é um pipeline muito simples que pode responder perguntas sobre o conteúdo de uma página web.

## 1. Instalação do Haystack

Primeiro, instale o Haystack:

In [3]:
pip install haystack-ai

Note: you may need to restart the kernel to use updated packages.


## 2. Abordagens para usar o Haystack (Simplicidade vs. Flexibilidade)

### Simplicidade

In [4]:
# SIMPLICIDADE

import os
from dotenv import load_dotenv
from haystack import Pipeline, PredefinedPipeline

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

pipeline = Pipeline.from_template(PredefinedPipeline.CHAT_WITH_WEBSITE)
result = pipeline.run({
    "fetcher": {"urls": ["https://haystack.deepset.ai/overview/quick-start"]},
    "prompt": {"query": "Responda em português, como eu posso instalar o Haystack?"}}
)
print(result["llm"]["replies"][0])

Você pode instalar o Haystack utilizando o comando 'pip install haystack-ai'. Certifique-se de ter o Python e o pip instalados em seu ambiente antes de executar este comando."


### Flexibilidade

In [8]:
# FLEXIBILIDADE

import os
from dotenv import load_dotenv
from haystack import Pipeline
from haystack.components.fetchers import LinkContentFetcher
from haystack.components.converters import HTMLToDocument
from haystack.components.builders import PromptBuilder

load_dotenv()
api_key = os.environ['OPENAI_API_KEY']

fetcher = LinkContentFetcher()
converter = HTMLToDocument()
prompt_template = """
According to the contents of this website:
{% for document in documents %}
  {{document.content}}
{% endfor %}
Answer the given question: {{query}}
Answer:
"""
prompt_builder = PromptBuilder(template=prompt_template)
llm = OpenAIGenerator()

pipeline = Pipeline()
pipeline.add_component("fetcher", fetcher)
pipeline.add_component("converter", converter)
pipeline.add_component("prompt", prompt_builder)
pipeline.add_component("llm", llm)

pipeline.connect("fetcher.streams", "converter.sources")
pipeline.connect("converter.documents", "prompt.documents")
pipeline.connect("prompt.prompt", "llm.prompt")

result = pipeline.run({"fetcher": {"urls": ["https://haystack.deepset.ai/overview/quick-start"]},
              "prompt": {"query": "Responda em português, como posso construir meu primeiro pipeline RAG?"}})

print(result["llm"]["replies"][0])


Para construir seu primeiro pipeline RAG com o Haystack, você precisa de três componentes principais: um Retriever, um PromptBuilder e um Generator. Você pode conectar esses componentes para criar um pipeline de Recuperação com Geração Aprimorada (RAG) que permitirá que você faça perguntas sobre documentos e obtenha respostas baseadas em modelos de linguagem. Siga as instruções fornecidas acima para instalar o Haystack, indexar seus documentos e executar consultas usando a abordagem RAG.


### Fluxograma

<p align="center">
  <img src="../data/docs-data/overview/faca-perguntas-a-uma-pagina-da-web.png" alt="Faça perguntas a uma página da web">
</p>

Os dois códigos demonstram diferentes maneiras de usar o framework Haystack para processar informações de páginas da web e gerar respostas baseadas nessas informações. Eles têm algumas diferenças fundamentais na abordagem e na complexidade.

### Simplicidade (Código 1): Uso de PredefinedPipeline

- **Simplicidade**: Este código utiliza a classe PredefinedPipeline para criar uma pipeline pré-definida com o mínimo de configuração necessária. Ele é mais direto e fácil de usar para casos de uso comuns.
- **Configuração de Pipeline**: A pipeline é criada com o método from_template(), usando uma pipeline pré-definida (CHAT_WITH_WEBSITE). Isso significa que a estrutura da pipeline (fetching, conversão, geração) já está definida pela template, e o usuário não precisa configurar manualmente cada componente.
- **Foco**: Este código é focado em extrair informações de URLs específicas para responder a uma pergunta, sem a necessidade de detalhar cada etapa do processo.

### Flexibilidade (Código 2): Construção Manual da Pipeline

- **Flexibilidade**: Este código demonstra uma abordagem mais granular e flexível, construindo a pipeline componente por componente. Isso permite uma personalização mais detalhada de cada etapa do processo.
- **Componentes Personalizados**: Aqui, os componentes são explicitamente criados e adicionados à pipeline (LinkContentFetcher, HTMLToDocument, PromptBuilder, OpenAIGenerator). Isso dá ao usuário controle total sobre o comportamento de cada componente.
- **Conexões Explícitas**: O código faz uso do método connect() para definir explicitamente como os dados fluem entre os componentes da pipeline. Isso oferece clareza sobre como as informações são processadas e transformadas ao longo da pipeline.
- **Template de Prompt Customizado**: Utiliza um template personalizado para construir o prompt enviado ao modelo de linguagem, dando ao usuário a capacidade de influenciar diretamente a formatação do prompt e, consequentemente, a qualidade da resposta gerada.

### Diferenças
- **Simplicidade vs. Flexibilidade**: O primeiro código é mais simples e direto, ideal para quem quer uma solução rápida e padronizada. O segundo oferece mais flexibilidade e controle, adequado para usuários que precisam de configurações específicas ou querem otimizar o processo detalhadamente.
- **Configuração da Pipeline**: No primeiro código, a pipeline é predefinida, enquanto no segundo, o usuário constrói e configura cada componente da pipeline manualmente.
- **Personalização do Prompt**: O segundo código permite uma personalização detalhada do prompt enviado ao modelo de linguagem, o que pode ser crucial para casos de uso específicos onde a formatação do prompt afeta significativamente a resposta gerada.
Cada abordagem tem seus benefícios e escolher entre elas depende das necessidades específicas do projeto e da preferência do desenvolvedor.