<a href="https://colab.research.google.com/github/osmarbraz/exemplos_Llama2/blob/main/RAG_RespondendoPergunta_Llama2_7B_8bit_HuggingFaceBgeEmbeddings_Langchain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Exemplo de RAG - Respondendo Perguntas sobre Textos Longos usando Llama v2.0 7B 8bit, Longchain, Chroma e Transformers by HuggingFace

**Toda a execução ocorre no Google Colaboratory.**

Pré-requisitos:
- Lhama 2 não está acessível abertamente e requer solicitação  de acesso. Faça o cadastro no site do https://huggingface.co/join. Depois do login, gere um token de acesso no link https://huggingface.co/settings/tokens.
- Configurar o notebook para usar GPU- Acesse o menu 'Ambiente de Execução -> Alterar o tipo do ambiente de execução -> Acelerador de hardware -> T4 GPU


**Referências**

https://medium.com/@onkarmishra/using-langchain-for-question-answering-on-own-data-3af0a82789ed

**Lista dos modelos:**

https://huggingface.co/models


**Link biblioteca Huggingface:**

https://github.com/huggingface/transformers




# 0 - Preparação do ambiente
Preparação do ambiente para execução do exemplo.

## Tratamento de logs

Método para tratamento dos logs.

In [None]:
# Biblioteca de logging
import logging

# Formatando a mensagem de logging
logging.basicConfig(format="%(asctime)s : %(levelname)s : %(message)s", level=logging.INFO)

## Identificando o ambiente Colab

Cria uma variável para identificar que o notebook está sendo executado no Google Colaboratory.

In [None]:
# Biblioteca do sistema
import sys

# Retorna true ou false se estiver no Google Colaboratory
IN_COLAB = "google.colab" in sys.modules

## Versão Python

In [None]:
# Biblioteca do sistema
import sys

print("Versão Python:", sys.version)

Versão Python: 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0]


## Funções auxiliares

Função auxiliar para formatar o tempo como `hh: mm: ss`

In [None]:
# Import das bibliotecas.
import time
import datetime

def formataTempo(tempo):
    """
      Pega a tempo em segundos e retorna uma string hh:mm:ss
    """
    # Arredonda para o segundo mais próximo.
    tempo_arredondado = int(round((tempo)))

    # Formata como hh:mm:ss
    return str(datetime.timedelta(seconds=tempo_arredondado))

Imprime linhas menores.

In [None]:
def print_linhas_menores(texto, tamanho=120):
  for i in range(0, len(texto), tamanho):
    print(texto[i:i+tamanho])

# 1 - Instalação das bibliotecas

Biblioteca para manipular pdf

https://pypi.org/project/pypdf/

In [None]:
!pip install pypdf==3.16.4



Bibliota de dependência para manipular os embeddings pelo Langchain.

https://pypi.org/project/sentence-transformers/

In [None]:
!pip install sentence_transformers==2.2.2



Biblioteca que persiste os embeddings e realiza busca semântica.

https://pypi.org/project/chromadb/

In [None]:
!pip install chromadb==0.4.15



Biblioteca para realizar a divisão por token.

In [None]:
!pip install tiktoken==0.5.1



Bibioteca LangChain é um framework de código aberto para o desenvolvimento de aplicações usando modelos de linguagem grandes.

https://pypi.org/project/langchain/

In [None]:
!pip install langchain==0.0.323



Dependências do xformers

https://pypi.org/project/lmdb/

In [None]:
!pip install lmdb==1.4.1
!pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio==2.0.2 torchtext==0.15.2+cpu torchdata==0.6.1 --index-url https://download.pytorch.org/whl/cu118

Looking in indexes: https://download.pytorch.org/whl/cu118


Permite maior velocidade e menor consumo de memória nos transformers.

https://pypi.org/project/xformers/

In [None]:
!pip install xformers==0.0.22.post7

Collecting xformers==0.0.22.post7
  Using cached xformers-0.0.22.post7-cp310-cp310-manylinux2014_x86_64.whl (211.8 MB)
Collecting torch==2.1.0 (from xformers==0.0.22.post7)
  Using cached torch-2.1.0-cp310-cp310-manylinux1_x86_64.whl (670.2 MB)
Collecting nvidia-cuda-nvrtc-cu12==12.1.105 (from torch==2.1.0->xformers==0.0.22.post7)
  Downloading nvidia_cuda_nvrtc_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (23.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m23.7/23.7 MB[0m [31m29.7 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting nvidia-cuda-runtime-cu12==12.1.105 (from torch==2.1.0->xformers==0.0.22.post7)
  Downloading nvidia_cuda_runtime_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (823 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m823.6/823.6 kB[0m [31m31.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting nvidia-cuda-cupti-cu12==12.1.105 (from torch==2.1.0->xformers==0.0.22.post7)
  Downloading nvidia_cuda_cupti_cu12-12.1.105-py3-none-man

O bitsandbytes é um wrapper leve em torno de funções personalizadas CUDA, em particular otimizadores de 8 bits, multiplicação de matrizes (LLM.int8()) e funções de quantização. É uma dependência do accelerate.

https://huggingface.co/blog/4bit-transformers-bitsandbytes

https://pypi.org/project/bitsandbytes/

In [None]:
!pip install bitsandbytes==0.41.1

Collecting bitsandbytes==0.41.1
  Using cached bitsandbytes-0.41.1-py3-none-any.whl (92.6 MB)
Installing collected packages: bitsandbytes
Successfully installed bitsandbytes-0.41.1


Accelerate é uma biblioteca que permite que o mesmo código PyTorch seja executado em qualquer configuração distribuída adicionando apenas quatro linhas de código. Otimiza as operações do PyTorch, especialmente na GPU.

https://pypi.org/project/accelerate/

In [None]:
!pip install accelerate==0.24.0

Collecting accelerate==0.24.0
  Downloading accelerate-0.24.0-py3-none-any.whl (260 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m261.0/261.0 kB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m


A Biblioteca A Biblioteca Transformers fornece APIs e ferramentas para baixar e treinar facilmente modelos pré-treinados de última geração para Processamento de linguagem natural, Visão computacional, Áudio, etc.

Fornece uma maneira direta de usar modelos pré-treinados.

In [None]:
# Instala a última versão da biblioteca
# !pip install transformers

# A última versão do huggingface apresenta um problema:
# UserWarning: `do_sample` is set to `False`. However, `temperature` is set to `0.1`
# https://discuss.huggingface.co/t/help-with-llama-2-finetuning-setup/50035
# Usar a versão 4.31.0

# Instala uma versão específica da biblioteca
!pip install -U transformers==4.31.0

Collecting transformers==4.31.0
  Downloading transformers-4.31.0-py3-none-any.whl (7.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.4/7.4 MB[0m [31m10.6 MB/s[0m eta [36m0:00:00[0m
Collecting tokenizers!=0.11.3,<0.14,>=0.11.1 (from transformers==4.31.0)
  Downloading tokenizers-0.13.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (7.8 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.8/7.8 MB[0m [31m31.7 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: tokenizers, transformers
  Attempting uninstall: tokenizers
    Found existing installation: tokenizers 0.14.1
    Uninstalling tokenizers-0.14.1:
      Successfully uninstalled tokenizers-0.14.1
  Attempting uninstall: transformers
    Found existing installation: transformers 4.35.0
    Uninstalling transformers-4.35.0:
      Successfully uninstalled transformers-4.35.0
Successfully installed tokenizers-0.13.3 transformers-4.31.0


A Biblioteca huggingface-cli fornece vários comandos para interagir com o Hugging Face Hub a partir da linha de comando. Um desses comandos é o login, que permite aos usuários se autenticarem no Hub usando suas credenciais.

In [None]:
!pip install huggingface_hub==0.18.0

Collecting huggingface_hub==0.18.0
  Using cached huggingface_hub-0.18.0-py3-none-any.whl (301 kB)
Installing collected packages: huggingface_hub
  Attempting uninstall: huggingface_hub
    Found existing installation: huggingface-hub 0.17.3
    Uninstalling huggingface-hub-0.17.3:
      Successfully uninstalled huggingface-hub-0.17.3
Successfully installed huggingface_hub-0.18.0


## Versão bibliotecas utilizadas

In [None]:
!pip freeze

absl-py==1.4.0
accelerate==0.24.0
aiohttp==3.8.6
aiosignal==1.3.1
alabaster==0.7.13
albumentations==1.3.1
altair==4.2.2
anyio==3.7.1
appdirs==1.4.4
argon2-cffi==23.1.0
argon2-cffi-bindings==21.2.0
array-record==0.5.0
arviz==0.15.1
astropy==5.3.4
astunparse==1.6.3
async-timeout==4.0.3
atpublic==4.0
attrs==23.1.0
audioread==3.0.1
autograd==1.6.2
Babel==2.13.1
backcall==0.2.0
backoff==2.2.1
bcrypt==4.0.1
beautifulsoup4==4.11.2
bidict==0.22.1
bigframes==0.10.0
bitsandbytes==0.41.1
bleach==6.1.0
blinker==1.4
blis==0.7.11
blosc2==2.0.0
bokeh==3.2.2
bqplot==0.12.42
branca==0.6.0
build==1.0.3
CacheControl==0.13.1
cachetools==5.3.2
catalogue==2.0.10
certifi==2023.7.22
cffi==1.16.0
chardet==5.2.0
charset-normalizer==3.3.1
chex==0.1.7
chroma-hnswlib==0.7.3
chromadb==0.4.15
click==8.1.7
click-plugins==1.1.1
cligj==0.7.2
cloudpickle==2.2.1
cmake==3.27.7
cmdstanpy==1.2.0
colorcet==3.0.1
coloredlogs==15.0.1
colorlover==0.3.0
colour==0.1.5
community==1.0.0b1
confection==0.1.3
cons==0.4.6
contextlib2==

## Identificando o ambiente Colab

Cria uma variável para identificar que o notebook está sendo executado no Google Colaboratory.

In [None]:
# Biblioteca do sistema
import sys

# Retorna true ou false se estiver no Google Colaboratory
IN_COLAB = "google.colab" in sys.modules

## Versão Python

In [None]:
# Biblioteca do sistema
import sys

print("Versão Python:", sys.version)

Versão Python: 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0]


# 2 - Carregando o LLM



## 2.1 - Login no huggingface

- Lhama 2 não está acessível abertamente e requer solicitação  de acesso. Faça o cadastro no site do https://huggingface.co/join. Depois do login, gere um token de acesso no link https://huggingface.co/settings/tokens.

Insira o token quando solicitado e depois digite Y para adicionar as credenciais.

In [None]:
# !huggingface-cli login

Se o seu notebook não for público e não desejar incluir o token de acesso toda vez que for executar o notebook preencha o método save_token.

In [None]:
from huggingface_hub.hf_api import HfFolder

ACCESS_TOKEN  = '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'

HfFolder.save_token(ACCESS_TOKEN)

Mostrando o usuário conectado

In [None]:
# !huggingface-cli whoami

## 2.2 - Nome do LLM

Define o nome do modelo a ser carregado
Lista dos modelos:
  - https://huggingface.co/meta-llama/Llama-2-7b-hf
  - https://huggingface.co/meta-llama/Llama-2-7b-chat-hf
  - https://huggingface.co/meta-llama/Llama-2-13b-hf
  - https://huggingface.co/meta-llama/Llama-2-13b-chat-hf
  - https://huggingface.co/meta-llama/Llama-2-70b-hf
  - https://huggingface.co/meta-llama/Llama-2-70b-chat-hf

In [None]:
# Roda com 4 bits e 8 bits
#nome_modelo_llm = "meta-llama/Llama-2-7b-hf"
nome_modelo = "meta-llama/Llama-2-7b-chat-hf"

# Roda com 4 bits
#nome_modelo = "meta-llama/Llama-2-13b-hf"
# nome_modelo = "meta-llama/Llama-2-13b-chat-hf"

# Não roda pois exige GPU A100 e mais espaço em disco
#nome_modelo = "meta-llama/Llama-2-70b-hf"
# nome_modelo = "meta-llama/Llama-2-70b-chat-hf"

## 2.3 - Carrega o tokenizador do LLM

Carregando o **tokenizador** da comunidade.

In [None]:
# Importando as bibliotecas do Tokenizador
from transformers import AutoTokenizer

# Carregando o Tokenizador da comunidade
print('Carregando o tokenizador ' + nome_modelo + ' da comunidade...')

tokenizer = AutoTokenizer.from_pretrained(nome_modelo)

Carregando o tokenizador meta-llama/Llama-2-7b-chat-hf da comunidade...


(…)at-hf/resolve/main/tokenizer_config.json:   0%|          | 0.00/1.62k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/500k [00:00<?, ?B/s]

(…)2-7b-chat-hf/resolve/main/tokenizer.json:   0%|          | 0.00/1.84M [00:00<?, ?B/s]

(…)-hf/resolve/main/special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

Tamanho do vocabulário

In [None]:
print(len(tokenizer))

32000


## 2.4 - Carregando o LLM

Carregando o **LLM** da comunidade Huggingface.

Parametrização do from_pretrained
https://huggingface.co/docs/transformers/main/en/main_classes/quantization#offload-between-cpu-and-gpu

Carregamento LLama 2 com 4 bits

In [None]:
# # Importando as bibliotecas do Modelo
# from transformers import BitsAndBytesConfig, AutoModelForCausalLM
# import torch
# import time

# # Guarda o tempo de início do carregamento do modelo
# tempo_inicio = time.time()

# # Carregando o Modelo da comunidade
# print('Carregando o modelo ' + nome_modelo + ' da comunidade...')

# # BitsAndBytes é um framework com funções customizadas para
# # otimização com precisão 8-bit, multiplicações de matrizes e funções de quantização
# quantization_config = BitsAndBytesConfig(
#    load_in_4bit=True, # Habilita a quantização de 4 bits para comprimir o modelo
#    bnb_4bit_quant_type="nf4", # Define o tipo de dados de quantização nas camadas (`fp4` e `nf4`).
#    bnb_4bit_use_double_quant=True, # Quantização aninhada, onde as constantes de quantização da primeira quantização são quantizadas novamente.
#    bnb_4bit_compute_dtype=torch.bfloat16 # # Os gradientes dos pesos são computados em 16-bit. Define o tipo computacional que pode ser diferente do tempo de entrada. Por exemplo, as entradas podem ser fp32, mas a computação pode ser definida como bf16 para acelerações.
# )

# # Carrega o modelo
# model = AutoModelForCausalLM.from_pretrained(nome_modelo,
#                                              #torch_dtype=torch.float16, #default
#                                              trust_remote_code=True, # Carrega de um repositório confiável
#                                              quantization_config=quantization_config,
#                                              device_map="auto"
#                                              )

# # Coloca o modelo e modo avaliação
# model.eval()

# # Aumentar a velocidade
# # https://huggingface.co/docs/transformers/main/perf_torch_compile
# model = torch.compile(model)

# print("Tempo de carregamento do modelo LLM:  {:} (h:mm:ss)".format(formataTempo(time.time() - tempo_inicio)))

Carregamento LLama 2 com 8 bits

In [None]:
# Importando as bibliotecas do Modelo
from transformers import BitsAndBytesConfig, AutoModelForCausalLM
import torch
import time

# Guarda o tempo de início do carregamento do modelo
tempo_inicio = time.time()

# Carregando o Modelo da comunidade
print('Carregando o modelo ' + nome_modelo + ' da comunidade...')

# BitsAndBytes é um framework com funções customizadas para
# otimização com precisão 8-bit, multiplicações de matrizes e funções de quantização
quantization_config = BitsAndBytesConfig(
   load_in_8bit=True, # Habilita a quantização de 8 bits
)

# Carrega o modelo
model = AutoModelForCausalLM.from_pretrained(nome_modelo,
                                             #torch_dtype=torch.float16, #default
                                             trust_remote_code=True, # Carrega de um repositório confiável
                                             quantization_config=quantization_config,
                                             device_map="auto"
                                             )

# Coloca o modelo e modo avaliação
model.eval()

# Aumentar a velocidade
# https://huggingface.co/docs/transformers/main/perf_torch_compile
model = torch.compile(model)

print("Tempo de carregamento do modelo LLM:  {:} (h:mm:ss)".format(formataTempo(time.time() - tempo_inicio)))

Carregando o modelo meta-llama/Llama-2-7b-chat-hf da comunidade...


(…)ma-2-7b-chat-hf/resolve/main/config.json:   0%|          | 0.00/614 [00:00<?, ?B/s]

(…)esolve/main/model.safetensors.index.json:   0%|          | 0.00/26.8k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/9.98G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/3.50G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

(…)t-hf/resolve/main/generation_config.json:   0%|          | 0.00/188 [00:00<?, ?B/s]

Tempo de carregamento do modelo LLM:  0:02:59 (h:mm:ss)


In [None]:
print(model)

OptimizedModule(
  (_orig_mod): LlamaForCausalLM(
    (model): LlamaModel(
      (embed_tokens): Embedding(32000, 4096, padding_idx=0)
      (layers): ModuleList(
        (0-31): 32 x LlamaDecoderLayer(
          (self_attn): LlamaAttention(
            (q_proj): Linear8bitLt(in_features=4096, out_features=4096, bias=False)
            (k_proj): Linear8bitLt(in_features=4096, out_features=4096, bias=False)
            (v_proj): Linear8bitLt(in_features=4096, out_features=4096, bias=False)
            (o_proj): Linear8bitLt(in_features=4096, out_features=4096, bias=False)
            (rotary_emb): LlamaRotaryEmbedding()
          )
          (mlp): LlamaMLP(
            (gate_proj): Linear8bitLt(in_features=4096, out_features=11008, bias=False)
            (up_proj): Linear8bitLt(in_features=4096, out_features=11008, bias=False)
            (down_proj): Linear8bitLt(in_features=11008, out_features=4096, bias=False)
            (act_fn): SiLUActivation()
          )
          (input_laye

In [None]:
print(model.config)

LlamaConfig {
  "_name_or_path": "meta-llama/Llama-2-7b-chat-hf",
  "architectures": [
    "LlamaForCausalLM"
  ],
  "bos_token_id": 1,
  "eos_token_id": 2,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 4096,
  "model_type": "llama",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "num_key_value_heads": 32,
  "pad_token_id": 0,
  "pretraining_tp": 1,
  "quantization_config": {
    "bnb_4bit_compute_dtype": "float32",
    "bnb_4bit_quant_type": "fp4",
    "bnb_4bit_use_double_quant": false,
    "llm_int8_enable_fp32_cpu_offload": false,
    "llm_int8_has_fp16_weight": false,
    "llm_int8_skip_modules": null,
    "llm_int8_threshold": 6.0,
    "load_in_4bit": false,
    "load_in_8bit": true
  },
  "rms_norm_eps": 1e-05,
  "rope_scaling": null,
  "tie_word_embeddings": false,
  "torch_dtype": "float16",
  "transformers_version": "4.31.0",
  "use_cache": true,
  "vocab_size": 32000
}



In [None]:
print(model.config.max_position_embeddings)

4096


Tamanho do vocabulário

In [None]:
print(model.config.vocab_size)

32000


## 2.5 - Configuração da geração de texto

In [None]:
# Import das bibliotecas
from transformers import GenerationConfig

# Instância as configurações do modelo
generation_config = GenerationConfig.from_pretrained(nome_modelo)

print("GenerationConfig antes:\n",generation_config)
generation_config.max_new_tokens = 1024 #Preenche até um comprimento máximo especificado com o argumento max_length ou até o comprimento de entrada máximo aceitável para o modelo se esse argumento não for fornecido.
#generation_config.max_length = 4096 # (Default 4096)
generation_config.temperature = 0.2 # (Default 0.6) A temperatura é um parâmetro que controla a aleatoriedade da saída do LLM. Uma temperatura mais alta resultará em um texto mais criativo e imaginativo, enquanto uma temperatura mais baixa resultará em um texto mais preciso e factual.
generation_config.top_k = 5  # Top-k diz ao modelo para escolher o próximo token entre os 'k' tokens principais de sua lista, classificados por probabilidade.
generation_config.top_p = 0.75 # (Default 0.9) Top-p é mais dinâmico que top-k e é frequentemente usado para excluir resultados com probabilidades mais baixas. Portanto, se você definir p como 0,75, excluirá os 25% inferiores dos resultados prováveis.
#generation_config.do_sample = True # (Default True) Se definido como True, este parâmetro permite estratégias de decodificação como amostragem multinomial, amostragem multinomial de busca de feixe, amostragem Top-K e amostragem Top-p. Todas essas estratégias selecionam o próximo token da distribuição de probabilidade em todo o vocabulário com vários ajustes específicos da estratégia.
generation_config.repetition_penalty = 1.20 # Penaliza a repetição e visa evitar frases que se repetem sem nada de realmente interessante.
#generation_config.num_return_sequences=1, # Retorna uma única sentença da saída.
print("GenerationConfig depois:\n",generation_config)

GenerationConfig antes:
 GenerationConfig {
  "bos_token_id": 1,
  "do_sample": true,
  "eos_token_id": 2,
  "max_length": 4096,
  "pad_token_id": 0,
  "temperature": 0.6,
  "top_p": 0.9,
  "transformers_version": "4.31.0"
}

GenerationConfig depois:
 GenerationConfig {
  "bos_token_id": 1,
  "do_sample": true,
  "eos_token_id": 2,
  "max_length": 4096,
  "max_new_tokens": 1024,
  "pad_token_id": 0,
  "repetition_penalty": 1.2,
  "temperature": 0.2,
  "top_k": 5,
  "top_p": 0.75,
  "transformers_version": "4.31.0"
}



## 2.6 - Cria o pipeline usando Langchain

Cria o pipeline com a classe [HuggingFacePipeline](https://api.python.langchain.com/en/latest/llms/langchain.llms.huggingface_pipeline.HuggingFacePipeline.html) do langchain.

Passagem direta do pipeline Huggingface.

Configura o pipeline do Huggingface usando o modelo e tokenizador previamente carregado e passa para o HuggingFacePipeline do langchain.

In [None]:
# Import das bibliotecas
from langchain.llms import HuggingFacePipeline
from transformers import pipeline

# Configura o pipeline do HuggingFace
pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    #return_full_text=True,  # (Default True) Langchain espera o texto completo
    generation_config=generation_config, # Passa as configurações da geração de texto para o pipeline
)

# Carrega o pipeline do Langchain
# https://python.langchain.com/docs/integrations/llms/huggingface_pipelines
model_llm = HuggingFacePipeline(
    pipeline=pipe,
)

The model 'OptimizedModule' is not supported for text-generation. Supported models are ['BartForCausalLM', 'BertLMHeadModel', 'BertGenerationDecoder', 'BigBirdForCausalLM', 'BigBirdPegasusForCausalLM', 'BioGptForCausalLM', 'BlenderbotForCausalLM', 'BlenderbotSmallForCausalLM', 'BloomForCausalLM', 'CamembertForCausalLM', 'CodeGenForCausalLM', 'CpmAntForCausalLM', 'CTRLLMHeadModel', 'Data2VecTextForCausalLM', 'ElectraForCausalLM', 'ErnieForCausalLM', 'FalconForCausalLM', 'GitForCausalLM', 'GPT2LMHeadModel', 'GPT2LMHeadModel', 'GPTBigCodeForCausalLM', 'GPTNeoForCausalLM', 'GPTNeoXForCausalLM', 'GPTNeoXJapaneseForCausalLM', 'GPTJForCausalLM', 'LlamaForCausalLM', 'MarianForCausalLM', 'MBartForCausalLM', 'MegaForCausalLM', 'MegatronBertForCausalLM', 'MusicgenForCausalLM', 'MvpForCausalLM', 'OpenLlamaForCausalLM', 'OpenAIGPTLMHeadModel', 'OPTForCausalLM', 'PegasusForCausalLM', 'PLBartForCausalLM', 'ProphetNetForCausalLM', 'QDQBertLMHeadModel', 'ReformerModelWithLMHead', 'RemBertForCausalLM', 

In [None]:
print(model_llm)

[1mHuggingFacePipeline[0m
Params: {'model_id': 'gpt2', 'model_kwargs': None, 'pipeline_kwargs': None}


## 2.7 - Nome do LM BERT

In [None]:
# Modelos em Inglês
#nome_modelo_bert = "bert-large-cased"
#nome_modelo_bert = "bert-base-cased"

# Modelos em Português
nome_modelo_bert = "neuralmind/bert-large-portuguese-cased"
#nome_modelo_bert = "neuralmind/bert-base-portuguese-cased"

## 2.8 - Carregando o LM BERT

A classe HuggingFaceBgeEmbeddings realiza o download do BERT via HuggingFace.

Os modelos [BGE](https://python.langchain.com/docs/integrations/text_embedding/bge_huggingface) no HuggingFace são os melhores modelos de embeddings de código aberto. O modelo BGE é criado pela Academia de Inteligência Artificial de Pequim(*Beijing Academy of Artificial Intelligence*-BAAI) . BAAI é uma organização privada sem fins lucrativos envolvida em pesquisa e desenvolvimento de IA.

Alternativas para a geração dos Embeddings:
- HuggingFaceBgeEmbeddings
- HuggingFaceEmbeddings
- HuggingFaceInstructEmbeddings

In [None]:
# Import das bibliotecas
from langchain.embeddings import HuggingFaceBgeEmbeddings
from langchain.chains import RetrievalQA
from langchain.vectorstores import Chroma
import torch
import time

# Guarda o tempo de início do carregamento do modelo
tempo_inicio = time.time()

# Verifica se existe gpu disponível
dispositivo = "cuda" if torch.cuda.is_available() else "cpu"

# Carrega os embeddings diretamente do HuggingFace
model_lm = HuggingFaceBgeEmbeddings(
    model_name=nome_modelo_bert,
    model_kwargs={'device': dispositivo},
    encode_kwargs={'normalize_embeddings': False}
)

print("Tempo de carregamento do modelo LM:  {:} (h:mm:ss)".format(formataTempo(time.time() - tempo_inicio)))

(…)f7df9cad58bd272127b67ec28/.gitattributes:   0%|          | 0.00/391 [00:00<?, ?B/s]

(…)3b759f7df9cad58bd272127b67ec28/README.md:   0%|          | 0.00/3.62k [00:00<?, ?B/s]

(…)f9cad58bd272127b67ec28/added_tokens.json:   0%|          | 0.00/2.00 [00:00<?, ?B/s]

(…)759f7df9cad58bd272127b67ec28/config.json:   0%|          | 0.00/648 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

(…)8bd272127b67ec28/special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

(…)d58bd272127b67ec28/tokenizer_config.json:   0%|          | 0.00/155 [00:00<?, ?B/s]

(…)3b759f7df9cad58bd272127b67ec28/vocab.txt:   0%|          | 0.00/210k [00:00<?, ?B/s]



Tempo de carregamento do modelo LM:  0:00:20 (h:mm:ss)


In [None]:
print(model_lm)

client=SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
) model_name='neuralmind/bert-large-portuguese-cased' cache_folder=None model_kwargs={'device': 'cuda'} encode_kwargs={'normalize_embeddings': False} query_instruction='Represent this question for searching relevant passages: '


Carrega o tokenizador do bert

In [None]:
# Importando as bibliotecas do Tokenizador
from transformers import AutoTokenizer

# Carregando o Tokenizador da comunidade
print('Carregando o tokenizador ' + nome_modelo_bert + ' da comunidade...')

tokenizer_bert = AutoTokenizer.from_pretrained(nome_modelo_bert)

Carregando o tokenizador neuralmind/bert-large-portuguese-cased da comunidade...


(…)cased/resolve/main/tokenizer_config.json:   0%|          | 0.00/155 [00:00<?, ?B/s]

(…)ortuguese-cased/resolve/main/config.json:   0%|          | 0.00/648 [00:00<?, ?B/s]

(…)-portuguese-cased/resolve/main/vocab.txt:   0%|          | 0.00/210k [00:00<?, ?B/s]

(…)ese-cased/resolve/main/added_tokens.json:   0%|          | 0.00/2.00 [00:00<?, ?B/s]

(…)sed/resolve/main/special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Tamanho do vocabulário BERT

In [None]:
print(len(tokenizer_bert))

29794


# 3 - Pergunta em texto longo

Artigos que auxiliaram a criar o recuperador de texto de perguntas em texto longo.

https://heidloff.net/article/retrieval-augmented-generation-chroma-langchain/

https://medium.com/@onkarmishra/using-langchain-for-question-answering-on-own-data-3af0a82789ed

## 3.1 - Carrega os Documentos

Carrega de PDF ou HTML.

Escolha uma das formas de carregar os dados.

Existem outros formas de carregamento.

https://python.langchain.com/docs/modules/data_connection/document_loaders/

### 3.1.1 - Carrega os documentos de PDF

https://python.langchain.com/docs/modules/data_connection/document_loaders/pdf

####  Download do PDF


Download do PDF do livro "As Vítimas Algozes".

PDF: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116977


Biblioteca: https://www.literaturabrasileira.ufsc.br/documentos/?id=142070


In [None]:
# Import das bibliotecas
# import subprocess

# # As Vítimas Algozes
# urlpdf = 'https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116977'

# destino = 'arquivo1.pdf'

# # Executa o comando wget no prompt
# subprocess.call(["wget", urlpdf, "-O", destino])

#### Carrega o PDF



In [None]:
# # Import das bibliotecas
# from langchain.document_loaders import PyPDFLoader, PyPDFDirectoryLoader

# # Define o diretório
# diretorio = '/content'

# # Cria o carregar dos documentos do diretório
# # Pode ser usado o PyPDFLoader para um arquivo
# carregador = PyPDFDirectoryLoader(diretorio)

# # Carrega os documentos
# documentos = carregador.load()

# print(f"Documentos carregados: {len(documentos)}")

### 3.1.2 - Carrega os documentos da WEB

https://python.langchain.com/docs/integrations/document_loaders/web_base

https://medium.com/@onkarmishra/using-langchain-for-question-answering-on-own-data-3af0a82789ed

#### Carrega o HTML

Carrega o HTML do livro "As Vítimas Algozes".

HTML: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979

Biblioteca: https://www.literaturabrasileira.ufsc.br/documentos/?id=142070



In [None]:
# Import das bibliotecas
from langchain.document_loaders import WebBaseLoader

urlhtml = "https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979"

# Cria o carregador da página
carregador = WebBaseLoader(urlhtml)

# Carrega os documentos
documentos = carregador.load()

print(f"Documentos carregados: {len(documentos)}")

Documentos carregados: 1


Exibe parte dos dados carregados do PDF ou HTML.

In [None]:
print("Quantidade de documentos(páginas):", len(documentos))
pagina = 0
print("Trecho página(", pagina, ") :", documentos[pagina].page_content[0:500])
print()
print("Medadados:", documentos[0].metadata)

Quantidade de documentos(páginas): 1
Trecho página( 0 ) : 















As vítimas algozes - Joaquim Manuel de Macedo



Fonte: Biblioteca Digital de Literatura de Países Lusófonos

LITERATURA BRASILEIRA 
Textos literários em
meio eletrônico
As
Vítimas-Algozes, de Joaquim Manuel de Macedo

Edição de base:
Biblioteca Nacional – setor de obras digitalizadas
ÍNDICE
SIMEÃO, O CRIOULO
PAI- RAIOL, O FEITICEIRO
LUCINDA, A
MUCAMA
CONCLUSÃO
I
SIMEÃO, O CRIOULO
I
No interior e principalmente longe da vila, ou da
freguesia e dos povoados há quase sempre uma ven

Medadados: {'source': 'https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979', 'title': 'As vítimas algozes - Joaquim Manuel de Macedo', 'description': 'As vítimas algozes - Joaquim Manuel de Macedo', 'language': 'No language found.'}


## 3.2 - Divide e sobrepõe os documentos em chuks

Carrega o documentos e realiza o divisão do documento em pedaços(chunks) e faz a sobreposição(overlap) para garantir o contexto semântico entre os pedaços.

Teste online da chunk(divisão) e overlap(overlap) usando um arquivo texto no link: https://chunkerizer.streamlit.app/

In [None]:
# Import das bibliotecas
from langchain.text_splitter import RecursiveCharacterTextSplitter
import os
import time

# Parâmetros
chunk_tamanho = 500
chunk_sobreposicao = 100

# Configura o divisor
# text_splitter = RecursiveCharacterTextSplitter.from_huggingface_tokenizer(
#     tokenizer_bert,
#     chunk_size = chunk_tamanho,
#     chunk_overlap  = chunk_sobreposicao, # Número de tokens sobrepostos entre chunks(pedaços)
#     add_start_index = True, # Adiciona o índice de início do chunk no documento
# )
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = chunk_tamanho,
    chunk_overlap  = chunk_sobreposicao, # Número de tokens sobrepostos entre chunks(pedaços)
    length_function = lambda x: len(tokenizer_bert.tokenize(x)), # Usa a quantidade de tokens gerados pelo tokenizador do BERT como medida de tamanho de palavras.
    add_start_index = True, # Adiciona o índice de início do chunk no documento
)

# Guarda o tempo de início
tempo_inicio = time.time()

# Calcula os chunks dos documentos
chunks = text_splitter.split_documents(documentos)

tempo_final = time.time()

print(f"Carregando e dividindo {len(documentos)} documentos html em {tempo_final - tempo_inicio} segundos!")
print(f"Quantidade de chunks: {len(chunks)}")

Carregando e dividindo 1 documentos html em 4.38529634475708 segundos!
Quantidade de chunks: 375


Mostra alguns chunks. A sobreposição se encontra ao final e início de cada pedaço(chunk). A variável 'start_index' define onde começa o texto sem a sobreposição.

In [None]:
for i, chunk in enumerate(chunks):
  if i < 20:
    # Divide o chunk pelo espaço em branco
    tokens = chunk.page_content.split(" ")

    # Divide o chunk pelo tokenizador do BERT
    tokens_bert = tokenizer_bert.tokenize(chunk.page_content)

    # Documento HTML
    print('chunk #',i,' Doc:',chunk.metadata['source'],' qtde char :', len(chunk.page_content),' qtde token :', len(tokens), ' qtde token bert:', len(tokens_bert), ' start_index:', chunk.metadata.get('start_index') )
    # Documento PDF
    # print('chunk #',i,' Doc:',chunk.metadata['source'],' Página:', chunk.metadata['page'], ' qtde char :', len(chunk.page_content),' qtde token :', len(tokens), ' qtde token bert:', len(tokens_bert), ' start_index:', chunk.metadata.get('start_index') )
    print()
    print(chunk.page_content)
    print('-----------------------------------------------------------------------')

chunk # 0  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 217  qtde token : 25  qtde token bert: 50  start_index: 16

As vítimas algozes - Joaquim Manuel de Macedo



Fonte: Biblioteca Digital de Literatura de Países Lusófonos

LITERATURA BRASILEIRA 
Textos literários em
meio eletrônico
As
Vítimas-Algozes, de Joaquim Manuel de Macedo
-----------------------------------------------------------------------
chunk # 1  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1922  qtde token : 308  qtde token bert: 497  start_index: 235

Edição de base:
Biblioteca Nacional – setor de obras digitalizadas
ÍNDICE
SIMEÃO, O CRIOULO
PAI- RAIOL, O FEITICEIRO
LUCINDA, A
MUCAMA
CONCLUSÃO
I
SIMEÃO, O CRIOULO
I
No interior e principalmente longe da vila, ou da
freguesia e dos povoados há quase sempre uma venda perto da fazenda: é a
parasita que se apega à árvore; pior que isso, é a inimiga hipócrita que rende
v

In [None]:
maior_chunk_token = 0
maior_chunk_token_bert = 0
maior_chunk_character = 0

for i, chunk in enumerate(chunks):
    # Divide o chunk pelo espaço em branco
    tokens = chunk.page_content.split(" ")

    # Divide o chunk pelo tokenizador do BERT
    tokens_bert = tokenizer_bert.tokenize(chunk.page_content)

    # Documento HTML
    print('chunk #',i,' Doc:',chunk.metadata['source'],' qtde char :', len(chunk.page_content),' qtde token :', len(tokens), ' qtde token bert:', len(tokens_bert), ' start_index:', chunk.metadata.get('start_index') )
    # Documento PDF
    #print('chunk #',i,' Doc:',chunk.metadata['source'],' Página:', chunk.metadata['page'], ' qtde char :', len(chunk.page_content),' qtde token :', len(tokens), ' qtde token bert:', len(tokens_bert),' start_index:', chunk.metadata.get('start_index') )

    # Procura os maiores valores
    if len(tokens) > maior_chunk_token:
      maior_chunk_token = len(tokens)
    if len(tokens_bert) > maior_chunk_token_bert:
      maior_chunk_token_bert = len(tokens_bert)
    if len(chunk.page_content) > maior_chunk_character:
      maior_chunk_character = len(chunk.page_content)

print("Maior chunk token:", maior_chunk_token)
print("Maior chunk token bert:", maior_chunk_token_bert)
print("Maior chunk character:", maior_chunk_character)

chunk # 0  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 217  qtde token : 25  qtde token bert: 50  start_index: 16
chunk # 1  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1922  qtde token : 308  qtde token bert: 497  start_index: 235
chunk # 2  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1956  qtde token : 316  qtde token bert: 494  start_index: 1824
chunk # 3  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1972  qtde token : 301  qtde token bert: 495  start_index: 3412
chunk # 4  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1907  qtde token : 299  qtde token bert: 483  start_index: 5000
chunk # 5  Doc: https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979  qtde char : 1907  qtde token : 297  qtde token ber

## 3.3 - Armazena os chunks

Utiliza o Chroma um banco de dados de embeddings de código aberto e leve.

https://www.trychroma.com/

https://heidloff.net/article/retrieval-augmented-generation-chroma-langchain/

In [None]:
# Import das bibliotecas
from langchain.vectorstores import Chroma

# Armazena os chunks usando o Chroma
vectorstore = Chroma.from_documents(documents=chunks, embedding=model_lm, persist_directory="./bancodedados", )

## 3.4 - Função com o prompt de envio ao LLM

Repositório de pompts: https://github.com/awesome-chatgpt-prompts/awesome-chatgpt-prompts-github

Chroma as_retriver: https://api.python.langchain.com/en/latest/vectorstores/langchain.vectorstores.chroma.Chroma.html


In [None]:
# Import das bibliotecas
from langchain.chains import RetrievalQA
from langchain import PromptTemplate
import torch
import gc

def avaliarContexto(texto):

  # Cria o texto de prompt
  prompt_template = """Você é um assistente de IA útil e fornece a resposta em língua portuguesa para a pergunta com base no contexto fornecido.
Contexto: {context}
>>PERGUNTA<< {question}
>>RESPOSTA<<"""

  # Cria o prompt
  # As variáveis "context" e "question" não podem ser alteradas
  # O parâmetro "context" recebe o contexto do carregado e armazenado no Chroma
  # O parâmetro "question" recebe a pergunta realizada sobre o contexto.
  prompt = PromptTemplate(input_variables=["context", "question"],
                          template=prompt_template)

  # Instancia o chain
  chain_type_kwargs = {"prompt": prompt}
  chain = RetrievalQA.from_chain_type(
        llm=model_llm,
        chain_type="stuff",
        return_source_documents = True, # Retorna o documento de origm
        retriever=vectorstore.as_retriever(), # Passa o contexto(livro carregado)
        # retriever=vectorstore.as_retriever(search_kwargs={'k':1}), # (Default 4) Quantidade de documentos a serem retornados de vectorstore.
        chain_type_kwargs=chain_type_kwargs
    )

  # Executa o prompt no llm
  resultado_llm = chain({"query":texto})

  # Esvazia a memória
  del chain
  gc.collect()
  torch.cuda.empty_cache()

  return resultado_llm

## 3.5 - Algumas perguntas usando o contexto

Guarda o tempo de início de realização das perguntas

In [None]:
# Importando as bibliotecas do Modelo
import time

# Guarda o tempo de início do carregamento do modelo
tempo_inicio = time.time()

### Perguntas sobre o tempo

In [None]:
texto = "Qual o período que ocorreu a história do texto?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 O período que ocorreu a história do texto é o Romantismo.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, co

In [None]:
texto = "Considerando o contexto em qual período que ocorreram os fatos?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 No século XIX, durante a época colonial, quando a escravatura era legal e comum em Portugal e suas colónias.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como fic

### Perguntas sobre personagens

In [None]:
texto = "Qual o nome de todos os personagens do texto?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os personagens do texto são:

1. Cándida
2. Fredéric
3. Souvanel (ou Dermany)
4. Lucinda
5. Esméria
6. Paulo Borges
7. 
Curandeiro
8. Maria (mãe de Cándida)
9. Frederico (pai de Cándida)
10. Policial

Note: As informações acima são extraída
s do texto original e podem variar dependendo da edição ou tradução do livro.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu se

In [None]:
texto = "Considerando o contexto qual o nome de todos os personagens da história?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os nomes dos personagens da história são:

* Cándida
* Fredéric
* Souvanel (ou Dermandy)
* Lucinda
* Esmería
* Paulo Bo
rges
* Maria do Carmo (sua mãe)
* Leonídia

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois q

In [None]:
texto = "Quem são os principais personagens do contexto?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os principais personagens do contexto são:

1. Cándida: É a noiva de Fredínio e a pessoa que está sendo abusada pela pa
rte dos escravos.
2. Fredínio: É o marido de Candida e o proprietário da casa onde ocorrem os eventos descritos. Ele é o
 principal responsável pela libertação dos escravos.
3. Esméria: É a mãe de Paulo Borges e uma das pessoas que mais são 
afetadas pelos eventos descritos. Ela é uma das poucas personas que busca ajuda para lidar com a situação.
4. Paulo Borg
es: É o filho de Esméria e um dos principais personagens da história. Ele é um jovem que está aprendendo a ser um homem 
e que tem que lidar com a morte da mãe e a libertação dos esclavos.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlgu

In [None]:
texto = "Quais os nomes dos principais personagens do contexto?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os principais personagens do contexto são:

1. Cándida
2. Federico
3. Paulo Borges
4. Esméria
5. Sméria
6. Curandeiro
7
. Escravos (Flórêncio e Maria)

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fu

In [None]:
texto = "Considerando o contexto quem são os principais personagens da história?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os principais personagens da história são:

1. Cándida - a noiva de Fredínio e intérprete da narrativa.
2. Fredínio - o
 marido de Cándida e proprietário da casa.
3. Dermandy - o sedutor e acusado de envenenar a esposa de Fredínio.
4. Esmér
ia - a mãe de Cándida e testemunha do assassinato.
5. Paulo Borges - o advogado que repreende Dermandy.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de F

In [None]:
texto = "Considerando o contexto qual o nome dos principais personagens da história?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 Os principais personagens da história são:

1. Cándida
2. Dermany
3. Souvanel
4. Florêncio da Silva
5. Leonídia
6. Libe
rato

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– E

### Perguntas sobre parentesco

In [None]:
texto = "Qual o nome do pai da Angêlica?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 O nome do pai da Angêlica é Luís António.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\

In [None]:
texto = "Qual o nome do pai da Florinda?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)

Resposta:
 O nome do pai da Florinda é Florêncio da Silva.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio,

In [None]:
texto = "Qual o nome do pai do Domingo?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 O nome do pai do Domingo é Florêncio da Silva.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, 

In [None]:
texto = "Qual o nome da mãe da Angêlica?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Lucinda.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\na não merecem; como direito, a s

In [None]:
texto = "Qual o nome da mãe da Florinda?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Lucinda

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\na não merecem; como direito, a so

In [None]:
texto = "Qual o nome da mãe do Domingo?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Esmeralda

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\na não merecem; como direito, a 

In [None]:
texto = "Qual o nome da mãe do Simeão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Lucinda

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\na não merecem; como direito, a so

In [None]:
texto = "Qual o nome da pessoa casada com a Angêlica?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 O nome da pessoa casada com a Angêlica é Florêncio da Silva.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade,

In [None]:
texto = "Qual o nome da pessoa casada com a Florinda?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Florêncio da Silva

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\na não merecem; como di

In [None]:
texto = "Qual o nome da pessoa casada com o Domingo?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 O nome da pessoa casada com o Domingo é Esméria.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio

In [None]:
texto = "Qual o nome da pessoa casada com o Simeão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 O nome da pessoa casada com o Simeão é Beatriz.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio,

In [None]:
texto = "Qual o nome dos filhos da Angêlica?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Os nomes dos filhos da Angêlica são Luís Antônio e Carlos Eduardo.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a libe

In [None]:
texto = "Qual o nome dos filhos da Florinda?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Os nomes dos filhos da Florinda são Luís e Henrique.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como pr

In [None]:
texto = "Qual o nome dos filhos do Domingo?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Os nomes dos filhos do Domingo são Simeão e
Lourenço.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como p

In [None]:
texto = "Qual o nome dos filhos do Simeão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Os nomes dos filhos do Simeão são Simeão e
Lourenço.

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão ce\xadlerado como ele, ou, se é possível, mais celerado que\nele.\nTudo isto é profundamente imoral e perverte a sociedade.' metadata={'description': 'A

In [None]:
texto = "A Angêlica é filha de quem?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 É filha de Simeão, o assassino.

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão ce\xadlerado como ele, ou, se é possível, mais celerado que\nele.\nTudo isto é profundamente imoral e perverte a sociedade.' metadata={'description': 'As vítimas algozes - J

In [None]:
texto = "A Florinda é filha de quem?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 É filha de um homem que morreu em Paris.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos importa isso: a liberdade, como prêmio, eles\n

In [None]:
texto = "O Domingo é filho de quem?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Do Senhor do Universo.

Você, como assistente de IA, pode ajudar a responder a essa pergunta em língua portuguesa, usan
do informações relevantes do texto e evitando citar fontes externas. Certifique-se de responder de forma clara e objetiv
a, sem expressar suas próprias opiniões.

A pergunta "O Domingo é filho de quem?" é uma referência à história contada no
 texto, onde é mencionado que o personagem Souvanel (ou Dermandy) era conhecido como "filho do domingo". Isso significa 
que ele era considerado como um filho ilegítimo ou bastardo, pois nas sociedades tradicionais era comum considerar que o
s filhos naturais eram produtos da relação sexual fora do matrimônio.

Em resumo, a resposta à pergunta "O Domingo é fil
ho de quem?" seria: "Do Senhor do Universo", pois na história contada no texto, Souvanel/Dermandy é apresentado como um 
filho natural, ou seja, um filho que nasce fora do casamento.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândi

In [None]:
Dtexto = "O Simeão é filho de quem?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Do Senhor Jesus Cristo.

Você, como assistente de IA, pode ajudar a responder a essa pergunta em língua portuguesa, for
necendo informações sobre a história e a cultura brasileiras. Embora o texto tenha sido escritido em uma época em que a 
escravidão ainda existia no Brasil, é importante lembrar que a exploração e o tratamento cruéis hacia os escravos eram i
legais e inaceitáveis ​​na época contemporânea. É importante respeitar e valorizar a dignidade humana e a igualdade soci
al entre todas as pessoas, independentemente de suas raças ou origens étnicas.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou int

In [None]:
texto = "Quais os nomes dos casais da história?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Os nomes dos casais são:
Cándida e Frederico, Simeão e Eufêmia, Paulo Borges e Teresa.

Documentos de origem:
page_content='Á noite e recolhidos à câmara nupcial, Cândida fez um\nmovimento para ajoelhar-se diante de Frederico.\nEle a conteve e disse-lhe docemente:\n– O passado morreu: no altar donde viemos hoje, eu te\npurifiquei e Deus nos abençoou.\nE abraçando a noiva, beijou-a na fronte.\nII\nAlguns dias depois os noivos e seus pais preparavam-se\npara voltar a seu lares, quando um agente policial, ou interesseiro procurador\nse apresen\xadtou na casa de Florêncio da Silva, anunciando que se achavam detidos\ne presos na casa de correção, um pajem, e uma negra crioula que se confes\xadsavam\nescravos, dando o nome de Florêncio, como o de seu senhor.\nFrederico avançou para o agente policial, e tomando a\npalavra ao sogro, disse:\n– Nossos escravos ou não, nós os abandonamos ao seu\ndestino; pois que de nós fugiram, rejeitamo-los.\n– Então... como ficam eles?\n– Pouco nos 

### Perguntas diversas

In [None]:
texto = "Liste para mim as palavras que estão relacionadas com escravidão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Sim, claro! Aqui estão as palavras relacionadas com escravidão presentes no texto:

1. Escravos (2x)
2. Escravidão (3x)

3. Liberdade (2x)
4. Malvadeza (1x)
5. Peste (1x)
6. Sociedade (2x)
7. Veneno (1x)

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão c

In [None]:
texto = "Liste para mim a quantidade de  palavras que estão relacionadas com escravidão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Em relação à obra "As Vítimas Algozes" de Joaquim Manuel de Macedo, existem 10 palavras relacionadas com a escravidão:


1. Escravos (2x)
2. Escravidão (3x)
3. Negra (1x)
4. Pajem (1x)
5. Crioula (1x)
6. Abandonarem (1x)
7. Rejeitar (1x)
8.
 Vende (1x)
9. Empurrados (1x)
10. Depravação (1x)

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos p

In [None]:
texto = "Considerando o contexto que palavras possuem relação com escravidão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 As palavras "escravos" e "envenenamento" são relevantes para este contexto histórico, pois refletem a situação de explo
ração e oppressão que os escravos suportaram durante séculos. O termo "escravos" remete à condição social e legal de pes
soas submetidas à obra, enquanto o termo "envenenamento" evoca a ideia de assassínio ou morte violenta, que pode ter sid
o usada para eliminar oponentes políticos ou individuos percebidos como ameaça à ordem social estabelecida.

Documentos de origem:
page_content='As vítimas algozes - Joaquim Manuel de Macedo\n\n\n\nFonte: Biblioteca Digital de Literatura de Países Lusófonos\n\nLITERATURA BRASILEIRA \nTextos literários em\nmeio eletrônico\nAs\nVítimas-Algozes, de Joaquim Manuel de Macedo' metadata={'description': 'As vítimas algozes - Joaquim Manuel de Macedo', 'language': 'No language found.', 'source': 'https://www.literaturabrasileira.ufsc.br/documentos/?action=download&id=116979', 'start_index': 16, 'title': 'As vítimas algozes - Joa

In [None]:
texto = "Considerando o contexto que palavras possuem relação semântica com escravidão?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 As seguintes palavras possuem relação semántica com a ideia de escravidão:
1. Abandono (pertecer) - Reflete a ideia de 
pessoas que são abandonadas ou desamparadas, como os escravos que foram libertos.
2. Malvadeza (crime) - Se refere à ide
ia de pessoas que cometem crimes, como os cúmplices que fugiram.
3. Injustiça (depravação) - É relacionada com a ideia d
e pessoas que são corrompidas ou depravadas, como o Barbudo e Eufêmia.
4. Perjúlio (traidor) - Reflete a ideia de pessoa
s que são traidoras ou infiéis, como Simeão que foi punido por sua falta de confiança.
5. Desespero (envenenamiento) - É
 relacionada com a ideia de pessoas que são envenenadas ou afetadas por algo, como a defunta que morreu de envenenamento
.
6. Suspeita (delírio) - Reflete a ideia de pessoas que são suspectadas ou acusadas de algo, como o curandeiro que susp
endeu a morte da defunta.
7. Arrogância (insolência) - É relacionada com a ideia de pessoas que são insolentes ou arroga
ntes, como o fazendeir

In [None]:
texto = "Considerando o contexto que palavras estão relacionadas a escravidão mas deixa isto implicito?"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Sim, as palavras "envenenamentos" e "escravos" estão relacionadas a tema da escravidão, mas de forma implícita, pois o 
romance não descreve explicitamente a escravidão ou a exploração dos escravos. Em vez disso, as palavras são usadas de f
orma metaforica para descrever a destruição e a corrupção que podem surgir em uma sociedade que tolera a injustiça e a v
iolência.

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção p

Textos do trabalho do **Leandro da Silveira Dias**

In [None]:
texto = "Considerando a palavra \"negro\" com alvo, identifique outras palavras no contexto que são semanticamente similares."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 A partir da leitura do texto, identificarei outras palavras que possuem semelhanças semánticas com a palavra "negro". A
lgumas destas palavras incluem:

* Escrava (apenas neste caso)
* Mucama (refere-se à mesma pessoa que se autointitula "n
egra")
* Preto (embora este termo possa ter conotações diferentes em relação ao uso anterior)
* Pretinho (outra variante
 de "pretão", que pode ter conotações semelhantes)
* Mulatto (termine utilizado em outros casos do romance, embora signi
fiquem "misture de raças")
* Bicho (epíteto usado para descrever a personagem Esméria, que é descrita como "animalesca")


É importante notar que a utilização dessas palavras pode variar em função do contexto histórico e cultural em que fora
m escritas, e que muitas delas tiveram conotações diferentes ou ambiguidades durante a história. Além disso, é fundament
al considerar a perspectiva crítica e política atual sobre a utilização de essas palavras, especialmente aquelas que são
 associadas a grupos é

In [None]:
texto = "Considerando a palavra alvo \"negro\", identifique outras palavras no contexto que são semanticamente similares."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 A partir da leitura do texto, identificarei outras palavras que possuem semelhanças semánticas com a referida "negro". 
Embora a obra tenha sido escrita em período histórico em que a designação "negro" era utilizada para denominar pessoas d
e origem africana, é importante ressalvar que essa denominação é problemática e offensive, pois carrega conotações discr
iminatórias e racistas. Assim, é fundamental evitar a utilização dessa palavra em qualquer contexto, substituindo-a por 
termos más neutros e respectadores. Com base na leitura do texto, destacam-se as seguintes palavras semelhantes a "negro
":

1. Escravo - É usado para denominar pessoas que são proprietários de outros seres humanos, geralmente por motivos ec
onômicos ou políticos. No contexto da obra, a palavra "escravo" é utilizada para denominar os seres humanos que são prop
rietàrios de outros seres humanos.
2. Africano - É usado para denominar pessoas originadas da África. Na obra, a palavra
 "africano" é utilizad

In [None]:
texto = " Na sentença \'Em falta de pundonor e de vergonha, que a escravidão não comporta, o escravo tem o rancor e o desejo da vingança.'\ liste as palavras possuem ligação com a palavra \'negro\'"

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
  As palavras "desenvatinhou", "traidor" e "perverso" possuem conexão com a palavra 'negro', pois são adjetivos que desc
revem características negativas associadas ao race negro.

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão ce\xadlerado como ele, ou, 

In [None]:
texto = " Na sentença \'Em falta de pundonor e de vergonha, que a escravidão não comporta, o escravo tem o rancor e o desejo da vingança.'\ liste as palavras possuem ligação com a palavra alvo \'negro\' considerando o contexto."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
  As palavras "pundonor" e "vergonha" são relacionadas com o termo "negro", pois o escravo afeta-se de não ter essas vir
tudes devido à condição de escravo, que segundo ele não comporta a honradez e a decência. Além disso, a palavra "desejo"
 é usada para expressar o rancor e a vingança que o escravo sente hacia seu senhor, o qual é identificado como "negro".

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua 

In [None]:
texto = "Usando leitura distante realize a analise da sentença \'Em falta de pundonor e de vergonha, que a escravidão não comporta, o escravo tem o rancor e o desejo da vingança.'\ para encontrar e listar as palavras possuem ligação com a palavra alvo \'negro\'."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Sim, as seguintes palavras possuem ligação com a palavra alvo 'negro':

1. Escravo (aparece duas vezes)
2. Negro (apare
ce três vezes)
3. Pajem (aparece uma vez)
4. Creoula (aparece uma vez)

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão ce\xadlerado c

In [None]:
texto = "Considerando o contexto use leitura distante para realizar a analise da sentença \'Em falta de pundonor e de vergonha, que a escravidão não comporta, o escravo tem o rancor e o desejo da vingança.'\ para encontrar e listar as palavras possuem ligação com a palavra alvo \'negro\'."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 Com base no contexto fornecido, as palavras que possuem relação com a palavra alvo 'negro' são:

1. Escravo (aparece du
as vezes)
2. Negro (aparece duas vezes)
3. Senhora (aparece duas vezes)
4. Parceira (aparece duas vezes)
5. Fazenda (apa
rece uma vez)
6. Marido (aparece uma vez)
7. Inimigos (aparece uma vez)
8. Maldade (aparece uma vez)
9. Vergonha (aparec
e uma vez)
10. Rancôr (aparece uma vez)

Observações:

* As palavras "escravo" e "negro" aparecem juntas em várias ocasi
ões, destacando a relação de dependência e opposição entre esses termos.
* A palavra "senhora" é usada tanto positivamen
te quanto negativamente, refletindo a complexidade da relação entre os personagens e a sociedade em que vivem.
* A expre
ssão "parceira" é utilizada para referir tanto os escravos quanto as senhoras, destacando a ideia de uneidade e solidari
edade entre esses grupos.
* A palavra "fazenda" é usada apenas uma vez, mas pode ser interpretada como um local de traba
lho e subsistência, al

In [None]:
texto = "Usando leitura distante realize a analise da sentença: \'Em falta de pundonor e de vergonha, que a escravidão não comporta, o escravo tem o rancor e o desejo da vingança.'\ e liste as palavras possuem relação semântica com a palavra alvo \'negro\'."

resultado_llm = avaliarContexto(texto)

# Mostra o resultado
print("Resposta:")
print_linhas_menores(resultado_llm["result"])

# Verifique os documentos de origem usados
print("\nDocumentos de origem:")
for fonte in resultado_llm["source_documents"]:
  print(fonte)



Resposta:
 As palavras que possuem relação semântica com a palavra alvo 'negro' são:

* rancor
* desejo
* vingança

Documentos de origem:
page_content='carregados de ouro e prata, fugiram precipitados pela porta da cozinha, e\nganharam o campo abandonando os cúmplices, que se batiam.\nSó de muito longe assobiaram repetidas vezes anunciando\na retirada, e metendo-se logo pelo mato, cada qual cuidando exclusivamente de\nsi.\nSimeão contara demais com as suas forças: ferido, e\ntendo perdido muito sangue, caiu desanimado, quando procurava saltar a cerca da\nfazenda.\nCONCLUSÃO\nO crime espantosamente horrível não ficou impune. A lei\nvingou as ví\xadtimas.\nO Barbudo,\nEufêmia e outros cúmplices acham-se na casa da correção pagando sua malvadeza.\nSimeão subiu à forca; estrebuchou e morreu\ndebaixo dos pés do car\xadrasco.\nA lei de exceção matou o escravo e deixou com\nvida o Barbudo tão ce\xadlerado como ele, ou, se é possível, mais celerado que\nele.\nTudo isto é profundamente imoral e

Tempo final de execução das perguntas

In [None]:
print("Tempo de execução das perguntas:  {:} (h:mm:ss)".format(formataTempo(time.time() - tempo_inicio)))

Tempo de execução das perguntas:  0:21:41 (h:mm:ss)
