<h1 align="center"><font color="yellow">Quatro maneiras de Question-Answering in LangChain</font></h1>

<font color="yellow">Data Scientist.: Dr.Eddy Giusepe Chirinos Isidro</font>

Este script est√° baseado nos trabalhos da [Sophia Yang]()

# Contextualizando

Converse com seus longos documentos `PDF`: load_qa_chain, RetrievalQA, VectorstoreIndexCreator, ConversationalRetrievalChain.


Voc√™ est√° interessado em conversar com seus pr√≥prios documentos, seja um `arquivo de texto`, um `PDF` ou um `site`? O `LangChain` torna mais f√°cil para voc√™ responder a perguntas com seus documentos. Mas voc√™ sabia que existem pelo menos `4` maneiras de responder a perguntas no LangChain? Nesta postagem do blog, exploraremos quatro maneiras diferentes de responder a perguntas e as v√°rias op√ß√µes que voc√™ pode considerar para seus casos de uso.

S√≥ lembrando que √© `LangChain`, na opini√£o de `Sophia Yang`, √© a maneira mais f√°cil de interagir com modelos de linguagem e criar aplicativos. √â uma ferramenta de c√≥digo aberto que envolve muitos `LLMs` e ferramentas. 

Ok, agora vamos come√ßar a responder perguntas em documentos externos.


# Configurando a API da OpenAI e importando as Bibliotecas necess√°rias

Observe que a [API OpenAI](https://platform.openai.com/account) n√£o √© gratuita. Voc√™ precisar√° configurar as informa√ß√µes de cobran√ßa para poder usar a `API OpenAI`. Como alternativa, voc√™ pode usar modelos do `HuggingFace Hub` ou de outros lugares.


In [None]:
#%pip install langchain==0.0.137 openai chromadb tiktoken pypdf

In [1]:
# Isto √© quando usas o arquivo .env:
from dotenv import load_dotenv
import os
print('Carregando a minha chave Key: ', load_dotenv())
Eddy_API_KEY_OpenAI = os.environ['OPENAI_API_KEY'] 

Carregando a minha chave Key:  True


In [2]:
from langchain.chains import RetrievalQA # Tem que atualizar --> pip install langchai==0.0.137
from langchain.llms import OpenAI
from langchain.document_loaders import TextLoader
from langchain.document_loaders import PyPDFLoader
from langchain.indexes import VectorstoreIndexCreator
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma


# Carregando Documentos

O `LangChain` suporta muitos [carregadores de documentos](https://python.langchain.com/en/latest/modules/indexes/document_loaders.html), como `Notion`, `YouTube` e `Figma`. Neste exemplo, gostaria de conversar com meu arquivo `PDF`. Assim, usei o `PyPDFLoader` para carregar meu arquivo.

Eu recomendo usar um PDF pequeno. Eu usei, s√≥ para demonstra√ß√£o mesmo, um boleto de pagamento da minha conta de energia que cont√©m apenas uma p√°gina (voc√™ pode usar qualquer outro documento). Meu boleto cont√©m certas entidades e em base a elas farei certas perguntas! 


In [3]:
# Verificamos nosso Modelo Instanciado:

llm = OpenAI()
print(llm("Conte-me uma piada."))




O que aconteceu quando o tijolo caiu do c√©u? Ele deu um tijolo no ch√£o.


In [4]:
# Carregando meu documento (Boleto de energia):
from langchain.document_loaders import PyPDFLoader

loader = PyPDFLoader("./Karina_boleto_FACULDADE.pdf")
documents = loader.load()

In [7]:
documents

[Document(page_content=' \nRECIBO DO PAGADOR\nBenefici√°rio\nUNIFRAN - GRADUA√á√ÉO EAD - CNPJ: 046.722.831/0001-78 \nAv. Dr. Armando Salles Oliveira - Franca/SPAg√™ncia/C√≥d. Benefici√°rio\n3393 - 6 / 0001544 - PData do Documento\n02/03/2023Vencimento\n27/03/2023\nPagador\nKARINA GON√áALVES SOARESN√∫mero Documento\n23103/06Nosso N√∫mero\n19/00236419200-6Valor do Documento\nR$ 551,26\nInstru√ß√µes: (Todas as informa√ß√µes deste bloqueto s√£o de exclusiva responsabilidade do benefici√°rio)\n* SR. CAIXA NAO RECEBER APOS VENCIMENTO; \n* DESCONTO DE R$ 320,43 ATE 07/03/23; R$ 289,64 ATE 27/03/23; \n* (3A CST EM CI√äNCIA DE DADOS) - RGM:22-30419841 \nAutentica√ß√£o Mec√¢nica\n237-2 23793.39316 90023.641922 00000.154401 2 93020000055126\nLocal de Pagamento\nPag√°vel preferencialmente nas ag√™ncias BRADESCOVencimento\n27/03/2023\nBenefici√°rio\nUNIFRAN - GRADUA√á√ÉO EAD - CNPJ: 046.722.831/0001-78 - Av. Dr. Armando Salles Oliveira - Franca/SPAg√™ncia/C√≥digo Benefici√°rio\n3393 - 6 / 0001544 -

# M√©todo 1: <font color="red">load_qa_chain</font>

`load_qa_chain` fornece a interface mais gen√©rica para responder a perguntas. Ele carrega uma cadeia que voc√™ pode fazer `QA` para seus documentos de entrada e usa TODO o texto nos documentos.

`chain_type="stuff"` n√£o funcionar√° porque o n√∫mero de tokens excede o limite. Podemos tentar outros tipos de cadeia como `"map_reduce"`.

In [8]:
from langchain.chains.question_answering import load_qa_chain


chain = load_qa_chain(llm=OpenAI(),
                      chain_type="map_reduce"
                     )


query = "Qual √© o nome do pagador?"

chain.run(input_documents=documents,
          question=query
         )


' O nome do pagador √© KARINA GON√áALVES SOARES.'

<font color="orange">Ele tamb√©m permite que voc√™ fa√ßa QA em um conjunto de documentos:</font>

In [None]:
### Para v√°rios Documentos:
# loaders = [....]
# documents = []
# for loader in loaders:
#     documents.extend(loader.load())

ü§î Mas e se meu documento for muito longo e ultrapassar o limite de token?

Existem duas maneiras de corrigi-lo:

## <font color="pink">Solu√ß√£o 1: Tipo de Cadeia (chain)</font>

O padr√£o `chain_type="stuff"` usa `TODO` o texto dos documentos no prompt. Se voc√™ tiver um arquivo muito grande (`tal como fez Sophia Yang, com um PDF de `50` p√°ginas`) n√£o funcionar√° porque excede o `limite de token` e causa erros de limita√ß√£o de taxa. √â por isso que para o exemplo da Sophia Yang, ela teve que usar outro tipo de cadeia, por exemplo `"map_reduce"`. 

A seguir vamos estudar outros tipos de cadeias:

ü§© `map_reduce:` Separa os textos em lotes (<font color="red">por exemplo</font>, voc√™ pode definir o tamanho do lote em `llm=OpenAI(batch_size=5)`), alimenta cada lote com a pergunta para o `LLM` separadamente e apresenta a resposta final com base nas respostas de cada lote.

ü§© `refine:` Separa os textos em lotes, alimenta o primeiro lote para o LLM e alimenta a resposta e o segundo lote para o LLM. Ele refina a resposta passando por todos os lotes.

ü§© `map-rerank:` ele separa os textos em lotes, alimenta cada lote para o LLM, retorna uma pontua√ß√£o de como responde completamente √† pergunta e apresenta a resposta final com base nas respostas com pontua√ß√£o mais alta de cada lote.

## <font color="pink">Solu√ß√£o 2: Recupera√ß√£o QA (`RetrievalQA`)</font>

Um problema com o uso de `TODO` o texto √© que pode ser `muito caro` porque voc√™ est√° alimentando todos os textos para a `API OpenAI` e a `API` √© cobrada pelo n√∫mero de tokens. Uma solu√ß√£o melhor √© recuperar os blocos (`chunks`) de texto relevantes primeiro e usar apenas os blocos de texto relevantes no modelo de linguagem. A seguir, examinarei os detalhes do `RetrievalQA`.

# M√©todo 2: <font color="red">RetrievalQA</font>