# RAG (Retrieval-Augmented Generation)

---

RAG en palabras simples es darle información al modelo para aumentar su ventana de contexto y que pueda responder preguntas especificas acerca de esos datos o información adicional.
[Aquí está la informacion sobre RAG](https://python.langchain.com/docs/use_cases/question_answering/).
Es recomendable que al comenzar con RAG se utilice LangChain, ya que es fácil de usar y bastante intuitivo.

¿Cómo le damos contexto a nuestro modelo? Bueno, primero utilizamos dos cosas, [Embeddings](https://developers.google.com/machine-learning/crash-course/embeddings/video-lecture?hl=es-419) y [VectorStores](https://python.langchain.com/docs/modules/data_connection/vectorstores/). **Leer esa documentación**.

Los pasos a seguir son los siguientes:

*   Cargo mis datos o documentos.
*   Parto estos documentos o datos en trozos.
*   Utilizo un modelo de Embeddings para crear Embeddings con mis documentos o datos.
*   Guardo estos Embeddings en una base de datos (VectorStore).
*   Cargo mi modelo.
*   Inicializo mi base de datos para que pueda servir para obtener información de ella
*   Indico que voy a utilizar esa base de datos para obtener la información.
*   Hago mi pregunta.
*   La pregunta pasa primero por la base de datos.
*   La base de datos recupera toda la informacion similar a la pregunta realizada.
*   Luego tanto el contexto como la pregunta es enviada al modelo para que haga la inferencia.

---

Recomiendo mucho leer la documentación sobre RAG de LangChain porque lo explica muy bien y tiene material visual con diagramas para entenderlo más fácil. También, para entender que es lo que pasa con tu información, te recomiendo leer la documentación sobre Embeddings y VectorStores.




# Requisitos
---
Para poder utilizar RAG en LangChain debes tener los siguientes paquetes de Python instalados (te recomiendo utilizar Virtual Enviroments de Python).


*   langchain
*   openai (en el caso de que uses modelos como GPT)
*   chromadb (es la base de datos (VectorStore) donde se guardaran tus Embeddings)
*   tiktoken
*   pypdf

In [1]:
# pip install langchain
# pip install openai
# pip install chromadb
# pip install tiktoken
# pip install pypdf

In [2]:
from langchain.llms import OpenAI
from langchain.document_loaders import WebBaseLoader
import os

# Profe API: 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.
# Mi API: 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 (ver plan en GPT).

os.environ["OPENAI_API_KEY"] = "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"

# Esto es para cargar modelos de OpenAI (Yo utilicé 5 dólares y aún me quedan, no es tan caro para realizar pruebas).
llm = OpenAI(openai_api_key = "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")

In [3]:
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import DirectoryLoader

# Lo que hace esta línea es cargar el contenido de un PDF y transformandolo a un archivo de texto,
# Yo cuando realicé estas pruebas usaba un solo documento, por eso especifíco la ruta de uno solo,
# pero entiendo que se puede para usar más documentos.
loader = PyPDFLoader(
    "2018-DECRETO-REGLAMENTO-GENERAL-DE-DOCENCIA-DE-PREGRADO.pdf"
    )
# loader = UnstructuredCSVLoader("/content/Reporte_Sensores_Maquinas_Industriales.csv", mode="single")

# Esta línea carga los documentos como una variable para ser utilizada más adelante.
docs = loader.load()

print(docs)

[Document(page_content=' \n \nPágina 1 de 29 \n \n                                     DECRETO U . DE C .   Nº 2018 - 017 \n \n \nVISTO:  \n                 Lo acordado por el Con sejo Académico en sesión de 18  de  enero de \n2018 en orden a aprobar la modificación orgánica del Reglamento General de \nDocencia de Pregrado  aprobado por Decreto U. de C. Nº 2015 -133 de 28 de \ndiciembre de 2015, que se reemplaza por un  nuevo texto y  lo dispuesto en el \nDecreto U. de C. Nº 2014 -057 de 8 de abril de 2014 y en los Estatutos de la \nCorporación.  \n \n \nDECRETO:  \n \n                 Aprué base a contar de esta fecha la modificación orgánica al Reglamento \nGeneral de Docencia de Pregrado, que se reemplaza por el siguiente texto, y que \ncomenzará a  regir a contar del año académico 2018 . \n \n                          \nREGLAMENTO GENERAL DE DOCENCIA DE PREGRADO  \n \n \nEn el texto de este reglamento se ha procurado el uso de un lenguaje que no \ndiscrimine ni marque diferencias d

In [4]:
from langchain.text_splitter import CharacterTextSplitter

# Esta línea se encarga de partir el texto en trozos de 1200 Chars (caracteres) con un Overlap (superpisición) de 0,
# lo ideal sería tener un Overlap un poco más grande, pero hay que ir viendo cual serÍa el óptimo.
# La razón de partir el texto en trozos es principalmente facilitar el hacer Embeddings con el texto.
text_splitter = CharacterTextSplitter(chunk_size = 1200, chunk_overlap = 0)

# Aquí indicamos que queremos partir los documentos y guardarlos en una variable.
all_splits = text_splitter.split_documents(docs)

print(all_splits)

[Document(page_content='Página 1 de 29 \n \n                                     DECRETO U . DE C .   Nº 2018 - 017 \n \n \nVISTO:  \n                 Lo acordado por el Con sejo Académico en sesión de 18  de  enero de \n2018 en orden a aprobar la modificación orgánica del Reglamento General de \nDocencia de Pregrado  aprobado por Decreto U. de C. Nº 2015 -133 de 28 de \ndiciembre de 2015, que se reemplaza por un  nuevo texto y  lo dispuesto en el \nDecreto U. de C. Nº 2014 -057 de 8 de abril de 2014 y en los Estatutos de la \nCorporación.  \n \n \nDECRETO:  \n \n                 Aprué base a contar de esta fecha la modificación orgánica al Reglamento \nGeneral de Docencia de Pregrado, que se reemplaza por el siguiente texto, y que \ncomenzará a  regir a contar del año académico 2018 . \n \n                          \nREGLAMENTO GENERAL DE DOCENCIA DE PREGRADO  \n \n \nEn el texto de este reglamento se ha procurado el uso de un lenguaje que no \ndiscrimine ni marque diferencias de géne

In [6]:
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma

# Aquí indicamos que queremos utilizar como modelo de Embedding text-embedding-ada-002,
# recomendado por openAI, pero puedes utilizar uno local de Huggingface.
EMBEDDING_MODEL = "text-embedding-ada-002"

# Aquí creamos un VestorStore, para almacenar los Embeddings en índices y facilitar la recuperación de los datos.
# Se indican los documentos que vas a pasar a Embeddings, aquí utilizo OpenAI (como modelo de Embedding),
# pero se puede cambiar, el nombre de la colección no es relevante a menos que tengas varios VectorStores.
vectorstore = Chroma.from_documents(documents = all_splits, embedding = OpenAIEmbeddings(model = EMBEDDING_MODEL), collection_name = "data")

Retrying langchain_community.embeddings.openai.embed_with_retry.<locals>._embed_with_retry in 4.0 seconds as it raised RateLimitError: You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors..


RateLimitError: You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.

In [None]:
question = "Plan de Estudio"

# Aquí estoy testeando si me devuelve todo el texto que encuentre similar o que contenga "Plan de estudio".
docs = vectorstore.similarity_search(question)

# len(docs)

print(docs)

NameError: name 'vectorstore' is not defined

In [None]:
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI
from langchain import hub
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema import StrOutputParser
from langchain.llms import OpenAI
from langchain.callbacks import get_openai_callback

# Aquí traemos un modelo de OpenAI, en este caso gpt-3.5-turbo. La temperatura indica la creatividad del modelo.
# Cuando quieres que te devuelve la información lo más parecida debes usar temperatura 0.
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# Aquí cargamos la Prompt que envuelve tanto el contexto como tu pregunta.
# Esto es para indicarle al modelo como debe actuar una vez recibe todo.
prompt = hub.pull("rlm/rag-prompt")

# Esto es para formatear los documentos.
def format_docs(docs):
  return "\n\n".join(doc.page_content for doc in docs)

# Aquí creamos la cadena de RAG, primero pasamos la base de datos como un Retriever, para obtener de ahí la información,
# luego indicamos como va a recibir la pregunta.
# Pasamos la Prompt, el modelo y un Parser (analizador) para la respuesta.
rag_chain = (
    {"context": vectorstore.as_retriever() | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

rag_chain.invoke("tu pregunta aquí")

ImportError: Could not import langchainhub, please install with `pip install langchainhub`.