# A quick tutorial to RAG

In [2]:
from langchain.embeddings import HuggingFaceInferenceAPIEmbeddings, HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from getpass import getpass
import sys
sys.path.append("../")
from src.config import Configuration
# HUGGING_FACE_KEY = getpass("Hugging face key: ")
# HUGGING_FACE_KEY = "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"
conf =  Configuration()
HUGGING_FACE_KEY = conf.load_hg_token(1)

In [3]:
conf.enable_tracing("TEST")

In [4]:
# get embedding model
# MODEL = "VoVanPhuc/sup-SimCSE-VietNamese-phobert-base"
MODEL = "sentence-transformers/LaBSE"

embeddings = HuggingFaceInferenceAPIEmbeddings(
    api_key=HUGGING_FACE_KEY,
    model_name=MODEL)

# insert data to vector store
docs = ["Huy là lập trình viên", "John là người Mỹ", "Kiệt là kĩ sư",
        "Hiếu là họa sĩ", "Khoa là giám đốc", "Tài là người kinh doanh",
        "Ngân là một tư vấn viên", "Quang Trung là một vị hoàng đế",
        "Quang Lê là ca sĩ", "Kỳ Duyên là người dẫn chương trình",
        "Vạn Thịnh Phát là đại gia"]

In [13]:
from langchain_google_genai.chat_models import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate

chat_model = ChatGoogleGenerativeAI(
            model="gemini-pro", 
            temperature=0, 
            google_api_key=conf.load_gemini_token()
        )

template = """\
    Answer the question based only on the following context: \
        {context} \
    Question: {question}"""
prompt = ChatPromptTemplate.from_template(template)



## FAISS vector store

In [5]:
faiss_db = FAISS.from_texts(docs, embeddings)

# Search

In [7]:
query = "Những người có tên Quang"
res = faiss_db.similarity_search_with_score(query, k=2)
res

[(Document(page_content='Quang Lê là ca sĩ'), 0.8617182),
 (Document(page_content='Quang Trung là một vị hoàng đế'), 1.0207205)]

In [5]:
query = "Ai làm bên mảng nghệ thuật"
res = faiss_db.similarity_search_with_score(query)
res

[(Document(page_content='Hiếu là họa sĩ'), 1.1108531),
 (Document(page_content='Quang Lê là ca sĩ'), 1.1798074),
 (Document(page_content='Tài là người kinh doanh'), 1.2564962),
 (Document(page_content='Kiệt là kĩ sư'), 1.2788237)]

In [8]:
query = "Ai là người nước ngoài"
res = faiss_db.similarity_search_with_score(query)
res

[(Document(page_content='John là người Mỹ'), 0.84808284),
 (Document(page_content='Huy là lập trình viên'), 1.1197588),
 (Document(page_content='Quang Lê là ca sĩ'), 1.1401577),
 (Document(page_content='Quang Trung là một vị hoàng đế'), 1.1879854)]

# RAG

In [34]:
class MyRunnable:
    def __init__(self, func):
        self.func = func

    def __or__(self, other):
        def chained_func(*args, **kwargs):
            # the other func consumes the result of this func
            print("invoke")
            return other(self.func(*args, **kwargs))
        return Runnable(chained_func)

    def __call__(self, *args, **kwargs):
        return self.func(*args, **kwargs)

In [46]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableLambda, RunnablePassthrough
from langchain_core.runnables import RunnableLambda
mem = []

def log(e):
    print(e)
    mem.append(e)
    return e

passt = RunnableLambda(log)

rag = (
    {"context": faiss_db.as_retriever(), "question": RunnablePassthrough()} | passt
    | prompt
    | chat_model
    | StrOutputParser()
) 

In [47]:
a = rag.invoke("Vua tên Quang")
a

{'context': [Document(page_content='Quang Trung là một vị hoàng đế'), Document(page_content='Quang Lê là ca sĩ'), Document(page_content='Vạn Thịnh Phát là đại gia'), Document(page_content='John là người Mỹ')], 'question': 'Vua tên Quang'}


'Quang Trung'

In [48]:
mem

[{'context': [Document(page_content='Quang Trung là một vị hoàng đế'),
   Document(page_content='Quang Lê là ca sĩ'),
   Document(page_content='Vạn Thịnh Phát là đại gia'),
   Document(page_content='John là người Mỹ')],
  'question': 'Vua tên Quang'}]

In [30]:
atemplate = """Tell me a joke about {topic}"""
aprompt = ChatPromptTemplate.from_template(atemplate)

jrag = {"topic": RunnablePassthrough()} | aprompt | chat_model | StrOutputParser()



a = jrag.invoke("Food")
a

"Why did the banana go to the doctor?\n\nBecause it wasn't peeling well!"

In [32]:
a = {"topic": RunnablePassthrough()}
type(a)

dict

# References
- https://python.langchain.com/docs/integrations/text_embedding/huggingfacehub
- https://python.langchain.com/docs/integrations/vectorstores/chroma