In [None]:
# Install required packages for langchain, Chroma, and embeddings
%pip install -q langchain langchain-community langchain-openai langchain-core chromadb sentence-transformers openai
%pip install google-generativeai langchain-google-genai

Note: you may need to restart the kernel to use updated packages.


In [18]:
from langchain_community.embeddings import SentenceTransformerEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnableMap, RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

In [16]:
gg_api_key="AIzaSyDDFxNLEEIRDksup7lKT7o8c0NoJDN1lS4"

In [None]:
# Test API Key from Google

from google import genai

# The client gets the API key from the environment variable `GEMINI_API_KEY`.
client = genai.Client(api_key=gg_api_key)

response = client.models.generate_content(
    model="gemini-2.5-flash", contents="Explain how AI works in a few words"
)
print(response.text)

AI learns from data to find patterns and make decisions or predictions.


In [27]:
# ---- Embeddings + Vector DB ----
embedder = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
# Lưu ý: "docs" phải là thư mục chứa Chroma DB đã được khởi tạo
vectordb = Chroma(persist_directory="docs", embedding_function=embedder)
retriever = vectordb.as_retriever(search_kwargs={"k": 4})

# ---- LLM (Gemini) ----
# Đảm bảo gg_api_key được truyền vào nếu không dùng biến môi trường
llm = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash",
    google_api_key=gg_api_key
)

# ---- Convert docs → string (Được giữ nguyên) ----
def format_docs(docs):
    # Trả về chuỗi chứa nội dung của các tài liệu được truy xuất
    return "\n\n".join([d.page_content for d in docs])

# ---- Prompt (Được giữ nguyên) ----
prompt = PromptTemplate.from_template("""
Use ONLY the context below to answer the question.

Context:
{context}

Question:
{question}

Answer:
""")

# ---- Chain (SỬA LỖI VÀ TỐI ƯU HÓA) ----
# Sử dụng StrOutputParser để trích xuất nội dung văn bản từ đối tượng AIMessage
rag_chain = (
    RunnableMap({
        # 1. Truy xuất tài liệu và định dạng thành chuỗi context
        "context": retriever | format_docs, 
        # 2. Truyền câu hỏi của người dùng nguyên vẹn
        "question": RunnablePassthrough(), # Tối ưu hóa: Thay thế lambda x: x["question"]
    })
    | prompt # 3. Đưa context và question vào PromptTemplate
    | llm    # 4. Truyền prompt đã định dạng cho LLM
    | StrOutputParser() # 5. Lấy nội dung text thuần túy từ kết quả của LLM
)

# ---- Run ----
# LƯU Ý: Nếu bạn sử dụng RunnablePassthrough, bạn chỉ cần truyền chuỗi câu hỏi.
# Nếu giữ nguyên RunnableMap, bạn phải truyền dict: {"question": "..."}
res = rag_chain.invoke("What is LangGraph state?") 

# In kết quả. res đã là chuỗi text thuần túy nhờ StrOutputParser
print(res)

I am sorry, but the provided context does not contain information about what LangGraph state is. The context only states, "This context is about LangGraph."
