In [1]:
import pandas as pd
import logging
import ast
import numpy as np
from sentence_transformers import SentenceTransformer
from typing import Dict
import re

  from .autonotebook import tqdm as notebook_tqdm


In [11]:
import google.generativeai as genai
import os

GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")
genai.configure(api_key=GEMINI_API_KEY)

llm =  genai.GenerativeModel("gemini-2.0-flash")

In [13]:
os.getenv("GEMINI_API_KEY")

In [3]:
import chromadb

chroma_client = chromadb.PersistentClient(path="chroma_db")
collection = chroma_client.get_or_create_collection(name="documents")

In [4]:
def retriever(question):
    model = SentenceTransformer('all-MiniLM-L6-v2')
    query_embedding = model.encode([question], convert_to_tensor=True).tolist()

    results = collection.query(
        query_embeddings=query_embedding,
        n_results=5
    )
    return results

def format_docs(docs):
    return "\n\n".join(['\n'.join([res['name'],res["description"]]) for res in docs["metadatas"][0]])
# Example query
docs = retriever("Nốt hương của Bleu Channel?")

print("Generated Response:", format_docs(docs))

Generated Response: Bleu de Chanel
Hương đầu: Quả bưởi, Quả chanh vàng, Bạc hà, Tiêu hồng. Hương giữa: Gừng, Nhục đậu khấu, Hoa nhài, Iso E Super. Hương cuối: Nhang, Cỏ hương bài, Gỗ tuyết tùng, Gỗ đàn hương, Hoắc hương, Nhựa hương Labdanum, Xạ hương trắng. Chanel Bleu de Chanel đã đem tới thế giới hương thơm một mùi hương dễ chịu. Cam chanh mở màn bằng nét đặc trưng của nốt hương Bưởi, tươi sáng mọng nước cùng Gừng thanh lịch sạch sẽ, rồi nhẹ nhàng thoang thoảng chút hương hoa. Gừng của Bleu de Chanel rõ ràng, dễ gần, đẹp và nịnh mũi. Lắng dần xuống, mùi hương của Bleu de Chanel trở nên dày và có chiều sâu hơn với Nhang mềm ngọt, cùng sự rắn chắc vững chãi của hương Gỗ, qua hương thơm từ Cỏ hương bài, Gỗ tuyết tùng và Đàn hương. Bạn thấy chứ? Không cần bàn quá nhiều về mùi hương của Bleu de Chanel, một hương thơm dễ mến và đa dụng. Sự thành công của Bleu de Chanel thậm chí còn lớn đến mức tạo thành một trào lưu những mùi hương đi theo phong cách của chai nước hoa này. Tươi sáng, dễ ch

In [5]:
class RunnableChain:
    """Lớp bọc lambda function để hỗ trợ .invoke()"""
    def __init__(self, func):
        self.func = func

    def invoke(self, **kwargs):
        return self.func(**kwargs)

    def __or__(self, other):
        """Hỗ trợ chaining nhiều bước"""
        if not callable(other):
            raise TypeError(f"Cannot chain with type {type(other)}")

        # Ensure the next step is also a RunnableChain
        return RunnableChain(lambda **kwargs: other.invoke(self.func(**kwargs)))


class ChatPromptTemplate:
    def __init__(self, template: str):
        self.template = template
        self.variables = self.extract_variables(template)

    def extract_variables(self, template: str):
        return re.findall(r"\{(\w+)\}", template)

    def format(self, **kwargs) -> str:
        """Điền giá trị vào template"""
        missing_vars = [var for var in self.variables if var not in kwargs]
        if missing_vars:
            raise ValueError(f"Missing variables: {missing_vars}")

        return self.template.format(**kwargs)

    @classmethod
    def from_template(cls, template: str):
        return cls(template)

    def __or__(self, model):
        if not hasattr(model, "generate_content"):
            raise TypeError(f"Cannot chain with type {type(model)}")

        return RunnableChain(lambda **kwargs: model.generate_content(self.format(**kwargs)))

In [6]:

template = """Using the following context:
{context}

Question: {question}
"""

prompt = ChatPromptTemplate.from_template(template)

formatted_prompt = prompt.format(context="AI is evolving rapidly", question="What is AI?")
print(formatted_prompt)

Using the following context:
AI is evolving rapidly

Question: What is AI?



In [7]:
class RunnableFunction:
    def __init__(self, func):
        self.func = func  

    def __or__(self, other):
        if not callable(other):
            raise TypeError(f"Cannot chain with type {type(other)}")
        return RunnableFunction(lambda x: other(self.func(x)))

    def __call__(self, *args, **kwargs):
        return self.func(*args, **kwargs)

    def invoke(self, x):
        return self.func(x)


def str_output_parser(output):
    if hasattr(output, "text"):
        return output.text  # Nếu output có thuộc tính `.text`
    if isinstance(output, dict) and "text" in output:
        return output["text"]  # Nếu output là dict chứa key "text"
    return str(output)  # Chuyển tất cả về string


In [8]:
template = """Using the following context:
{context}

Question: {question}
"""

prompt = ChatPromptTemplate.from_template(template)

# Khởi tạo parser
parser = RunnableFunction(str_output_parser)

# Xây dựng chain
chain = (
    prompt 
    | llm 
    | parser
)

question="Nốt hương của Bleu Chanel là gì?"

docs = retriever(question)

# Chạy pipeline
response = chain.invoke(context=format_docs(docs), question=question)
print(response)


DefaultCredentialsError: 
  No API_KEY or ADC found. Please either:
    - Set the `GOOGLE_API_KEY` environment variable.
    - Manually pass the key with `genai.configure(api_key=my_api_key)`.
    - Or set up Application Default Credentials, see https://ai.google.dev/gemini-api/docs/oauth for more information.