In [1]:
import pandas as pd
import logging
import ast
import numpy as np
from sentence_transformers import SentenceTransformer
from typing import Dict
import re

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
from dotenv import load_dotenv
load_dotenv()

True

In [3]:
import google.generativeai as genai
import os

GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")
genai.configure(api_key=GEMINI_API_KEY)

llm =  genai.GenerativeModel("gemini-2.0-flash")


In [19]:
import chromadb

chroma_client = chromadb.PersistentClient(path="chroma_db_v1")
collection = chroma_client.get_or_create_collection(name="new_documents")

In [5]:
EMBEDDING_MODEL =  'paraphrase-multilingual-mpnet-base-v2'

In [21]:
def retriever(question):
    model = SentenceTransformer(EMBEDDING_MODEL)
    query_embedding = model.encode([question], convert_to_tensor=True).tolist()

    results = collection.query(
        query_embeddings=query_embedding,
        n_results=3
    )
    return results

def format_docs(docs):
    return "\n\n".join(['\n'.join([res['name'],res["description"]]) for res in docs["metadatas"][0]])
# Example query
docs = retriever("N·ªët h∆∞∆°ng c·ªßa Bleu Channel l√† g√¨?")

print("Generated Response:", format_docs(docs))

Generated Response: Scandal Pour Homme
H∆∞∆°ng ƒê·∫ßu: C√¢y X√¥ Th∆°m, Cam qu√Ωt H∆∞∆°ng Gi·ªØa: Caramel, ƒê·∫≠u Tonka H∆∞∆°ng Cu·ªëi: C·ªè H∆∞∆°ng B√†i. NƒÉm 2021, th∆∞∆°ng hi·ªáu ƒë√¨nh ƒë√°m Jean Paul Gaultier tr·ªü l·∫°i c√πng v·ªõi m·ªôt si√™u ph·∫©m m·ªõi v·ªõi c√°i t√™n quen thu·ªôc "SCANDAL", nh∆∞ng l·∫ßn n√†y l√† phi√™n b·∫£n d√†nh cho c√°c ch√†ng trai. M√πi h∆∞∆°ng ƒë·∫ßy h·ª©a h·∫πn n√†y ch∆∞a g√¨ ƒë√£ ƒë·∫°t ƒë∆∞·ª£c m·ª•c ƒë√≠ch¬†l√†m cho√°ng ng·ª£p nh·ªØng t√≠n ƒë·ªì n∆∞·ªõc hoa v·ªõi ngo·∫°i h√¨nh chi·∫øc v∆∞∆°ng mi·ªán ƒë·∫ßy m·∫°nh m·∫Ω, ƒë∆∞·ª£c l·∫•y c·∫£m h·ª©ng t·ª´ nh·ªØng v·ªã ƒë·∫•u sƒ© quy·ªÅn anh ki√™u h√£nh v√† oai phong. Mi√™u t·∫£ t·ªïng quan v·ªÅ m√πi h∆∞∆°ng th√¨ Scandal Pour Homme thu·ªôc t√¥ng m√πi Ng·ªçt - m·ªôt n√©t ƒë·∫∑c tr∆∞ng, kh√¥ng l·∫´n v√†o ƒë√¢u ƒë∆∞·ª£c c·ªßa th∆∞∆°ng hi·ªáu Jean Paul Gaultier. Scandal Pour Homme m·ªü ra v·ªõi m√πi chua nh·∫π nh√†ng v√† t∆∞∆°i qu√°t c·ªßa nh·ªØng qu·∫£ Cam Qu√Ωt m·ªçng n∆∞·ªõc c√πng m·ªôt √≠t m√†u xanh l·ª•c

In [7]:
class RunnableChain:
    """L·ªõp b·ªçc lambda function ƒë·ªÉ h·ªó tr·ª£ .invoke()"""
    def __init__(self, func):
        self.func = func

    def invoke(self, **kwargs):
        return self.func(**kwargs)

    def __or__(self, other):
        """H·ªó tr·ª£ chaining nhi·ªÅu b∆∞·ªõc"""
        if not callable(other):
            raise TypeError(f"Cannot chain with type {type(other)}")

        # Ensure the next step is also a RunnableChain
        return RunnableChain(lambda **kwargs: other.invoke(self.func(**kwargs)))


class ChatPromptTemplate:
    def __init__(self, template: str):
        self.template = template
        self.variables = self.extract_variables(template)

    def extract_variables(self, template: str):
        return re.findall(r"\{(\w+)\}", template)

    def format(self, **kwargs) -> str:
        """ƒêi·ªÅn gi√° tr·ªã v√†o template"""
        missing_vars = [var for var in self.variables if var not in kwargs]
        if missing_vars:
            raise ValueError(f"Missing variables: {missing_vars}")

        return self.template.format(**kwargs)

    @classmethod
    def from_template(cls, template: str):
        return cls(template)

    def __or__(self, model):
        if not hasattr(model, "generate_content"):
            raise TypeError(f"Cannot chain with type {type(model)}")

        return RunnableChain(lambda **kwargs: model.generate_content(self.format(**kwargs)))

In [9]:
class RunnableFunction:
    def __init__(self, func):
        self.func = func  

    def __or__(self, other):
        if not callable(other):
            raise TypeError(f"Cannot chain with type {type(other)}")
        return RunnableFunction(lambda x: other(self.func(x)))

    def __call__(self, *args, **kwargs):
        return self.func(*args, **kwargs)

    def invoke(self, x):
        return self.func(x)


def str_output_parser(output):
    if hasattr(output, "text"):
        return output.text  # N·∫øu output c√≥ thu·ªôc t√≠nh `.text`
    if isinstance(output, dict) and "text" in output:
        return output["text"]  # N·∫øu output l√† dict ch·ª©a key "text"
    return str(output)  # Chuy·ªÉn t·∫•t c·∫£ v·ªÅ string


In [22]:
template = """Using the following context:
{context}

Question: {question}
"""

prompt = ChatPromptTemplate.from_template(template)

# Kh·ªüi t·∫°o parser
parser = RunnableFunction(str_output_parser)

# X√¢y d·ª±ng chain
chain = (
    prompt 
    | llm 
    | parser
)

question="N·ªët h∆∞∆°ng c·ªßa Bleu Chanel l√† g√¨?"

docs = retriever(question)

# Ch·∫°y pipeline
response = chain.invoke(context=format_docs(docs), question=question)
print(response)


D·ª±a tr√™n ƒëo·∫°n vƒÉn b·∫£n b·∫°n cung c·∫•p, c√≥ hai lo·∫°i Bleu de Chanel ƒë∆∞·ª£c m√¥ t·∫£:

**Bleu de Chanel Parfum:**

*   **H∆∞∆°ng ƒê·∫ßu:** V·ªè chanh, Cam Bergamot, C√¢y b·∫°c h√†
*   **H∆∞∆°ng gi·ªØa:** Hoa O·∫£i H∆∞∆°ng, Hoa phong l·ªØ, Qu·∫£ d·ª©a (qu·∫£ th∆°m)
*   **H∆∞∆°ng cu·ªëi:** G·ªó tuy·∫øt t√πng, G·ªó ƒë√†n h∆∞∆°ng, ƒê·∫≠u Tonka

**Bleu de Chanel (phi√™n b·∫£n g·ªëc):**

*   **H∆∞∆°ng ƒë·∫ßu:** Qu·∫£ b∆∞·ªüi, Qu·∫£ chanh v√†ng, B·∫°c h√†, Ti√™u h·ªìng.
*   **H∆∞∆°ng gi·ªØa:** G·ª´ng, Nh·ª•c ƒë·∫≠u kh·∫•u, Hoa nh√†i, Iso E Super.
*   **H∆∞∆°ng cu·ªëi:** Nhang, C·ªè h∆∞∆°ng b√†i, G·ªó tuy·∫øt t√πng, G·ªó ƒë√†n h∆∞∆°ng, Ho·∫Øc h∆∞∆°ng, Nh·ª±a h∆∞∆°ng Labdanum, X·∫° h∆∞∆°ng tr·∫Øng.

V·∫≠y n√™n, n·ªët h∆∞∆°ng c·ªßa Bleu de Chanel s·∫Ω kh√°c nhau t√πy thu·ªôc v√†o phi√™n b·∫£n Parfum hay phi√™n b·∫£n g·ªëc.



# Kh√°m ph√° s·ªü th√≠ch, nhu c·∫ßu c·ªßa kh√°ch h√†ng.


## T·∫°o cu·ªôc h·ªôi tho·∫°i v·ªõi kh√°ch h√†ng

In [None]:
prompt_begin_template = """
B·∫°n l√† tr·ª£ l√Ω ·∫£o c·ªßa Namperfume, chuy√™n t∆∞ v·∫•n n∆∞·ªõc hoa. H√£y b·∫Øt ƒë·∫ßu cu·ªôc tr√≤ chuy·ªán m·ªôt c√°ch t·ª± nhi√™n v√† ƒë·∫∑t c√¢u h·ªèi m·ªôt c√°ch linh ho·∫°t ƒë·ªÉ hi·ªÉu r√µ s·ªü th√≠ch c·ªßa kh√°ch h√†ng. D∆∞·ªõi ƒë√¢y l√† m·ªôt s·ªë g·ª£i √Ω v·ªÅ th√¥ng tin b·∫°n c√≥ th·ªÉ thu th·∫≠p:

* M√πi h∆∞∆°ng kh√°ch h√†ng y√™u th√≠ch l√† g√¨? (V√≠ d·ª•: t∆∞∆°i m√°t, hoa c·ªè, g·ªó, tr√°i c√¢y, vani,...)
* X√°c ƒë·ªãnh gi·ªõi t√≠nh c·ªßa kh√°ch h√†ng s·ª≠ d·ª•ng? Mua cho b·∫£n th√¢n hay mua t·∫∑ng cho ai?
* Kh√°ch h√†ng mu·ªën s·ª≠ d·ª•ng n∆∞·ªõc hoa cho m·ª•c ƒë√≠ch g√¨? (H√†ng ng√†y, d·ªãp ƒë·∫∑c bi·ªát, ƒëi l√†m, h·∫πn h√≤,...)
* Phong c√°ch m√† kh√°ch h√†ng h∆∞·ªõng ƒë·∫øn l√† g√¨? (NƒÉng ƒë·ªông, thanh l·ªãch, l√£ng m·∫°n, c√° t√≠nh, quy·∫øn r≈©,...)
* Kh√°ch h√†ng mong mu·ªën n∆∞·ªõc hoa mang l·∫°i c·∫£m gi√°c g√¨? (T·ª± tin, th∆∞ gi√£n, n·ªïi b·∫≠t, ·∫•m √°p,...)
* Th·ªùi ti·∫øt ho·∫∑c m√πa n√†o m√† kh√°ch h√†ng th∆∞·ªùng s·ª≠ d·ª•ng n∆∞·ªõc hoa?
* Ng√¢n s√°ch m√† kh√°ch h√†ng d·ª± ƒë·ªãnh chi cho n∆∞·ªõc hoa l√† bao nhi√™u?
* Kh√°ch h√†ng c√≥ th∆∞∆°ng hi·ªáu n∆∞·ªõc hoa y√™u th√≠ch n√†o kh√¥ng?

**L∆∞u √Ω quan tr·ªçng:**

* Kh√¥ng nh·∫•t thi·∫øt ph·∫£i h·ªèi t·∫•t c·∫£ c√°c c√¢u h·ªèi. H√£y l·∫Øng nghe c√¢u tr·∫£ l·ªùi c·ªßa kh√°ch h√†ng v√† ƒë·∫∑t c√¢u h·ªèi ti·∫øp theo m·ªôt c√°ch t·ª± nhi√™n d·ª±a tr√™n th√¥ng tin ƒë√£ c√≥.
* N·∫øu b·∫°n c·∫£m th·∫•y ƒë√£ thu th·∫≠p ƒë·ªß th√¥ng tin ƒë·ªÉ ƒë∆∞a ra g·ª£i √Ω ph√π h·ª£p, h√£y chuy·ªÉn sang b∆∞·ªõc gi·ªõi thi·ªáu s·∫£n ph·∫©m m√† kh√¥ng c·∫ßn h·ªèi th√™m.
* ∆Øu ti√™n t·∫°o ra m·ªôt cu·ªôc tr√≤ chuy·ªán tho·∫£i m√°i v√† h·ªØu √≠ch cho kh√°ch h√†ng.
* Ch·ªâ h·ªèi ch∆∞a t∆∞ v·∫•n s·∫£n ph·∫©m c·ª• th·ªÉ n√†o.
* Sau khi thu th·∫≠p ƒë·ªß th√¥ng tin th√¨ n√≥i kh√°ch h√†ng ƒë·ª£i ƒë·ªÉ t√¨m ki·∫øm s·∫£n ph·∫©m ph√π h·ª£p

######
ChatBot: Ch√†o b·∫°n, m√¨nh l√† tr·ª£ l√Ω ·∫£o c·ªßa Namperfume. R·∫•t vui ƒë∆∞·ª£c h·ªó tr·ª£ b·∫°n t√¨m ki·∫øm m√πi h∆∞∆°ng ∆∞ng √Ω. B·∫°n c√≥ th·ªÉ cho m√¨nh bi·∫øt b·∫°n ƒëang t√¨m ki·∫øm lo·∫°i n∆∞·ªõc hoa nh∆∞ th·∫ø n√†o kh√¥ng?

Kh√°ch h√†ng: {question}

ChatBot:
"""


prompt_begin = ChatPromptTemplate.from_template(prompt_begin_template)
input_prompt_begin = prompt_begin.format(question="T√¥i mu·ªën ƒë∆∞·ª£c t∆∞ v·∫•n n∆∞·ªõc hoa")

response = llm.generate_content(input_prompt_begin)
print(f"ChatBot: {str_output_parser(response)}\n")

history = [input_prompt_begin]  # Danh s√°ch l∆∞u l·ªãch s·ª≠ h·ªôi tho·∫°i

while True:
    user_input = input("B·∫°n: ")
    

    if "exit" in user_input.lower():
        break
    
    print(f"Kh√°ch h√†ng: {user_input}\n")

    history.append(f"Kh√°ch h√†ng: {user_input}")
    full_prompt = "\n".join(history)
    
    # Chu·ªói h·ªôi tho·∫°i ƒë·∫ßy ƒë·ªß
    response = llm.generate_content(full_prompt)

    # X·ª≠ l√Ω ph·∫£n h·ªìi
    if hasattr(response, "text"):
        bot_response = response.text
    elif isinstance(response, dict) and "text" in response:
        bot_response = response["text"]
    else:
        bot_response = str(response)

    print(f"{bot_response}\n")
    # L∆∞u tin nh·∫Øn c·ªßa chatbot v√†o l·ªãch s·ª≠
    history.append(f"{bot_response}")



ChatBot: Tuy·ªát v·ªùi! ƒê·ªÉ gi√∫p b·∫°n t√¨m ƒë∆∞·ª£c m√πi h∆∞∆°ng ho√†n h·∫£o nh·∫•t, b·∫°n c√≥ th·ªÉ chia s·∫ª m·ªôt ch√∫t v·ªÅ s·ªü th√≠ch c·ªßa m√¨nh ƒë∆∞·ª£c kh√¥ng? V√≠ d·ª•, b·∫°n th∆∞·ªùng th√≠ch nh·ªØng m√πi h∆∞∆°ng nh∆∞ th·∫ø n√†o? T∆∞∆°i m√°t, ng·ªçt ng√†o, ·∫•m √°p hay m·ªôt phong c√°ch n√†o kh√°c?


Kh√°ch h√†ng: M√¨nh mu·ªën t√¨m m·ªôt trai n∆∞·ªõc hoa, h∆∞∆°ng g·ªó th·ªÉ hi·ªán s·ª± nam t√≠nh. Nh∆∞ng m√¨nh kh√¥ng mu·ªën qu√° n·∫∑ng m√πi

Ch√†o b·∫°n! Tuy·ªát v·ªùi! H∆∞∆°ng g·ªó nam t√≠nh nh∆∞ng kh√¥ng qu√° n·ªìng l√† m·ªôt l·ª±a ch·ªçn r·∫•t ph·ªï bi·∫øn v√† d·ªÖ d√πng. ƒê·ªÉ m√¨nh gi√∫p b·∫°n t√¨m ƒë∆∞·ª£c m·ªôt m√πi h∆∞∆°ng ph√π h·ª£p nh·∫•t, b·∫°n c√≥ th·ªÉ cho m√¨nh bi·∫øt th√™m m·ªôt ch√∫t th√¥ng tin ƒë∆∞·ª£c kh√¥ng?

V√≠ d·ª•, b·∫°n th√≠ch nh·ªØng t√¥ng g·ªó n√†o h∆°n? G·ªó tuy·∫øt t√πng m·∫°nh m·∫Ω, g·ªó ƒë√†n h∆∞∆°ng ·∫•m √°p hay g·ªó vetiver t∆∞∆°i m√°t? Ho·∫∑c b·∫°n c√≥ th√≠ch m·ªôt ch√∫t h∆∞∆°ng th∆°m n√†o kh√°c ƒëi k√®m v·ªõi g·ªó kh√¥ng? Ch·∫≥ng h·∫°n nh∆∞

## Ph√¢n t√≠ch s·ªü th√≠ch, nhu c·∫ßu n∆∞·ªõc hoa c·ªßa kh√°ch h√†ng


In [31]:
full_text_history = "\n".join(history)
history_chat = full_text_history.split("######")[1]

print(history_chat)


ChatBot: Ch√†o b·∫°n, m√¨nh l√† tr·ª£ l√Ω ·∫£o c·ªßa Namperfume. R·∫•t vui ƒë∆∞·ª£c h·ªó tr·ª£ b·∫°n t√¨m ki·∫øm m√πi h∆∞∆°ng ∆∞ng √Ω. B·∫°n c√≥ th·ªÉ cho m√¨nh bi·∫øt b·∫°n ƒëang t√¨m ki·∫øm lo·∫°i n∆∞·ªõc hoa nh∆∞ th·∫ø n√†o kh√¥ng?

Kh√°ch h√†ng: T√¥i mu·ªën ƒë∆∞·ª£c t∆∞ v·∫•n n∆∞·ªõc hoa

ChatBot:

Kh√°ch h√†ng: M√¨nh mu·ªën t√¨m m·ªôt trai n∆∞·ªõc hoa, h∆∞∆°ng g·ªó th·ªÉ hi·ªán s·ª± nam t√≠nh. Nh∆∞ng m√¨nh kh√¥ng mu·ªën qu√° n·∫∑ng m√πi
Ch√†o b·∫°n! Tuy·ªát v·ªùi! H∆∞∆°ng g·ªó nam t√≠nh nh∆∞ng kh√¥ng qu√° n·ªìng l√† m·ªôt l·ª±a ch·ªçn r·∫•t ph·ªï bi·∫øn v√† d·ªÖ d√πng. ƒê·ªÉ m√¨nh gi√∫p b·∫°n t√¨m ƒë∆∞·ª£c m·ªôt m√πi h∆∞∆°ng ph√π h·ª£p nh·∫•t, b·∫°n c√≥ th·ªÉ cho m√¨nh bi·∫øt th√™m m·ªôt ch√∫t th√¥ng tin ƒë∆∞·ª£c kh√¥ng?

V√≠ d·ª•, b·∫°n th√≠ch nh·ªØng t√¥ng g·ªó n√†o h∆°n? G·ªó tuy·∫øt t√πng m·∫°nh m·∫Ω, g·ªó ƒë√†n h∆∞∆°ng ·∫•m √°p hay g·ªó vetiver t∆∞∆°i m√°t? Ho·∫∑c b·∫°n c√≥ th√≠ch m·ªôt ch√∫t h∆∞∆°ng th∆°m n√†o kh√°c ƒëi k√®m v·ªõi g·ªó kh√¥ng? Ch·∫≥ng h·∫°n nh∆∞ m·ªôt ch√∫t

# Query Transformations

D·ª±a v√†o nh·ªØng s·ªü th√≠ch, nhu c·∫ßu c·ªßa kh√°ch h√†ng, h√£y t·∫°o ra 5 c√¢u m√¥ t·∫£ s·∫£n ph·∫©m n∆∞·ªõc hoa ph√π h·ª£p v·ªõi khach h√†ng:

## T·∫°o ra 5 c√¢u m√¥ t·∫£ kh√°c nhau v·ªÅ s·∫£n ph·∫©m cho l√† ph√π h·ª£p v·ªõi kh√°ch h√†ng

In [27]:
query_explore_customer_preferces_template = """
D·ª±a v√†o l·ªãch s·ª≠ tr√≤ chuy·ªán sau ƒë√¢y, b·∫°n h√£y ƒë√≥ng vai tr√≤ l√† m·ªôt chuy√™n gia t∆∞ v·∫•n n∆∞·ªõc hoa cao c·∫•p. Nhi·ªám v·ª• c·ªßa b·∫°n l√† t·∫°o ra **nƒÉm m√¥ t·∫£ chi ti·∫øt v√† ƒëa d·∫°ng** v·ªÅ s·ªü th√≠ch, nhu c·∫ßu v√† mong mu·ªën c·ªßa kh√°ch h√†ng, nh·∫±m m·ª•c ƒë√≠ch t√¨m ki·∫øm c√°c m·∫´u n∆∞·ªõc hoa ph√π h·ª£p nh·∫•t t·ª´ c∆° s·ªü d·ªØ li·ªáu vector.

**M·ª•c ti√™u:** B·∫±ng c√°ch khai th√°c c√°c kh√≠a c·∫°nh kh√°c nhau trong y√™u c·∫ßu c·ªßa kh√°ch h√†ng, b·∫°n s·∫Ω gi√∫p h·ªá th·ªëng v∆∞·ª£t qua nh·ªØng h·∫°n ch·∫ø c·ªßa ph∆∞∆°ng ph√°p t√¨m ki·∫øm t∆∞∆°ng t·ª± d·ª±a tr√™n kho·∫£ng c√°ch ƒë∆°n thu·∫ßn, t·ª´ ƒë√≥ mang ƒë·∫øn k·∫øt qu·∫£ ch√≠nh x√°c v√† ph√π h·ª£p h∆°n.

**L·ªãch s·ª≠ tr√≤ chuy·ªán:**
{history_chat}

**Y√™u c·∫ßu:**

* M·ªói m√¥ t·∫£ c·∫ßn t·∫≠p trung v√†o vi·ªác ph√¢n t√≠ch v√† l√†m r√µ c√°c y·∫øu t·ªë sau:
    * Gi·ªõi t√≠nh c·ªßa kh√°ch h√†ng: Nam/N·ªØ
    * M√πi h∆∞∆°ng y√™u th√≠ch: (v√≠ d·ª•: t∆∞∆°i m√°t, hoa c·ªè, g·ªó, tr√°i c√¢y, vani,...)
    * M·ª•c ƒë√≠ch s·ª≠ d·ª•ng: (v√≠ d·ª•: h√†ng ng√†y, d·ªãp ƒë·∫∑c bi·ªát, ƒëi l√†m, h·∫πn h√≤,...)
    * Phong c√°ch c√° nh√¢n: (v√≠ d·ª•: nƒÉng ƒë·ªông, thanh l·ªãch, l√£ng m·∫°n, c√° t√≠nh, quy·∫øn r≈©,...)
    * Ng√¢n s√°ch d·ª± ki·∫øn: (v√≠ d·ª•: 1.000.000 ƒë·ªìng - 2.000.000 ƒë·ªìng, 1.500.000 ƒë·ªìng - 2.000.000 ƒë·ªìng, ...)
* S·ª≠ d·ª•ng ng√¥n ng·ªØ chuy√™n nghi·ªáp, tinh t·∫ø v√† gi√†u h√¨nh ·∫£nh ƒë·ªÉ truy·ªÅn t·∫£i ch√≠nh x√°c c·∫£m x√∫c v√† mong mu·ªën c·ªßa kh√°ch h√†ng.
* T·∫°o ra c√°c m√¥ t·∫£ c√≥ g√≥c nh√¨n kh√°c nhau, nh·∫•n m·∫°nh v√†o c√°c kh√≠a c·∫°nh kh√°c nhau trong s·ªü th√≠ch c·ªßa kh√°ch h√†ng.
* ƒê·∫£m b·∫£o m·ªói m√¥ t·∫£ ƒë·ªÅu ƒë·ªß chi ti·∫øt ƒë·ªÉ h·ªá th·ªëng c√≥ th·ªÉ hi·ªÉu r√µ v√† t√¨m ki·∫øm hi·ªáu qu·∫£ trong c∆° s·ªü d·ªØ li·ªáu vector.
* M√¥ t·∫£ c·∫ßn ƒë√∫ng ƒë·ªãnh d·∫°ng ƒë·∫ßu ra.

**ƒê·ªãnh d·∫°ng ƒë·∫ßu ra:**

M√¥ t·∫£ 1: [M√¥ t·∫£ chi ti·∫øt v·ªõi g√≥c nh√¨n 1]

M√¥ t·∫£ 2: [M√¥ t·∫£ chi ti·∫øt v·ªõi g√≥c nh√¨n 2]

M√¥ t·∫£ 3: [M√¥ t·∫£ chi ti·∫øt v·ªõi g√≥c nh√¨n 3]

M√¥ t·∫£ 4: [M√¥ t·∫£ chi ti·∫øt v·ªõi g√≥c nh√¨n 4]

M√¥ t·∫£ 5: [M√¥ t·∫£ chi ti·∫øt v·ªõi g√≥c nh√¨n 5]
"""

In [None]:
prompt_query_explore_customer_preferces = ChatPromptTemplate.from_template(query_explore_customer_preferces_template)

# X√¢y d·ª±ng chain
chain = (
    prompt_query_explore_customer_preferces 
    | llm 
    | parser
)

response = chain.invoke(history_chat=history_chat)
print(response)

M√¥ t·∫£ 1: M·ªôt qu√Ω √¥ng hi·ªán ƒë·∫°i ƒëang t√¨m ki·∫øm s·ª± t·ª± tin v√† nƒÉng l∆∞·ª£ng cho ng√†y l√†m vi·ªác. Anh ·∫•y mu·ªën m·ªôt m√πi h∆∞∆°ng nam t√≠nh nh∆∞ng kh√¥ng √°p ƒë·∫£o, m·ªôt l√†n gi√≥ bi·ªÉn h√≤a quy·ªán v·ªõi s·ª± ·∫•m √°p c·ªßa g·ªó, t·∫°o n√™n s·ª± c√¢n b·∫±ng ho√†n h·∫£o gi·ªØa s·ª± s·∫£ng kho√°i v√† s·ª± tr∆∞·ªüng th√†nh. Anh ·∫•y mong mu·ªën m·ªôt m√πi h∆∞∆°ng gi√° c·∫£ ph·∫£i chƒÉng (1-2 tri·ªáu VNƒê) c√≥ th·ªÉ tr·ªü th√†nh d·∫•u ·∫•n c√° nh√¢n h√†ng ng√†y, m·ªôt s·ª± kh·∫≥ng ƒë·ªãnh tinh t·∫ø v·ªÅ phong c√°ch v√† b·∫£n lƒ©nh. Gi·ªõi t√≠nh: Nam, M√πi h∆∞∆°ng y√™u th√≠ch: G·ªó, Bi·ªÉn, M·ª•c ƒë√≠ch s·ª≠ d·ª•ng: H√†ng ng√†y, ƒêi l√†m, Phong c√°ch c√° nh√¢n: NƒÉng ƒë·ªông, T·ª± tin, Ng√¢n s√°ch: 1.000.000 - 2.000.000 VNƒê.

M√¥ t·∫£ 2: Ng∆∞·ªùi ƒë√†n √¥ng n√†y khao kh√°t m·ªôt m√πi h∆∞∆°ng g·ª£i nh·ªõ ƒë·∫øn nh·ªØng bu·ªïi s√°ng tr√™n b·ªù bi·ªÉn, n∆°i s·ª± m·∫°nh m·∫Ω c·ªßa ƒë·∫°i d∆∞∆°ng g·∫∑p g·ª° s·ª± v·ªØng ch√£i c·ªßa r·ª´ng c√¢y. Anh ta kh√¥ng mu·ªën m·ªôt

In [33]:
def split_descriptions_re(text):
  
    descriptions = re.split(r'\n\nM√¥ t·∫£ \d+:\s*', text)
    # X·ª≠ l√Ω ƒëo·∫°n ƒë·∫ßu ti√™n n·∫øu n√≥ kh√¥ng b·∫Øt ƒë·∫ßu b·∫±ng "M√¥ t·∫£"
    final_descriptions = []
    for idx,item in enumerate(descriptions):
        if item.startswith("M√¥ t·∫£"):
            final_descriptions.append(item)
        else:
            final_descriptions.append(f"M√¥ t·∫£ {idx+1}: " + item)
    return final_descriptions


descriptions = split_descriptions_re(response)
descriptions

['M√¥ t·∫£ 1: M·ªôt qu√Ω √¥ng hi·ªán ƒë·∫°i ƒëang t√¨m ki·∫øm s·ª± t·ª± tin v√† nƒÉng l∆∞·ª£ng cho ng√†y l√†m vi·ªác. Anh ·∫•y mu·ªën m·ªôt m√πi h∆∞∆°ng nam t√≠nh nh∆∞ng kh√¥ng √°p ƒë·∫£o, m·ªôt l√†n gi√≥ bi·ªÉn h√≤a quy·ªán v·ªõi s·ª± ·∫•m √°p c·ªßa g·ªó, t·∫°o n√™n s·ª± c√¢n b·∫±ng ho√†n h·∫£o gi·ªØa s·ª± s·∫£ng kho√°i v√† s·ª± tr∆∞·ªüng th√†nh. Anh ·∫•y mong mu·ªën m·ªôt m√πi h∆∞∆°ng gi√° c·∫£ ph·∫£i chƒÉng (1-2 tri·ªáu VNƒê) c√≥ th·ªÉ tr·ªü th√†nh d·∫•u ·∫•n c√° nh√¢n h√†ng ng√†y, m·ªôt s·ª± kh·∫≥ng ƒë·ªãnh tinh t·∫ø v·ªÅ phong c√°ch v√† b·∫£n lƒ©nh. Gi·ªõi t√≠nh: Nam, M√πi h∆∞∆°ng y√™u th√≠ch: G·ªó, Bi·ªÉn, M·ª•c ƒë√≠ch s·ª≠ d·ª•ng: H√†ng ng√†y, ƒêi l√†m, Phong c√°ch c√° nh√¢n: NƒÉng ƒë·ªông, T·ª± tin, Ng√¢n s√°ch: 1.000.000 - 2.000.000 VNƒê.',
 'M√¥ t·∫£ 2: Ng∆∞·ªùi ƒë√†n √¥ng n√†y khao kh√°t m·ªôt m√πi h∆∞∆°ng g·ª£i nh·ªõ ƒë·∫øn nh·ªØng bu·ªïi s√°ng tr√™n b·ªù bi·ªÉn, n∆°i s·ª± m·∫°nh m·∫Ω c·ªßa ƒë·∫°i d∆∞∆°ng g·∫∑p g·ª° s·ª± v·ªØng ch√£i c·ªßa r·ª´ng c√¢y. Anh ta kh√¥ng mu·ªën 

## T·ª´ 5 c√¢u m√¥ t·∫£ tr√™n, th·ª±c hi·ªán retrival th√¥ng tin c√°c lo·∫°i n∆∞·ªõc hoa ph√π h·ª£p

In [34]:
docs = []
for description in  descriptions:
    docs.append(retriever(description))
docs

[{'ids': [['10952115', '10950786', '10951679']],
  'embeddings': None,
  'documents': [[None, None, None]],
  'uris': None,
  'data': None,
  'metadatas': [[{'brand': 'Prada',
     'compare_at_price': 2430000,
     'count_rate': 46,
     'count_rate_1': 0,
     'count_rate_2': 0,
     'count_rate_3': 0,
     'count_rate_4': 4,
     'count_rate_5': 96,
     'description': 'H∆∞∆°ng ƒë·∫ßu: Hoa o·∫£i h∆∞∆°ng, Qu·∫£ cam. H∆∞∆°ng gi·ªØa: B·∫°c h√†, X√¥ th∆°m. H∆∞∆°ng cu·ªëi: H·∫°t v√¥ng vang (Ambrette ‚Äì Musk Mallow), Ambroxan. S·ª± s·∫°ch s·∫Ω, g·ªçn g√†ng v√† th∆°m tho c·ªßa ng∆∞·ªùi ƒë√†n √¥ng c≈©ng ƒë∆∞·ª£c xem l√† m·ªôt n√©t quy·∫øn r≈© v·ªõi ng∆∞·ªùi kh√°c gi·ªõi. N·∫øu kh√¥ng qu√° c·∫ßu k·ª≥ v√† ƒëi·ªáu ƒë√†, m·ªôt qu√Ω √¥ng ƒë√¥i khi ch·ªâ c·∫ßn s·ª± thoang tho·∫£ng h∆∞∆°ng th∆°m nh∆∞ v·ª´a b∆∞·ªõc ra t·ª´ nh√† t·∫Øm, m·ªôt c√°ch th∆°m thanh l·ªãch v√† nh·∫π nh√†ng. ƒê√≥ c≈©ng ch√≠nh l√† nh·ªØng g√¨ m√† Prada Luna Rossa ƒëem t·ªõi cho c√°c anh em. M·ªôt h∆∞∆°ng O·∫£i h∆∞∆°ng nh·∫π 

# Re-ranking

In [None]:
temp = docs[0]['metadatas'][0][0]

In [79]:
def product_description(id,temp):
    brand = temp["brand"]
    name = temp["name"]
    description = temp["description"]
    origin = temp["origin"]
    product_style = temp["product_style"]
    product_note = temp["product_note"]
    product_gender = temp["product_gender"]
    price = temp["price"]
    return f"""\n------------\nID S·∫£n ph·∫©m : {id}\nT√™n s·∫£n ph·∫©m: {name} \nTh∆∞∆°ng hi·ªáu: {brand}\nS·∫£n xu·∫•t: {origin}\nN∆∞·ªõc hoa cho: {product_gender} \nGi√° b√°n: {price}\nNh√≥m h∆∞∆°ng: {product_note}\nPhong c√°ch: {product_style}\nM√¥ t·∫£: {description}"""
    

In [80]:
product_recomment = []
for doc in docs:
    ids = doc['ids']
    for id, temp in zip(ids[0], doc['metadatas'][0]):
        product =  product_description(id,temp)
        product_recomment.append(product)

In [85]:
prompt_ranking = f"""
D∆∞·ªõi ƒë√¢y l√† danh s√°ch c√°c s·∫£n ph·∫©m n∆∞·ªõc hoa g·ª£i √Ω. Nhi·ªám v·ª• c·ªßa b·∫°n l√† ch·ªçn ra 3 s·∫£n ph·∫ßm ph√π h·ª£p nh·∫•t v·ªõi nh·ªØng th√¥ng tin thu th·∫≠p t·ª´ kh√°ch h√†ng

###########
D∆Ø·ªöI ƒê√ÇY L√Ä 5 M√î T·∫¢ (5 M√î T·∫¢ N√ÄY ƒê∆Ø·ª¢C T·∫†O RA T·ª™ TH√îNG TIN THU TH·∫¨P T·ª™ 1 KH√ÅCH H√ÄNG) S·∫¢N PH·∫®M C·ª¶A M·ªòT KH√ÅCH H√ÄNG V·ªÄ NHU C·∫¶U MUA N∆Ø·ªöC HOA

{response}

##########
DANH S√ÅCH S·∫¢N PH·∫®M 

"""

for item in product_recomment:
    prompt_ranking += item
    
print(prompt_ranking)


D∆∞·ªõi ƒë√¢y l√† danh s√°ch c√°c s·∫£n ph·∫©m n∆∞·ªõc hoa g·ª£i √Ω. Nhi·ªám v·ª• c·ªßa b·∫°n l√† ch·ªçn ra 3 s·∫£n ph·∫ßm ph√π h·ª£p nh·∫•t v·ªõi nh·ªØng th√¥ng tin thu th·∫≠p t·ª´ kh√°ch h√†ng

###########
D∆Ø·ªöI ƒê√ÇY L√Ä 5 M√î T·∫¢ (5 M√î T·∫¢ N√ÄY ƒê∆Ø·ª¢C T·∫†O RA T·ª™ TH√îNG TIN THU TH·∫¨P T·ª™ 1 KH√ÅCH H√ÄNG) S·∫¢N PH·∫®M C·ª¶A M·ªòT KH√ÅCH H√ÄNG V·ªÄ NHU C·∫¶U MUA N∆Ø·ªöC HOA

M√¥ t·∫£ 1: M·ªôt qu√Ω √¥ng hi·ªán ƒë·∫°i ƒëang t√¨m ki·∫øm s·ª± t·ª± tin v√† nƒÉng l∆∞·ª£ng cho ng√†y l√†m vi·ªác. Anh ·∫•y mu·ªën m·ªôt m√πi h∆∞∆°ng nam t√≠nh nh∆∞ng kh√¥ng √°p ƒë·∫£o, m·ªôt l√†n gi√≥ bi·ªÉn h√≤a quy·ªán v·ªõi s·ª± ·∫•m √°p c·ªßa g·ªó, t·∫°o n√™n s·ª± c√¢n b·∫±ng ho√†n h·∫£o gi·ªØa s·ª± s·∫£ng kho√°i v√† s·ª± tr∆∞·ªüng th√†nh. Anh ·∫•y mong mu·ªën m·ªôt m√πi h∆∞∆°ng gi√° c·∫£ ph·∫£i chƒÉng (1-2 tri·ªáu VNƒê) c√≥ th·ªÉ tr·ªü th√†nh d·∫•u ·∫•n c√° nh√¢n h√†ng ng√†y, m·ªôt s·ª± kh·∫≥ng ƒë·ªãnh tinh t·∫ø v·ªÅ phong c√°ch v√† b·∫£n lƒ©nh. Gi·ªõi t√≠nh: Nam, M√πi h∆∞∆°ng y√™u th√≠ch: G·ªó,

In [84]:
print(llm.generate_content(prompt_ranking).text)

D·ª±a tr√™n th√¥ng tin thu th·∫≠p t·ª´ kh√°ch h√†ng (c·∫£ 5 m√¥ t·∫£ ƒë·ªÅu t∆∞∆°ng ƒë·ªìng), ƒë√¢y l√† 3 s·∫£n ph·∫©m ph√π h·ª£p nh·∫•t:

1.  **Mr. Burberry Indigo (ID S·∫£n ph·∫©m: 27395052):**
    *   **Gi√°:** 1.350.000 VNƒê (Ph√π h·ª£p ng√¢n s√°ch)
    *   **Nh√≥m h∆∞∆°ng:** B·∫°c h√†, Hoa h∆∞∆°ng th·∫£o, Qu·∫£ chanh v√†ng, Hoa t√≠m (C√≥ h∆∞∆°ng bi·ªÉn - b·∫°c h√†, v√† h∆∞∆°ng g·ªó - r√™u s·ªìi, h·ªï ph√°ch)
    *   **Phong c√°ch:** L·ªãch l√£m, Nam t√≠nh, Cu·ªën h√∫t (Ph√π h·ª£p v·ªõi m√¥i tr∆∞·ªùng c√¥ng s·ªü, s·ª± t·ª± tin)
    *   **M√¥ t·∫£:** M·ªü ƒë·∫ßu t∆∞∆°i m√°t, nam t√≠nh, kh√¥ng qu√° ·ªìn √†o, nh·∫π nh√†ng.

2.  **Versace Pour Homme Dylan Blue (ID S·∫£n ph·∫©m: 10951424):**
    *   **Gi√°:** 1.880.000 VNƒê (Ph√π h·ª£p ng√¢n s√°ch)
    *   **Nh√≥m h∆∞∆°ng:** H∆∞∆°ng ambroxan, Cam bergamot, Qu·∫£ b∆∞·ªüi, H∆∞∆°ng n∆∞·ªõc (H∆∞∆°ng bi·ªÉn v√† g·ªó)
    *   **Phong c√°ch:** Nam t√≠nh, T∆∞∆°i m√°t, H·∫•p d·∫´n (Ph√π h·ª£p v·ªõi phong c√°ch nƒÉng ƒë·ªông, tr·∫ª trung)
    *  

#  ƒê·ªÅ xu·∫•t lo·∫°i n∆∞·ªõc hoa - thu th·∫≠p ph·∫£n h·ªìi c·ªßa kh√°ch h√†ng

## N·∫øu kh√°ch h√†ng ch√¥t s·∫£n ph·∫©m th√¨ th·ª±c hi·ªán ch·ªët ƒë∆°n

## N·∫øu kh√°ch h√†ng kh√¥ng ∆∞ng √Ω th√¨ l·∫≠p l·∫°i quy tr√¨nh d·ª±a tr√™n ph·∫£n h·ªìi c·ªßa kh√°ch h√†ng ƒë·ªÉ g·ª£i √Ω s·∫£n ph·∫©m kh√°c.

# G·ª≠i maill ch·ªët ƒë∆°n.