In [18]:
import os
import re
import pandas as pd
import numpy as np
from dotenv import load_dotenv
from sentence_transformers import SentenceTransformer
from pymilvus import connections, Collection, utility
from huggingface_hub import login

### **Connect to Milvus Database**

In [19]:
load_dotenv()
login(os.getenv("HF_TOKEN"))

Note: Environment variable`HF_TOKEN` is set and is the current active token independently from the token you've just configured.


In [20]:
connections.connect(host="localhost", port="19530")
print("Connected to Milvus server")

Connected to Milvus server


In [21]:
# Check collection
COLLECTION_NAME = "coffee_embeddings"
if not utility.has_collection(COLLECTION_NAME):
    print(f"Collection {COLLECTION_NAME} does not exist")
    exit(1)

In [22]:
collection = Collection(COLLECTION_NAME)
collection.load()
print(f"Loaded collection {COLLECTION_NAME}")

Loaded collection coffee_embeddings


### **Preprocess text and Create embedding vector**

In [23]:
# Preprocess text function
def preprocess_text(text):
    text = text.lower()
    text = re.sub(r"[^\w\s]", "", text)  # Remove punctuation
    text = re.sub(r"\d+", "", text)      # Remove numbers
    text = re.sub(r"\s+", " ", text)     # Remove extra spaces
    return text.strip()

# Create embedding function 
def emb_text(text):
    embed_model = SentenceTransformer("keepitreal/vietnamese-sbert")
    text = preprocess_text(text)
    embeddings = embed_model.encode(text, convert_to_numpy=True, show_progress_bar=False)
    return embeddings

In [None]:
def print_results(results, ascending=True):
    if not results or len(results[0]) == 0:
        print("There are no results")
        return
    
    sorted_results = sorted(results[0], key=lambda x: x.distance, reverse=not ascending)
    
    print("Top matching results:")
    for result in sorted_results:
        print(f"ProductID: {result.entity.get('ProductID')}")
        print(f"Title: {result.entity.get('Title')}")
        print(f"Price: {result.entity.get('Price')}")
        print(f"Description: {result.entity.get('Description')}")
        print(f"Main category: {result.entity.get('Main_category')}")
        print(f"Sub category: {result.entity.get('Sub_category')}")
        print(f"Image URL: {result.entity.get('Image_url')}")
        print(f"Distance: {result.distance:.4f}")
        print("-" * 50)

#### **1. Vector Search**

In [None]:
# Example query
query = "Latte Classic"
query_embedding = emb_text(query)

# Vector search (can be called ANN search)
search_params = {"metric_type": "L2", "params": {"nprobe": 6}}
results = collection.search(
    data=[query_embedding],
    anns_field="embedding",
    param=search_params,
    limit=5,
    expr='Main_category == "Cà phê" and Sub_category == "Cà phê máy"',
    output_fields=["Title", "Price", "Description", "Main_category", "Sub_category", "Image_url"]
)

print_results(results, ascending=False)

Top matching results:
ProductID: 6
Title: Latte Hazelnut
Price: 59000
Description: Latte Hazelnut là sự kết hợp giữa Espresso đậm đà, sữa tươi béo ngậy, và syrup hạt phỉ ngọt nhẹ, mang đến một hương vị thơm lừng, béo ngậy và mát lạnh. Thức uống này mang đến sự hòa quyện hoàn hảo giữa cà phê và hương vị hạt phỉ, tạo nên một trải nghiệm dễ chịu và thơm ngon.
Main category: Cà phê
Sub category: Cà phê máy
Image URL: http://product.hstatic.net/1000075078/product/1746441372_halzenut-latte_3ef994056c3b4765a600e853f6cca72d_grande.png
Distance: 118.4600
--------------------------------------------------
ProductID: 4
Title: Latte Bạc Xỉu
Price: 49000
Description: Latte Bạc Xỉu là sự kết hợp giữa Espresso, sữa tươi béo ngậy và cà phê phin đậm đà, tạo ra một hương vị vừa ngọt nhẹ, vừa đậm đà, dễ uống và mát lạnh.
Main category: Cà phê
Sub category: Cà phê máy
Image URL: http://product.hstatic.net/1000075078/product/1746441267_latte-bac-xiu_a6fe420fef6f4ec7a2e4f87e9e03ef4b_grande.png
Distance: 117

#### **2. Optimization**

**Case 1: If the customer directly asks to buy that item, then respond accurately.**

In [24]:
# Category mappings
mappings = {
    'Cà phê': {
        'Cà phê máy': ['Latte Classic', 'Latte Bạc Xỉu', 'Latte Coconut', 'Latte Hazelnut', 'Latte Caramel', 'Latte Almond', 'Latte Nóng'],
        'Cà phê phin': ['Bạc Xỉu Foam Dừa', 'Bạc Xỉu Caramel Muối', 'Đường Đen Sữa Đá','Bạc Xỉu Nóng',
                        'Bạc Xỉu', 'Cà Phê Sữa Đá', 'Cà Phê Đen Đá', 'Cà Phê Sữa Nóng', 'Cà Phê Đen Nóng'],
        'Cold Brew': ['Cold Brew Kim Quất', 'Cold Brew Sữa Tươi', 'Cold Brew Truyền Thống'],
        'A-Mê': ['A-Mê Tuyết Quất', 'A-Mê Tuyết Mơ', 'A-Mê Tuyết Đào', 'A-Mê Quất', 'A-Mê Mơ', 'A-Mê Đào', 'A-Mê Classic', 'Americano Nóng'],
        'Espresso': ['Espresso Đá','Cappuccino Đá', 'Caramel Macchiato Đá', 'Cappuccino Nóng', 'Caramel Macchiato Nóng', 'Espresso Nóng']
    },

    'Thức uống đá xay': {
        'Đá xay': ['Frosty Cà Phê Đường Đen', 'Frosty Caramel Arabica', 'Frosty Bánh Kem Dâu', 'Frosty Phin-Gato', 'Frosty Trà Xanh',
                   'Frosty Cà Phê Đường Đen', 'Frosty Caramel Arabica', 'Frosty Phin-Gato', 'Frosty Trà Xanh', 'Frosty Bánh Kem Dâu'],
        'Đá xay có lớp whipping cream': ['Frappe Choco Chip', 'Frappe Hazelnut', 'Frappe Caramel', 'Frappe Almond', 'Frappe Espresso', 'Frappe Coconut Coffee', 'Frappe Matcha'],
    },

    'Matcha': {
        '': ['Matcha Yuzu Đá Xay', 'Matcha Yuzu', 'Matcha Đào Đá Xay', 'Matcha Đào', 'Matcha Okinawa Trân Châu Hoàng Kim', 'Matcha Sữa Dừa Đá Xay', 'Matcha Sữa Dừa',
            'Matcha Latte', 'Matcha Tinh Khiết', 'Trà Xanh - Xinh Chẳng Phai', 'Trà Xanh - Yêu Chẳng Phai', 'Matcha Latte Tây Bắc Sữa Yến Mạch', 'Trà Xanh Tây Bắc',
            'Matcha Latte Tây Bắc Sữa Yến Mạch (Nóng)', 'Trà Xanh Nước Dừa', 'Trà Xanh Nước Dừa Yuzu', 'Matcha Latte Tây Bắc (Nóng)', 'Matcha Latte Tây Bắc']
    },

    'Trà trái cây - Hi Tea': {
        'Hi Tea': ['Hi-Tea Yuzu Kombucha', 'Hi-Tea Đào Kombucha', 'Hi-Tea - Xinh Chẳng Phai', 'Hi-Tea Đào', 'Hi-Tea Vải', 'Hi-Tea Yuzu Trân Châu', 'Hi-Tea - Yêu Chẳng Phai',
                   'Hi-Tea Đá Tuyết Mận Muối Trân Châu', 'Hi-Tea Dâu Tây Mận Muối Trân Châu', 'Hi-Tea Kim Quất Bưởi Hồng Mandarin', 'Dâu Phô Mai'],
        'Trà trái cây': ['Oolong Tứ Quý Sen',  'Oolong Tứ Quý Sen (Nóng)', 'Oolong Tứ Quý Dâu Trân Châu', 'Oolong Tứ Quý Vải',
                         'Oolong Tứ Quý Kim Quất Trân Châu', 'Trà Đào Cam Sả - Nóng', 'Trà Đào Cam Sả - Đá', 'Oolong Berry']
    },

    'Trà sữa': {
        '': ['Trà sữa Oolong Nướng Trân Châu', 'Trà Đen Macchiato', 'Hồng Trà Sữa Trân Châu', 'Hồng Trà Sữa Nóng',
            'Trà Sữa Oolong Tứ Quý Sương Sáo', 'Trà Sữa Oolong Nướng Sương Sáo','Trà Đào - Yêu Chẳng Phai',
            'Trà Sữa Oolong BLao', 'Trà sữa Oolong Nướng (Nóng)', 'Chocolate Nóng', 'Chocolate Đá']
    },

    'Bánh': {
        'Bánh ngọt': ['Mochi Kem Trà Sữa Trân Châu', 'Mochi Kem Matcha', 'Mochi Kem Chocolate', 'Mochi Kem Việt Quất', 'Mochi Kem Phúc Bồn Tử',
                      'Mousse Matcha', 'Mousse Tiramisu', 'Mousse Gấu Chocolate', 'Matcha Burnt Cheesecake', 'Burnt Cheesecake', 'Mít Sấy', 'Butter Croissant Sữa Đặc'],
        'Bánh mặn': ['Bánh Mì Que Bò Nấm Xốt Bơ', 'Bánh Mì Que Chà Bông Phô Mai Bơ Cay', 'Bánh Mì Que Pate Cột Đèn', 'Chà Bông Phô Mai', 'Croissant trứng muối', 'Butter Croissant']
    },

    'Đồ ăn chế biến': {
        '': ['Spaghetti Bò Bằm', 'Cơm Chiên Hải Sản']
    },

    'Cà phê gói mang đi': {
        '': ['Cà Phê Đen Đá Túi (30 gói x 16g)', 'Cà Phê Đen Đá Hộp (14 gói x 16g)', 'Cà Phê Hoà Tan Đậm Vị Việt (18 gói x 16 gam)',
            'Cà Phê Sữa Đá Hòa Tan Túi 25x22G', 'Cà Phê Rang Xay Original 1 250G', 'Cà Phê Sữa Đá Hòa Tan (10 gói x 22g)', 'Cà Phê Nguyên Hạt Arabica TCH (200gr)']
    }
}

In [25]:
# Function to determine if the query is an exact item
def is_exact_item(query):
    query = query.strip().lower()
    for main_cat, sub_cats in mappings.items():
        for sub_cat, items in sub_cats.items():
            for item in items:
                if item.lower() in query:
                    return True, item           # Return True and the original item name
    return False, None

In [26]:
# Function to search exact item
def search_exact_item(exact_title):

    expr = f'Title == "{exact_title}"'    
    try: 
        search_results = collection.search(
            data = [emb_text(preprocess_text(exact_title))],
            anns_field="embedding",
            param={"metric_type": "L2", "params": {"nprobe": 8}},
            limit=1,
            expr=expr,
            output_fields=["Title", "Price", "Description", "Image_url"]
        )
    
        retrieval_results = [
            {
                "title": hit.entity.get("Title"),
                "description": hit.entity.get("Description"),
                "price": hit.entity.get("Price"),
                "image_url": hit.entity.get("Image_url"),
            }
            for hit in search_results[0]
        ]
        return retrieval_results
    except Exception as e:
        print(f"Error search: {e}")
        return None

#### **Case 2: When the user asks a general question about a type of beverage/food**

In [29]:
sub_category_keywords = {
    'Cà phê máy': ['pha máy', 'latte'],
    'Cà phê phin': ['phin', 'bạc xỉu', 'đen đá', 'sữa đá'],
    'A-Mê': ['a-mê', 'americano'],
    'Espresso': ['espresso', 'cappuccino', 'caramel'],
    'Đá xay': ['đá xay', 'frosty'],
    'Đá xay có lớp whipping cream': ['frappe', 'whipping cream'],
    'Matcha': ['matcha', 'trà xanh'],
    'Trà trái cây': ['trà trái cây', 'oolong', 'đào cam sả'],
    'Trà sữa': ['trà sữa', 'hồng trà', 'chocolate'],
    'Bánh ngọt': ['bánh ngọt', 'mochi kem', 'mousse', 'cheesecake', 'croissant sữa đặc'],
    'Bánh mặn': ['bánh mặn', 'bánh mì', 'croissant trứng muối', 'chà bông']
}

# Function to find product based on keywords from items
def find_items_by_keyword(query, keyword):
    query = query.lower()
    keyword = keyword.lower()
    matched_items = []
    
    for main_cat, sub_cats in mappings.items():
        for sub_cat, items in sub_cats.items():
            for item in items:
                if keyword in item.lower():
                    matched_items.append((item, main_cat, sub_cat))
                    
    return matched_items
    
# Function to determine category from query
def get_category_from_query(query):
    query = query.lower()
    
    # 1. Check keyword-based item search (ví dụ: "latte" -> tất cả món có "latte")
    for sub_cat, keywords in sub_category_keywords.items():
        for keyword in keywords:
            if keyword in query:
                matched_items = find_items_by_keyword(query, keyword)
                if matched_items:
                    return None, None, matched_items  # Trả về danh sách món matched
    
    # 2. Check sub_category keywords
    for main_cat, sub_cats in mappings.items():
        for sub_cat in sub_cats.keys():
            if sub_cat:
                keywords = sub_category_keywords.get(sub_cat, [])
                if any(keyword in query for keyword in keywords):
                    return main_cat, sub_cat, None
    
    # 3. Check main_category
    for main_cat in mappings.keys():
        if main_cat.lower() in query:
            return main_cat, None, None
    
    return None, None, None

In [30]:
def general_search_and_recommend(query, limit):
    query_embedding = emb_text(query)
    
    main_cat, sub_cat, matched_items = get_category_from_query(query)
    print(main_cat, sub_cat, matched_items)
    
    # Trường hợp keyword-based
    if matched_items:
        expr = ' or '.join([f'Title == "{item[0]}"' for item in matched_items])
        try:
            search_results = collection.search(
                data=[query_embedding],
                anns_field="embedding",
                param={"metric_type": "L2", "params": {"nprobe": 8}},
                limit=len(matched_items),
                expr=expr,
                output_fields=["Title", "Price", "Description", "Image_url"]
            )
            
            retrieval_results = [
                {
                    "title": hit.entity.get("Title", "N/A"),
                    "description": hit.entity.get("Description", ""),
                    "price": hit.entity.get("Price", "Liên hệ"),
                    "image_url": hit.entity.get("Image_url", "")
                }
                for hit in search_results[0][:limit]
            ]
            
            return retrieval_results
        except Exception as e:
            print(f"Search error: {e}")
            return "Xin lỗi, hệ thống đang bận."
    
    # Trường hợp main_cat/sub_cat
    if main_cat and sub_cat is None:
        sub_list = [k for k in mappings[main_cat].keys() if k] or ['']
        if len(sub_list) > 1:
            final_ans = ", ".join(sub_list[:-1]) + f" và {sub_list[-1]}" if len(sub_list) > 1 else sub_list[0]
            return f"Quán có các loại {main_cat.lower()} như: {final_ans}. Bạn muốn thử loại nào?"
        else:
            sub_cat = sub_list[0]
    
    expr = ''
    if main_cat:
        expr = f'Main_category == "{main_cat}"'
        if sub_cat is not None:
            expr += f' and Sub_category == "{sub_cat}"'
    
    try:
        search_results = collection.search(
            data=[query_embedding],
            anns_field="embedding",
            param={"metric_type": "L2", "params": {"nprobe": 8}},
            limit=limit,
            expr=expr,
            output_fields=["Title", "Price", "Description", "Image_url"]
        )
        retrieval_results = [
            {
                "title": hit.entity.get("Title", "N/A"),
                "description": hit.entity.get("Description", ""),
                "price": hit.entity.get("Price", "Liên hệ"),
                "image_url": hit.entity.get("Image_url", "")
            }
            for hit in search_results[0][:limit]
        ]
        
        if retrieval_results:
            return retrieval_results
        else: return None
    except Exception as e:
        print(f"Search error: {e}")
        return "Xin lỗi, hệ thống đang bận."

In [16]:
query3 = "Quán mình có những loại cà phê nào nhỉ?"
retrieval3 = general_search_and_recommend(query3, limit=5)

Cà phê None None


In [17]:
retrieval3

'Quán có các loại cà phê như: Cà phê máy, Cà phê phin, Cold Brew, A-Mê và Espresso. Bạn muốn thử loại nào?'

In [18]:
query4 = "Quán mình có những loại Matcha nào ngon vậy?"
retrieval4 = general_search_and_recommend(query4, limit=5)

None None [('Frappe Matcha', 'Thức uống đá xay', 'Đá xay có lớp whipping cream'), ('Matcha Yuzu Đá Xay', 'Matcha', ''), ('Matcha Yuzu', 'Matcha', ''), ('Matcha Đào Đá Xay', 'Matcha', ''), ('Matcha Đào', 'Matcha', ''), ('Matcha Okinawa Trân Châu Hoàng Kim', 'Matcha', ''), ('Matcha Sữa Dừa Đá Xay', 'Matcha', ''), ('Matcha Sữa Dừa', 'Matcha', ''), ('Matcha Latte', 'Matcha', ''), ('Matcha Tinh Khiết', 'Matcha', ''), ('Matcha Latte Tây Bắc Sữa Yến Mạch', 'Matcha', ''), ('Matcha Latte Tây Bắc Sữa Yến Mạch (Nóng)', 'Matcha', ''), ('Matcha Latte Tây Bắc (Nóng)', 'Matcha', ''), ('Matcha Latte Tây Bắc', 'Matcha', ''), ('Mochi Kem Matcha', 'Bánh', 'Bánh ngọt'), ('Mousse Matcha', 'Bánh', 'Bánh ngọt'), ('Matcha Burnt Cheesecake', 'Bánh', 'Bánh ngọt')]


In [19]:
retrieval4

[{'title': 'Matcha Latte',
  'description': 'Matcha Nhật Bản hảo hạng kết hợp sữa tươi mịn màng, cân bằng vị umami thanh nhẹ và độ béo dịu, mang đến thức uống thơm ngon, đầy năng lượng.',
  'price': '55000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1745246722_matcha-latte_805657f9e18948e6a6218bbce3e8fbe4_grande.png'},
 {'title': 'Matcha Latte Tây Bắc',
  'description': 'Best seller của Nhà - rất phù hợp cho ai muốn nhập môn matcha. *Khuấy đều để thưởng trọn hương vị.',
  'price': '45000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1737355612_tx-latte_6909ebc57c8e4b1e9aeef7e5ecdd5f9d_grande.png'},
 {'title': 'Matcha Tinh Khiết',
  'description': 'Matcha nguyên chất 100% từ Nhật Bản, không đường, không sữa, giữ trọn hương vị nguyên bản đậm đà.',
  'price': '49000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1745246736_matcha-tinh-khiet_fecd3381031d43859cefb802337057bf_grande.png'},
 {'title': 'Matcha Burnt Cheesecake',
  'descrip

In [20]:
query5 = "Quán mình có những loại bánh mì nào vậy?"
retrieval5 = general_search_and_recommend(query5, limit=5)

None None [('Bánh Mì Que Bò Nấm Xốt Bơ', 'Bánh', 'Bánh mặn'), ('Bánh Mì Que Chà Bông Phô Mai Bơ Cay', 'Bánh', 'Bánh mặn'), ('Bánh Mì Que Pate Cột Đèn', 'Bánh', 'Bánh mặn')]


In [21]:
retrieval5

[{'title': 'Bánh Mì Que Pate Cột Đèn',
  'description': 'Aiiiii Pate Cột Đèn đậm đà thơm béo hônggg? Rộp rộp vỏ bánh nóng hổi giòn rụm, thêm ngấu nghiến với pate cùng xốt bơ trứng đẫm vị.',
  'price': '19000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1737355276_bmq-pate-hai-phong_8e0d00ff7cf44d4e9eb504948ed4697c_grande.png'},
 {'title': 'Bánh Mì Que Bò Nấm Xốt Bơ',
  'description': 'Bò mềm thấm vị, nấm đông cô dai giòn. Rộp rộp vỏ bánh giòn rụm nóng hổi, thêm ngấu nghiến với xốt bơ béo bùi ngon số dzách.',
  'price': '22000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1737355257_bmq-bo-nam_160a1e2a36b14f89b3ef0c61cda229ad_grande.png'},
 {'title': 'Bánh Mì Que Chà Bông Phô Mai Bơ Cay',
  'description': 'Aiiiii Bánh Mì Chà Bông Phô Mai hônggg? Chà bông tơi mịn đẫm phô mai Mozzarella kéo sợi, cay hít hà. Rộp rộp vỏ bánh giòn rụm nóng hổi, thêm ngấu nghiến với xốt bơ đậm đà.',
  'price': '22000',
  'image_url': 'http://product.hstatic.net/1000075078/

In [24]:
query6 = "Quán có những loại Latte nào vậy?"
retrieval6 = general_search_and_recommend(query6, limit=5)

None None [('Latte Classic', 'Cà phê', 'Cà phê máy'), ('Latte Bạc Xỉu', 'Cà phê', 'Cà phê máy'), ('Latte Coconut', 'Cà phê', 'Cà phê máy'), ('Latte Hazelnut', 'Cà phê', 'Cà phê máy'), ('Latte Caramel', 'Cà phê', 'Cà phê máy'), ('Latte Almond', 'Cà phê', 'Cà phê máy'), ('Latte Nóng', 'Cà phê', 'Cà phê máy'), ('Matcha Latte', 'Matcha', ''), ('Matcha Latte Tây Bắc Sữa Yến Mạch', 'Matcha', ''), ('Matcha Latte Tây Bắc Sữa Yến Mạch (Nóng)', 'Matcha', ''), ('Matcha Latte Tây Bắc (Nóng)', 'Matcha', ''), ('Matcha Latte Tây Bắc', 'Matcha', '')]


In [25]:
retrieval6

[{'title': 'Latte Almond',
  'description': 'Latte Almond là sự kết hợp giữa Espresso đậm đà, sữa tươi béo ngậy, và syrup hạnh nhân thơm lừng, mang đến một hương vị ngọt nhẹ, béo ngậy và mát lạnh. Thức uống này tạo nên sự hòa quyện tuyệt vời giữa cà phê và vị hạnh nhân đặc trưng, đem lại cảm giác dễ chịu và độc đáo.',
  'price': '59000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1746441513_almond-coffee_f0797787534a473ea51f29afaadf37d3_grande.png'},
 {'title': 'Latte Caramel',
  'description': 'Latte Caramel là sự kết hợp giữa Espresso đậm đà, sữa tươi béo ngậy, và syrup caramel ngọt ngào, mang đến một hương vị thơm lừng, ngọt nhẹ và mát lạnh. Thức uống này tạo nên sự hài hòa giữa cà phê đậm và vị ngọt của caramel, đem lại cảm giác dễ chịu và thú vị.',
  'price': '59000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1746441451_caramel-coffee_dc2004f6d8144f2f8b7512ba95319ef7_grande.png'},
 {'title': 'Latte Hazelnut',
  'description': 'Latte Hazelnut 

#### **3. Determine to choose cases**

In [31]:
def handle_user_query(query, limit=5):
    preprocessed_query = preprocess_text(query)
    
    # Case 1: Check exact item
    is_exact, exact_item = is_exact_item(preprocessed_query)
    if is_exact:
        return search_exact_item(exact_item)
    
    # Case 2: General recommend
    return general_search_and_recommend(preprocessed_query, limit)

In [32]:
query7 = "Quán bạn có những loại Trà trái cây nào vậy?"
retrieval7 = handle_user_query(query7)

Trà trái cây - Hi Tea Trà trái cây None


In [33]:
retrieval7

[{'title': 'Oolong Tứ Quý Sen',
  'description': 'Nền trà oolong hảo hạng kết hợp cùng hạt sen tươi, bùi bùi và lớp foam cheese béo ngậy. Trà hạt sen là thức uống thanh mát, nhẹ nhàng phù hợp cho cả buổi sáng và chiều tối.',
  'price': '49000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1737356345_oolong-sen_d10cade0d3144d929a271638421d5e2a_grande.png'},
 {'title': 'Oolong Tứ Quý Sen (Nóng)',
  'description': 'Nền trà oolong hảo hạng kết hợp cùng hạt sen tươi, bùi bùi thơm ngon. Trà hạt sen là thức uống thanh mát, nhẹ nhàng phù hợp cho cả buổi sáng và chiều tối.',
  'price': '59000',
  'image_url': 'http://product.hstatic.net/1000075078/product/1737356332_oolong-tu-quy-sen-nong_df3f6ef8a6874fae8618499d8d1e2754_grande.png'},
 {'title': 'Trà Đào Cam Sả - Đá',
  'description': 'Vị thanh ngọt của đào, vị chua dịu của Cam Vàng nguyên vỏ, vị chát của trà đen tươi được ủ mới mỗi 4 tiếng, cùng hương thơm nồng đặc trưng của sả chính là điểm sáng làm nên sức hấp dẫn của thức u

### **Prompt Augmentation**

In [None]:
def get_relevant_chunk(query):
    results = handle_user_query(query, limit=5)
    
    # Case 2: List of sub_categories
    if isinstance(results, dict) and results.get("type") == "sub_category":
        sub_list = results["data"]
        final_ans = ", ".join(sub_list[:-1]) + f" và {sub_list[-1]}" if len(sub_list) > 1 else sub_list[0]
        context = f"Quán có các loại như: {final_ans}. Bạn muốn thử loại nào?"
        return {"context": context, "image_url": []}
    
    # Case 2: String
    if isinstance(results, str):
        return {"context": results, "image_url": []}
    
    if results:
        # Collect image URLs in a list
        image_urls = [item["image_url"] for item in results if item.get("image_url") and item.get("image_url").strip()]
        
        if len(results) == 1:
            # Case 1: Exact match
            item = results[0]
            price = f"{item['price']} VNĐ" if isinstance(item['price'], (int, float)) else item['price']
            context = (
                f"Tên: {item['title']}\n"
                f"Giá: {price}\n"
                f"Mô tả: {item['description']}"
            )
            return {"context": context, "image_url": image_urls}
        else:
            # Case 2: General match with multiple items
            context = "Quán có các món sau:\n"
            for i, item in enumerate(results, 1):
                price = f"{item['price']} VNĐ" if isinstance(item['price'], (int, float)) else item['price']
                context += (
                    f"{i}. {item['title']}\n"
                    f"   Giá: {price}\n"
                    f"   Mô tả: {item['description']}\n"
                    f"---\n"
                )
            return {"context": context.strip(), "image_url": image_urls}

    return {
        "context": "Quán của mình hiện không bán món nước này. Anh/chị muốn thử món nào khác không?", 
        "image_url": []
    }

In [None]:
def make_prompt(query, context):
    # Determine case to create suitable instruction
    is_exact, _ = is_exact_item(query)
    case = 1 if is_exact else 2
    
    if case == 1:
        instruction = (
            """
            Hãy trả lời một cách ấm áp, nhẹ nhàng, tập trung vào món mà khách hàng hỏi.
            Tóm tắt mô tả món dựa trên context, chỉ nói những điểm nổi bật.
            Cuối cùng, hỏi thêm nếu cần. 
            """
        )
    else:
        instruction = (
            """
            Hãy trả lời một cách thân thiện, tự nhiên.
            Nếu context là danh sách các món, tóm tắt và giới thiệu từng món một cách ngắn gọn, chỉ nêu những đặc điểm nổi bật.
            Sau đó, khuyến khích khách hàng chọn một món.
            
            Quan trọng: Vui lòng liệt kê mỗi món sử dụng dấu gạch đầu dòng (-) để đánh dấu từng món theo format sau
            1. **[Tên món]**: [Mô tả]
            2. **[Tên món]**: [Mô tả]
            ...
            """
        )
    
    return (
        f"Query: {query}\n\n"
        f"Context: \n{context}\n\n"
        f"Answer: {instruction}"
    )

In [None]:
import google.generativeai as genai

chat_history = []

# System prompt content
system_prompt_content = (
    "Bạn là một chatbot của cửa hàng bán cà phê và các loại đồ uống khác. ",
    "Vai trò của bạn là hỗ trợ khách hàng trong việc tìm hiểu về các sản phẩm và dịch vụ của cửa hàng, ",
    "cũng như tạo một trải nghiệm mua sắm dễ chịu và thân thiện. ",
    "Bạn cũng có thể trò chuyện với khách hàng về các chủ đề không liên quan đến sản phẩm như thời tiết, sở thích cá nhân, ",
    "và những câu chuyện thú vị khác để tạo sự gắn kết. ",
    "Hãy luôn giữ thái độ lịch sự và chuyên nghiệp. ",
    "Nếu khách hàng hỏi về sản phẩm cụ thể, hãy cung cấp thông tin chi tiết và gợi ý các lựa chọn phù hợp. ",
    "Nếu khách hàng trò chuyện về các chủ đề không liên quan đến sản phẩm, hãy tham gia vào cuộc trò chuyện một cách vui vẻ và thân thiện.\n",
    
    "Một số điểm bạn cần lưu ý:\n",
    "1. Đáp ứng nhanh chóng và chính xác, sử dụng xưng hô là 'Mình và bạn'\n",
    "2. Giữ cho cuộc trò chuyện vui vẻ và thân thiện.\n",
    "3. Cung cấp thông tin hữu ích về quán và dịch vụ của cửa hàng.\n",
    "4. Giữ cho cuộc trò chuyện mang tính chất hỗ trợ và giúp đỡ.\n",
    "5. Khi tính tiền: chỉ cần thông báo **tổng tiền cuối cùng**. Không hiển thị bước tính toán.\n"
    "6. Nếu khách gọi tên món kèm yêu cầu cá nhân hóa (ví dụ: 'ít đường', 'ít đá', 'nhiều sữa', 'đậm vị'...): "
    "Hãy làm cho khách hàng cảm thấy được chào đón và quan tâm!"
)

### **Generate Answer**

In [None]:
def generate_answer(query, chat_history, limit=5):
    genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
    model = genai.GenerativeModel('gemini-1.5-flash')
    
    # Take context from get_relevant_chunk
    context = get_relevant_chunk(query)
    
    # Create prompt
    prompt = make_prompt(query, context)
    
    # Apppend the prompt to chat history
    if len(chat_history) > 10:
        chat_history = chat_history[-10:]
    chat_history.append(f'User: {prompt}')
    
    # Combine system message to chat history
    full_prompt = f"{system_prompt_content}\n\n" + "\n".join(chat_history) + f"\n\n{prompt}\nAssistant:"
    
    # Generate response
    try:
        response = model.generate_content(full_prompt)
        chat_history.append(f"Assistant: {response.text}")
        return response.text
    except Exception as e:
        print(f"Error generating response: {e}")
        return "Mình xin lỗi vì gặp chút trục trặc. Bạn có thể hỏi lại hoặc thử món khác nhé!"

In [33]:
def main():
    # query = "Quán mình có cà phê đen đá không? Cho tôi một ly cà phê đen đá không đường"
    # query = "Quán mình có bán những loại bánh ngọt nào vậy?"
    query = "Quán mình có bán những loại cà phê nào vậy? Có thể cho tôi biết best seller của quán không?"
    
    print(f"\nQuery: {query}")
    answer = generate_answer(query, chat_history, limit=5)
    print("Answer:", answer)
    print("Chat history:", chat_history[-2:] if len(chat_history) >= 2 else chat_history) 

if __name__ == "__main__":
    main()


Query: Quán mình có bán những loại cà phê nào vậy? Có thể cho tôi biết best seller của quán không?
Answer: Chào bạn! Quán mình có rất nhiều loại cà phê ngon đó nha!  Mình có cà phê máy thơm ngon, đậm đà, cà phê phin truyền thống, Cold Brew thơm mát, A-Mê độc đáo và Espresso mạnh mẽ.

Best seller của quán hiện nay là Cold Brew đấy bạn ạ!  Nó có vị cà phê êm dịu, không đắng gắt, rất dễ uống, đặc biệt thích hợp cho những ngày hè nóng bức.  

Bạn thấy loại nào hợp khẩu vị nhất nè?  Mình có thể tư vấn thêm cho bạn nếu bạn muốn đó!

Chat history: ['User: Query: Quán mình có bán những loại cà phê nào vậy? Có thể cho tôi biết best seller của quán không?\n\nContext: \nQuán mình có các loại cà phê như: Cà phê máy, Cà phê phin, Cold Brew, A-Mê và Espresso\n\nAnswer: Hãy trả lời một cách thân thiện, tự nhiên. Nếu context là danh sách loại món, liệt kê chúng và hỏi khách muốn loại nào cụ thể. Nếu context là danh sách món, giới thiệu ngắn gọn từng món và khuyến khích khách chọn.', 'Assistant: Chào 