In [3]:
from __future__ import annotations
import os
import uuid
import chromadb
# Import สิ่งที่จำเป็นจาก ChromaDB
from chromadb.utils.embedding_functions import OpenCLIPEmbeddingFunction
from chromadb.utils.data_loaders import ImageLoader

In [7]:
# ---------------- Config ----------------
PERSIST_DIR = "./chroma_multimodal_local_dataloader" # เปลี่ยน path เพื่อไม่ให้ปนกับของเก่า
COLLECTION_NAME = "pets_local_dataloader"

DOG_IMAGES = ["images/dog1.png", "images/dog2.png", "images/dog3.png"]
CAT_IMAGES = ["images/cat1.png", "images/cat2.png", "images/cat3.png"]

In [8]:
# Step 1 - เตรียม path ของรูปและ metadata
all_image_paths = DOG_IMAGES + CAT_IMAGES
labels = ["dog"] * len(DOG_IMAGES) + ["cat"] * len(CAT_IMAGES)
doc_ids = [str(uuid.uuid4()) for _ in all_image_paths]

# --- ส่วนที่แก้ไข ---
# สร้าง document description
document_descriptions = [f"A photo of a {lbl}" for lbl in labels]
# เอามารวมใน metadatas แทน
metadatas = [
    {
        "label": lbl,
        "filename": os.path.basename(path),
        "description": desc # เพิ่ม description เข้าไปใน metadata
    }
    for lbl, path, desc in zip(labels, all_image_paths, document_descriptions)
]

In [10]:
# Step 2 - Setup ChromaDB Client
# ใช้ PersistentClient เพื่อให้บันทึกข้อมูลลงดิสก์
client = chromadb.PersistentClient(path=PERSIST_DIR)

# Step 3 - สร้าง/เรียกใช้ Collection โดยระบุ Embedding Function และ Data Loader
# ChromaDB จะใช้ OpenCLIP model ซึ่งเทียบเท่ากับ "clip-ViT-B-32" โดยอัตโนมัติ
collection = client.get_or_create_collection(
    name=COLLECTION_NAME,
    embedding_function=OpenCLIPEmbeddingFunction(), # บอกให้ใช้ OpenCLIP
    data_loader=ImageLoader(),                     # บอกให้ใช้ ImageLoader
    metadata={"hnsw:space": "cosine"}
)

In [11]:
# Step 4 - เพิ่มรูปเข้า DB โดยใช้ URIs
# ไม่ต้องแปลงรูปเป็น embedding เองแล้ว! แค่ส่ง path ของไฟล์ไป
collection.add(
    ids=doc_ids,
    uris=all_image_paths, # <--- จุดสำคัญคือตรงนี้
    metadatas=metadatas
)
print(f"Indexed {len(doc_ids)} images into collection '{collection.name}'.")

Indexed 6 images into collection 'pets_local_dataloader'.


In [12]:
# Step 5 - ทดสอบ Query ด้วยข้อความ
# ไม่ต้องแปลง query เป็น embedding เองเช่นกัน
query_text = "dog"
res = collection.query(
  query_texts=[query_text], # <--- ส่งข้อความ query เข้าไปตรงๆ
  n_results=4,
  include=["metadatas", "documents", "distances"]
)

# แสดงผลลัพธ์
print(f"\n=== Query: '{query_text}' ===")
for rank, (meta, doc, dist) in enumerate(zip(res["metadatas"][0], res["documents"][0], res["distances"][0]), start=1):
  print(f"#{rank} -> {meta['filename']} ({meta['label']}) distance={dist:.4f}")
  print("desc:", doc)


=== Query: 'dog' ===
#1 -> dog1.png (dog) distance=0.7248
desc: None
#2 -> dog2.png (dog) distance=0.7345
desc: None
#3 -> dog3.png (dog) distance=0.7376
desc: None
#4 -> cat1.png (cat) distance=0.7784
desc: None
