In [26]:
!pip install sentence-transformers faiss-cpu google-generativeai python-dotenv sqlalchemy psycopg2



In [27]:
import sys
import os

backend_path = os.path.abspath("..")
sys.path.append(backend_path)

print(sys.path)

['c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\python310.zip', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\DLLs', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\lib', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism', '', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\lib\\site-packages', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\lib\\site-packages\\win32', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\lib\\site-packages\\win32\\lib', 'c:\\Users\\nghoo\\AppData\\Local\\anaconda3\\envs\\tourism\\lib\\site-packages\\Pythonwin', 'd:\\Giselle_\\My Project\\smart-tourism-system\\backend', 'd:\\Giselle_\\My Project\\smart-tourism-system\\backend']


In [28]:
from sqlalchemy import create_engine, MetaData, Table
from sqlalchemy.orm import sessionmaker

DATABASE_URL = "postgresql+psycopg2://postgres:abc123@/tourismdb?host=/tmp"

engine = create_engine(DATABASE_URL, echo=False)
SessionLocal = sessionmaker(bind=engine)
session = SessionLocal()

metadata = MetaData()

print("PostgreSQL connected!")

PostgreSQL connected!


In [29]:
from typing import List, Dict, Any

def load_postgres_data_dynamic(engine, table_names: List[str]):
    metadata = MetaData()
    results = []

    with engine.begin() as conn:
        for tbl_name in table_names:
            table = Table(tbl_name, metadata, autoload_with=engine)
            rows = conn.execute(table.select()).fetchall()

            for r in rows:
                row_dict = dict(r._mapping)
                rid = row_dict.get("id", None)
                results.append({
                    "id": f"{tbl_name}:{rid}",
                    "record": row_dict
                })
    return results

In [30]:
from sentence_transformers import SentenceTransformer
import numpy as np

model = SentenceTransformer("intfloat/multilingual-e5-small")

def convert_record_to_text(record):
    if isinstance(record, dict):
        return " ".join(f"{k}: {v}" for k, v in record.items() if v)
    return str(record)

def get_embeddings(records):
    texts = [convert_record_to_text(r["record"]) for r in records]
    emb = model.encode(texts, convert_to_numpy=True, show_progress_bar=True)
    return emb.astype("float32")

In [31]:
import faiss
import pickle
import os

class VectorStore:
    def __init__(self, vectors, records):
        self.records = records
        d = vectors.shape[1]
        self.index = faiss.IndexFlatL2(d)
        self.index.add(vectors)

    def search(self, query_vector, top_k=5):
        if query_vector.ndim == 1:
            query_vector = query_vector.reshape(1, -1)
        distances, indices = self.index.search(query_vector, top_k)
        return [self.records[i] for i in indices[0] if 0 <= i < len(self.records)]

In [32]:
def retrieve(query: str, store: VectorStore, top_k=5):
    q_emb = get_embeddings([{"record": query}])
    return store.search(q_emb, top_k)

In [33]:
def build_itinerary_prompt(province, categories, subcategories, places, contexts, days=2):
    places_text = "\n".join([f"- {p['name']}" for p in places])
    contexts_text = "\n".join(["---\n" + str(c) for c in contexts])

    return f"""
Bạn là hướng dẫn viên du lịch chuyên nghiệp, hãy đưa ra một lịch trình cụ thể (chỉ đưa ra thôi, như một hệ thống và bạn không cần nói gì thêm).

## Tỉnh: {province}

## Category:
- {", ".join(categories)}

## Sub-category:
- {", ".join(subcategories)}

## Danh sách địa điểm người dùng chọn:
{places_text}

## Thông tin tham khảo từ cơ sở dữ liệu:
{contexts_text}

## Hãy xây dựng lịch trình du lịch {days} ngày:
- Chia rõ từng ngày.
- Thứ tự di chuyển hợp lý.
- Hoạt động chi tiết.
- Gợi ý thời gian trong ngày.
- Phong cách thân thiện, gợi cảm hứng.
- KHÔNG nhắc đến nguồn dữ liệu hay tài liệu tham khảo.
"""

In [34]:
from app.api.llm_module import ask_gemini

def generate_itinerary(prompt):
    return ask_gemini(prompt)

In [35]:
from sqlalchemy import create_engine, text

url = "postgresql+psycopg2://postgres:abc123@localhost:5432/tourismdb"
engine = create_engine(url)

try:
    with engine.connect() as conn:
        result = conn.execute(text("SELECT version();")).fetchone()
        print("Connected:", result)
except Exception as e:
    print("Error:", e)

Connected: ('PostgreSQL 16.10, compiled by Visual C++ build 1944, 64-bit',)


# Example

In [36]:
# 1) Load data
data = load_postgres_data_dynamic(engine, ["tourism_places"])
print("Loaded:", len(data))

# 2) Embed
vectors = get_embeddings(data)

# 3) Build vector store
store = VectorStore(vectors, data)

# 4) User selections (simulate)
province = "Đà Nẵng"
selected_categories = ["Tham quan", "Văn hoá"]
selected_subcategories = ["Chùa", "Bảo tàng"]
places = [
    {"name": "Chùa Linh Ứng"},
    {"name": "Bảo tàng điêu khắc Chăm"},
]

# 5) Create query
query = f"Tôi đang muốn đi du lịch {province} với các loại hình {selected_subcategories}"

# 6) RAG retrieve
contexts = retrieve(query, store, top_k=5)

# 7) Build prompt
prompt = build_itinerary_prompt(
    province,
    selected_categories,
    selected_subcategories,
    places,
    contexts,
    days=2
)

# 8) Generate itinerary
result = await generate_itinerary(prompt)

print(result)

Loaded: 387


Batches: 100%|██████████| 13/13 [00:19<00:00,  1.47s/it]
Batches: 100%|██████████| 1/1 [00:00<00:00, 57.41it/s]


## Lịch trình du lịch Đà Nẵng 2 ngày:

**Ngày 1: Khám phá văn hóa và tâm linh**

*   **8:00 - 11:00:** Chùa Linh Ứng (tham quan, ngắm cảnh).
*   **11:30 - 13:00:** Ăn trưa (mì Quảng, bún chả cá).
*   **14:00 - 17:00:** Bảo tàng điêu khắc Chăm (khám phá nghệ thuật Chăm Pa).

**Ngày 2: Hòa mình vào thiên nhiên**

*   **8:00 - 12:00:** Ngũ Hành Sơn (leo núi, khám phá hang động, viếng chùa).
*   **12:30 - 14:00:** Ăn trưa (nhà hàng địa phương gần Ngũ Hành Sơn).
*   **15:00 - 18:00:** Bãi biển Mỹ Khê (tắm biển, thư giãn).

