# ตัวอย่าง การทำงานที่รวมเรื่องการกรองฟิวเตอร์จากคำถามของ user + ตำแหน่ง และทำการแสดงแผนที่ออกมา 10 ลำดับ

Keyword-Driven Data Filtering with LLM Integration + Filtering by radius calculation of users  & Show maps

In [2]:
url ='http://111.223.37.52/v1'
api_key = 'eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJkYXRhIjp7Im9yZ2FuaXphdGlvbl9pZCI6IjY3MzU2NTczYWM4ZjUzNGEwMGUxNjkzZiIsInRva2VuX25hbWUiOiJTRFAtREVWIiwic3RkRGF0ZSI6IjIwMjQtMTEtMTdUMTc6MDA6MDAuMDAwWiJ9LCJpYXQiOjE3MzE5MTczNzksImV4cCI6MTc4Mjc1MjM5OX0.XLU98w0PT4Gy_PzlLhHVWMawkEH8pWpxsYzt3Ffw6xE'

In [3]:
# 1 Data Loading
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI
import pandas as pd

# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # API Key สำหรับการเข้าถึงเซิร์ฟเวอร์
    max_tokens=1000  # จำกัดจำนวนโทเค็นในคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")  # โหลดไฟล์ข้อมูล


In [4]:
# 2 Distance Calculation : คำนวณระยะทางระหว่างตำแหน่งผู้ใช้กับสถานที่ใน DataFrame
from geopy.distance import geodesic

def calculate_distance(user_location, place_location):
    return geodesic(user_location, place_location).kilometers

# ลบแถวที่มีค่า NaN ในคอลัมน์ LATITUDE_LOCATION และ LONGITUDE_LOCATION
df = df.dropna(subset=['LATITUDE_LOCATION', 'LONGITUDE_LOCATION'])


In [5]:
# 3  Keyword Extraction : ใช้ LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
def extract_keywords_from_query(query: str) -> str:
    """
    ใช้โมเดล LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
    """
    # ส่งคำถามไปยังโมเดล LLM
    response = llm.invoke(f"แยกคำสำคัญจากคำถามนี้: '{query}' และแสดงคำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้")
    
    # ตรวจสอบผลลัพธ์และคืนค่าคำสำคัญ
    return response.content.strip()


In [7]:
# คาดว่าไม่ได้ใช้
# 4 Data Filtering : กรองข้อมูลใน DataFrame ตามคำสำคัญ เช่น จังหวัด, ประเภท, ระยะทาง ฯลฯ 
# คำนวณระยะทางแล้วเก็บไว้ในคอลัมน์ DISTANCE และกรองข้อมูลจากระยะทางที่คำนวณได้
def filter_data(df: pd.DataFrame, thai_name: str = None, region: str = None, subdistrict: str = None,
                district: str = None, province: str = None, category: str = None, subtype: str = None,
                user_location: tuple = None, radius: float = None) -> pd.DataFrame:
    """
    ฟังก์ชันกรองข้อมูลจาก DataFrame ตามค่าที่ระบุในคอลัมน์ต่างๆ และพิกัดระยะทาง
    """
    if df.empty:
        print("DataFrame is empty!")
        return pd.DataFrame()

    print("Initial DataFrame shape:", df.shape)

    # กรองข้อมูลตามคอลัมน์
    if thai_name:
        df = df[df['ATT_NAME_TH'].str.contains(thai_name, na=False, case=False)]
    if region:
        df = df[df['REGION_NAME_TH'].str.contains(region, na=False, case=False)]
    if subdistrict:
        df = df[df['SUBDISTRICT_NAME_TH'].str.contains(subdistrict, na=False, case=False)]
    if district:
        df = df[df['DISTRICT_NAME_TH'].str.contains(district, na=False, case=False)]
    if province:
        df = df[df['PROVINCE_NAME_TH'].str.contains(province, na=False, case=False)]
    if category:
        df = df[df['ATTR_CATAGORY_TH'].str.contains(category, na=False, case=False)]
    if subtype:
        df = df[df['ATTR_SUB_TYPE_TH'].str.contains(subtype, na=False, case=False)]

    # กรองข้อมูลตามระยะทาง (ถ้ากำหนดพิกัดผู้ใช้และรัศมี)#
    if user_location and radius:
        df['DISTANCE'] = df.apply(
            lambda row: calculate_distance(user_location, (row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION'])), axis=1
        )
        df = df[df['DISTANCE'] <= radius]

    print("Filtered DataFrame shape:", df.shape)
    return df


In [8]:
# 5 Tool Creation : ให้ LLM สามารถเรียกใช้ฟังก์ชัน filter_data ได้ (Function Calling)
from langchain.agents import Tool

# สร้าง Custom Tool
filter_data_tool = Tool(
    name="Filter Data",
    func=filter_data,
    description="กรองข้อมูลจาก DataFrame ตามคอลัมน์ต่างๆ เช่น ATT_NAME_TH, REGION_NAME_TH รวมถึงการกรองระยะทางจากพิกัดผู้ใช้"
)


In [9]:
# 6 Agent Creation : ใช้ create_pandas_dataframe_agent รวม LLM กับ DataFrame และ Tool
# ตั้งค่าให้ Agent สามารถทำงานแบบ Function Calling ได้
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

agent = create_pandas_dataframe_agent(
    llm=llm,
    df=df,
    verbose=True,
    allow_dangerous_code=True,  # ใช้ตัวเลือกนี้อย่างระมัดระวัง
    agent_type="tool-calling",
    tools=[filter_data_tool]
)




In [10]:
# 7 User Query Processing : รับคำถามของผู้ใช้ & แยกคำสำคัญ & เพื่อกรองข้อมูลตามคำสำคัญ และ ระยะทาง
# รับค่ามาจากinput user ที่กรองแล้ว
# ตัวอย่างคำถามของผู้ใช้
user_query = "ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติในจังหวัดนครปฐมให้หน่อย"

# ใช้ฟังก์ชันแยกคำสำคัญ
keywords = extract_keywords_from_query(user_query)
print("คำสำคัญที่ได้จากคำถาม:", keywords)

# การกรองข้อมูลตามคำสำคัญจากคำถามผู้ใช้
# แยกคำสำคัญที่เกี่ยวข้องกับการกรองข้อมูลออก
province = None
category = None

# กรองข้อมูลตามคำสำคัญของผู้ใช้
filtered_by_user_request = filter_data(
    df=df, 
    province=province,  # กรองจังหวัดตามคำสำคัญที่ได้
    category=category  # กรองประเภทตามคำสำคัญที่ได้
)

# ระบุพิกัดของผู้ใช้และรัศมี
user_location = (14.022788, 99.978337)  # พิกัดของผู้ใช้
radius = 50  # รัศมี 50 กิโลเมตร

# กรองข้อมูลตามพิกัดหลังจากกรองคำสั่งผู้ใช้แล้ว
filtered_by_location = filter_data(
    df=filtered_by_user_request,
    user_location=user_location,
    radius=radius
)

# แสดงผลลัพธ์สุดท้าย
print("สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:")
print(filtered_by_location[['ATT_NAME_TH', 'PROVINCE_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']])


คำสำคัญที่ได้จากคำถาม: คำสำคัญจากคำถาม 'ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติในจังหวัดนครปฐมให้หน่อย' ได้แก่:

1. แหล่งท่องเที่ยว
2. ทางธรรมชาติ
3. จังหวัดนครปฐม

คำที่สามารถใช้กรองข้อมูลได้:
- ท่องเที่ยว
- ธรรมชาติ
- นครปฐม
- แหล่งท่องเที่ยวทางธรรมชาติ
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (8241, 15)
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (330, 16)
สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:
                       ATT_NAME_TH PROVINCE_NAME_TH  LATITUDE_LOCATION  \
48              ชุมชนเกาะลัดอีแท่น           นครปฐม          13.756728   
130    พิพิธภัณฑสถานแห่งชาติอู่ทอง       สุพรรณบุรี          14.372874   
165         วัดราษฎร์ศรัทธากะยาราม        สมุทรสาคร          13.590556   
191   กลุ่มสตรีพัฒนากล้วยน้ำว้าไทย        กาญจนบุรี          14.071364   
203               วูดแลนด์เมืองไม้           นครปฐม          13.858140   
...                            ...              ...                ...   
8175              สมาภรณ์ การ์เด้น     

โชว์ตำแหน่งทั้งหมดเลย

In [11]:
# 8 แสดงแผนที่และข้อมูลชื่อสถานที่ที่กรองได้ และ แสดงตำแหน่งของuser

import ipywidgets as widgets
import folium
from IPython.display import display

# ฟังก์ชันสร้างแผนที่พร้อมแสดงหมุดของผู้ใช้
def create_map(center_lat, center_lon, zoom_start=12, user_lat=None, user_lon=None):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    
    # หากมีข้อมูลตำแหน่งของผู้ใช้ ให้แสดงหมุดของผู้ใช้
    if user_lat and user_lon:
        folium.Marker([user_lat, user_lon],
                      popup="คุณอยู่ที่นี่",
                      icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)  # หมุดสีน้ำเงิน
    
    return m

# ฟังก์ชันอัปเดตแผนที่เมื่อเลือกสถานที่
def update_map(change):
    # ค้นหาสถานที่ที่ถูกเลือกใน Dropdown
    selected_place = filtered_by_location[filtered_by_location['ATT_NAME_TH'] == dropdown.value].iloc[0]
    lat, lon = selected_place['LATITUDE_LOCATION'], selected_place['LONGITUDE_LOCATION']
    
    # ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
    user_lat, user_lon = user_location   # พิกัดของผู้ใช้
    
    m = create_map(lat, lon, user_lat=user_lat, user_lon=user_lon)
    
    # แสดงหมุดของสถานที่ที่เลือก
    for _, row in filtered_by_location.iterrows():
        folium.Marker([row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION']],
                      popup=row['ATT_NAME_TH'],
                      icon=folium.Icon(color="green")).add_to(m)
    display(m)

# สร้าง Dropdown สำหรับเลือกสถานที่ที่กรองแล้ว
dropdown = widgets.Dropdown(
    options=filtered_by_location['ATT_NAME_TH'].tolist(),  # ใช้สถานที่ที่กรองแล้ว
    description='สถานที่:',
    value=filtered_by_location['ATT_NAME_TH'].iloc[0]  # กำหนดค่าเริ่มต้น
)

# ตั้งค่าการอัปเดตเมื่อเปลี่ยนค่า Dropdown
dropdown.observe(update_map, names='value')

# สร้าง Layout สำหรับการแสดงผล
display(widgets.VBox([dropdown]))

# แสดงแผนที่เริ่มต้น
initial_place = filtered_by_location.iloc[0]  # ใช้สถานที่ที่กรองแล้วเป็นจุดเริ่มต้น
# ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
user_lat, user_lon = 14.022788, 99.978337  # พิกัดของผู้ใช้

initial_map = create_map(initial_place['LATITUDE_LOCATION'], initial_place['LONGITUDE_LOCATION'], user_lat=user_lat, user_lon=user_lon)
# แสดงหมุดของสถานที่
for _, row in filtered_by_location.iterrows():
    folium.Marker([row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION']],
                  popup=row['ATT_NAME_TH'],
                  icon=folium.Icon(color="green")).add_to(initial_map)
display(initial_map)


VBox(children=(Dropdown(description='สถานที่:', options=('ชุมชนเกาะลัดอีแท่น', 'พิพิธภัณฑสถานแห่งชาติอู่ทอง', …

# 10 อันดับ

# รับค่ามาจาก user location โดยที่ไม่ได้กำหนดเอง

In [12]:
# Map Rendering
import ipywidgets as widgets
import folium
from IPython.display import display

# ฟังก์ชันสร้างแผนที่พร้อมแสดงหมุดของผู้ใช้
def create_map(center_lat, center_lon, zoom_start=12, user_lat=None, user_lon=None):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    
    # หากมีข้อมูลตำแหน่งของผู้ใช้ ให้แสดงหมุดของผู้ใช้
    if user_lat and user_lon:
        folium.Marker([user_lat, user_lon],
                      popup="คุณอยู่ที่นี่",
                      icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)  # หมุดสีน้ำเงิน
    
    return m

# ฟังก์ชันอัปเดตแผนที่เมื่อเลือกสถานที่
def update_map(change):
    # ค้นหาสถานที่ที่ถูกเลือกใน Dropdown
    selected_place = filtered_by_location.head(10).reset_index(drop=True)
    selected_place = selected_place[selected_place['ATT_NAME_TH'] == dropdown.value].iloc[0]
    lat, lon = selected_place['LATITUDE_LOCATION'], selected_place['LONGITUDE_LOCATION']
    
    # ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
    user_lat, user_lon = user_location  # ใช้ตำแหน่งจากตัวแปร user_location
    
    m = create_map(lat, lon, user_lat=user_lat, user_lon=user_lon)
    
    # แสดงหมุดของสถานที่ที่เลือก
    for _, row in filtered_by_location.head(10).iterrows():  # ใช้ head(10) เพื่อแสดงแค่ 10 อันดับแรก
        folium.Marker([row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION']],
                      popup=row['ATT_NAME_TH'],
                      icon=folium.Icon(color="green")).add_to(m)
    display(m)

# สร้าง Dropdown สำหรับเลือกสถานที่ที่กรองแล้ว (จำกัด 10 อันดับแรก)
dropdown = widgets.Dropdown(
    options=filtered_by_location.head(10)['ATT_NAME_TH'].tolist(),  # ใช้สถานที่ที่กรองแล้ว 10 อันดับแรก
    description='สถานที่:',
    value=filtered_by_location.head(10)['ATT_NAME_TH'].iloc[0]  # กำหนดค่าเริ่มต้น
)

# ตั้งค่าการอัปเดตเมื่อเปลี่ยนค่า Dropdown
dropdown.observe(update_map, names='value')

# สร้าง Layout สำหรับการแสดงผล
display(widgets.VBox([dropdown]))

# แสดงแผนที่เริ่มต้น (แค่ 10 อันดับแรก)
initial_place = filtered_by_location.head(10).reset_index(drop=True).iloc[0]  # รีเซ็ตดัชนี
# ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
user_lat, user_lon = user_location  # ใช้ตำแหน่งจากตัวแปร user_location

initial_map = create_map(initial_place['LATITUDE_LOCATION'], initial_place['LONGITUDE_LOCATION'], user_lat=user_lat, user_lon=user_lon)
# แสดงหมุดของสถานที่
for _, row in filtered_by_location.head(10).iterrows():  # ใช้ head(10) เพื่อแสดงแค่ 10 อันดับแรก
    folium.Marker([row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION']],
                  popup=row['ATT_NAME_TH'],
                  icon=folium.Icon(color="green")).add_to(initial_map)
display(initial_map)


VBox(children=(Dropdown(description='สถานที่:', options=('ชุมชนเกาะลัดอีแท่น', 'พิพิธภัณฑสถานแห่งชาติอู่ทอง', …

# ลองให้ทำการกรองระยะทางก่อนกรองความสำคัญ

In [30]:
# รับคำถามจากผู้ใช้
user_query = "วัดใกล้ๆ"

# แยกคำสำคัญจากคำถามผู้ใช้
# keywords = extract_keywords_from_query(user_query)
# print("คำสำคัญที่ได้จากคำถาม:", keywords)

# ระบุพิกัดของผู้ใช้และรัศมี
user_location = (14.022788, 99.978337)  # พิกัดของผู้ใช้

radius = 10  # รัศมี 50 กิโลเมตร

# กรองข้อมูลตามระยะทางก่อน
filtered_by_location = filter_data(
    df=df,
    user_location=user_location,
    radius=radius
)
# filtered_by_location
# # กรองข้อมูลที่ได้จากระยะทางโดยใช้คำสำคัญจากคำถาม
# province = None
# category = None

# # กรองข้อมูลตามคำสำคัญที่ได้จากคำถาม
# filtered_by_user_request = filter_data(
#     df=filtered_by_location, 
#     province=keywords,  # กรองจังหวัดตามคำสำคัญที่ได้
#     category=keywords   # กรองประเภทตามคำสำคัญที่ได้
# )

# # แสดงผลลัพธ์สุดท้าย
# print("สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตรและตามคำสำคัญ:")
# print(filtered_by_user_request[['ATT_NAME_TH', 'PROVINCE_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']])


Initial DataFrame shape: (8241, 16)
Filtered DataFrame shape: (7, 16)


In [32]:
filtered_by_location

Unnamed: 0,ATT_NAME_TH,ATT_NAME_EN,ATT_NEARBY_LOCATION,ATT_ADDRESS,REGION_NAME_TH,SUBDISTRICT_NAME_TH,DISTRICT_NAME_TH,PROVINCE_NAME_TH,ATTR_CATAGORY_TH,ATTR_SUB_TYPE_TH,ATT_START_END,ATT_DETAIL_TH,ATT_LOCATION,LATITUDE_LOCATION,LONGITUDE_LOCATION,DISTANCE
563,เมืองเก่ากำแพงแสน,Ancient City of Kamphaeng Saen,ตั้งอยู่ที่ตำบลทุ่งขวาง อำเภอกำแพงแสน อยู่ห่าง...,หมู่ที่ 5,ภาคกลาง,,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,กำแพงเมือง/คูเมือง,09.00 17.00 น.,เป็นเมืองโบราณสมัยทวารวดี มีอายุเท่ากับเมืองนค...,"13.99081662,99.96277294",13.990817,99.962773,3.916572
3383,สวนป่าสมุนไพร วัดปลักไม้ลาย,"Herbal Grove, Wat Plug Mai Lai",บริเวณวัดปลักไม้ลาย ตำบลทุ่งขวาง ห่างจากตัวเมื...,,ภาคกลาง,,เมืองนครปฐม,นครปฐม,แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษ นันทนาการ แล...,ไร่/สวนเกษตร (ฟาร์มสัตว์/ประมง),เปิดวันเสาร์ วันอาทิตย์ 09.00 17.00 น.,เป็นสวนป่าที่มีสมุนไพรไทยประมาณ 500 ชนิด ในเนื...,"13.983889,99.993889",13.983889,99.993889,4.620081
3841,อุทยานแมลงเฉลิมพระเกียรติ,His Majesty The king Insect Park,ตั้งอยู่ในมหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตกำแพงแสน,หมู่ 1,ภาคกลาง,,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษ นันทนาการ แล...,ศูนย์วิจัย (เกษตร)/สถานีทดลอง (เกษตร),ศูนย์วิจัยและพัฒนากีฏวิทยาอุตสาหกรรม สถาบันวิจ...,อยู่ในความดูแลของศูนย์วิจัยและพัฒนากีฏวิทยาอุต...,"14.03828686,99.96813811",14.038287,99.968138,2.038185
4621,สวนสาธารณะเฉลิมพระเกียรติ 80 พรรษา พระบาทสมเด็...,,บริเวณสวนพฤกษศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ วิท...,,ภาคกลาง,กำแพงแสน,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษ นันทนาการ แล...,สวนสาธารณะ/สวนหย่อม,ทุกวันตลอด 24 ชั่วโมง,,"14.0205778, 99.9735639",14.020578,99.973564,0.570657
4756,วัดประชาราษฎร์บำรุง,Wat Pracha Rat Bamrung,ใกล้ค่ายลูกเสือกำแพงแสน ตำบลรางพิกุล,,ภาคกลาง,,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),06.00 21.00 น.,,"13.9921332, 99.9084039999999",13.992133,99.908404,8.281281
4757,วัดปลักไม้ลาย,Wat Plak Mai Lai,ใกล้โรงเรียนวัดปลักไม้ลาย ตั้งอยู่ที่ตำบลทุ่งข...,,ภาคกลาง,,เมืองนครปฐม,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),08.00 17.00 น.,,"13.9358898, 99.9646898",13.93589,99.96469,9.726749
5595,วัดไผ่รื่นรมย์,ไม่มี,โรงเรียนการบิน ทางหลวงแผ่นดินหมายเลข 3294 อำเภ...,หมู่ 6,ภาคกลาง,ทุ่งลูกนก,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),ทุกวันเวลา 08.00 17.00 น.,,"14.0736875, 99.9256875",14.073688,99.925687,8.003309


In [33]:
 
import pandas as pd
 

# กรองคอลัมน์ ATTR_SUB_TYPE_TH เป็น list และตัดคำซ้ำ
a = filtered_by_location['ATT_NAME_TH'].drop_duplicates().tolist()

print("รายการ ATTR_SUB_TYPE_TH ที่ไม่ซ้ำ:")
print(a)


รายการ ATTR_SUB_TYPE_TH ที่ไม่ซ้ำ:
['เมืองเก่ากำแพงแสน', 'สวนป่าสมุนไพร วัดปลักไม้ลาย', 'อุทยานแมลงเฉลิมพระเกียรติ', 'สวนสาธารณะเฉลิมพระเกียรติ 80 พรรษา พระบาทสมเด็จพระเจ้าอยู่หัว', 'วัดประชาราษฎร์บำรุง', 'วัดปลักไม้ลาย', 'วัดไผ่รื่นรมย์']


In [None]:
from pydantic import BaseModel, Field
from langchain_core.prompts import PromptTemplate

from langchain_core.output_parsers import JsonOutputParser

class ScheduleEvent(BaseModel):
    Names: list[str] = Field(description="คือ list สถานที่ท่องเที่ยว")
   
        
user_query = "วัดใกล้ๆ"
unique_attr_sub_types = filtered_by_location['ATTR_SUB_TYPE_TH'].drop_duplicates().tolist()
 
parser = JsonOutputParser(pydantic_object=ScheduleEvent)

prompt = PromptTemplate(
    template="""\
## คุณมีหน้าที่กรองประเภทจากคำขอผู้ใช้.

# คำขอผู้ใช้: {user_query}
#  สถานที่ ท่องเที่ยวทั้งหมดที่มี เลือกจากในนี้มาตอบเท่านั้น: {unique_attr_sub_types}

# Your response should be structured as follows:
{format_instructions}
""",
    input_variables=["user_query" , "unique_attr_sub_types"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)
chain = prompt | llm | parser
event = chain.invoke({"user_query": user_query, "unique_attr_sub_types": a})
event

{'Names': ['วัดประชาราษฎร์บำรุง', 'วัดปลักไม้ลาย', 'วัดไผ่รื่นรมย์']}

In [35]:
from pydantic import BaseModel, Field
from langchain_core.prompts import PromptTemplate

from langchain_core.output_parsers import JsonOutputParser

class ScheduleEvent(BaseModel):
    TypeName: str = Field(description="คือ ประเภทของสถานที่ท่องเที่ยว")
   
        
user_query = "วัดใกล้ๆ"
unique_attr_sub_types = filtered_by_location['ATTR_SUB_TYPE_TH'].drop_duplicates().tolist()
 
parser = JsonOutputParser(pydantic_object=ScheduleEvent)

prompt = PromptTemplate(
    template="""\
## คุณมีหน้าที่กรองประเภทจากคำขอผู้ใช้.

# คำขอผู้ใช้: {user_query}
# ประเภทสถานที่ ท่องเที่ยวทั้งหมดที่มี เลือกจากในนี้มาตอบแค่อย่างเดียวเท่านั้น: {unique_attr_sub_types}

# Your response should be structured as follows:
{format_instructions}
""",
    input_variables=["user_query" , "unique_attr_sub_types"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)
chain = prompt | llm | parser
event = chain.invoke({"user_query": user_query, "unique_attr_sub_types": unique_attr_sub_types})
event

{'TypeName': 'ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ)'}

In [36]:
filtered_df = filtered_by_location[filtered_by_location['ATTR_SUB_TYPE_TH'].str.contains('ศาสนสถาน', na=False)].head(5)
filtered_df

Unnamed: 0,ATT_NAME_TH,ATT_NAME_EN,ATT_NEARBY_LOCATION,ATT_ADDRESS,REGION_NAME_TH,SUBDISTRICT_NAME_TH,DISTRICT_NAME_TH,PROVINCE_NAME_TH,ATTR_CATAGORY_TH,ATTR_SUB_TYPE_TH,ATT_START_END,ATT_DETAIL_TH,ATT_LOCATION,LATITUDE_LOCATION,LONGITUDE_LOCATION,DISTANCE
4756,วัดประชาราษฎร์บำรุง,Wat Pracha Rat Bamrung,ใกล้ค่ายลูกเสือกำแพงแสน ตำบลรางพิกุล,,ภาคกลาง,,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),06.00 21.00 น.,,"13.9921332, 99.9084039999999",13.992133,99.908404,8.281281
4757,วัดปลักไม้ลาย,Wat Plak Mai Lai,ใกล้โรงเรียนวัดปลักไม้ลาย ตั้งอยู่ที่ตำบลทุ่งข...,,ภาคกลาง,,เมืองนครปฐม,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),08.00 17.00 น.,,"13.9358898, 99.9646898",13.93589,99.96469,9.726749
5595,วัดไผ่รื่นรมย์,ไม่มี,โรงเรียนการบิน ทางหลวงแผ่นดินหมายเลข 3294 อำเภ...,หมู่ 6,ภาคกลาง,ทุ่งลูกนก,กำแพงแสน,นครปฐม,แหล่งท่องเที่ยวทางประวัติศาสตร์ และวัฒนธรรม,ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ),ทุกวันเวลา 08.00 17.00 น.,,"14.0736875, 99.9256875",14.073688,99.925687,8.003309


In [16]:
event["TypeName"]

'ศาสนสถาน (วัด/โบสถ์/มัสยิด ฯลฯ)'

In [38]:
from pydantic import BaseModel, Field
from langchain_core.prompts import PromptTemplate

from langchain_core.output_parsers import JsonOutputParser

class ScheduleEvent(BaseModel):
    TypeName: str = Field(description="คือ ประเภทของสถานที่ท่องเที่ยว")
   
        
user_query = "ร้านกาแฟใกล้ๆ"
unique_attr_sub_types = filtered_by_location['ATTR_SUB_TYPE_TH'].drop_duplicates().tolist()
 
parser = JsonOutputParser(pydantic_object=ScheduleEvent)

prompt = PromptTemplate(
    template="""\
## คุณมีหน้าที่กรองประเภทจากคำขอผู้ใช้.

# คำขอผู้ใช้: {user_query}
# ประเภทสถานที่ ท่องเที่ยวทั้งหมดที่มี เลือกจากในนี้มาตอบแค่อย่างเดียวเท่านั้น: {unique_attr_sub_types}

# Your response should be structured as follows:
{format_instructions}
""",
    input_variables=["user_query" , "unique_attr_sub_types"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)
chain = prompt | llm | parser
event = chain.invoke({"user_query": user_query, "unique_attr_sub_types": unique_attr_sub_types})
event

{'TypeName': 'สวนสาธารณะ/สวนหย่อม'}

![image.png](attachment:image.png)
