# จำลองให้แสดงแผนที่จากการเลือกสถานที่ต่างๆ แบบ drop down List โดยใช้การจำลองข้อมูล

In [1]:
import folium
from IPython.display import display
import ipywidgets as widgets
import pandas as pd

# ข้อมูลตัวอย่าง: สถานที่ 10 แห่ง
places = [
    {"name": "สถานที่ 1", "latitude": 14.022788, "longitude": 99.978337},
    {"name": "สถานที่ 2", "latitude": 14.050000, "longitude": 99.980000},
    {"name": "สถานที่ 3", "latitude": 14.070000, "longitude": 99.985000},
    {"name": "สถานที่ 4", "latitude": 14.080000, "longitude": 99.970000},
    {"name": "สถานที่ 5", "latitude": 14.060000, "longitude": 99.965000},
    {"name": "สถานที่ 6", "latitude": 14.040000, "longitude": 99.960000},
    {"name": "สถานที่ 7", "latitude": 14.030000, "longitude": 99.955000},
    {"name": "สถานที่ 8", "latitude": 14.025000, "longitude": 99.950000},
    {"name": "สถานที่ 9", "latitude": 14.035000, "longitude": 99.945000},
    {"name": "สถานที่ 10", "latitude": 14.045000, "longitude": 99.940000},
]

# สร้าง DataFrame สำหรับสถานที่
df = pd.DataFrame(places)

# ฟังก์ชันสร้างแผนที่
def create_map(center_lat, center_lon, zoom_start=15):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    folium.Marker([center_lat, center_lon],
                  popup="คุณอยู่ที่นี่",
                  icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)
    return m

# ฟังก์ชันอัปเดตแผนที่เมื่อเลือกสถานที่
def update_map(change):
    selected_place = df[df['name'] == dropdown.value].iloc[0]
    lat, lon = selected_place['latitude'], selected_place['longitude']
    m = create_map(lat, lon)
    display(m)

# สร้าง Dropdown สำหรับเลือกสถานที่
dropdown = widgets.Dropdown(
    options=df['name'].tolist(),
    description='สถานที่:',
    value=df['name'].iloc[0]
)

# ตั้งค่าการอัปเดตเมื่อเปลี่ยนค่า Dropdown
dropdown.observe(update_map, names='value')

# สร้าง Layout สำหรับการแสดงผล
display(widgets.VBox([dropdown]))

# แสดงแผนที่เริ่มต้น
initial_place = df.iloc[0]
initial_map = create_map(initial_place['latitude'], initial_place['longitude'])
display(initial_map)


VBox(children=(Dropdown(description='สถานที่:', options=('สถานที่ 1', 'สถานที่ 2', 'สถานที่ 3', 'สถานที่ 4', '…

# ลองเอา Keyword-Driven Data Filtering with LLM Integration + Filtering by radius calculation of users นำมาแสดงแผนที่

In [3]:
url ='http://111.223.37.52/v1'
api_key = 'eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJkYXRhIjp7Im9yZ2FuaXphdGlvbl9pZCI6IjY3MzU2NTczYWM4ZjUzNGEwMGUxNjkzZiIsInRva2VuX25hbWUiOiJTRFAtREVWIiwic3RkRGF0ZSI6IjIwMjQtMTEtMTdUMTc6MDA6MDAuMDAwWiJ9LCJpYXQiOjE3MzE5MTczNzksImV4cCI6MTc4Mjc1MjM5OX0.XLU98w0PT4Gy_PzlLhHVWMawkEH8pWpxsYzt3Ffw6xE'

In [4]:
# 1
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI
import pandas as pd

# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # API Key สำหรับการเข้าถึงเซิร์ฟเวอร์
    max_tokens=1000  # จำกัดจำนวนโทเค็นในคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")  # โหลดไฟล์ข้อมูล


In [5]:
# 2
from geopy.distance import geodesic

def calculate_distance(user_location, place_location):
    return geodesic(user_location, place_location).kilometers

# ลบแถวที่มีค่า NaN ในคอลัมน์ LATITUDE_LOCATION และ LONGITUDE_LOCATION
df = df.dropna(subset=['LATITUDE_LOCATION', 'LONGITUDE_LOCATION'])


In [6]:
# 3
def extract_keywords_from_query(query: str) -> str:
    """
    ใช้โมเดล LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
    """
    # ส่งคำถามไปยังโมเดล LLM
    response = llm.invoke(f"แยกคำสำคัญจากคำถามนี้: '{query}' และแสดงคำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้")
    
    # ตรวจสอบผลลัพธ์และคืนค่าคำสำคัญ
    return response.content.strip()


In [7]:
# 4 คำนวณระยะทางแล้วเก็บไว้ในคอลัมน์ DISTANCE และกรองข้อมูลจากระยะทางที่คำนวณได้
def filter_data(df: pd.DataFrame, thai_name: str = None, region: str = None, subdistrict: str = None,
                district: str = None, province: str = None, category: str = None, subtype: str = None,
                user_location: tuple = None, radius: float = None) -> pd.DataFrame:
    """
    ฟังก์ชันกรองข้อมูลจาก DataFrame ตามค่าที่ระบุในคอลัมน์ต่างๆ และพิกัดระยะทาง
    """
    if df.empty:
        print("DataFrame is empty!")
        return pd.DataFrame()

    print("Initial DataFrame shape:", df.shape)

    # กรองข้อมูลตามคอลัมน์
    if thai_name:
        df = df[df['ATT_NAME_TH'].str.contains(thai_name, na=False, case=False)]
    if region:
        df = df[df['REGION_NAME_TH'].str.contains(region, na=False, case=False)]
    if subdistrict:
        df = df[df['SUBDISTRICT_NAME_TH'].str.contains(subdistrict, na=False, case=False)]
    if district:
        df = df[df['DISTRICT_NAME_TH'].str.contains(district, na=False, case=False)]
    if province:
        df = df[df['PROVINCE_NAME_TH'].str.contains(province, na=False, case=False)]
    if category:
        df = df[df['ATTR_CATAGORY_TH'].str.contains(category, na=False, case=False)]
    if subtype:
        df = df[df['ATTR_SUB_TYPE_TH'].str.contains(subtype, na=False, case=False)]

    # กรองข้อมูลตามระยะทาง (ถ้ากำหนดพิกัดผู้ใช้และรัศมี)
    if user_location and radius:
        df['DISTANCE'] = df.apply(
            lambda row: calculate_distance(user_location, (row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION'])), axis=1
        )
        df = df[df['DISTANCE'] <= radius]

    print("Filtered DataFrame shape:", df.shape)
    return df


In [8]:
# 5
from langchain.agents import Tool

# สร้าง Custom Tool
filter_data_tool = Tool(
    name="Filter Data",
    func=filter_data,
    description="กรองข้อมูลจาก DataFrame ตามคอลัมน์ต่างๆ เช่น ATT_NAME_TH, REGION_NAME_TH รวมถึงการกรองระยะทางจากพิกัดผู้ใช้"
)


In [9]:
# 6
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

agent = create_pandas_dataframe_agent(
    llm=llm,
    df=df,
    verbose=True,
    allow_dangerous_code=True,  # ใช้ตัวเลือกนี้อย่างระมัดระวัง
    agent_type="tool-calling",
    tools=[filter_data_tool]
)




In [10]:
# 7 รับค่ามาจากinput user ที่กรองแล้ว
# ตัวอย่างคำถามของผู้ใช้
user_query = "แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษนันทนาการและความสนใจพิเศษในจังหวัดประจวบคีรีขันธ์ให้หน่อย"

# ใช้ฟังก์ชันแยกคำสำคัญ
keywords = extract_keywords_from_query(user_query)
print("คำสำคัญที่ได้จากคำถาม:", keywords)

# การกรองข้อมูลตามคำสำคัญจากคำถามผู้ใช้
# แยกคำสำคัญที่เกี่ยวข้องกับการกรองข้อมูลออก
province = None
category = None

# กรองข้อมูลตามคำสำคัญของผู้ใช้
filtered_by_user_request = filter_data(
    df=df, 
    province=province,  # กรองจังหวัดตามคำสำคัญที่ได้
    category=category  # กรองประเภทตามคำสำคัญที่ได้
)

# ระบุพิกัดของผู้ใช้และรัศมี
user_location = (10.9, 99.2)  # พิกัดของผู้ใช้
radius = 50  # รัศมี 50 กิโลเมตร

# กรองข้อมูลตามพิกัดหลังจากกรองคำสั่งผู้ใช้แล้ว
filtered_by_location = filter_data(
    df=filtered_by_user_request,
    user_location=user_location,
    radius=radius
)

# แสดงผลลัพธ์สุดท้าย
print("สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:")
print(filtered_by_location[['ATT_NAME_TH', 'PROVINCE_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']])


คำสำคัญที่ได้จากคำถาม: จากคำถาม "แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษนันทนาการและความสนใจพิเศษในจังหวัดประจวบคีรีขันธ์ให้หน่อย" สามารถแยกคำสำคัญออกมาได้ดังนี้:

1. แหล่งท่องเที่ยว
2. กิจกรรมพิเศษ
3. นันทนาการ
4. ความสนใจพิเศษ
5. จังหวัดประจวบคีรีขันธ์

คำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้ ได้แก่:

- ท่องเที่ยว
- กิจกรรม
- นันทนาการ
- ความสนใจ
- จังหวัด
- ประจวบคีรีขันธ์

คำเหล่านี้สามารถใช้ในการค้นหาข้อมูลที่เฉพาะเจาะจงเกี่ยวกับแหล่งท่องเที่ยวและกิจกรรมในจังหวัดประจวบคีรีขันธ์ได้อย่างมีประสิทธิภาพ
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (8241, 15)
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (89, 16)
สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:
                    ATT_NAME_TH PROVINCE_NAME_TH  LATITUDE_LOCATION  \
158                 ถ้ำแก้วโครำ            ชุมพร          10.648071   
170                 น้ำตกไทรคู่  ประจวบคีรีขันธ์          11.248322   
424                  แก่งหินปิด  ประจวบคีรีขันธ์          11.125246   
427      อุทยา

In [11]:
# 8 แสดงแผนที่และข้อมูลชื่อสถานที่ที่กรองได้
import folium
from IPython.display import display
import ipywidgets as widgets
import pandas as pd

# คัดเลือก 10 สถานที่แรกจาก DataFrame ที่กรองแล้ว
top_places = filtered_by_location.head(10)

# แปลงข้อมูลสถานที่ให้เป็นรูปแบบที่ต้องการ
places = top_places[['ATT_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']].rename(
    columns={'ATT_NAME_TH': 'name', 'LATITUDE_LOCATION': 'latitude', 'LONGITUDE_LOCATION': 'longitude'}
).to_dict('records')

# สร้าง DataFrame สำหรับสถานที่
df = pd.DataFrame(places)

# ฟังก์ชันสร้างแผนที่
def create_map(center_lat, center_lon, zoom_start=12):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    folium.Marker([center_lat, center_lon],
                  popup="คุณอยู่ที่นี่",
                  icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)
    return m

# ฟังก์ชันอัปเดตแผนที่เมื่อเลือกสถานที่
def update_map(change):
    selected_place = df[df['name'] == dropdown.value].iloc[0]
    lat, lon = selected_place['latitude'], selected_place['longitude']
    m = create_map(lat, lon)
    for _, row in df.iterrows():
        folium.Marker([row['latitude'], row['longitude']],
                      popup=row['name'],
                      icon=folium.Icon(color="green")).add_to(m)
    display(m)

# สร้าง Dropdown สำหรับเลือกสถานที่
dropdown = widgets.Dropdown(
    options=df['name'].tolist(),
    description='สถานที่:',
    value=df['name'].iloc[0]
)

# ตั้งค่าการอัปเดตเมื่อเปลี่ยนค่า Dropdown
dropdown.observe(update_map, names='value')

# สร้าง Layout สำหรับการแสดงผล
display(widgets.VBox([dropdown]))

# แสดงแผนที่เริ่มต้น
initial_place = df.iloc[0]
initial_map = create_map(initial_place['latitude'], initial_place['longitude'])
for _, row in df.iterrows():
    folium.Marker([row['latitude'], row['longitude']],
                  popup=row['name'],
                  icon=folium.Icon(color="green")).add_to(initial_map)
display(initial_map)


VBox(children=(Dropdown(description='สถานที่:', options=('ถ้ำแก้วโครำ', 'น้ำตกไทรคู่', 'แก่งหินปิด', 'อุทยานแห…

# เพิ่มหมุดของUSER

In [13]:
# ฟังก์ชันสร้างแผนที่พร้อมแสดงหมุดของผู้ใช้
def create_map(center_lat, center_lon, zoom_start=12, user_lat=None, user_lon=None):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    
    # หากมีข้อมูลตำแหน่งของผู้ใช้ ให้แสดงหมุดของผู้ใช้
    if user_lat and user_lon:
        folium.Marker([user_lat, user_lon],
                      popup="คุณอยู่ที่นี่",
                      icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)  # หมุดสีน้ำเงิน
    
    return m

# ฟังก์ชันอัปเดตแผนที่เมื่อเลือกสถานที่
def update_map(change):
    selected_place = df[df['name'] == dropdown.value].iloc[0]
    lat, lon = selected_place['latitude'], selected_place['longitude']
    
    # ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
    user_lat, user_lon = 10.9, 99.2  # พิกัดของผู้ใช้
    
    m = create_map(lat, lon, user_lat=user_lat, user_lon=user_lon)
    
    # แสดงหมุดของสถานที่ที่เลือก
    for _, row in df.iterrows():
        folium.Marker([row['latitude'], row['longitude']],
                      popup=row['name'],
                      icon=folium.Icon(color="green")).add_to(m)
    display(m)

# สร้าง Dropdown สำหรับเลือกสถานที่
dropdown = widgets.Dropdown(
    options=df['name'].tolist(),
    description='สถานที่:',
    value=df['name'].iloc[0]
)

# ตั้งค่าการอัปเดตเมื่อเปลี่ยนค่า Dropdown
dropdown.observe(update_map, names='value')

# สร้าง Layout สำหรับการแสดงผล
display(widgets.VBox([dropdown]))

# แสดงแผนที่เริ่มต้น
initial_place = df.iloc[0]
# ใช้ตำแหน่งผู้ใช้จาก user_location ที่ได้รับจากโค้ดก่อนหน้า
user_lat, user_lon = 10.9, 99.2  # พิกัดของผู้ใช้

initial_map = create_map(initial_place['latitude'], initial_place['longitude'], user_lat=user_lat, user_lon=user_lon)
# แสดงหมุดของสถานที่
for _, row in df.iterrows():
    folium.Marker([row['latitude'], row['longitude']],
                  popup=row['name'],
                  icon=folium.Icon(color="green")).add_to(initial_map)
display(initial_map)


VBox(children=(Dropdown(description='สถานที่:', options=('ถ้ำแก้วโครำ', 'น้ำตกไทรคู่', 'แก่งหินปิด', 'อุทยานแห…

# ลองเอาLlamaIndex มาใช้

In [2]:
! pip install llama_index




[notice] A new release of pip is available: 24.2 -> 24.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [5]:
from llama_index import GPTSimpleVectorIndex, Document
import pandas as pd
from langchain_openai import ChatOpenAI
from geopy.distance import geodesic
from langchain.agents import Tool
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

# 1 Data Loading
# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # API Key สำหรับการเข้าถึงเซิร์ฟเวอร์
    max_tokens=1000  # จำกัดจำนวนโทเค็นในคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")  # โหลดไฟล์ข้อมูล

# 2 สร้างดัชนี LlamaIndex จากข้อมูล DataFrame
documents = []
for _, row in df.iterrows():
    # สร้าง Document จากข้อมูลในแต่ละแถว
    text = f"ชื่อสถานที่: {row['ATT_NAME_TH']}, จังหวัด: {row['PROVINCE_NAME_TH']}, ประเภท: {row['ATTR_CATAGORY_TH']}, ตำแหน่ง: ({row['LATITUDE_LOCATION']}, {row['LONGITUDE_LOCATION']})"
    documents.append(Document(text=text))

# สร้างดัชนีจากเอกสาร
index = GPTSimpleVectorIndex.from_documents(documents)

# 3 Distance Calculation: คำนวณระยะทางระหว่างตำแหน่งผู้ใช้กับสถานที่ใน DataFrame
def calculate_distance(user_location, place_location):
    return geodesic(user_location, place_location).kilometers

# 4 Keyword Extraction: ใช้ LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
def extract_keywords_from_query(query: str) -> str:
    """
    ใช้โมเดล LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
    """
    # ส่งคำถามไปยังโมเดล LLM
    response = llm.invoke(f"แยกคำสำคัญจากคำถามนี้: '{query}' และแสดงคำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้")
    
    # ตรวจสอบผลลัพธ์และคืนค่าคำสำคัญ
    return response.content.strip()

# 5 Tool Creation: ให้ LLM สามารถเรียกใช้ฟังก์ชัน filter_data ได้ (Function Calling)
# สร้าง Custom Tool สำหรับค้นหาจาก LlamaIndex
def search_using_llamaindex(query: str):
    # ใช้ LlamaIndex ในการค้นหาคำสำคัญจากคำถาม
    return index.query(query)

filter_data_tool = Tool(
    name="Search Data",
    func=search_using_llamaindex,
    description="ค้นหาข้อมูลจาก DataFrame โดยใช้ LlamaIndex"
)

# 6 Agent Creation: ใช้ create_pandas_dataframe_agent รวม LLM กับ DataFrame และ Tool
agent = create_pandas_dataframe_agent(
    llm=llm,
    df=df,
    verbose=True,
    allow_dangerous_code=True,  # ใช้ตัวเลือกนี้อย่างระมัดระวัง
    agent_type="tool-calling",
    tools=[filter_data_tool]
)

# 7 User Query Processing: รับคำถามของผู้ใช้ & แยกคำสำคัญ & เพื่อกรองข้อมูลตามคำสำคัญ และ ระยะทาง
user_query = "ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติในจังหวัดนครปฐมให้หน่อย"

# ใช้ฟังก์ชันแยกคำสำคัญ
keywords = extract_keywords_from_query(user_query)
print("คำสำคัญที่ได้จากคำถาม:", keywords)

# ค้นหาข้อมูลจาก LlamaIndex
result = search_using_llamaindex(user_query)
print("ผลการค้นหาจาก LlamaIndex:", result)

# ถ้าต้องการกรองข้อมูลตามระยะทางด้วย
user_location = (14.022788, 99.978337)  # พิกัดของผู้ใช้
radius = 50  # รัศมี 50 กิโลเมตร

# กรองข้อมูลตามระยะทาง
filtered_by_location = df[df.apply(
    lambda row: calculate_distance(user_location, (row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION'])) <= radius,
    axis=1
)]

# แสดงผลลัพธ์
print("สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:")
print(filtered_by_location[['ATT_NAME_TH', 'PROVINCE_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']])



ImportError: cannot import name 'GPTSimpleVectorIndex' from 'llama_index' (unknown location)

In [4]:
! pip install llama_index




[notice] A new release of pip is available: 24.2 -> 24.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip
