# ฟังก์ชันคำนวณระยะห่างระหว่างจุดที่ User อยู่เป็นรัศมี 10 กิโลเมตร

In [1]:
import math

# ฟังก์ชันคำนวณระยะทางระหว่างสองจุด (Haversine Formula)
def haversine(lat1, lon1, lat2, lon2):
    # แปลงค่าละติจูดและลองจิจูดจากองศาเป็นเรเดียน
    lat1, lon1, lat2, lon2 = map(math.radians, [lat1, lon1, lat2, lon2])

    # คำนวณความแตกต่างของละติจูดและลองจิจูด
    dlat = lat2 - lat1
    dlon = lon2 - lon1

    # ใช้สูตร Haversine ในการคำนวณระยะทาง
    a = math.sin(dlat / 2)**2 + math.cos(lat1) * math.cos(lat2) * math.sin(dlon / 2)**2
    c = 2 * math.atan2(math.sqrt(a), math.sqrt(1 - a))

    # รัศมีโลก (กิโลเมตร)
    R = 6371
    return R * c  # ระยะทางเป็นกิโลเมตร

# ตำแหน่ง User (ละติจูด, ลองจิจูด)
user_lat, user_lon = 13.736717, 100.523186  # ตัวอย่าง: ตำแหน่งในกรุงเทพ

# ตำแหน่งที่ต้องการตรวจสอบ (ละติจูด, ลองจิจูด)
positions = [
    (13.735000, 100.525000),  # ตำแหน่งที่ 1
    (13.745000, 100.535000),  # ตำแหน่งที่ 2
    (13.755000, 100.545000),  # ตำแหน่งที่ 3
    (13.765000, 100.555000),  # ตำแหน่งที่ 4
    (13.785000, 100.585000),  # ตำแหน่งที่ 5
    (13.795000, 100.595000),  # ตำแหน่งที่ 6
    (13.805000, 100.605000),  # ตำแหน่งที่ 7
    (13.815000, 100.615000),  # ตำแหน่งที่ 8
    (13.825000, 100.625000),  # ตำแหน่งที่ 9
]

# รัศมีที่ต้องการ (กิโลเมตร)
radius = 10

# หาตำแหน่งที่อยู่ในรัศมี 10 กิโลเมตรจาก User
nearby_positions = []
far_positions = []

for pos in positions:
    distance_from_user = haversine(user_lat, user_lon, pos[0], pos[1])
    
    if 0 <= distance_from_user <= radius:  # เงื่อนไขระยะทาง 0-10 กิโลเมตร
        nearby_positions.append(pos)
    else:
        far_positions.append((pos, distance_from_user))

print("ตำแหน่งที่อยู่ในรัศมี 10 กิโลเมตรจาก User:")
print(nearby_positions)

print("\nตำแหน่งที่อยู่เกิน 10 กิโลเมตรจาก User (พร้อมระยะทาง):")
print(far_positions)


ตำแหน่งที่อยู่ในรัศมี 10 กิโลเมตรจาก User:
[(13.735, 100.525), (13.745, 100.535), (13.755, 100.545), (13.765, 100.555), (13.785, 100.585)]

ตำแหน่งที่อยู่เกิน 10 กิโลเมตรจาก User (พร้อมระยะทาง):
[((13.795, 100.595), 10.107210229028942), ((13.805, 100.605), 11.649929958252391), ((13.815, 100.615), 13.194317203079017), ((13.825, 100.625), 14.739837614624102)]


# folium เป็นไลบรารีใน Python ใช้ในการแสดงแผนที่แทน

In [7]:
import folium
from IPython.display import display

# ฟังก์ชันสร้างแผนที่
def create_map(center_lat, center_lon, zoom_start=15):
    m = folium.Map(location=[center_lat, center_lon], zoom_start=zoom_start)
    folium.Marker([center_lat, center_lon],
                  popup="คุณอยู่ที่นี่",
                  icon=folium.Icon(color="blue", icon="info-sign")).add_to(m)
    return m

# ตำแหน่งศูนย์กลาง (ตัวอย่าง: กรุงเทพฯ)
center_lat = 14.022788 #latitude
center_lon = 99.978337 #longitude

# สร้างแผนที่
my_map = create_map(center_lat, center_lon)

# แสดงแผนที่ใน Jupyter Notebook
display(my_map)


# เขียนฟังขั่นดึงผลลัพย์ออกมาจาก CSV ตามที่ USER response คำถามเข้าไป

In [10]:
url ='http://111.223.37.52/v1'
api_key = 'eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJkYXRhIjp7Im9yZ2FuaXphdGlvbl9pZCI6IjY3MzU2NTczYWM4ZjUzNGEwMGUxNjkzZiIsInRva2VuX25hbWUiOiJTRFAtREVWIiwic3RkRGF0ZSI6IjIwMjQtMTEtMTdUMTc6MDA6MDAuMDAwWiJ9LCJpYXQiOjE3MzE5MTczNzksImV4cCI6MTc4Mjc1MjM5OX0.XLU98w0PT4Gy_PzlLhHVWMawkEH8pWpxsYzt3Ffw6xE'

In [3]:
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI
import pandas as pd

# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # กำหนด URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # ใส่ API Key ที่ให้มา
    max_tokens=1000 # จะตอบข้อความที่มีความยาวไม่เกิน 1000 โทเค็นในแต่ละคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")

In [4]:
def filter_data(df: pd.DataFrame, thai_name: str = None, region: str = None, subdistrict: str = None,
                district: str = None, province: str = None, category: str = None, subtype: str = None) -> pd.DataFrame:
    """
    ฟังก์ชันนี้กรองข้อมูลจาก DataFrame ตามค่าที่ระบุในคอลัมน์ต่างๆ
    """
    # ตรวจสอบ DataFrame ก่อนกรอง
    if df.empty:
        print("DataFrame is empty!")
        return pd.DataFrame()

    print("Initial DataFrame shape:", df.shape)

    # กรองข้อมูลตามคอลัมน์
    if thai_name:
        df = df[df['ATT_NAME_TH'].str.contains(thai_name, na=False, case=False)]
    if region:
        df = df[df['REGION_NAME_TH'].str.contains(region, na=False, case=False)]
    if subdistrict:
        df = df[df['SUBDISTRICT_NAME_TH'].str.contains(subdistrict, na=False, case=False)]
    if district:
        df = df[df['DISTRICT_NAME_TH'].str.contains(district, na=False, case=False)]
    if province:
        df = df[df['PROVINCE_NAME_TH'].str.contains(province, na=False, case=False)]
    if category:
        df = df[df['ATTR_CATAGORY_TH'].str.contains(category, na=False, case=False)]
    if subtype:
        df = df[df['ATTR_SUB_TYPE_TH'].str.contains(subtype, na=False, case=False)]

    # ตรวจสอบผลลัพธ์หลังการกรอง
    if df.empty:
        print("No matching records found.")
    
    print("Filtered DataFrame shape:", df.shape)
    return df

In [5]:
##สร้าง Custom Tool สำหรับการกรองข้อมูล:
from langchain.agents import Tool

# สร้าง Custom Tool
filter_data_tool = Tool(
    name="Filter Data",
    func=filter_data,  # ฟังก์ชันที่สร้างไว้
    description="กรองข้อมูลจาก DataFrame ตามคอลัมน์ต่างๆ เช่น ATT_NAME_TH, REGION_NAME_TH ฯลฯ"
)


In [6]:
import pandas as pd
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

agent = create_pandas_dataframe_agent(llm, df, verbose=True , allow_dangerous_code=True,  agent_type="tool-calling", tools=[filter_data_tool],)



In [7]:
response = agent.run("ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติ เสาหินบะซอลต์ ภาคตะวันออกเฉียงเหนือ จากข้อมูลในไฟล์splitData.csvให้หน่อย")
print(response)

  response = agent.run("ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติ เสาหินบะซอลต์ ภาคตะวันออกเฉียงเหนือ จากข้อมูลในไฟล์splitData.csvให้หน่อย")




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `python_repl_ast` with `{'query': "import pandas as pd\n\n# Load the CSV file\nfile_path = 'splitData.csv'\ndf = pd.read_csv(file_path)\n\n# Filter for natural attractions in the Northeast region with the name 'เสาหินบะซอลต์'\nfiltered_df = df[(df['ATTR_CATAGORY_TH'] == 'แหล่งท่องเที่ยวทางธรรมชาติ') & \n                  (df['ATT_NAME_TH'].str.contains('เสาหินบะซอลต์')) & \n                  (df['REGION_NAME_TH'] == 'ภาคตะวันออกเฉียงเหนือ')]\n\nfiltered_df"}`


[0m[36;1m[1;3m     ATT_NAME_TH ATT_NAME_EN  \
0  เสาหินบะซอลต์         NaN   

                                 ATT_NEARBY_LOCATION ATT_ADDRESS  \
0  บ้านโคกม่ะค่าโหรน หมู่12 ตำบล สะเดา อำเภอนางรอ...         NaN   

          REGION_NAME_TH SUBDISTRICT_NAME_TH DISTRICT_NAME_TH  \
0  ภาคตะวันออกเฉียงเหนือ               สะเดา           นางรอง   

  PROVINCE_NAME_TH            ATTR_CATAGORY_TH       ATTR_SUB_TYPE_TH  \
0        บุรีรัมย์  แหล่งท่องเที่ยวทางธ

In [1]:
pip show langchain

Name: langchain
Version: 0.3.12
Summary: Building applications with LLMs through composability
Home-page: https://github.com/langchain-ai/langchain
Author: 
Author-email: 
License: MIT
Location: c:\llmproject\testenv\Lib\site-packages
Requires: aiohttp, langchain-core, langchain-text-splitters, langsmith, numpy, pydantic, PyYAML, requests, SQLAlchemy, tenacity
Required-by: langchain-community
Note: you may need to restart the kernel to use updated packages.


# Keyword-Driven Data Filtering with LLM Integration

In [34]:
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI
import pandas as pd

# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # API Key สำหรับการเข้าถึงเซิร์ฟเวอร์
    max_tokens=1000  # จำกัดจำนวนโทเค็นในคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")  # โหลดไฟล์ข้อมูล


In [35]:
def extract_keywords_from_query(query: str) -> str:
    """
    ใช้โมเดล LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
    """
    # ส่งคำถามไปยังโมเดล LLM
    response = llm.invoke(f"แยกคำสำคัญจากคำถามนี้: '{query}' และแสดงคำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้")
    
    # ตรวจสอบผลลัพธ์และคืนค่าคำสำคัญ
    return response.content.strip()


In [36]:
def filter_data(df: pd.DataFrame, thai_name: str = None, region: str = None, subdistrict: str = None,
                district: str = None, province: str = None, category: str = None, subtype: str = None) -> pd.DataFrame:
    """
    ฟังก์ชันกรองข้อมูลจาก DataFrame ตามค่าที่ระบุในคอลัมน์ต่างๆ
    """
    if df.empty:
        print("DataFrame is empty!")
        return pd.DataFrame()

    print("Initial DataFrame shape:", df.shape)
    
    # กรองข้อมูลตามคอลัมน์
    if thai_name:
        df = df[df['ATT_NAME_TH'].str.contains(thai_name, na=False, case=False)]
    if region:
        df = df[df['REGION_NAME_TH'].str.contains(region, na=False, case=False)]
    if subdistrict:
        df = df[df['SUBDISTRICT_NAME_TH'].str.contains(subdistrict, na=False, case=False)]
    if district:
        df = df[df['DISTRICT_NAME_TH'].str.contains(district, na=False, case=False)]
    if province:
        df = df[df['PROVINCE_NAME_TH'].str.contains(province, na=False, case=False)]
    if category:
        df = df[df['ATTR_CATAGORY_TH'].str.contains(category, na=False, case=False)]
    if subtype:
        df = df[df['ATTR_SUB_TYPE_TH'].str.contains(subtype, na=False, case=False)]

    return df


In [37]:
from langchain.agents import Tool

# สร้าง Custom Tool
filter_data_tool = Tool(
    name="Filter Data",
    func=filter_data,
    description="กรองข้อมูลจาก DataFrame ตามคอลัมน์ต่างๆ เช่น ATT_NAME_TH, REGION_NAME_TH ฯลฯ"
)


In [38]:
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

agent = create_pandas_dataframe_agent(
    llm=llm,
    df=df,
    verbose=True,
    allow_dangerous_code=True,  # ใช้ตัวเลือกนี้อย่างระมัดระวัง
    agent_type="tool-calling",
    tools=[filter_data_tool]
)




In [39]:
# ตัวอย่างคำถามของผู้ใช้
user_query = "ช่วยหาแหล่งท่องเที่ยวทางธรรมชาติ ภาคตะวันออกเฉียงเหนือ ให้หน่อย"

# ใช้ฟังก์ชันแยกคำสำคัญ
keywords = extract_keywords_from_query(user_query)
print("คำสำคัญที่ได้จากคำถาม:", keywords)

# รัน Agent ด้วยคำถาม
response = agent.run(f"ช่วยกรองข้อมูลจากคำสำคัญต่อไปนี้: {keywords}")
print(response)


คำสำคัญที่ได้จากคำถาม: คำสำคัญจากคำถามคือ:

1. แหล่งท่องเที่ยว
2. ทางธรรมชาติ
3. ภาคตะวันออกเฉียงเหนือ

คำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้:

- ท่องเที่ยว
- ธรรมชาติ
- ภาคตะวันออกเฉียงเหนือ
- สถานที่ท่องเที่ยว
- สถานที่ธรรมชาติ
- จังหวัดในภาคตะวันออกเฉียงเหนือ
- กิจกรรมกลางแจ้ง
- สถานที่พักผ่อน
- สวนสาธารณะ
- อุทยานแห่งชาติ

สามารถใช้คำสำคัญเหล่านี้ในการค้นหาข้อมูลเกี่ยวกับแหล่งท่องเที่ยวทางธรรมชาติในภาคตะวันออกเฉียงเหนือได้ค่ะ


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `python_repl_ast` with `{'query': "import pandas as pd\n\n# Assuming df is already defined as the DataFrame\n\n# Define keywords for filtering\nkeywords = ['แหล่งท่องเที่ยว', 'ทางธรรมชาติ', 'ภาคตะวันออกเฉียงเหนือ', 'ท่องเที่ยว', 'ธรรมชาติ', 'สถานที่ท่องเที่ยว', 'สถานที่ธรรมชาติ', 'จังหวัดในภาคตะวันออกเฉียงเหนือ', 'กิจกรรมกลางแจ้ง', 'สถานที่พักผ่อน', 'สวนสาธารณะ', 'อุทยานแห่งชาติ']\n\n# Filter the DataFrame based on the keywords in relevant columns\nfiltered_df = df[df['ATT_DETAIL_T

# Keyword-Driven Data Filtering with LLM Integration + Filtering by radius calculation of users

In [11]:
# 1
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI
import pandas as pd

# สร้างโมเดลที่ใช้เชื่อมต่อกับเซิร์ฟเวอร์กลาง
llm = ChatOpenAI(
    model='gpt-4o-mini',
    base_url=url,  # URL ของเซิร์ฟเวอร์กลาง
    api_key=api_key,  # API Key สำหรับการเข้าถึงเซิร์ฟเวอร์
    max_tokens=1000  # จำกัดจำนวนโทเค็นในคำตอบ
)

# โหลดข้อมูล
df = pd.read_csv("splitData.csv")  # โหลดไฟล์ข้อมูล


In [12]:
# 2
from geopy.distance import geodesic

def calculate_distance(user_location, place_location):
    return geodesic(user_location, place_location).kilometers

# ลบแถวที่มีค่า NaN ในคอลัมน์ LATITUDE_LOCATION และ LONGITUDE_LOCATION
df = df.dropna(subset=['LATITUDE_LOCATION', 'LONGITUDE_LOCATION'])


In [13]:
# 3
def extract_keywords_from_query(query: str) -> str:
    """
    ใช้โมเดล LLM เพื่อแยกคำสำคัญจากคำถามของผู้ใช้
    """
    # ส่งคำถามไปยังโมเดล LLM
    response = llm.invoke(f"แยกคำสำคัญจากคำถามนี้: '{query}' และแสดงคำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้")
    
    # ตรวจสอบผลลัพธ์และคืนค่าคำสำคัญ
    return response.content.strip()


In [14]:
# 4 คำนวณระยะทางแล้วเก็บไว้ในคอลัมน์ DISTANCE และกรองข้อมูลจากระยะทางที่คำนวณได้
def filter_data(df: pd.DataFrame, thai_name: str = None, region: str = None, subdistrict: str = None,
                district: str = None, province: str = None, category: str = None, subtype: str = None,
                user_location: tuple = None, radius: float = None) -> pd.DataFrame:
    """
    ฟังก์ชันกรองข้อมูลจาก DataFrame ตามค่าที่ระบุในคอลัมน์ต่างๆ และพิกัดระยะทาง
    """
    if df.empty:
        print("DataFrame is empty!")
        return pd.DataFrame()

    print("Initial DataFrame shape:", df.shape)

    # กรองข้อมูลตามคอลัมน์
    if thai_name:
        df = df[df['ATT_NAME_TH'].str.contains(thai_name, na=False, case=False)]
    if region:
        df = df[df['REGION_NAME_TH'].str.contains(region, na=False, case=False)]
    if subdistrict:
        df = df[df['SUBDISTRICT_NAME_TH'].str.contains(subdistrict, na=False, case=False)]
    if district:
        df = df[df['DISTRICT_NAME_TH'].str.contains(district, na=False, case=False)]
    if province:
        df = df[df['PROVINCE_NAME_TH'].str.contains(province, na=False, case=False)]
    if category:
        df = df[df['ATTR_CATAGORY_TH'].str.contains(category, na=False, case=False)]
    if subtype:
        df = df[df['ATTR_SUB_TYPE_TH'].str.contains(subtype, na=False, case=False)]

    # กรองข้อมูลตามระยะทาง (ถ้ากำหนดพิกัดผู้ใช้และรัศมี)
    if user_location and radius:
        df['DISTANCE'] = df.apply(
            lambda row: calculate_distance(user_location, (row['LATITUDE_LOCATION'], row['LONGITUDE_LOCATION'])), axis=1
        )
        df = df[df['DISTANCE'] <= radius]

    print("Filtered DataFrame shape:", df.shape)
    return df


In [15]:
# 5
from langchain.agents import Tool

# สร้าง Custom Tool
filter_data_tool = Tool(
    name="Filter Data",
    func=filter_data,
    description="กรองข้อมูลจาก DataFrame ตามคอลัมน์ต่างๆ เช่น ATT_NAME_TH, REGION_NAME_TH รวมถึงการกรองระยะทางจากพิกัดผู้ใช้"
)


In [16]:
# 6
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent

agent = create_pandas_dataframe_agent(
    llm=llm,
    df=df,
    verbose=True,
    allow_dangerous_code=True,  # ใช้ตัวเลือกนี้อย่างระมัดระวัง
    agent_type="tool-calling",
    tools=[filter_data_tool]
)




In [17]:
# 7 รับค่ามาจากinput user ที่กรองแล้ว
# ตัวอย่างคำถามของผู้ใช้
user_query = "แหล่งท่องเที่ยวสำหรับกิจกรรมพิเศษนันทนาการและความสนใจพิเศษในจังหวัดประจวบคีรีขันธ์ให้หน่อย"

# ใช้ฟังก์ชันแยกคำสำคัญ
keywords = extract_keywords_from_query(user_query)
print("คำสำคัญที่ได้จากคำถาม:", keywords)

# การกรองข้อมูลตามคำสำคัญจากคำถามผู้ใช้
# แยกคำสำคัญที่เกี่ยวข้องกับการกรองข้อมูลออก
province = None
category = None

# กรองข้อมูลตามคำสำคัญของผู้ใช้
filtered_by_user_request = filter_data(
    df=df, 
    province=province,  # กรองจังหวัดตามคำสำคัญที่ได้
    category=category  # กรองประเภทตามคำสำคัญที่ได้
)

# ระบุพิกัดของผู้ใช้และรัศมี
user_location = (10.9, 99.2)  # พิกัดของผู้ใช้
radius = 50  # รัศมี 50 กิโลเมตร

# กรองข้อมูลตามพิกัดหลังจากกรองคำสั่งผู้ใช้แล้ว
filtered_by_location = filter_data(
    df=filtered_by_user_request,
    user_location=user_location,
    radius=radius
)

# แสดงผลลัพธ์สุดท้าย
print("สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:")
print(filtered_by_location[['ATT_NAME_TH', 'PROVINCE_NAME_TH', 'LATITUDE_LOCATION', 'LONGITUDE_LOCATION']])


คำสำคัญที่ได้จากคำถาม: คำสำคัญจากคำถามคือ:

1. แหล่งท่องเที่ยว
2. กิจกรรมพิเศษ
3. นันทนาการ
4. ความสนใจพิเศษ
5. จังหวัดประจวบคีรีขันธ์

คำสำคัญที่เกี่ยวข้องที่สามารถใช้กรองข้อมูลได้ ได้แก่:

- แหล่งท่องเที่ยวในประจวบคีรีขันธ์
- กิจกรรมนันทนาการ
- กิจกรรมพิเศษ
- ความสนใจพิเศษ
- สถานที่ท่องเที่ยว
- ประจวบคีรีขันธ์
- กิจกรรมกลางแจ้ง
- อีเว้นท์พิเศษ
- การท่องเที่ยวเชิงนันทนาการ

คำเหล่านี้สามารถใช้ในการค้นหาข้อมูลที่เกี่ยวข้องกับแหล่งท่องเที่ยวและกิจกรรมต่าง ๆ ในจังหวัดประจวบคีรีขันธ์ได้อย่างมีประสิทธิภาพ
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (8241, 15)
Initial DataFrame shape: (8241, 15)
Filtered DataFrame shape: (89, 16)
สถานที่ท่องเที่ยวที่กรองแล้วในรัศมี 50 กิโลเมตร:
                    ATT_NAME_TH PROVINCE_NAME_TH  LATITUDE_LOCATION  \
158                 ถ้ำแก้วโครำ            ชุมพร          10.648071   
170                 น้ำตกไทรคู่  ประจวบคีรีขันธ์          11.248322   
424                  แก่งหินปิด  ประจวบคีรีขันธ์          11.125246   
427      อุทยานแ