In [1]:
import pandas as pd
import numpy as np
import openai
import requests
import json
import re
from sklearn.neighbors import NearestNeighbors
from concurrent.futures import ThreadPoolExecutor
import random
from random import shuffle

In [2]:
data = pd.read_csv("trip_personality.csv")

user_responses = {
    '개방성': np.random.randint(1, 6, 5),
    '성실성': np.random.randint(1, 6, 5),
    '외향성': np.random.randint(1, 6, 5),
    '친화성': np.random.randint(1, 6, 5),
    '신경성': np.random.randint(1, 6, 5),
}

user_traits = {trait: '높음' if np.mean(responses) > 3 else '낮음' for trait, responses in user_responses.items()}
matching_rows = (data.loc[:, list(user_traits.keys())] == user_traits).all(axis=1)
matching_character = data[matching_rows]
travel_preferences = matching_character['여행지 추천']

desired_location = '강원도'
travel_duration = 5
travel_type = '연인'

openai.api_key = '본인 키'

In [3]:
import math
import time
    
# 시작시간
start = time.time()

In [4]:
# 장소 이름을 기반으로 Google Places API를 통해 장소 정보를 가져오는 함수
# 이미 캐시에 정보가 있다면 캐시에서 가져옴
def get_place_info(place):
    if place in place_info_cache:
        return place_info_cache[place]

    url = f"https://maps.googleapis.com/maps/api/place/findplacefromtext/json?input={place}&inputtype=textquery&fields=photos,formatted_address,name,rating,opening_hours,geometry&key=AIzaSyCb8uKTHV4K9slyw6XkqPhW5hLK1NfQ2J0"
    response = requests.get(url)
    result = json.loads(response.text)
    place_info_cache[place] = result
    return result

# 주어진 프롬프트를 사용하여 GPT-3로부터 여행 장소 추천을 받는 함수
def get_gpt3_response(prompt):
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo-16k-0613",
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant that provides travel recommendations."
            },
            {
                "role": "user",
                "content": prompt
            }
        ]
    )
    return response['choices'][0]['message']['content']

# Google Places API의 응답에서 필요한 장소 정보를 추출하는 함수
# 반환 값은 (카테고리, 이름, 위도, 경도, 평점)의 형태
def extract_place_info(place_json, category_name):
    if place_json and place_json['status'] == 'OK':
        candidate = place_json['candidates'][0]
        name = candidate['name']
        lat = candidate['geometry']['location']['lat']
        lng = candidate['geometry']['location']['lng']
        rating = candidate.get('rating', 'N/A')
        return (category_name, name, lat, lng, rating)
    else:
        return None

# 병렬로 장소 정보를 가져오는 함수
def get_places_info(places, category_name):
    with ThreadPoolExecutor() as executor:
        results = list(executor.map(get_place_info, places))
    return [extract_place_info(result, category_name) for result in results if extract_place_info(result, category_name) is not None]

# 데이터 필터링 함수
def filter_places(category_name):
    return [(category, name, lat, lon, rating) for category, name, lat, lon, rating in places_info if category == category_name and rating != 'N/A']

# 해당 장소의 평점을 찾아 반환하는 함수
def get_rating(place_name, places_info):
    for place in places_info:
        if place[1] == place_name:
            place_rating =  place[4]
            return place_rating
    return None

In [5]:
place_info_cache = {}

# 필요한 장소의 개수 설정
num_spots = 5 * travel_duration
num_accommodations = 5 * travel_duration
num_restaurants = 5 * travel_duration

# GPT-3에게 추천을 요청
prompt = f''' 
나는 제 {travel_type}와 함께 한국내의 {desired_location}로 {str(travel_duration)}일 간 여행을 계획 중입니다.
나는 {travel_preferences}를 선호하여 장소들을 선별해주세요.
각 장소에 대한 정보를 아래와 같이 리스트 형식으로 제공해주세요:

관광지: 
1. 장소
2. 장소
3. 장소
4. 장소
5. 장소
6. 장소
7. 장소
8. 장소
9. 장소
10. 장소
...
{num_spots}. 장소

숙소: 
1. 장소
2. 장소
3. 장소
4. 장소
5. 장소
6. 장소
7. 장소
8. 장소
9. 장소
10. 장소
...
{num_accommodations}. 장소

식당: 
1. 장소
2. 장소
3. 장소
4. 장소
5. 장소
6. 장소
7. 장소
8. 장소
9. 장소
10. 장소
... 
{num_restaurants}. 장소

위의 양식을 반드시 지켜야 합니다.
관광지, 숙소, 식당을 각각을 반드시 {num_spots}개, {num_accommodations}개, {num_restaurants}개 추천해주세요.
<장소에 대한 부가적인 설명은 필요 없습니다.>
'''

gpt_response = get_gpt3_response(prompt)

In [6]:
# 정규 표현식 패턴
pattern = r"(?<=\d\. )[^0-9\n]+"

# 관광지, 숙소, 식당의 이름 추출
tourist_spots = re.findall(pattern, gpt_response.split("숙소:")[0])
accommodations = re.findall(pattern, gpt_response.split("숙소:")[1].split("식당:")[0])
restaurants = re.findall(pattern, gpt_response.split("식당:")[1])

# 장소 개수 검사 및 부족한 경우 재요청
while len(tourist_spots) < num_spots or len(accommodations) < num_accommodations or len(restaurants) < num_restaurants:
    gpt_response = get_gpt3_response(prompt)
    tourist_spots = re.findall(pattern, gpt_response.split("숙소:")[0])
    accommodations = re.findall(pattern, gpt_response.split("숙소:")[1].split("식당:")[0])
    restaurants = re.findall(pattern, gpt_response.split("식당:")[1])

In [7]:
# 각 리스트에서 공백 제거
tourist_spots = [spot.strip() for spot in tourist_spots]
accommodations = [accommodation.strip() for accommodation in accommodations]
restaurants = [restaurant.strip() for restaurant in restaurants]

categories = [tourist_spots, accommodations, restaurants]
category_names = ['관광지', '숙소', '식당']

places_info = []  # 각 장소의 정보를 저장할 리스트

for category, category_name in zip(categories, category_names):
    places = [desired_location + location for location in category]
    places_info.extend(get_places_info(places, category_name))

In [8]:
# 데이터 필터링 병렬 처리(평점 'N/A' 제외)
with ThreadPoolExecutor() as executor:
    tourist_spots, accommodations, restaurants = executor.map(filter_places, ['관광지', '숙소', '식당'])

# 위경도 데이터만 추출
tourist_spots_locations = np.array([(lat, lon) for category, name, lat, lon, rating in tourist_spots])
restaurants_locations = np.array([(lat, lon) for category, name, lat, lon, rating in restaurants])
accommodations_locations = np.array([(lat, lon) for category, name, lat, lon, rating in accommodations])

# NearestNeighbors 모델 학습
tourist_model = NearestNeighbors(n_neighbors=len(tourist_spots), algorithm='ball_tree').fit(tourist_spots_locations)
restaurant_model = NearestNeighbors(n_neighbors=len(restaurants), algorithm='ball_tree').fit(restaurants_locations)
accommodation_model = NearestNeighbors(n_neighbors=len(accommodations), algorithm='ball_tree').fit(accommodations_locations)

# 순서를 랜덤하게 섞어서 일정 다양화
tourist_spots_order = list(range(len(tourist_spots)))
shuffle(tourist_spots_order)

# 클러스터 생성
clusters_v7 = []
selected_spots = []
selected_restaurants = []

for i in tourist_spots_order:
    if i in selected_spots:  # 이미 선택된 관광지는 제외
        continue

    if len(clusters_v7) >= travel_duration:  # 여행 기간 동안의 클러스터가 완성되면 종료
        break

    _, spot_name, spot_lat, spot_lon, _ = tourist_spots[i]
    current_location = np.array([[spot_lat, spot_lon]])
    cluster = [spot_name]
    selected_spots.append(i)

    for _ in range(2):  # 2개의 추가 관광지를 찾기 위한 반복
        # 현재 위치와 가장 가까운 식당 찾기
        _, restaurant_index = restaurant_model.kneighbors(current_location, n_neighbors=len(restaurants))
        restaurant_index = [idx for idx in restaurant_index[0] if idx not in selected_restaurants]
        if restaurant_index:
            cluster.append(restaurants[restaurant_index[0]][1])
            selected_restaurants.append(restaurant_index[0])
            current_location = restaurants_locations[restaurant_index[0]].reshape(1, -1)
        else:
            break  # 더 이상 선택할 수 있는 식당이 없을 경우 반복 종료

        # 식당과 가장 가까운 관광지 찾기
        _, spot_index = tourist_model.kneighbors(current_location, n_neighbors=len(tourist_spots))
        spot_index = [idx for idx in spot_index[0] if idx not in selected_spots]
        cluster.append(tourist_spots[spot_index[0]][1])
        selected_spots.append(spot_index[0])
        current_location = tourist_spots_locations[spot_index[0]].reshape(1, -1)

    # 마지막 관광지와 가장 가까운 식당 찾기
    _, restaurant_index = restaurant_model.kneighbors(current_location, n_neighbors=len(restaurants))
    restaurant_index = [idx for idx in restaurant_index[0] if idx not in selected_restaurants]
    cluster.append(restaurants[restaurant_index[0]][1])

    # 마지막 식당과 가장 가까운 숙소 찾기
    _, accommodation_index = accommodation_model.kneighbors(restaurants_locations[restaurant_index[0]].reshape(1, -1))
    cluster.append(accommodations[accommodation_index[0][0]][1])

    # 다음 클러스터의 첫 번째 관광지와 현재 숙소의 거리를 확인하고 가까운 숙소를 선택
    if i < travel_duration - 1:
        next_spot_location = tourist_spots_locations[tourist_spots_order[i+1]].reshape(1, -1)
        _, accommodation_index = accommodation_model.kneighbors(next_spot_location, n_neighbors=len(accommodations))
        cluster[-1] = accommodations[accommodation_index[0][0]][1]

    clusters_v7.append(tuple(cluster))

In [9]:
# 여행 일정 소개 프롬프트 작성
for i, day_route in enumerate(clusters_v7):
    prompt = f''' 
    아래와 같은 형식으로 여행 일정을 작성해주세요:
    각 장소에 대한 정보도 아래와 같은 형식으로 제공해주세요<<<:
    - 오전 식사
    장소: {clusters_v7[i][1]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][1]}에 대한 소개글
    - 오전 여행지
    장소: {clusters_v7[i][0]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][0]}에 대한 소개글
    - 점심 식사
    장소: {clusters_v7[i][3]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][3]}에 대한 소개글
    - 오후 여행지
    장소: {clusters_v7[i][2]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][2]}에 대한 소개글
    - 저녁
    장소: {clusters_v7[i][5]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][5]}에 대한 소개글
    - 저녁 여행지
    장소: {clusters_v7[i][4]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][4]}에 대한 소개글
    - 숙박
    장소: {clusters_v7[i][6]}
    평점: {get_rating(clusters_v7[i][1],places_info)}
    정보: {clusters_v7[i][6]}에 대한 소개글
    
    위의 모든 일정은 비어있지 않고, 일정의 흐름을 고려하여 추천하여 채우도록 한다.
    해당 결과는 고객들에게 안내될 예정이니, 친절하게 추천 계획을 작성해줘.
    소개글은 내용이 풍부했으면 좋을 것 같아.
    정해진 양식의 답변만 하고, 추가적으로 코멘트를 덧붙이지 말아줘.
    '''
    gpt_response = get_gpt3_response(prompt)

In [10]:
# 종료시간
end = time.time()

print(end - start)

157.19777131080627
