In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel

# 가상의 여행지 데이터 생성
data = pd.DataFrame({
    '여행지': ['서울', '부산', '경주', '제주', '강릉', '전주', '대구', '속초'],
    '키워드': ['문화 역사 도시', '바다 해변 도시 번화가', '문화 역사 도시', '바다 자연 풍경', '자연 풍경 고즈넉한', '문화 역사 도시', '도시 번화가', '바다 해변 도시']
})

# 사용자 입력 키워드
user_keywords = '바다 해변 도시 번화가'

# TF-IDF 벡터화 => 검색과 문서 간의 일치도 평가를 위해 사용 되는 것으로 관련성에 따라 순위를 매기는데 사용 즉 클러스터링(유사한 성격 가진 개체 묶는 것)
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(data['키워드'])

# 입력 키워드와 여행지 키워드 간의 코사인 유사도 계산
cosine_sim = linear_kernel(tfidf_matrix, tfidf_vectorizer.transform([user_keywords]))

# 코사인 유사도를 기반으로 여행지 추천
similarity_scores = list(enumerate(cosine_sim[0]))
sorted_scores = sorted(similarity_scores, key=lambda x: x[1], reverse=True)
recommended_destinations = [data['여행지'][i] for i, _ in sorted_scores]

print("사용자에게 추천하는 여행지 순서:")
print(recommended_destinations)


사용자에게 추천하는 여행지 순서:
['서울']


In [None]:
import pandas as pd

# 가상의 여행지 데이터
data = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '경주', '강릉'],
    '평균 별점': [4.5, 4.2, 4.8, 4.0, 4.6]
})

# 사용자 리뷰 데이터 (가상 데이터)
reviews = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '강릉'],
    '사용자 리뷰': ['서울은 역사적인 장소가 많고 맛집도 많아서 좋았어요.', '부산의 바다 풍경이 아름답고 음식도 훌륭해요.',
                 '제주는 자연 풍경이 멋지고 휴식하기 좋았습니다.', '강릉은 조용하고 아름다운 곳이에요.'],
    '별점': [4.5, 4.2, 4.8, 4.6]
})

# 평가 데이터베이스 합치기
merged_data = pd.merge(data, reviews, on='여행지')

# 여행지를 별점을 기준으로 내림차순 정렬하여 순위 매기기
sorted_data = merged_data.sort_values(by='평균 별점', ascending=False)

# 순위를 새로운 열로 추가
sorted_data['순위'] = range(1, len(sorted_data) + 1)

# 인덱스를 제거하고 순위가 나타나도록 출력
print(sorted_data[['순위', '여행지', '평균 별점']].to_string(index=False))


 순위 여행지  평균 별점
  1  제주    4.8
  2  강릉    4.6
  3  서울    4.5
  4  부산    4.2


In [None]:
import pandas as pd

# 가상의 여행지 데이터
data = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '경주', '강릉'],
    '평균 별점': [3.5, 2.2, 1.8, 5.0, 1.6]
})

# 사용자 리뷰 데이터 (가상 데이터)
reviews = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '강릉'],
    '사용자 리뷰': ['서울은 역사적인 장소가 많고 맛집도 많아서 좋았어요.', '부산의 바다 풍경이 아름답고 음식도 훌륭해요.',
                 '제주는 자연 풍경이 멋지고 휴식하기 좋았습니다.', '강릉은 조용하고 아름다운 곳이에요.'],
    '별점': [4.5, 4.2, 4.8, 4.6]
})

# 평가 데이터베이스 합치기
merged_data = pd.merge(data, reviews, on='여행지')

# 여행지를 별점을 기준으로 내림차순 정렬하여 순위 매기기
sorted_data = merged_data.sort_values(by='평균 별점', ascending=False)

# 순위를 새로운 열로 추가
sorted_data['순위'] = range(1, len(sorted_data) + 1)

# 상위 5개 행만 선택하여 출력
top_5 = sorted_data[['순위', '여행지', '평균 별점']].head(5)
print(top_5.to_string(index=False))


 순위 여행지  평균 별점
  1  서울    3.5
  2  부산    2.2
  3  제주    1.8
  4  강릉    1.6


In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel

# 여행지와 리뷰 데이터 생성
data = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '강릉', '경주'],
    '평균 별점': [4.5, 4.2, 4.8, 4.6, 4.0]
})

reviews = pd.DataFrame({
    '여행지': ['서울'] * 5 + ['부산'] * 5 + ['제주'] * 5 + ['강릉'] * 5 + ['경주'] * 5,
    '해시태그': [
        ##서울 해쉬태그
        '#도시 #맛집 #역사',
        '#부자 #도시 #맛집',
        '#빌딩 #풍경 #번화',
        '#번화 #아름다운',
        '#도시 #문화',
        ##부산 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#바다 #풍경 #도시',
        '#번화 #아름다운',
        '#바다 #문화',
        ##제주 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#자연 #풍경 #휴식 # 바다',
        '#바다 #아름다운',
        '#바다 #문화',
        ##강릉 해쉬태그
        '#산 #맛집 #도시',
        '#산 #풍경 #맛집',
        '#자연 #풍경 #휴식',
        '#산 #아름다운',
        '#산 #조용',
        ##경주 해쉬태그
        '#역사 #맛집 #휴식',
        '#역사 #풍경 #맛집',
        '#역사 #풍경 #휴식',
        '#역사 #아름다운',
        '#역사 #문화',
    ],
    '별점': [4.5, 4.8, 4.3, 4.6, 4.7,
            4.2, 4.5, 4.4, 4.6, 4.3,
            2.8, 3.0, 3.5, 4.0, 3.8,
            4.6, 4.7, 4.5, 4.2, 4.4,
            3.9, 4.1, 3.7, 4.0, 4.2]
})

# 사용자 입력 해시태그에 따라 관련 리뷰를 추천
def get_recommendations_by_hashtags(input_hashtags, cosine_sim = cosine_sim):
    # 입력된 해시태그를 벡터화
    input_vector = tfidf_vectorizer.transform([input_hashtags])

    # 코사인 유사도 계산
    sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()

    # 유사도에 따라 리뷰 정렬
    related_reviews_indices = sim_scores.argsort()[::-1]

    # 상위 5개의 리뷰 추천
    top_reviews = reviews.iloc[related_reviews_indices[:5]]

    # 추천된 리뷰 중에서 각 도시가 몇 번 나왔는지 카운트
    city_counts = top_reviews['여행지'].value_counts()

    # 도시별 추천 순위 매기기
    city_rankings = city_counts.reset_index()
    city_rankings.columns = ['도시', '추천 횟수']
    city_rankings['순위'] = city_rankings['추천 횟수'].rank(ascending=False, method='min')

    # 가장 많이 추천된 상위 5개의 도시 추천
    top_cities = city_rankings[city_rankings['순위'] <= 5]

    # 각 도시에서 가장 많이 태그된 해시태그 가져오기
    top_cities['대표 태그'] = top_cities['도시'].apply(
        lambda city: reviews[reviews['여행지'] == city]['해시태그'].value_counts().idxmax()
    )

    return top_cities

# 사용자 입력 해시태그
input_hashtags = '도시'  # 사용자가 입력한 해시태그

# 입력된 해시태그에 따라 관련 리뷰 추천 및 대표 태그 출력
recommended_cities = get_recommendations_by_hashtags(input_hashtags)
print(recommended_cities)


   도시  추천 횟수   순위        대표 태그
0  부산      3  1.0  #바다 #맛집 #도시
1  서울      2  2.0  #도시 #맛집 #역사


In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel

# 여행지와 리뷰 데이터 생성
data = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '강릉', '경주'],
    '평균 별점': [4.5, 4.2, 4.8, 4.6, 4.0]
})

reviews = pd.DataFrame({
    '여행지': ['서울'] * 5 + ['부산'] * 5 + ['제주'] * 5 + ['강릉'] * 5 + ['경주'] * 5,
    '해시태그': [
        ##서울 해쉬태그
        '#도시 #맛집 #역사',
        '#부자 #도시 #맛집',
        '#빌딩 #풍경 #번화',
        '#번화 #아름다운',
        '#도시 #문화',
        ##부산 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#바다 #풍경 #도시',
        '#번화 #아름다운',
        '#바다 #문화',
        ##제주 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#자연 #풍경 #휴식 # 바다',
        '#바다 #아름다운',
        '#바다 #문화',
        ##강릉 해쉬태그
        '#산 #맛집 #도시',
        '#산 #풍경 #맛집',
        '#자연 #풍경 #휴식',
        '#산 #아름다운',
        '#산 #조용',
        ##경주 해쉬태그
        '#역사 #맛집 #휴식',
        '#역사 #풍경 #맛집',
        '#역사 #풍경 #휴식',
        '#역사 #아름다운',
        '#역사 #문화',
    ],
    '별점': [4.5, 4.8, 4.3, 4.6, 4.7,
            4.2, 4.5, 4.4, 4.6, 4.3,
            2.8, 3.0, 3.5, 4.0, 3.8,
            4.6, 4.7, 4.5, 4.2, 4.4,
            3.9, 4.1, 3.7, 4.0, 4.2]
})

# 사용 가능한 해시태그 목록
available_hashtags = ['#도시', '#자연', '#역사', '#바다','#산', '#맛집','#풍경']

# 사용자에게 입력 받기
print("#도시 #자연 #역사 #바다 #산 #맛집 #풍경")
selected_hashtag = input("사용하려는 해시태그를 선택하세요: ")
if selected_hashtag not in available_hashtags:
    print("잘못된 해시태그입니다.")
else:
    # 입력된 해시태그에 따라 관련 리뷰를 추천
    def get_recommendations_by_hashtags(input_hashtags, cosine_sim=cosine_sim):
        # 입력된 해시태그를 벡터화
        input_vector = tfidf_vectorizer.transform([input_hashtags])

        # 코사인 유사도 계산
        sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()

        # 유사도에 따라 리뷰 정렬
        related_reviews_indices = sim_scores.argsort()[::-1]

        # 상위 5개의 리뷰 추천
        top_reviews = reviews.iloc[related_reviews_indices[:5]]

        return top_reviews[['여행지', '해시태그']]


    # 입력된 해시태그에 따라 관련 리뷰를 출력
    recommended_reviews = get_recommendations_by_hashtags(selected_hashtag)

    if not recommended_reviews.empty:
        print(f"{selected_hashtag} 해시태그에 관련된 상위 5개 여행지:")
        # index 제거
        recommended_reviews.reset_index(drop=True, inplace=True)

        # 해시태그 필터링
        filtered_reviews = recommended_reviews[recommended_reviews['해시태그'].str.contains(selected_hashtag)]
        print(filtered_reviews.to_string(index=False))
    else:
        print(f"{selected_hashtag} 해시태그에 관련된 리뷰가 없습니다.")


#도시 #자연 #역사 #바다 #산 #맛집 #풍경
사용하려는 해시태그를 선택하세요: #도시
#도시 해시태그에 관련된 상위 5개 여행지:
여행지        해시태그
 부산 #바다 #맛집 #도시
 서울 #도시 #맛집 #역사
 부산 #바다 #풍경 #도시


In [None]:
#data base 연결 시키면 쓸 부분(미완)

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
import sqlite3  # 데이터베이스 연동을 위한 라이브러리

# 데이터베이스 연결
conn = sqlite3.connect('travel_reviews.db')  # 데이터베이스 파일명은 'travel_reviews.db'로 가정

# 데이터베이스에서 리뷰 데이터 가져오기
reviews = pd.read_sql_query("SELECT * FROM reviews", conn)
available_hashtags = pd.read_sql_query("SELECT DISTINCT 해시태그 FROM reviews", conn)['해시태그'].tolist()

# 사용자에게 입력 받기
print("(#봄여행#여름여행#가을여행#겨울여행#자연#도시여행#역사유적탐방#바다#산#계곡#음식여행#문화축제#미술#백패킹#스포츠여행#농촌여행#호캉스#뚜벅이#자차#쇼핑#tv프로소개)")
selected_hashtag = input("사용하려는 해시태그를 선택하세요: ")
if selected_hashtag not in available_hashtags:
    print("잘못된 해시태그입니다.")
else:
    # 입력된 해시태그에 따라 관련 리뷰를 추천
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(reviews['해시태그'])
    cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)

    def get_recommendations_by_hashtags(input_hashtags, cosine_sim=cosine_sim):
        input_vector = tfidf_vectorizer.transform([input_hashtags])
        sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()
        related_reviews_indices = sim_scores.argsort()[::-1]
        top_reviews = reviews.iloc[related_reviews_indices[:5]]
        return top_reviews[['여행지', '해시태그']]

    recommended_reviews = get_recommendations_by_hashtags(selected_hashtag)

    if not recommended_reviews.empty:
        print(f"{selected_hashtag} 해시태그에 관련된 상위 5개 여행지:")
        recommended_reviews.reset_index(drop=True, inplace=True)
        filtered_reviews = recommended_reviews[recommended_reviews['해시태그'].str.contains(selected_hashtag)]
        print(filtered_reviews.to_string(index=False))
    else:
        print(f"{selected_hashtag} 해시태그에 관련된 리뷰가 없습니다.")


# 데이터베이스 연결 종료
conn.close()


DatabaseError: ignored

In [None]:
import requests

# GW 키 설정
gw_key = "NB11m43WRMwKCe9w96hjIHPHlCuulBqp%2FKn83jLJtIUw6zUXTUca8FNPYUwucbh7zKLV%2BrRk%2F0kfSI%2Ff4R5z%2FA%3D%3D"

# API 엔드포인트 및 요청 헤더 설정
url = "https://api.example.com/some_endpoint"
headers = {
    "Authorization": f"Bearer {gw_key}",
    "Content-Type": "application/json"
}

# API 요청 보내기
response = requests.get(url, headers=headers)

# API 응답 처리
if response.status_code == 200:
    data = response.json()
    # 결과를 처리하거나 활용
else:
    print("API 요청에 실패했습니다.")


SyntaxError: ignored

In [None]:
#별점 반영한 부분

# import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel

# 여행지와 리뷰 데이터 생성
data = pd.DataFrame({
    '여행지': ['서울', '부산', '제주', '강릉', '경주'],
    '평균 별점': [4.5, 4.2, 4.8, 4.6, 4.0]
})

reviews = pd.DataFrame({
    '여행지': ['서울'] * 5 + ['부산'] * 5 + ['제주'] * 5 + ['강릉'] * 5 + ['경주'] * 5,
    '해시태그': [
        ##서울 해쉬태그
        '#도시 #맛집 #역사',
        '#부자 #도시 #맛집',
        '#빌딩 #풍경 #번화',
        '#번화 #아름다운',
        '#도시 #문화',
        ##부산 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#바다 #풍경 #도시',
        '#번화 #아름다운',
        '#바다 #문화',
        ##제주 해쉬태그
        '#바다 #맛집 #도시',
        '#바다 #풍경 #맛집',
        '#자연 #풍경 #휴식 # 바다',
        '#바다 #아름다운',
        '#바다 #문화',
        ##강릉 해쉬태그
        '#산 #맛집 #도시',
        '#산 #풍경 #맛집',
        '#자연 #풍경 #휴식',
        '#산 #아름다운',
        '#산 #조용',
        ##경주 해쉬태그
        '#역사 #맛집 #휴식',
        '#역사 #풍경 #맛집',
        '#역사 #풍경 #휴식',
        '#역사 #아름다운',
        '#역사 #문화',
    ],
    '별점': [4.5, 4.8, 4.3, 4.6, 4.7,
            4.2, 4.5, 4.4, 4.6, 4.3,
            2.8, 3.0, 3.5, 4.0, 3.8,
            4.6, 4.7, 4.5, 4.2, 4.4,
            3.9, 4.1, 3.7, 4.0, 4.2]
})

# 사용 가능한 해시태그 목록
available_hashtags = ['#도시', '#자연', '#역사', '#바다','#산', '#맛집','#풍경']

# 사용자에게 입력 받기
print("#도시 #자연 #역사 #바다 #산 #맛집 #풍경")
selected_hashtag = input("사용하려는 해시태그를 선택하세요: ")
if selected_hashtag not in available_hashtags:
    print("잘못된 해시태그입니다.")
else:
    # 입력된 해시태그에 따라 관련 리뷰를 추천
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(reviews['해시태그'] + ' ' + reviews['별점'].astype(str))
    cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)

    def get_recommendations_by_hashtags(input_hashtags, cosine_sim=cosine_sim):
        input_vector = tfidf_vectorizer.transform([input_hashtags])
        sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()
        related_reviews_indices = sim_scores.argsort()[::-1]
        top_reviews = reviews.iloc[related_reviews_indices[:5]]
        return top_reviews[['여행지', '해시태그', '별점']]

    recommended_reviews = get_recommendations_by_hashtags(selected_hashtag)

    if not recommended_reviews.empty:
        print(f"{selected_hashtag} 해시태그에 관련된 상위 5개 여행지:")
        recommended_reviews.reset_index(drop=True, inplace=True)
        filtered_reviews = recommended_reviews[recommended_reviews['해시태그'].str.contains(selected_hashtag)]
        print(filtered_reviews.to_string(index=False))
    else:
        print(f"{selected_hashtag} 해시태그에 관련된 리뷰가 없습니다.")


#도시 #자연 #역사 #바다 #산 #맛집 #풍경
사용하려는 해시태그를 선택하세요: #도시
#도시 해시태그에 관련된 상위 5개 여행지:
여행지        해시태그  별점
 강릉  #산 #맛집 #도시 4.6
 서울     #도시 #문화 4.7
 부산 #바다 #맛집 #도시 4.2
 제주 #바다 #맛집 #도시 2.8
 부산 #바다 #풍경 #도시 4.4


In [None]:
import requests
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
import sqlite3

# 데이터베이스 연결
conn = sqlite3.connect('travel_reviews.db')  # 데이터베이스 파일명은 'travel_reviews.db'로 가정

# 데이터베이스에서 리뷰 데이터 가져오기
reviews = pd.read_sql_query("SELECT * FROM reviews", conn)

# API 요청 함수
def get_api_data():
    # API 요청에 필요한 매개변수 설정
    params = {
        'numOfRows': 10,
        'pageNo': 1,
        'MobileOS': 'ETC',
        'MobileApp': 'AppTest',
        '_type': 'json',
        'listYN': 'Y',
        'arrange': 'A',
        'keyword': '강원',
        'contentTypeId': 12,
        'serviceKey': ''
    }

    # API 요청 URL 생성
    base_url = 'NB11m43WRMwKCe9w96hjIHPHlCuulBqp%2FKn83jLJtIUw6zUXTUca8FNPYUwucbh7zKLV%2BrRk%2F0kfSI%2Ff4R5z%2FA%3D%3D'
    response = requests.get(base_url, params=params)

    # API 응답 확인
    if response.status_code == 200:
        # JSON 형식으로 응답 데이터 파싱
        data = response.json()
        return data
    else:
        print("API 요청에 실패하였습니다.")
        return None

# API 데이터 받아오기
api_data = get_api_data()

if api_data is not None:
    # API 데이터를 pandas DataFrame으로 변환
    api_df = pd.DataFrame(api_data['items'])

    # 여기에서 api_df를 활용하여 원하는 데이터 추출 및 처리

    # 사용자에게 입력 받기
    print("(#봄여행#여름여행#가을여행#겨울여행#자연#도시여행#역사유적탐방#바다#산#계곡#음식여행#문화축제#미술#백패킹#스포츠여행#농촌여행#호캉스#뚜벅이#자차#쇼핑#tv프로소개)")
    selected_hashtag = input("사용하려는 해시태그를 선택하세요: ")
    if selected_hashtag not in api_df['해시태그'].tolist():
        print("잘못된 해시태그입니다.")
    else:
        # 입력된 해시태그에 따라 관련 리뷰를 추천
        tfidf_vectorizer = TfidfVectorizer()
        tfidf_matrix = tfidf_vectorizer.fit_transform(reviews['해시태그'])
        cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)

        def get_recommendations_by_hashtags(input_hashtags, cosine_sim=cosine_sim):
            input_vector = tfidf_vectorizer.transform([input_hashtags])
            sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()
            related_reviews_indices = sim_scores.argsort()[::-1]
            top_reviews = reviews.iloc[related_reviews_indices[:5]]
            return top_reviews[['여행지', '해시태그']]

        recommended_reviews = get_recommendations_by_hashtags(selected_hashtag)

        if not recommended_reviews.empty:
            print(f"{selected_hashtag} 해시태그에 관련된 상위 5개 여행지:")
            recommended_reviews.reset_index(drop=True, inplace=True)
            filtered_reviews = recommended_reviews[recommended_reviews['해시태그'].str.contains(selected_hashtag)]
            print(filtered_reviews.to_string(index=False))
        else:
            print(f"{selected_hashtag} 해시태그에 관련된 리뷰가 없습니다.")

# 데이터베이스 연결 종료
conn.close()


DatabaseError: ignored

In [None]:
pip install supabase-py

Collecting supabase-py
  Downloading supabase_py-0.0.2-py3-none-any.whl (7.5 kB)
Collecting gotrue==0.2.0 (from supabase-py)
  Downloading gotrue-0.2.0-py3-none-any.whl (8.9 kB)
Collecting postgrest-py==0.4.0 (from supabase-py)
  Downloading postgrest_py-0.4.0-py3-none-any.whl (6.0 kB)
Collecting pytest<7,>=6 (from supabase-py)
  Downloading pytest-6.2.5-py3-none-any.whl (280 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m280.7/280.7 kB[0m [31m5.8 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting realtime-py<0.2.0,>=0.1.2 (from supabase-py)
  Downloading realtime_py-0.1.3-py3-none-any.whl (8.1 kB)
Collecting requests==2.25.1 (from supabase-py)
  Downloading requests-2.25.1-py2.py3-none-any.whl (61 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.2/61.2 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting deprecation<3.0.0,>=2.1.0 (from postgrest-py==0.4.0->supabase-py)
  Downloading deprecation-2.1.0-py2.py3-none-any.whl (11 kB)
Colle

In [None]:
from supabase import create_client

ModuleNotFoundError: ignored

In [None]:
import pandas as pd
import requests

# API 엔드포인트 URL 설정
api_url = 'http://apis.data.go.kr/B551011/KorService1'

# API에서 데이터 가져오기
response = requests.get(api_url)

try:
    # API 응답을 JSON으로 파싱
    data = response.json()

    # 데이터를 데이터프레임으로 변환 (pandas DataFrame)
    df = pd.DataFrame(data)

    # CSV 파일로 저장
    csv_filename = 'api_data.csv'
    df.to_csv(csv_filename, index=False)

    print(f'Data saved to {csv_filename}')


SyntaxError: ignored

In [None]:
!curl -o api_data.json "http://apis.data.go.kr/B551011/KorService1"


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   682  100   682    0     0   1146      0 --:--:-- --:--:-- --:--:--  1148


In [None]:
import json
import csv

# JSON 파일 읽기
with open('api_data.json', 'r') as json_file:
    data = json.load(json_file)

# CSV 파일로 저장
csv_filename = 'api_data.csv'
with open(csv_filename, 'w', newline='') as csv_file:
    csv_writer = csv.writer(csv_file)

    # 헤더 작성
    headers = data[0].keys()
    csv_writer.writerow(headers)

    # 데이터 작성
    for item in data:
        csv_writer.writerow(item.values())

print(f'Data saved to {csv_filename}')


JSONDecodeError: ignored

In [None]:
!pip install supabase-py



In [None]:
import supabase



ModuleNotFoundError: ignored

In [None]:
import createClient from supabase

SyntaxError: ignored

In [None]:
import requests
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
import sqlite3
from rdflib import Graph

# 데이터베이스 연결
conn = sqlite3.connect('travel_reviews.db')  # 데이터베이스 파일명은 'travel_reviews.db'로 가정

# 데이터베이스에서 리뷰 데이터 가져오기
reviews = pd.read_sql_query("SELECT * FROM reviews", conn)

# RDF 그래프 생성
g = Graph()
# .nt 파일을 로드
g.parse('visitkorea.nt', format='nt')

# API 데이터 받아오기
# 여기에서 API 데이터를 가져오는 부분을 RDF 데이터를 읽는 코드로 변경해야 합니다.

# 사용자에게 입력 받기
print("(#봄여행#여름여행#가을여행#겨울여행#자연#도시여행#역사유적탐방#바다#산#계곡#음식여행#문화축제#미술#백패킹#스포츠여행#농촌여행#호캉스#뚜벅이#자차#쇼핑#tv프로소개)")
selected_hashtag = input("사용하려는 해시태그를 선택하세요: ")

# 여행지 정보 추출 (예시: 관광명소와 관련 정보 추출)
query = """
    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
    SELECT ?place ?name ?description
    WHERE {
        ?place a <http://example.org/ontology/TravelDestination> ;
               <http://example.org/ontology/name> ?name ;
               <http://example.org/ontology/description> ?description .
    }
"""
results = g.query(query)

places_data = []
for result in results:
    place_data = {
        'place': str(result.place),
        'name': str(result.name),
        'description': str(result.description),
    }
    places_data.append(place_data)

# 입력된 해시태그에 따라 관련 리뷰를 추천
input_hashtags = selected_hashtag  # 사용자 입력을 활용
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(reviews['해시태그'])
cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)

def get_recommendations_by_hashtags(input_hashtags, cosine_sim=cosine_sim):
    input_vector = tfidf_vectorizer.transform([input_hashtags])
    sim_scores = linear_kernel(input_vector, tfidf_matrix).flatten()
    related_reviews_indices = sim_scores.argsort()[::-1]
    top_reviews = reviews.iloc[related_reviews_indices[:5]]
    return top_reviews[['여행지', '해시태그']]

recommended_reviews = get_recommendations_by_hashtags(input_hashtags)

if not recommended_reviews.empty:
    print(f"{selected_hashtag} 해시태그에 관련된 상위 5개 여행지:")
    recommended_reviews.reset_index(drop=True, inplace=True)
    filtered_reviews = recommended_reviews[recommended_reviews['해시태그'].str.contains(selected_hashtag)]
    print(filtered_reviews.to_string(index=False))
else:
    print(f"{selected_hashtag} 해시태그에 관련된 리뷰가 없습니다.")

# 데이터베이스 연결 종료
conn.close()


DatabaseError: ignored