In [None]:
!pip install langchain langchain_community langchain_chroma -qU langchain-openai bs4 googlemaps

In [58]:
import os

# Python 코드에서 환경 변수 설정
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = "langchain"
os.environ["GOOGLE_API_KEY"] = "gmaps"
os.environ["OPENAI_API_KEY"] = "openai"

import googlemaps
from langchain import hub
from langchain_chroma import Chroma
from langchain_community.document_loaders import WebBaseLoader
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.prompts import ChatPromptTemplate
from datetime import datetime
from langchain.schema import Document
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o-mini")

In [59]:
# Google Maps API 클라이언트 초기화
api_key = 'gmaps'
gmaps = googlemaps.Client(key=api_key)

def get_place_reviews(city_name, max_places=10):
    # 도시의 좌표를 찾기 위해 Geocoding API를 사용
    geocode_result = gmaps.geocode(city_name)
    if not geocode_result:
        return []

    # 도시의 중앙 좌표를 추출
    city_location = geocode_result[0]['geometry']['location']

    # Places API를 사용하여 관광지 검색
    places_result = gmaps.places_nearby(
        location=(city_location['lat'], city_location['lng']),
        radius=10000,  # 10km 반경 내의 장소 검색
        type='tourist_attraction'
    )

    docs = []
    unique_docs = []

    # 관광지에서 리뷰를 가져오기
    for place in places_result.get('results', [])[:max_places]:
        place_id = place['place_id']
        place_details = gmaps.place(place_id=place_id, fields=['name', 'reviews'])

        place_name = place_details.get('result', {}).get('name', 'No name')
        reviews = place_details.get('result', {}).get('reviews', [])

        #print("reviews : ",reviews)
        #print("\n\n")
        #print("\n\n place_details :", place_details)


        # 리뷰를 docs 리스트에 추가
        if reviews:
            place_result = []
            review_texts = []
            review_texts = [f"Review for {place_name}:\n\n{review['text']}" for review in reviews]
            docs.extend(review_texts)
            reviews = []
            place_detail = []
        else:
            docs.append(f"No reviews available for {place_name}.")

    return docs

# 예시 사용
#docs = get_place_reviews(city_name)

# docs 출력
#for doc in docs:
 #   print(doc)
  #  print("\n---\n")


In [61]:
city_name = input("도시를 입력하세요 (예: 서울): ")
user_request = input("여행 관심사를 입력하세요 (예: 역사적인 관광지): ")

all_review = []
docs = []
doc = []
unique_docs = []
all_review = get_place_reviews(city_name)

#all_review
#docs

도시를 입력하세요 (예: 서울): 오사카
여행 관심사를 입력하세요 (예: 역사적인 관광지): 아이들과 가면 좋은 여행지


In [62]:

# 문자열을 문서 객체로 변환
docs = [Document(page_content=text) for text in all_review]  # 'texts'는 문서 내용이 담긴 문자열 리스트

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 벡터 저장소 초기화 및 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# 검색 및 생성
retriever = vectorstore.as_retriever(search_kwargs={"k": 50})

# Prompt
template = '''없는 정보는 자체 제공하여도 되나 최대한
제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''

prompt = ChatPromptTemplate.from_template(template)


# Rretriever
retriever = vectorstore.as_retriever()

# Combine Documents
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG Chain 연결
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Chain 실행
rag_chain.invoke(f"""도시"{city_name}"의"{user_request}"의 관한 여행계획 추천해주세요""")



'오사카에서 아이들과 함께 즐길 수 있는 여행지를 포함한 여행 계획을 추천드립니다. 아래는 가족과 함께 즐길 수 있는 일정입니다.\n\n### 오사카 가족 여행 계획\n\n**1일차: 오사카 시내 탐방**\n- **오사카 성**: 역사적인 오사카 성을 방문하여 아름다운 정원을 산책하고 성의 전시물을 관람합니다. 아이들도 성의 구조물과 주변의 자연을 즐길 수 있습니다.\n- **우메다 스카이 빌딩**: 도시 전경을 한눈에 볼 수 있는 전망대에서 사진도 찍고, 아이들과 함께 경치를 감상합니다.\n- **저녁: 도톤보리**: 유명한 도톤보리 지역에서 다양한 스트리트 푸드를 맛보고, 네온사인이 빛나는 거리에서 산책합니다. \n\n**2일차: 테마파크 즐기기**\n- **유니버설 스튜디오 재팬 (USJ)**: 다양한 놀이기구와 캐릭터 테마의 어트랙션이 있어 아이들이 즐길 수 있습니다. 하루 종일 신나는 시간을 보낼 수 있습니다.\n- **저녁: 주변 레스토랑에서 저녁 식사**\n\n**3일차: 자연과 놀이**\n- **난바나카 공원**: 아이들과 함께 뛰어놀 수 있는 넓은 공원입니다. 놀이터와 잔디밭이 있어 피크닉을 하며 여유로운 시간을 보낼 수 있습니다.\n- **신세카이 지역 탐방**: 일본 전통 음식과 아이들이 좋아할 만한 다양한 간식이 있는 곳입니다. 또한, 아기자기한 가게들도 많아 재미있게 구경할 수 있습니다.\n\n**4일차: 온천과 휴식**\n- **소라니와 온센**: 아침 일찍 방문하여 한적하게 온천을 즐길 수 있습니다. 온천의 규칙을 배우고, 가족과 함께 편안한 시간을 보내세요.\n- **저녁: 호텔 근처의 슈퍼마켓 방문**: 다양한 일본 과자와 음료를 구입하고, 아이들에게 익숙한 과일을 찾아보세요.\n\n이렇게 구성된 일정으로 오사카에서 아이들과 함께 즐거운 추억을 만들 수 있을 것입니다. 안전하고 즐거운 여행 되세요!'

In [60]:
# vectorstore 초기화
coll = vectorstore.get()

ids_to_del = []

for idx in range(len(coll['ids'])):

    id = coll['ids'][idx]
    metadata = coll['metadatas'][idx]

    # Check if metadata is None. If it is, add the ID to be deleted
    if metadata is None:
        ids_to_del.append(id)

# Check if ids_to_del is not empty before attempting to delete
if ids_to_del:
    vectorstore._collection.delete(ids=ids_to_del)
else:
    print("No documents found with None metadata.")

No documents found with None metadata.


LangChain 이용 RAG 사용
Retriever 초기화 안됨 수정완료

수정용 테스트 코드

In [20]:
from functools import lru_cache

@lru_cache(maxsize=None)
def some_function(x):
    return x * x

# 캐시를 비우기
some_function.cache_clear()


In [None]:
for i in range(len(splits)):
    print(i, "n")
    print(splits[i])
    print("\n---\n")


In [None]:
type(vectorstore)

In [38]:
coll = vectorstore.get()

ids_to_del = []

for idx in range(len(coll['ids'])):

    id = coll['ids'][idx]
    metadata = coll['metadatas'][idx]

    # Check if metadata is None. If it is, add the ID to be deleted
    if metadata is None:
        ids_to_del.append(id)

# Check if ids_to_del is not empty before attempting to delete
if ids_to_del:
    vectorstore._collection.delete(ids=ids_to_del)
else:
    print("No documents found with None metadata.")

In [None]:

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

def remove_duplicates(docs):
    seen = set()
    unique_docs = []
    for doc in docs:
        if doc.page_content not in seen:
            unique_docs.append(doc)
            seen.add(doc.page_content)
    return unique_docs

# 중복 제거 후 문서 분할
unique_docs = remove_duplicates(docs)
splits = text_splitter.split_documents(unique_docs)

rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)


In [None]:

# 문자열을 문서 객체로 변환
docs = [Document(page_content=text) for text in all_review]  # 'texts'는 문서 내용이 담긴 문자열 리스트

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

def remove_duplicates(docs):
    seen = set()
    unique_docs = []
    for doc in docs:
        if doc.page_content not in seen:
            unique_docs.append(doc)
            seen.add(doc.page_content)
    return unique_docs

# 중복 제거 후 문서 분할
unique_docs = remove_duplicates(docs)
splits = text_splitter.split_documents(unique_docs)

# 벡터 저장소 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# 검색 및 생성
retriever = vectorstore.as_retriever(search_kwargs={"k": len(docs)})

# Prompt
template = '''제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''

prompt = ChatPromptTemplate.from_template(template)


# Rretriever
retriever = vectorstore.as_retriever()

# Combine Documents
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG Chain 연결
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Chain 실행
rag_chain.invoke(f"""도시"{city_name}"의"{user_request}"의 관한 여행계획 추천해주세요""")

"I'm sorry, I can only provide information and answer questions related to attractions in Seoul. Let me know if you need any recommendations for places to visit in Seoul!"

In [None]:

# 문자열을 문서 객체로 변환
docs = [Document(page_content=text) for text in all_review]  # 'texts'는 문서 내용이 담긴 문자열 리스트

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 벡터 저장소 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# 검색 및 생성
retriever = vectorstore.as_retriever(search_kwargs={"k": 50})

# Prompt 설정
template = '''없는 정보는 자체 제공하여도 되나 최대한
제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''

prompt = ChatPromptTemplate.from_template(template)
llm = ChatOpenAI(model='gpt-3.5-turbo-0125', temperature=0)

# 문서 포맷팅 함수
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs if doc.page_content)

# Context를 동적으로 생성하는 함수
def generate_context(query):
    # 검색 수행 (get_relevant_documents 메서드 사용)
    search_results = retriever.get_relevant_documents(query)
    return format_docs(search_results)

# RAG Chain 설정 함수
def create_rag_chain(retriever, prompt, model):
    def context_runnable(query):
        # 새 쿼리에 대해 새로운 컨텍스트 생성
        return generate_context(query)

    # 데이터 흐름 설정
    return (
        {'context': RunnablePassthrough(func=context_runnable), 'question': RunnablePassthrough()}
        | prompt
        | model
        | StrOutputParser()
    )

# RAG Chain 생성
rag_chain = create_rag_chain(retriever, prompt, llm)

# Chain 실행
query = f'도시 "{city_name}"의 "{user_request}"에 관한 여행계획 추천해주세요'
result = rag_chain.invoke({'context': query, 'question': query})
print(result)


In [None]:


# 문서 리스트와 텍스트 분할기 설정
docs = [Document(page_content=text) for text in all_review]
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 벡터 저장소 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# retriever 초기화
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

# Prompt 템플릿 정의
template = '''없는 정보는 자체 제공하여도 되나 최대한
제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''
prompt = ChatPromptTemplate.from_template(template)

# Combine Documents 함수 정의
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG Chain 연결
def create_rag_chain():
    return (
        {'context': retriever | format_docs, 'question': RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )

# RAG Chain 실행 함수 정의
def run_rag_chain(query, city_name, user_request):
    # query를 포함한 문서 검색
    search_results = retriever.get_relevant_documents(query)

    # 검색된 문서들을 포맷팅
    context = format_docs(search_results)

    # RAG Chain 생성
    rag_chain = create_rag_chain()

    # Chain 실행
    return rag_chain.invoke(f"""도시 "{city_name}"의 "{user_request}"에 관한 여행 계획 추천해주세요""")

# 예시 실행
result = run_rag_chain(f"도시 '{city_name}'의 '{user_request}'에 관한 여행 계획 추천해주세요", city_name, user_request)

print(result)


In [None]:
# 문자열을 문서 객체로 변환
docs = [Document(page_content=text) for text in all_review]

# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 벡터 저장소 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# retriever 초기화
retriever = vectorstore.as_retriever(search_kwargs={"k": 50})

# Prompt 템플릿 정의
template = '''없는 정보는 자체 제공하여도 되나 최대한
제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''
prompt = ChatPromptTemplate.from_template(template)

# Combine Documents 함수 정의
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG Chain 생성 함수 정의
def create_rag_chain():
    return (
        {'context': retriever | format_docs, 'question': RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )

# RAG Chain 실행 함수 정의
def run_rag_chain(query, city_name, user_request):
    # query를 포함한 문서 검색
    search_results = retriever.get_relevant_documents(query)

    # 검색된 문서들을 포맷팅
    context = format_docs(search_results)

    # RAG Chain 생성
    rag_chain = create_rag_chain()

    # Chain 실행
    return rag_chain.invoke(f"""도시 "{city_name}"의 "{user_request}"에 관한 여행 계획 추천해주세요""")

# 예시 실행
result = run_rag_chain(f"도시 '{city_name}'의 '{user_request}'에 관한 여행 계획 추천해주세요", city_name, user_request)

print(result)

In [None]:
# 문서 분할
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)

# 벡터 저장소 생성
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# retriever 초기화
retriever = vectorstore.as_retriever(search_kwargs={"k": 50})

# Prompt 템플릿 정의
template = '''없는 정보는 자체 제공하여도 되나 최대한
제공되는 리뷰에 맞추어 대답해주세요:
{context}

Question: {question}
'''
prompt = ChatPromptTemplate.from_template(template)

# Combine Documents 함수 정의
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG Chain 생성 함수 정의
def create_rag_chain():
    return (
        {'context': retriever | format_docs, 'question': RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )

# RAG Chain 실행 함수 정의
def run_rag_chain(query, city_name, user_request):
    # query를 포함한 문서 검색
    search_results = retriever.get_relevant_documents(query)

    # 검색된 문서들을 포맷팅
    context = format_docs(search_results)

    # RAG Chain 생성
    rag_chain = create_rag_chain()

    # Chain 실행
    return rag_chain.invoke(f"""도시 "{city_name}"의 "{user_request}"에 관한 여행 계획 추천해주세요""")

# 예시 실행
result = run_rag_chain(f"도시 '{city_name}'의 '{user_request}'에 관한 여행 계획 추천해주세요", city_name, user_request)

print(result)

In [3]:
import googlemaps

# Google Maps API 클라이언트 초기화
api_key = 'AIzaSyD8wsLwdy0gyFfTnJBsj2ZA-biZ1OlKHPI'  # 실제 API 키로 교체하세요
gmaps = googlemaps.Client(key=api_key)

def get_place_reviews(city_name, max_places=10):
    # 도시의 좌표를 찾기 위해 Geocoding API를 사용
    geocode_result = gmaps.geocode(city_name)
    if not geocode_result:
        return []

    # 도시의 중앙 좌표를 추출
    city_location = geocode_result[0]['geometry']['location']

    # Places API를 사용하여 관광지 검색
    places_result = gmaps.places_nearby(
        location=(city_location['lat'], city_location['lng']),
        radius=10000,  # 10km 반경 내의 장소 검색
        type='tourist_attraction'
    )

    docs = []

    # 관광지에서 리뷰를 가져오기
    for place in places_result.get('results', [])[:max_places]:
        place_id = place['place_id']
        place_details = gmaps.place(place_id=place_id, fields=['name', 'reviews'])

        place_name = place_details.get('result', {}).get('name', 'No name')
        reviews = place_details.get('result', {}).get('reviews', [])

        if reviews:
            for review in reviews:
                review_text = f"Review for {place_name}:\n\n{review['text']}"
                docs.append(review_text)
        else:
            docs.append(f"No reviews available for {place_name}.")

    return docs

# 예시 사용
#docs = get_place_reviews('Seoul')  # 예시로 서울을 사용
#for doc in docs:
 #   print(doc)
  #  print("\n---\n")
