# 5.5 PromptTemplate 활용방법

- PromptTemplate을 활용해서 `LangChain` 스럽게 활용하는 방법을 알아봅니다

## 환경변수 불러오기

- `.env` 파일에 `OPENAI_API_KEY` 등록

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## LLM을 활용한 답변 생성

- `ChatOpenAI` 모델을 활용해서 답변을 생성합니다
  - `ChatAzureOpenAI`, `ChatAnthropic`, `ChatBedrock` 등 다양한 모델을 활용할 수 있습니다

In [2]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model='gpt-4o-mini', temperature=0)
question = '인프런에는 어떤 강의가 있나요?'
# llm.invoke(question)

In [3]:
text_prompt = f'아래 질문에 답변해주세요:\n\n {question}'
llm.invoke(text_prompt)

AIMessage(content='인프런은 다양한 주제의 온라인 강의를 제공하는 플랫폼입니다. 주로 IT, 프로그래밍, 데이터 분석, 디자인, 마케팅, 비즈니스 등 여러 분야의 강의가 있습니다. 예를 들어, 웹 개발, 모바일 앱 개발, 머신러닝, 데이터베이스, UX/UI 디자인, 디지털 마케팅, 그리고 자기계발 관련 강의 등이 포함되어 있습니다. 각 강의는 전문가들이 진행하며, 수강생들이 실습할 수 있는 자료와 커뮤니티 지원도 제공됩니다. 구체적인 강의 내용은 인프런 웹사이트에서 확인할 수 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 131, 'prompt_tokens': 26, 'total_tokens': 157, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-9e6296bc-1040-4d67-b92e-83cdce730a84-0', usage_metadata={'input_tokens': 26, 'output_tokens': 131, 'total_tokens': 157, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### PromptTemplate 활용

- 텍스트를 활용한 `invoke`와 `PromptTemplate`을 활용한 `invoke`의 차이를 알아봅니다

In [4]:
from langchain_core.prompts import PromptTemplate

prompt_with_template = '아래 질문에 답변해주세요:\n\n {question}'

prompt_template = PromptTemplate(template=prompt_with_template, input_variables=["question"])
prompt_template.invoke({"question": question})

StringPromptValue(text='아래 질문에 답변해주세요:\n\n 인프런에는 어떤 강의가 있나요?')

In [5]:
llm.invoke(prompt_template.invoke({"question": question}))

AIMessage(content='인프런은 다양한 주제의 온라인 강의를 제공하는 플랫폼으로, 주로 IT, 프로그래밍, 데이터 분석, 디자인, 마케팅 등 여러 분야의 강의를 포함하고 있습니다. 예를 들어, 다음과 같은 강의들이 있습니다:\n\n1. **프로그래밍**: Python, Java, JavaScript, C++, Ruby 등 다양한 프로그래밍 언어에 대한 강의.\n2. **웹 개발**: HTML, CSS, React, Vue.js, Node.js 등을 활용한 웹 개발 강의.\n3. **데이터 분석**: 데이터 시각화, 머신러닝, 데이터베이스(SQL) 관련 강의.\n4. **모바일 개발**: iOS, Android 앱 개발 관련 강의.\n5. **디자인**: UI/UX 디자인, 그래픽 디자인, 포토샵, 일러스트레이터 강의.\n6. **마케팅**: 디지털 마케팅, SEO, 소셜 미디어 마케팅 관련 강의.\n\n각 강의는 초급부터 고급까지 다양한 수준으로 제공되며, 실습 중심의 강의도 많아 실제 프로젝트에 적용할 수 있는 내용을 배울 수 있습니다. 인프런 웹사이트를 방문하면 더 많은 강의와 상세 정보를 확인할 수 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 266, 'prompt_tokens': 26, 'total_tokens': 292, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed

## Chain 구성

- `PromptTemplate`을 활용하면 LCEL 문법을 활용해서 chain을 구성할 수 있습니다

In [6]:
prompt_chain = prompt_template | llm
prompt_chain.invoke({"question": question})

AIMessage(content='인프런은 다양한 주제의 온라인 강의를 제공하는 플랫폼입니다. 주로 IT, 프로그래밍, 데이터 분석, 디자인, 마케팅, 비즈니스 등 여러 분야의 강의가 있습니다. 예를 들어, 웹 개발, 모바일 앱 개발, 머신러닝, 데이터베이스, UX/UI 디자인, 디지털 마케팅, 그리고 자기계발 관련 강의 등이 포함되어 있습니다. 각 강의는 전문가들이 진행하며, 수강생들이 실습을 통해 배울 수 있도록 구성되어 있습니다. 특정 강의에 대한 정보는 인프런 웹사이트를 방문하여 확인할 수 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 130, 'prompt_tokens': 26, 'total_tokens': 156, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-2dc3d212-17b5-4b50-9048-3de4ad7b835f-0', usage_metadata={'input_tokens': 26, 'output_tokens': 130, 'total_tokens': 156, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## RAG 구성

- `WebBaseLoader`를 활용해서 웹 페이지를 로드합니다
- `RecursiveCharacterTextSplitter`를 활용해서 텍스트를 청크로 분할합니다
- `Chroma`를 활용해서 청크를 데이터베이스에 저장합니다
- `OpenAIEmbeddings`를 활용해서 청크를 임베딩합니다
- `Chroma`를 활용해서 임베딩된 청크를 검색합니다
- `RAG` 구성을 활용해서 답변을 생성합니다


In [7]:
%pip install -qU beautifulsoup4


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.0.1[0m[39;49m -> [0m[32;49m24.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [8]:
from langchain_community.document_loaders import WebBaseLoader

loader = WebBaseLoader('https://www.inflearn.com/courses/it-programming?isDiscounted=false&types=&sort=')

USER_AGENT environment variable not set, consider setting it to identify your requests.


In [9]:
from langchain_text_splitters import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1500,
    chunk_overlap=200,
)
document_list = loader.load_and_split(text_splitter)

In [10]:
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings

embedding = OpenAIEmbeddings(model='text-embedding-3-large')

database = Chroma.from_documents(
    documents=document_list,
    embedding=embedding,
    collection_name='inflearn-lectures',
    persist_directory="./inflearn-lectures"
)

In [12]:
retriever = database.as_retriever(search_kwargs={'k': 1})
retriever.invoke(question)
retrieved_docs = retriever.invoke(question)
retrieved_docs


[Document(metadata={'description': '개발 · 프로그래밍 강의에 관심이 있다면 지금 당장 시작하세요! 인프런은 언제나 당신의 성장을 응원합니다.', 'language': 'ko', 'source': 'https://www.inflearn.com/courses/it-programming?isDiscounted=false&types=&sort=', 'title': '개발 · 프로그래밍 강의 리스트 | 인프런'}, page_content='개발 · 프로그래밍 강의 리스트 | 인프런개발 · 프로그래밍 강의 리스트 | 인프런검색검색전체전체개발 · 프로그래밍개발 · 프로그래밍게임 개발게임 개발데이터 사이언스데이터 사이언스인공지능인공지능보안 · 네트워크보안 · 네트워크하드웨어하드웨어디자인 · 아트디자인 · 아트기획 · 경영 · 마케팅기획 · 경영 · 마케팅업무 생산성업무 생산성커리어 · 자기계발커리어 · 자기계발대학 교육대학 교육전체웹 개발프론트엔드백엔드풀스택모바일 앱 개발프로그래밍 언어알고리즘 · 자료구조데이터베이스데브옵스 · 인프라소프트웨어 테스트개발 도구웹 퍼블리싱데스크톱 앱 개발VR/AR개발 · 프로그래밍 자격증개발 · 프로그래밍 기타기술 검색기술 검색필터0000모임/부트캠프강의 리스트')]

- `PromptTemplate`의 중괄호에 있는 변수들을 dictionary의 key로 활용해서 `invoke()` 함수를 호출할 수 있습니다

In [13]:
rag_prompt_template = PromptTemplate(
    template='''
    You are a helpful assistant that can answer questions about the Inflearn website.
    You are given the following context:
    {context}
    Question: {question}
    ''',
    input_variables=["context", "question"]
)
rag_chain = rag_prompt_template | llm
rag_chain.invoke({"context": retrieved_docs, "question": question})

AIMessage(content='인프런에는 다양한 개발 및 프로그래밍 강의가 있습니다. 주요 카테고리는 다음과 같습니다:\n\n- 웹 개발 (프론트엔드, 백엔드, 풀스택)\n- 모바일 앱 개발\n- 게임 개발\n- 데이터 사이언스\n- 인공지능\n- 보안 및 네트워크\n- 하드웨어\n- 디자인 및 아트\n- 기획, 경영, 마케팅\n- 업무 생산성\n- 커리어 및 자기계발\n- 대학 교육\n- 프로그래밍 언어\n- 알고리즘 및 자료구조\n- 데이터베이스\n- 데브옵스 및 인프라\n- 소프트웨어 테스트\n- 개발 도구\n- 웹 퍼블리싱\n- 데스크톱 앱 개발\n- VR/AR\n- 개발 · 프로그래밍 자격증\n- 기타 개발 · 프로그래밍 관련 강의\n\n이 외에도 다양한 주제의 강의가 제공되고 있으니, 관심 있는 분야의 강의를 찾아보시면 좋습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 220, 'prompt_tokens': 379, 'total_tokens': 599, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-158b5478-13c7-4060-bece-9a6e557348e5-0', usage_metadata={'input_tokens': 379, 'output_tokens': 220

## LangChain Hub 활용

- `LangChain Hub`를 활용해서 미리 정의된 `PromptTemplate`을 활용할 수 있습니다
- `hub.pull()` 함수를 활용해서 `PromptTemplate`을 불러올 수 있습니다

In [16]:
# set the LANGSMITH_API_KEY environment variable (create key in settings)
from langchain import hub
rlm_rag_prompt = hub.pull("rlm/rag-prompt")

In [17]:
rlm_rag_chain = rlm_rag_prompt | llm
rlm_rag_chain.invoke({"context": retrieved_docs, "question": question})


AIMessage(content='인프런에는 개발 및 프로그래밍 관련 다양한 강의가 있습니다. 강의 주제로는 웹 개발, 게임 개발, 데이터 사이언스, 인공지능, 보안, 디자인, 경영 등이 포함됩니다. 각 분야별로 프론트엔드, 백엔드, 모바일 앱 개발 등 세부 강의도 제공됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 74, 'prompt_tokens': 403, 'total_tokens': 477, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-e9eec8ba-d2f6-4743-b82d-1846a60d9a75-0', usage_metadata={'input_tokens': 403, 'output_tokens': 74, 'total_tokens': 477, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## RunnablePassthrough 활용

- `RunnablePassthrough`를 활용해서 특정 변수를 파이프라인에 포함시킬 수 있습니다
- `RunnablePassthrough`는 파이프라인에 포함되지 않고 그대로 전달됩니다

In [20]:
from langchain_core.runnables import RunnablePassthrough

rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | rlm_rag_prompt
    | llm
)
rag_chain.invoke(question)

AIMessage(content='인프런에는 개발 및 프로그래밍 관련 다양한 강의가 있습니다. 강의 주제로는 웹 개발, 게임 개발, 데이터 사이언스, 인공지능, 보안, 하드웨어 등이 포함됩니다. 또한, 프로그래밍 언어, 알고리즘, 데이터베이스 등도 다루고 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 69, 'prompt_tokens': 403, 'total_tokens': 472, 'completion_tokens_details': {'audio_tokens': 0, 'reasoning_tokens': 0, 'accepted_prediction_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-f48c98c1-db85-4789-9981-7aa9579f0f84-0', usage_metadata={'input_tokens': 403, 'output_tokens': 69, 'total_tokens': 472, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})