In [1]:
# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

True

In [2]:
# LangSmith 추적을 설정합니다. https://smith.langchain.com
# .env 파일에 LANGCHAIN_API_KEY를 입력합니다.
# !pip install -qU langchain-teddynote
from langchain_teddynote import logging

# 프로젝트 이름을 입력합니다.
logging.langsmith("CH01-Basic")

# LangSmith 추적을 원하지 않을 경우
# logging.langsmith("CH01-Basic", set_enable=False)

LangSmith 추적을 시작합니다.
[프로젝트명]
CH01-Basic


### 프롬프트 템플릿의 활용
`PromptTemplate`
- 사용자의 입력 변수를 사용하여 완전한 프롬프트 문자열을 만드는 데 사용되는 템플릿입니다.
- 사용법
    - `template` : 템플릿 문자열입니다. 이 문자열 내에서 중괄호 `{}`는 변수를 나타냅니다.
    - `input_variables` : 중괄호 안에 들어갈 변수의 이름을 리스트로 정의합니다.
</br>

`input_variables`
- input_variables는 PromptTemplate에서 사용되는 변수의 이름을 정의하는 리스트입니다.

In [4]:
from langchain_core.prompts import PromptTemplate

`from_template()` 메소드를 사용하여 PromptTemplate 객체 생성

In [5]:
# template 정의
template = "{country}의 수도는 어디인가요?"

# from_template 메소드를 이용하여 PromptTemplate 객체 생성
prompt_template = PromptTemplate.from_template(template)
prompt_template

PromptTemplate(input_variables=['country'], input_types={}, partial_variables={}, template='{country}의 수도는 어디인가요?')

In [6]:
# prompt 생성
prompt = prompt_template.format(country="대한민국")
prompt

'대한민국의 수도는 어디인가요?'

In [7]:
# prompt 생성
prompt = prompt_template.format(country="미국")
prompt

'미국의 수도는 어디인가요?'

In [8]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.1,
    max_tokens=2048,
)

### LCEL(LangChain Expression Language) </br>

여기서 우리는 LCEL을 사용하여 다양한 구성 요소를 단일 체인으로 결합합니다. </br>

`chain = prompt | model | output_parser` </br>

`|` 기호는 unix 파이프 연산자와 유사하며, 서로 다른 구성 요소를 연결하고 한 구성 요소의 출력을 다음 구성 요소의 입력으로 전달합니다. </br>

이 체인에서 사용자의 입력은 프롬프트 템플릿으로 전달되고, 그런 다음 프롬프트 템플릿 출력은 모델로 전달됩니다. 각 구성 요소를 개별적으로 살펴보면 무슨 일이 일어나고 있는지 이해할 수 있습니다.

In [11]:
# prompt를 PromptTemplate 객체로 생성합니다. 
prompt = PromptTemplate.from_template("{topic}에 대해 쉽게 설명해주세요.")

model = ChatOpenAI()

chain = prompt | model

In [12]:
chain

PromptTemplate(input_variables=['topic'], input_types={}, partial_variables={}, template='{topic}에 대해 쉽게 설명해주세요.')
| ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x14b8ae900>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x14b8ae420>, root_client=<openai.OpenAI object at 0x148ff7740>, root_async_client=<openai.AsyncOpenAI object at 0x14abc13a0>, model_kwargs={}, openai_api_key=SecretStr('**********'), stream_usage=True)

### invoke() 호출
- python 딕셔너리 형태로 입력값을 전달합니다. (키:값)
- invoke() 함수 호출 시, 입력값을 전달합니다.

In [None]:
# input 딕셔너리에 주제를 '인공지능 모델의 학습 원리' 로 설정합니다.
input = {"topic" : "인공지능 모델의 학습 원리"}

# prompt = PromptTemplate.from_template("{topic}에 대해 쉽게 설명해주세요.")
# topic을 채워주지 않으면 에러가 발생한다.

In [14]:
# prompt 객체와 model 객체를 파이프(|) 연산자로 연결하고 invoke 메서드를 사용하여 input을 전달합니다.
# 이를 통해 AI 모델이 생성한 메시지를 반환합니다.
chain.invoke(input)

AIMessage(content='인공지능 모델의 학습 원리는 데이터를 입력으로 받아서 원하는 결과를 도출하기 위해 자동으로 가중치를 조정하는 과정입니다. \n\n먼저, 학습 데이터를 모델에 입력하고 모델은 입력 데이터를 분석하여 예측을 수행합니다. 예측 결과와 실제 결과를 비교하여 오차를 계산하고, 이 오차를 최소화하기 위해 모델의 가중치를 업데이트합니다.\n\n이 과정을 반복하면서 모델은 학습 데이터에 대한 패턴을 습득하고 최적의 가중치를 학습하여 새로운 데이터에 대해 정확한 예측을 할 수 있도록 됩니다. 이러한 과정을 통해 모델은 학습 데이터에 대한 패턴을 추출하고 일반화된 예측을 수행할 수 있게 됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 259, 'prompt_tokens': 33, 'total_tokens': 292, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CqH7fMEACaEcXgsp4bK9MW1qOGEKs', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--f3f7972b-cc72-41b2-a9f0-af3c660fcd9c-0', usage_metadata={'input_tokens': 33, 'output_tokens': 259, 'total_tokens':

In [21]:
# 변수가 하나일 경우에는 예외적으로 딕셔너리 형태가 아니더라도 허용된다.
chain.invoke("인공지능 모델의 학습 원리")

AIMessage(content='인공지능 모델의 학습 원리는 다양한 데이터를 입력으로 받아 그 데이터 간의 패턴이나 관계를 학습하는 과정을 말합니다. 이를 위해 모델은 수학적인 알고리즘을 사용하여 데이터를 분석하고 특정한 규칙을 찾아내게 됩니다. 이후, 주어진 데이터에 대한 예측이나 분류를 수행할 수 있게 됩니다.\n\n모델은 초기에는 무작위로 설정된 가중치를 가지고 데이터를 입력받아 가공하고 예측하게 됩니다. 그리고 이러한 예측과 실제 결과 간의 차이를 계산하여 이를 최소화하는 방향으로 가중치를 조정하며 학습됩니다. 이 과정은 반복적으로 이루어지며, 모델은 예측의 정확도가 높아지도록 계속해서 학습하게 됩니다.\n\n이렇게 학습된 모델은 새로운 데이터가 입력되었을 때, 해당 데이터의 패턴이나 관계를 예측하거나 분류할 수 있는 능력을 갖추게 됩니다. 이러한 학습 과정을 통해 인공지능 모델은 더욱 정확하고 효율적으로 작업을 수행할 수 있도록 개선됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 395, 'prompt_tokens': 33, 'total_tokens': 428, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CqHDAI2Ih14BkS6ZaH9h7YW6wCOsj', 'service_tier': 'default', 'finish_reason': 'stop', 'logp

In [16]:
prompt2 = PromptTemplate.from_template("{topic}에 대해 {how} 설명해주세요.")

model2 = ChatOpenAI()

chain2 = prompt2 | model2

In [19]:
input2 = {"topic" : "인공지능 모델의 학습 원리", "how" : "간단하게"}

In [20]:
chain2.invoke(input2)

AIMessage(content='인공지능 모델의 학습 원리는 데이터를 입력으로 받아들이고 이를 처리하여 원하는 결과를 출력하는 과정을 말합니다. 모델은 처음에는 초기 설정된 일련의 파라미터를 가지고 있고, 이를 기반으로 데이터를 반복적으로 학습하여 최적의 파라미터 값을 찾아내는 과정을 거칩니다.\n\n학습 과정은 일반적으로 손실 함수를 통해 모델의 성능을 평가하고 이를 최소화하기 위해 파라미터를 조정하는 과정을 반복하여 진행됩니다. 이 과정을 통해 모델은 데이터의 패턴과 관련된 정보를 습득하고, 새로운 데이터에 대해 정확한 결과를 예측할 수 있게 됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 228, 'prompt_tokens': 35, 'total_tokens': 263, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CqHAus7XfDhXx2N07cTsD2aiS7PN4', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--5c9a6464-e0cc-41c0-b8e4-13d61343c22d-0', usage_metadata={'input_tokens': 35, 'output_tokens': 228, 'total_tokens': 263, 'input_token_details': {'

### 출력 파서(Output Parser)

In [22]:
from langchain_core.output_parsers import StrOutputParser

output_parser = StrOutputParser()

Chain에 출력 파서를 추가합니다.

In [23]:
# 프롬프트, 모델, 출력 파서를 연결하여 처리 체인을 구성합니다.
chain = prompt | model | output_parser

In [None]:
# chain 객체의 invoke 메서드를 사용하여 input을 전달합니다.
input = {"topic" : "인공지능 모델의 학습 원리"}
chain.invoke(input)

# OutputParser를 사용하지 않으면 AIMessage라는 객체에 담겨서 응답이 출력된다.

'인공지능 모델의 학습 원리는 데이터를 입력으로 사용하여 모델 내의 매개변수를 조정함으로써 데이터의 패턴이나 관계를 학습하는 과정입니다. \n\n먼저, 모델은 입력된 데이터를 받아들이고, 이 데이터를 처리하여 출력을 생성합니다. 이 출력은 실제 정답 또는 원하는 결과와 비교되어 오차를 계산합니다. 이 오차를 최소화하기 위해 모델 내의 매개변수를 조정하여 예측값을 실제 값에 가깝게 만드는 것이 학습의 목표입니다.\n\n모델은 학습 데이터를 반복적으로 사용하여 매개변수를 조정하며 학습하게 됩니다. 이 과정을 통해 모델은 데이터의 패턴을 파악하고, 새로운 데이터에 대한 예측을 수행할 수 있게 됩니다. 이렇게 모델은 데이터를 효율적으로 처리하고 문제를 해결하는 인공지능 시스템으로 발전하게 됩니다. \n\n요약하면, 인공지능 모델의 학습은 데이터를 이용하여 매개변수를 조정하고 오차를 최소화하는 과정으로, 모델이 입력된 데이터의 패턴을 학습하여 문제를 해결하는 능력을 향상시키는 것입니다.'

### 템플릿을 변경하여 적용
- 아래의 프롬프트 내용을 얼마든지 변경하여 테스트 해볼 수 있습니다.
- `model_name` 역시 변경하여 테스트가 가능합니다.

In [28]:
template = """
당신은 영어를 가르치는 10년차 영어 선생님입니다. 주어진 상황에 영어 회화를 작성해 주세요.
양식은 [FORMAT]을 참고하여 작성해 주세요.

#상황:
{question}

#FORMAT:
- 영어 회화:
- 한글 해석
"""
# {{ }} 중괄호를 2개 쓰면 input_variables로 잡히지 않는다.

# 프롬프트 템플릿을 이용하여 프롬프트를 생성합니다.
prompt = PromptTemplate.from_template(template)

# ChatOpenAI 챗모델을 초기화합니다.
model = ChatOpenAI(model_name="gpt-4-turbo")

# 문자열 출력 파서를 초기화합니다.
output_parser = StrOutputParser()

In [29]:
# 체인을 구성합니다.
chain = prompt | model | output_parser

In [31]:
# 완성된 Chain을 실행하여 답변을 얻습니다.
print(chain.invoke({"question" : "저는 식당에 가서 음식을 주문하고 싶어요."}))

- 영어 회화:
  Customer: Hi, could I see the menu, please?
  Waiter: Of course! Here you go.
  Customer: Thank you. I’d like to order the grilled salmon with a side of roasted vegetables.
  Waiter: That’s a great choice! Would you like anything to drink?
  Customer: Yes, I’ll have a glass of white wine, please.
  Waiter: Sure, I’ll bring that right out for you. Anything else?
  Customer: No, that'll be all for now. Thank you.

- 한글 해석:
  고객: 안녕하세요, 메뉴판 좀 볼 수 있을까요?
  웨이터: 물론입니다! 여기 있습니다.
  고객: 감사합니다. 구운 연어와 구운 채소 사이드를 주문하겠습니다.
  웨이터: 좋은 선택이네요! 음료는 무엇을 드시겠어요?
  고객: 네, 화이트 와인 한 잔 주세요.
  웨이터: 알겠습니다, 곧 가져다 드리겠습니다. 더 필요하신 것 있으세요?
  고객: 아니요, 이걸로 충분합니다. 감사합니다.


In [32]:
# 이번에는 question을 '미국에서 피자 주문'으로 설정하여 실행합니다.
print(chain.invoke({"question" : "미국에서 피자 주문"}))

- 영어 회화:
  - Customer: Hi, I'd like to order a large pepperoni pizza with extra cheese, please.
  - Employee: Sure! Would you like any sides or drinks with that?
  - Customer: Yes, can I have an order of garlic bread and two cans of Coke?
  - Employee: Absolutely. Will that be for delivery or pick-up?
  - Customer: Delivery, please. How long will it take?
  - Employee: It should take about 30-45 minutes. May I have your address, please?
  - Customer: Sure, it's 123 Elm Street, Apartment 4B.
  - Employee: Great! Your total comes to $27.50. We accept cash, credit, or debit. How would you like to pay?
  - Customer: I’ll pay with my credit card.
  - Employee: Perfect. We’ll process the payment when the delivery arrives. Thank you for ordering with us!

- 한글 해석:
  - 고객: 안녕하세요, 대형 페퍼로니 피자에 치즈를 추가로 더 넣어서 하나 주문하겠습니다.
  - 직원: 네, 사이드 메뉴나 음료도 추가로 주문하시겠어요?
  - 고객: 네, 마늘빵 하나와 콜라 두 캔도 주세요.
  - 직원: 알겠습니다. 배달로 할까요, 아니면 픽업으로 하시겠어요?
  - 고객: 배달로 해주세요. 얼마나 걸리나요?
  - 직원: 대략 30-45분 정도 걸립니다. 주소를 알려주시겠어요?
  -