In [1]:
# langchain.chat_models에서 ChatOpenAI를 가져옴
from langchain.chat_models import ChatOpenAI
from langchain.prompts import PromptTemplate, ChatPromptTemplate

# ChatOpenAI의 인스턴스를 생성하고, 낮은 온도 설정으로 대화의 예측 가능성을 높임
chat = ChatOpenAI(temperature=0.1)

template = PromptTemplate.from_template(
    "What is the distance between {country_a} and {country_b}",
)

prompt = template.format(country_a="South Korea", country_b="Japan")

#chat.predict(prompt)

In [2]:
# langchain.schema에서 여러 메시지 타입을 가져옴
from langchain.schema import HumanMessage, AIMessage, SystemMessage

# 대화 메시지의 시퀀스를 정의함
template = ChatPromptTemplate.from_messages([
    # 시스템 메시지는 지리 전문가로서, 오직 {language}로만 답변하라는 지시를 포함함
    ("system", "You are a geography expert. And you only reply in {language}."),
    # AI 메시지는 자기 소개를 함
    ("ai", "Hi my name is {name}!"),
    # 인간 메시지는 {country_a}와 {country_b} 사이의 거리를 묻고, AI의 이름을 물음
    ("human", "What is the distance between {country_a} and {country_b}. Also what is your name?")
])

prompt = template.format_messages(
    language="Japan",
    name="Haru",
    country_a="Japan",
    country_b="South Korea",
)

#chat.predict_messages(prompt)

In [3]:
from langchain.schema import BaseOutputParser

class CommaOutputParser(BaseOutputParser):
    
    def parse(self, text):
        items = text.strip().split(",")
        return list(map(str.strip, items))
    
p = CommaOutputParser()

p.parse("Hello, How, Are, you")

['Hello', 'How', 'Are', 'you']

In [4]:
template = ChatPromptTemplate.from_messages([
    ("system", "You are a list generating machine. Everything you are asked will be answered with comma seperated list of max {max_items} in lowercase. DO NOT reply with anything else"),
    ("human", "{question}"),
])

chain = template | chat | CommaOutputParser()

chain.invoke({
    "max_items": 5,
    "question": "What are the poketmons ?"
})

['pikachu', 'charizard', 'bulbasaur', 'squirtle', 'jigglypuff']


## 정리
### langchain
Prompt Template 만들고, OutputParser 처리, langchain invoke 사용 (파이프라인)

In [None]:
# langchain.chat_models에서 ChatOpenAI를 가져오기
from langchain.chat_models import ChatOpenAI

# 예측 가능한 대화를 위해 낮은 온도 설정으로 ChatOpenAI 인스턴스 생성
chat = ChatOpenAI(temperature=0.1)

# 단순 거리 질의에 대한 템플릿 생성
# 두 나라 간의 거리에 관한 템플릿을 생성합니다.
template = PromptTemplate.from_template(
    "What is the distance between {country_a} and {country_b}",
)

# 템플릿 포매팅을 사용하여 특정 국가 쌍에 대한 질문 생성
prompt = template.format(country_a="South Korea", country_b="Japan")

# chat.predict(prompt) # 이 코드는 실행되지 않았으므로 주석 처리합니다.

### =============================================================== ###

# langchain.schema에서 필요한 메시지 타입 가져오기
from langchain.schema import HumanMessage, AIMessage, SystemMessage

# 대화 흐름을 정의하는 템플릿 생성
# 지리 전문가로서의 역할과 답변 언어를 지정하는 시스템 메시지를 포함합니다.
template = ChatPromptTemplate.from_messages([
    ("system", "You are a geography expert. And you only reply in {language}."),
    ("ai", "Hi my name is {name}!"),
    ("human", "What is the distance between {country_a} and {country_b}. Also what is your name?")
])

# 대화 흐름을 포매팅하여 실제 값을 채워 넣습니다.
prompt = template.format_messages(
    language="Korean", # 언어를 일본어에서 한국어로 변경했습니다.
    name="Haru",
    country_a="Japan",
    country_b="South Korea",
)

# chat.predict_messages(prompt) # 이 코드는 실행되지 않았으므로 주석 처리합니다.

### =============================================================== ###

# 출력 파싱을 위한 클래스 정의
class CommaOutputParser(BaseOutputParser):
    # 컴마로 구분된 문자열을 리스트로 변환
    def parse(self, text):
        items = text.strip().split(",")
        return list(map(str.strip, items))
    
# CommaOutputParser 인스턴스 생성
p = CommaOutputParser()

# 파서를 테스트하기 위한 문자열 파싱
p.parse("Hello, How, Are, you")

### =============================================================== ###


# 리스트 생성기로서의 역할을 정의하는 대화 흐름 생성
template = ChatPromptTemplate.from_messages([
    ("system", "You are a list generating machine. Everything you are asked will be answered with comma separated list of max {max_items} items in lowercase. DO NOT reply with anything else"),
    ("human", "{question}"),
])

# 파이프라인을 구성하여 대화 템플릿, 챗봇, 그리고 출력 파서를 연결합니다.
chain = template | chat | CommaOutputParser()

# 파이프라인을 호출하여 질문에 대한 답변을 리스트 형태로 변환합니다.
chain.invoke({
    "max_items": 5,
    "question": "What are the Pokémon?" # 'poketmons' 오타를 'Pokémon'으로 수정했습니다.
}) 
# 결과: ['pikachu', 'charizard', 'bulbasaur', 'squirtle', 'jigglypuff']

# CommaOutputParser 클래스는 BaseOutputParser를 상속받아 구현되었습니다.
# 이 클래스는 입력된 텍스트를 쉼표로 분리하여 리스트로 만드는 역할을 합니다.
# 이 과정은 데이터 처리나 문자열 파싱에 유용할 수 있습니다.
