## 프롬프트 생성
- PromptTemplate : LLM 에 문장을 전달하기 전에 문장 구성을 편리하게 만들어주는 역할

In [2]:
from langchain import PromptTemplate
template = "{product}를 홍보하기 위한 좋은 문구를 추천해줘"

prompt = PromptTemplate(
    input_variables = ["product"],
    template = template
)

prompt.format(product ='카메라')

'카메라를 홍보하기 위한 좋은 문구를 추천해줘'

## OpenAI 모델 LLM 호출
- https://platform.openai.com/docs/models/gpt-4-and-gpt-4-tudo

In [3]:
# !pip install --upgrade langchain langchain_community

In [4]:
import os

In [30]:
from langchain.chat_models import ChatOpenAI
llm1 = ChatOpenAI(
    temperature= 0, # 창의성 0 으로 설정
    model_name = 'gpt-4' # 모델명 () 
)

prompt = "진희는 강아지를 키우고 있습니다. 진희가 키우고 있는 동물은?"
print(llm1.predict(prompt))
# print(llm1.invoke(prompt).content)

강아지입니다.


In [15]:
import os

In [21]:
from langchain import HuggingFaceHub
# llm2 = HuggingFaceHub(repo_id = "google/flan-t5-xxl", model_kwargs = {"temperature": 0.8, "max_length": 512})
llm2 = HuggingFaceHub(repo_id = "google/flan-t5-base", model_kwargs = {"temperature": 0.8, "max_length": 512})

# google/flan-t5-xxl : 큰 모델
# google/flan-t5-large, flan-t5-base: 상대적으로 작은 모델 (성능이 떨어짐)

promt = "진희는 강아지를 키우고 있습니다. 진희가 키우고 있는 동물은?"
completion = llm2(promt)
print("출력값:", completion)

출력값: I'm not sure.


## 모델 성능 비교

In [1]:
# from langchain.model_laboratory import ModelLaboratory
# model_lab = ModelLaboratory.from_llms([llm1, llm2])
# model_lab.compare("대한민국의 가을은 몇 월부터 몇 월까지야?")

## 출력파서
- PydantcOutputParer: 입력된 데이터를 정의된 필드 타입에 맞게 자동으로 반환
- SimpleJsonOutputParser: Json 형태로 결과를 반환
- CommaSeparatedListOutputParer: 콤마(,)로 구분하여 결과를 반환합니다.
- DatetimeOutputParser: 날짜/시간 형태로 결과를 반환 (예시. 1969-07-20 20:17:40)
- XMLOutputParer: XML 형태로 결과를 반환

In [32]:
# CommaSeparatedListOutputParer 작성 예제 확인
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatOpenAI
# OpenAI의 GPT-4 모델을 초기화 (temperature 0으로 설정하여 출력 결과의 일관성을 높임)
llm = ChatOpenAI(
    temperature=0,  # 창의성 0으로 설정 (예측에 있어 가장 일관된 답변을 기대)
    max_tokens=2048,  # 최대 토큰 수 설정 (한 번의 예측에서 사용할 최대 토큰 수)
    model_name='gpt-4'  # 사용할 모델 지정 (GPT-4 사용)
)

# 결과값을 콤마로 구분된 리스트로 변환해주는 출력 파서 초기화
output_parser = CommaSeparatedListOutputParser()

# 템플릿에 질의를 적용하여 완성된 문장을 LLM에 전달 (질의를 통해 결과 생성)
output = llm.predict(text=prompt.format(subject=query))

# PromptTemplate 생성
# - 'subject' 변수는 사용자가 입력할 질의(query)에 해당
# - 'format_instructions'는 파서가 요구하는 출력 형식을 반영
prompt = PromptTemplate(
    template="7개의 팀을 보여줘 {subject}. \n {format_instructions}",  # 템플릿 문장 (사용자 질의와 형식 요구 사항 포함)
    input_variables=["subject"],  # 사용자 입력을 받을 변수 (여기서는 'subject')
    partial_variables={"format_instructions": format_instructions}  # 출력 형식 지정 (파서에서 전달된 형식 요구 사항)
)

In [35]:
query = "한국의 도시 이름은?"

# 출력 결과 생성
output = llm.predict(text= prompt.format(subject = query))

# 출력에 대한 포맷 변경
parsed_result = output_parser.parse(output)
print(parsed_result)

['서울', '부산', '인천', '대구', '대전', '광주', '울산']
