# 모델 I/O
## 1. 라이브러리 설치
- 아나콘다에서 다음 라이브러리를 설치합니다. 다음 코드는 한줄씩 실행합니다.

In [1]:
!pip install langchain



In [None]:
!pip install openai

In [None]:
!pip install huggingface-hub

## 2. 프롬프트 생성 
- 실행해볼 코드는 프롬프트와 관련된 것입니다. 프롬프트 생성을 위해 PromptTemplate를 사용합니다. 
- PromptTemplate은 LLM에 문장을 전달하기 전에 문장 구성을 편리하게 해주는 역할을 합니다. 
- 즉 말 그대로 LLM이 어떤 문장을 만들어야 하는지를 알려주는 역할을 하죠. 
- 다음은 제품(Product)만 바뀌고 나머지 문구는 고정해서 출력하는 PromptTemplate에 대한 사용 예시 입니다.

In [None]:
from langchain import PromptTemplate
template = "{product}를 홍보하기 위한 좋은 문구를 추천해줘?"

prompt = PromptTemplate(
    input_variables=["product"],
    template=template,
)

prompt.format(product="카메라")

## 3. LLM 호출
- LLM은 오픈AI와 구글에서 제공하는 모델을 사용합니다. 프롬프트는 "진희는 강아지를 키우고 있습니다. 진희가 키우고 있는 동물은?"이며, 
- 이에 따라 모델을 거쳐 나오는 겨로가인 컬플리션은 "강아지"가 되어야 합니다.

In [None]:
import os
os.environ["OPENAI_API_KEY"] = "sk-" #openai 키 입력

#from langchain.chat_models import ChatOpenAI #The class `ChatOpenAI` was deprecated in LangChain 0.0.10 and will be removed in 0.3.0. 
from langchain_openai import ChatOpenAI
llm1 = ChatOpenAI(temperature=0.1,  # 창의성 0.1으로 설정 
                 model_name='gpt-4o-mini',  # 모델명 #gpt-4o-mini #gpt-3.5-turbo-16k 
                 )

question = "진희는 강아지를 키우고 있습니다. 진희가 키우고 있는 동물은?"
#print(llm1.predict(question)) # The method `BaseChatModel.predict` was deprecated in langchain-core 0.1.7 and will be removed in 0.3.0. Use invoke instead.
print(llm1.invoke(question))

- 메타에서 제공하는 모델을 사용해 실행해봅니다.
  [meta-llama/Meta-Llama-3-8B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct)
- Meta-Llama-3-8B-Instruct 모델은 80억 개의 파라미터를 가진 중간 크기의 언어 모델로, 명령 기반 응답 생성에 최적화되어 있습니다. 

In [None]:
import os
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "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"  #허깅페이스 키 입력

#from langchain import HuggingFaceHub #The class `HuggingFaceHub` was deprecated in LangChain 0.0.21 and will be removed in 0.3.0
#llm2 = HuggingFaceHub(repo_id = "google/flan-t5-xxl", model_kwargs={"temperature":0.8, "max_length":512})

from langchain_huggingface import HuggingFaceEndpoint
llm2 = HuggingFaceEndpoint(
    repo_id="meta-llama/Meta-Llama-3-8B-Instruct", 
    task="text-generation",
    max_new_tokens=100,
    temperature=0.1,
    do_sample=False,
)

question = "진희는 강아지를 키우고 있습니다. 진희가 키우고 있는 동물은?"
completion = llm2.invoke(question)
print(completion)

## 4. 모델 성능 비교
- 랭체인에서 제공하는 ModelLaboratory을 이용하면 모델의 성능을 비교해볼 수 있습니다. 
- lim1은 오픈AI, lim2는 메타에서 제공하는 모델입니다.

In [None]:
from langchain.model_laboratory import ModelLaboratory
model_lab = ModelLaboratory.from_llms([llm1, llm2])
model_lab.compare("대한민국의 가을은 몇 월부터 몇 월까지야?")

## 5. 출력 파서 (Output Parser)
- 파서를 CommaSeparatedListOutputParser로 초기화한 후 출력 형식을 지정합니다.

In [None]:
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import PromptTemplate
#from langchain.chat_models import ChatOpenAI #The class `ChatOpenAI` was deprecated in LangChain 0.0.10 and will be removed in 0.2.0. An updated version of the class exists in the langchain-openai package and should be used instead. 
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(temperature=0,  # 창의성 0으로 설정 
                 max_tokens=2048,  # 최대 토큰수
                 model_name='gpt-4o-mini',  # 모델명 #gpt-4o-mini #gpt-3.5-turbo-16k
                )

output_parser = CommaSeparatedListOutputParser() #파서 초기화
format_instructions = output_parser.get_format_instructions() #출력 형식 지정

prompt = PromptTemplate(
    template="7개의 팀을 이름순서대로 보여줘 {subject}.\n{format_instructions}",
    input_variables=["subject"],
    partial_variables={"format_instructions": format_instructions}
)

print(prompt)

- 지정된 CommaSeparatedListOutputParser 출력을 확인해보기 위해 "한국의 야구팀은?"이라고 질의를 해봅니다.

In [None]:
query = "한국의 야구팀은?"

# 출력 결과 생성
#output = llm.predict(text=prompt.format(subject=query)) #The method `BaseChatModel.predict` was deprecated in langchain-core 0.1.7 and will be removed in 0.3.0. Use invoke instead 

# 출력 결과 생성
response = llm.invoke(prompt.format(subject=query))

# 실제 텍스트 추출
# llm.invoke 메서드가 AIMessage 객체를 반환하기 때문에, AIMessage 객체에서 실제 텍스트를 추출하려면 content 속성을 사용해야 합니다.
output = response.content

# 출력에 대한 포맷 변경
parsed_result = output_parser.parse(output)
print(parsed_result)

## 6. langchain_openai.chat_models.base.ChatOpenAI
- https://api.python.langchain.com/en/latest/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html

### 6.1 Invoke:

In [None]:
messages = [
    (
        "system",
        "20개의 팀을 이름순서대로 보여줘",
    ),
    ("human", "한국의 야구팀은?"),
]
llm.invoke(messages)

### 6.2 Stream:

In [None]:
for chunk in llm.stream(messages):
    print(chunk)

### 6.3 Async:

In [None]:
await llm.ainvoke(messages)

# stream:
# async for chunk in (await llm.astream(messages))

# batch:
#await llm.abatch([messages])

## 7. Output Parsers Types
### https://python.langchain.com/v0.1/docs/modules/model_io/output_parsers/

### 7.1 CSV parser (CommaSeparatedListOutputParser)

In [None]:
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

output_parser = CommaSeparatedListOutputParser()

format_instructions = output_parser.get_format_instructions()
prompt = PromptTemplate(
    template="List five {subject}.\n{format_instructions} in Korean",
    input_variables=["subject"],
    partial_variables={"format_instructions": format_instructions},
)

model = ChatOpenAI(temperature=0)

chain = prompt | model | output_parser

chain.invoke({"subject": "ice cream flavors"})

### 7.2 Datetime parser

In [None]:
from langchain.output_parsers import DatetimeOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import OpenAI

output_parser = DatetimeOutputParser()
template = """Answer the users question:

{question}

{format_instructions}"""
prompt = PromptTemplate.from_template(
    template,
    partial_variables={"format_instructions": output_parser.get_format_instructions()},
)

chain = prompt | OpenAI() | output_parser

output = chain.invoke({"question": "6.25 한국전쟁은 언제 발발했나요?"})

print(output)

### 7.3 JSON parser

In [None]:
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI

model = ChatOpenAI(temperature=1)

# Define your desired data structure.
class Joke(BaseModel):
    setup: str = Field(description="question to set up a joke")
    punchline: str = Field(description="answer to resolve the joke")

# And a query intented to prompt a language model to populate the data structure.
joke_query = "재미난 이야기 해주세요. 한글로 해주세요"

# Set up a parser + inject instructions into the prompt template.
parser = JsonOutputParser(pydantic_object=Joke)

prompt = PromptTemplate(
    template="Answer the user query.\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

chain = prompt | model | parser

chain.invoke({"query": joke_query})