# 2025.06.09. (MON)

In [27]:
from dotenv import load_dotenv

load_dotenv()

True

## Prompt Template

### Model I/O

* Prompt Template

* Language Model

* Output Parser

### Prompt

* input value to let model do certain tasks

* mainly by human language

### Prompt Engineering

* to design and optimize prompts to get the best result

* for a constant and precise answer

#### Components

* Markdown code

    * Instruction

    * Context

    * Input Data

    * Output Indicator

### Guide

1. Clarity

2. Specificity

3. Conciseness

4. Explicit Instruction

5. Constraint Prompting

6. Persona

7. Step-by-Step Instruction

8. Zero-shot, One-shot, Few-shot

9. Open-ended questioning

10. Providing Context

11. Ethical Usage

### Approaches

#### CoT(Chain of Thought)

* Step-by-step Logic

* methods

    * Zero-shot CoT: to put a phrase such as '단계적으로 풀어보자', '차근 차근 생각해보자', 'Think step by step' onto our prompts

    * Few-shot CoT: to state each steps

#### ToT(Tree of Thought)

* Not a sequential, but a tree-like logic.

* explore & evaluate for each branches.

* on mathematical problem, creativity, strategic planning, coding

**References**

* Langchain Hub

* Promry

* 오픈프롬프트

* Prompt Hero

In [28]:
from textwrap import dedent, indent

def test():
    txt = dedent("""
    first
    second
    third             
    """)
    print(txt.strip())

test()

first
second
third


In [29]:
txt = "first\nsecond\nthird"
txt = indent(txt, " " * 4)
print(txt)

    first
    second
    third


### Prompt Template

* Reusablility

* Maintenance Intimacy

* Automation Compatibility

### Common Templates of Langchain

* `PromptTemplate`: common format for instruction prompt
    
    * simple text formatting

    * `{}` for variables

* `ChatPromptTemplate`

    * For chat model

    * Various Roles of Speaker(e.g. System, User, AI, ect.)

    * Features

        * Role-based messages: goot at context-maintaining

        * System Message(Order), User Messasge(Input), AI Message(LLM Response), etc.

* `FewShotPromptTemplate`

    * Few-shot Learning in prompt

    ```python
    from langchain.prompts import FewShotPromptTemplate, PromptTemplate

    examples = [
        {'input': '2+2', 'output': '4'},
        {'input': '3+5', 'output': '8'}
    ]
    example_template = PromptTemplate(template='Q: {input}\nA: {output}')
    prompt = FewShotPromptTemplate(
        examples = examples,
        example_prompt = example_template,
        prefix = 'Answer the following math questions:',
        suffix = 'Q: {query}\nA:'
    )
    prompt.invoke({"query":"8+20"})
    ```

    ```output
    Answer the following math questions:

    Q: 2+2
    A: 4

    Q: 3+5
    A: 8

    Q: 8+20
    A:
    ```

In [30]:
from langchain.prompts import FewShotPromptTemplate, PromptTemplate

examples = [
    {'input': '2+2', 'output': '4'},
    {'input': '3+5', 'output': '8'}
]
example_template = PromptTemplate(template='Q: {input}\nA: {output}')
prompt = FewShotPromptTemplate(
    examples = examples,
    example_prompt = example_template,
    prefix = 'Answer the following math questions:',
    suffix = 'Q: {query}\nA:'
)
print(prompt.invoke({"query":"8+20"}).text)

Answer the following math questions:

Q: 2+2
A: 4

Q: 3+5
A: 8

Q: 8+20
A:


### How?

* template: 'string'

* variables: `{}`

* `"{country}의 수도는 어디인가요?"`

* to `PromptTemplate` Object

#### Common Methods

* Template Generation:

    * `from_template()`

    * `from_messages()`

* Prompt Generation:

    * `format(variable = value, ...)`

    * `format_messages(variable = value, ...)`

    * `invoke(dict)`

    > `invoke()`
    >
    > * a common method of `Runnable` class, which is the KEY class of Langchain.
    >
    > * `Runnable`: Superclass of other task classes composing Chain
    >
    > * `invoke()` -> result -> next chain

In [54]:
from langchain.prompts import PromptTemplate, ChatPromptTemplate

template = "{country}의 수도는 어디인가요?"
prompt_template = PromptTemplate(
    template = template,
    # input_variables = ['country']    # able to omit after v 0.3
)
print(prompt_template)

input_variables=['country'] input_types={} partial_variables={} template='{country}의 수도는 어디인가요?'


In [55]:
print(prompt_template.format(country = '대한민국'))
print(prompt_template.format(country = '미국'))
print(prompt_template.format(country = '중국'))

대한민국의 수도는 어디인가요?
미국의 수도는 어디인가요?
중국의 수도는 어디인가요?


In [56]:
prompt_template.invoke({'country':'독일'})
# prompt_template.invoke({'country':'독일'}).text

StringPromptValue(text='독일의 수도는 어디인가요?')

In [57]:
from langchain_openai import ChatOpenAI

prompt = prompt_template.invoke({'country':'대한민국'})
model = ChatOpenAI(model = 'gpt-4o-mini')
result = model.invoke(prompt)
print(result.content)

대한민국의 수도는 서울입니다.


In [58]:
# ChatPromptTemplate
# 1. ("role", "content") -> ("user", "한국의 수도는 어디야?")
# 2. Message Object: managing messages of every roles
#         L HumanMessage, AIMessage, SystemMessage
#         L HumanMessage("한국의 수도는 어디야?")

In [64]:
template = [
    ('system', '당신은 {domain} 전문가입니다. 답변은 {length}글자 이하로 해주세요.'),
    ("user", "{query}")
]

prompt_template = ChatPromptTemplate(messages = template)
print(prompt_template)

prompt = prompt_template.format_messages(domain = 'AI', length = 10, query = 'LLM의 3가지 특징을 정리해주세요.')
print(prompt)
response = model.invoke(prompt)

input_variables=['domain', 'length', 'query'] input_types={} partial_variables={} messages=[SystemMessagePromptTemplate(prompt=PromptTemplate(input_variables=['domain', 'length'], input_types={}, partial_variables={}, template='당신은 {domain} 전문가입니다. 답변은 {length}글자 이하로 해주세요.'), additional_kwargs={}), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['query'], input_types={}, partial_variables={}, template='{query}'), additional_kwargs={})]
[SystemMessage(content='당신은 AI 전문가입니다. 답변은 10글자 이하로 해주세요.', additional_kwargs={}, response_metadata={}), HumanMessage(content='LLM의 3가지 특징을 정리해주세요.', additional_kwargs={}, response_metadata={})]


In [65]:
response

AIMessage(content='대규모, 고유연성, 맥락 이해', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 13, 'prompt_tokens': 42, 'total_tokens': 55, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BgSx3PYpJXAb0mll9bjYgsGyg4Jls', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--5bcc0303-679b-424e-90e2-978a1bf6c9fb-0', usage_metadata={'input_tokens': 42, 'output_tokens': 13, 'total_tokens': 55, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [66]:
prompt = prompt_template.invoke(
    {"domain":"요리",
     "length":50,
     "query": "와인에 어울리는 요리를 세 가지 추천해주세요."}
)
response = model.invoke(prompt)

In [67]:
print(response.content)

1. 크림 리소토  
2. 양갈비 스테이크  
3. 해산물 파스타


### Message Placeholder

* Locating Multiple Messages

* **Initializer**

    * variable_name: str

    * optional: bool = False

    * n_messages: int

In [70]:
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
template = [
    ('system', "당신은 수학 전문가입니다."),
    MessagesPlaceholder(variable_name = 'history', optional = True),
    ("human", "{query}")
]
prompt_template = ChatPromptTemplate(template)

chat_history = [
    ("human", "1 + 2의 결과는?"),
    ("ai", "1 + 2 = 3"),
    ("human", "7 + 5의 결과는?"),
    ("ai", "7 + 5 = 12")
]

prompt = prompt_template.invoke({
    "history":chat_history,
    "query": "위 최종 결과에 4제곱하면 얼마인가요?"
})

response = model.invoke(prompt)

In [71]:
print(response.content)

12의 4제곱은 12^4 = 20736입니다.


In [72]:
12 ** 4

20736

In [74]:
# Chain
chain = prompt_template | model
chain.invoke({
    "history":chat_history,
    "query": "위 최종 결과에 4제곱하면 얼마인가요?"
})

AIMessage(content='12의 4제곱은 \\( 12^4 \\)로 계산할 수 있습니다.\n\n\\( 12^4 = 12 \\times 12 \\times 12 \\times 12 = 20736 \\)\n\n따라서 결과는 20736입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 57, 'prompt_tokens': 80, 'total_tokens': 137, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BgT6rtW7gl78X6qk6tSValOP6BEY5', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--80e7faed-80d7-46b6-9461-72abc4cda854-0', usage_metadata={'input_tokens': 80, 'output_tokens': 57, 'total_tokens': 137, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## Output Parser

: to convert Output to appropriate(structurized) format for our App.

### Types

1. CommaSeperatedListOutputParser

* "Apple, Banana, "Grape" -> ["Apple", "Banana", "Grape"]

2. JsonOutputParser

* `JSON` to Python `dict`

3. PydanticOutputParser

* `JSON` to Python `Pydantic` model

* widely used data validation library for Python

4. StrOutputParser

* just to string-type data

### Methods

* `parse(text: str)`

* `get_format_instructions() -> str`

#### cf. `invoke()`

#### StrOutputParser

In [34]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

prompt_template = ChatPromptTemplate.from_template(
    "한국의 {topic} 관련된 속담을 {count}개 알려줘."
)
prompt = prompt_template.format(topic = '호랑이', count = 2)
# prompt = prompt_template.invoke({"topic":"호랑이", "count":2})
prompt


model = ChatOpenAI(model = 'gpt-4o-mini')
response = model.invoke(prompt)

In [35]:
response

AIMessage(content='한국의 호랑이와 관련된 속담 중 두 가지는 다음과 같습니다:\n\n1. **"호랑이 굴에 가야 호랑이를 잡는다."**  \n   이 속담은 목표를 이루기 위해서는 그 목표에 직접 나서야 한다는 뜻입니다. 즉, 위험을 감수해야 성과를 얻을 수 있다는 의미입니다.\n\n2. **"호랑이보다 무서운 것이 없다."**  \n   이 속담은 어떤 상황에서 호랑이보다 더 위협적이거나 힘든 것이 없다는 뜻으로, 특히 괴로운 상황이나 두려운 일을 비유적으로 표현할 때 사용됩니다.\n\n이 속담들은 호랑이를 통해 인간의 삶의 이치나 감정 등을 전달하고 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 161, 'prompt_tokens': 25, 'total_tokens': 186, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BgSo71lnY1gzZeew0r5QJLZPXBzdI', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--12686fb6-fc19-4fe6-b37d-3723c0725b63-0', usage_metadata={'input_tokens': 25, 'output_tokens': 161, 'total_tokens': 18

In [36]:
print(response.response_metadata)
print(response.content)

{'token_usage': {'completion_tokens': 161, 'prompt_tokens': 25, 'total_tokens': 186, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BgSo71lnY1gzZeew0r5QJLZPXBzdI', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}
한국의 호랑이와 관련된 속담 중 두 가지는 다음과 같습니다:

1. **"호랑이 굴에 가야 호랑이를 잡는다."**  
   이 속담은 목표를 이루기 위해서는 그 목표에 직접 나서야 한다는 뜻입니다. 즉, 위험을 감수해야 성과를 얻을 수 있다는 의미입니다.

2. **"호랑이보다 무서운 것이 없다."**  
   이 속담은 어떤 상황에서 호랑이보다 더 위협적이거나 힘든 것이 없다는 뜻으로, 특히 괴로운 상황이나 두려운 일을 비유적으로 표현할 때 사용됩니다.

이 속담들은 호랑이를 통해 인간의 삶의 이치나 감정 등을 전달하고 있습니다.


In [37]:
parser = StrOutputParser()
res = parser.invoke(response)
print(res)

한국의 호랑이와 관련된 속담 중 두 가지는 다음과 같습니다:

1. **"호랑이 굴에 가야 호랑이를 잡는다."**  
   이 속담은 목표를 이루기 위해서는 그 목표에 직접 나서야 한다는 뜻입니다. 즉, 위험을 감수해야 성과를 얻을 수 있다는 의미입니다.

2. **"호랑이보다 무서운 것이 없다."**  
   이 속담은 어떤 상황에서 호랑이보다 더 위협적이거나 힘든 것이 없다는 뜻으로, 특히 괴로운 상황이나 두려운 일을 비유적으로 표현할 때 사용됩니다.

이 속담들은 호랑이를 통해 인간의 삶의 이치나 감정 등을 전달하고 있습니다.


In [38]:
# What is the difference between response.content and parser.invoke(response)?
# Critical when chaining

# prompt_template -> model -> parser
chain = prompt_template | model | parser
res = chain.invoke({"topic":"사람의 정신력", "count":3})
print(res)

# what if below:
# chain = prompt_template | model
# res = chain.invoke({"topic":"사람의 정신력", "count":3})
# print(res)

한국의 정신력과 관련된 속담은 다음과 같습니다:

1. **"바늘 도둑이 소 도둑 된다."**  
   - 작은 잘못을 가볍게 여기면 큰 잘못으로 이어질 수 있다는 의미로, 작은 실패에도 굴하지 않고 꾸준히 노력해야 한다는 교훈을 줍니다.

2. **"시작이 반이다."**  
   - 어떤 일을 시작하는 것이 그 일의 절반이라는 의미로, 실행에 옮기는 것이 중요함을 강조합니다. 정신력을 발휘해 일단 시작하는 것이 중요합니다.

3. **"고생 끝에 낙이 온다."**  
   - 힘든 과정을 겪은 후에야 좋은 결과가 온다는 의미로, 인내와 노력의 중요성을 강조합니다. 힘든 상황에서도 포기하지 않고 버티는 정신력을 배울 수 있습니다.

이 속담들은 어려운 시기를 이겨내고, 정신적으로 강해지기 위한 중요한 교훈을 담고 있습니다.


#### CommaSeparatedListOutputParser

In [39]:
from langchain_core.output_parsers import CommaSeparatedListOutputParser

parser = CommaSeparatedListOutputParser()
res_txt = '사과, 배, 귤수박, 오렌지'
print(parser.invoke(res_txt))

['사과', '배', '귤수박', '오렌지']


In [40]:
# Output format preset
format_string = parser.get_format_instructions()
print(format_string)

Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`


In [41]:
from textwrap import dedent
prompt_template = ChatPromptTemplate.from_template(
    dedent("""
    # instruction
    {subject}의 이름 다섯 개를 나열해주세요.

    # output indicator
    {format_instructions}
    # """),
    partial_variables = {'format_instructions' : parser.get_format_instructions()}
    # to initialize placeholder value when creating PromptTemplate object.
    # when we get values by calling functions or methods.
)

model = ChatOpenAI(model = 'gpt-4o-mini')
prompt = prompt_template.invoke({'subject':'동물'})
response = model.invoke(prompt)
response

AIMessage(content='고양이, 개, 소, 말, 토끼', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 12, 'prompt_tokens': 58, 'total_tokens': 70, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BgSoFzhTRIxZ5RAFePzHh0Dn6Gp7A', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--ad8ff8a6-ac5e-46c1-a9df-c57cc021bbba-0', usage_metadata={'input_tokens': 58, 'output_tokens': 12, 'total_tokens': 70, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [42]:
print(response.content)

고양이, 개, 소, 말, 토끼


In [43]:
res = parser.invoke(response)
print(type(res))
print(res)

<class 'list'>
['고양이', '개', '소', '말', '토끼']


In [44]:
response.content.split(',')

['고양이', ' 개', ' 소', ' 말', ' 토끼']

In [45]:
# chaining
chain = prompt_template | model | parser

res = chain.invoke({"subject" : "자동차"})
print(res)

['현대 아반떼', '기아 K5', 'BMW 3시리즈', '테슬라 모델 S', '토요타 캠리']


#### JsonOutputParser

In [46]:
from langchain_core.output_parsers import JsonOutputParser

parser = JsonOutputParser()
res_text = """
{
    "name":"홍길동",
    "age":20,
    "address":"서울",
    "hobby":["독서", "게임"]
}
"""
res_dict = parser.invoke(res_text)
print(type(res_dict))
res_dict
res_dict['name'], res_dict['address']

<class 'dict'>


('홍길동', '서울')

In [47]:
parser.get_format_instructions()

'Return a JSON object.'

In [48]:
prompt_template = ChatPromptTemplate.from_template(
    "{name}에 대해 설명해줘.\n{format_instructions}",
    partial_variables = {'format_instructions':parser.get_format_instructions()}
)
model = ChatOpenAI(model = 'gpt-4o-mini')
prompt = prompt_template.invoke({"name":"아이폰"})
res = model.invoke(prompt)

In [49]:
print(res.content)

```json
{
  "아이폰": {
    "설명": "아이폰은 Apple Inc.에서 개발한 스마트폰으로, iOS 운영 체제를 기반으로 합니다. 기본적으로 전화 기능 외에도 인터넷 탐색, 사진 촬영, 비디오 녹화, 음악 감상 등 다양한 기능을 제공합니다.",
    "출시연도": 2007,
    "주요특징": {
      "디자인": "세련된 디자인과 고급스러운 소재 사용",
      "운영체제": "iOS, 정기적인 업데이트 및 보안 패치 제공",
      "앱생태계": "App Store를 통해 수백만 개의 애플리케이션 이용 가능",
      "카메라": "고품질 사진 및 동영상 촬영 기능",
      "보안": "Face ID, Touch ID 등 생체 인식 기술 도입"
    },
    "모델": [
      {
        "이름": "아이폰 14",
        "출시연도": 2022
      },
      {
        "이름": "아이폰 13",
        "출시연도": 2021
      },
      {
        "이름": "아이폰 12",
        "출시연도": 2020
      }
    ],
    "경쟁사": ["삼성", "구글", "화웨이"]
  }
}
```


In [50]:
res_dict = parser.invoke(res)
print(type(res.content), type(res_dict))
res_dict['모델'][:3]

<class 'str'> <class 'dict'>


KeyError: '모델'

In [None]:
prompt_template = ChatPromptTemplate.from_template(
    "{name}에 대해 설명해줘.\n{format_instructions}",
    partial_variables = {'format_instructions':parser.get_format_instructions()}
)
model = ChatOpenAI(model = 'gpt-4o-mini')
prompt = prompt_template.invoke({"name":"제네시스"})
res = model.invoke(prompt)
print(res.content)

```json
{
  "brand": "제네시스",
  "description": "제네시스는 현대자동차의 프리미엄 자동차 브랜드로, 2015년에 독립 브랜드로 출범했습니다. 고급스러운 디자인과 첨단 기술을 바탕으로 한 다양한 차량을 제공합니다.",
  "key_features": [
    "고급스러운 인테리어 및 외관 디자인",
    "첨단 안전 기술 및 운전 보조 시스템",
    "강력한 성능의 엔진 옵션",
    "최신 인포테인먼트 시스템"
  ],
  "model_range": [
    {
      "name": "G70",
      "type": "세단",
      "features": "스포츠 주행 성능과 고급스러운 내부 공간"
    },
    {
      "name": "G80",
      "type": "세단",
      "features": "프리미엄 세단으로 고급스러운 편안함 제공"
    },
    {
      "name": "G90",
      "type": "플래그십 세단",
      "features": "최고급 사양과 최신 기술이 적용된 모델"
    },
    {
      "name": "GV70",
      "type": "SUV",
      "features": "스포티한 디자인과 실용성을 갖춘 중형 SUV"
    },
    {
      "name": "GV80",
      "type": "SUV",
      "features": "럭셔리 대형 SUV로 가족 및 장거리 여행에 적합"
    }
  ],
  "mission": "제네시스는 고급 자동차 시장에서 고객에게 우수한 품질과 만족도를 제공하는 것을 목표로 하고 있습니다."
}
```


In [None]:
# catecory might be changed every time we run.

In [None]:
from pydantic import BaseModel, Field

class ItemSchema(BaseModel):
    name: str = Field(description = "제품의 이름")
    info: str = Field(description = "제품에 대한 정보")
    release_date: str = Field(description = "제품이 출시된 일시. yyyy-mm-dd 형시")
    price: int = Field(description = "제품의 한국 발매 가격")

In [None]:
parser = JsonOutputParser(pydantic_object = ItemSchema)
print(parser.get_format_instructions())

The output should be formatted as a JSON instance that conforms to the JSON schema below.

As an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}
the object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.

Here is the output schema:
```
{"properties": {"name": {"description": "제품의 이름", "title": "Name", "type": "string"}, "info": {"description": "제품에 대한 정보", "title": "Info", "type": "string"}, "release_date": {"description": "제품이 출시된 일시. yyyy-mm-dd 형시", "title": "Release Date", "type": "string"}, "price": {"description": "제품의 한국 발매 가격", "title": "Price", "type": "integer"}}, "required": ["name", "info", "release_date", "price"]}
```


In [None]:
prompt_template = ChatPromptTemplate.from_template(
    dedent("""
    # Instruction
    {name}에 대해 설명해주세요.
    # Output Indicator
    {format_instructions}
    """)
    , partial_variables = {'format_instructions':parser.get_format_instructions()}
)
prompt = prompt_template.invoke({'name':'Galaxy 핸드폰'})
print(prompt.messages[0].content)
model = ChatOpenAI(model = 'gpt-4o-mini')
response = model.invoke(prompt)


# Instruction
Galaxy 핸드폰에 대해 설명해주세요.
# Output Indicator
The output should be formatted as a JSON instance that conforms to the JSON schema below.

As an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}
the object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.

Here is the output schema:
```
{"properties": {"name": {"description": "제품의 이름", "title": "Name", "type": "string"}, "info": {"description": "제품에 대한 정보", "title": "Info", "type": "string"}, "release_date": {"description": "제품이 출시된 일시. yyyy-mm-dd 형시", "title": "Release Date", "type": "string"}, "price": {"description": "제품의 한국 발매 가격", "title": "Price", "type": "integer"}}, "required": ["name", "info", "release_date", "price"]}
```



In [None]:
print(response.content)

```json
{
  "name": "Galaxy S23",
  "info": "삼성의 최신 플래그십 스마트폰으로, 강력한 성능과 고급스러운 디자인을 자랑하며, 세련된 카메라 기능과 긴 배터리 수명을 제공합니다.",
  "release_date": "2023-02-17",
  "price": 1099000
}
```


str

In [None]:
parsed_response  = parser.invoke(response)
parsed_response

{'name': 'Galaxy S23',
 'info': '삼성의 최신 플래그십 스마트폰으로, 강력한 성능과 고급스러운 디자인을 자랑하며, 세련된 카메라 기능과 긴 배터리 수명을 제공합니다.',
 'release_date': '2023-02-17',
 'price': 1099000}

#### PydanticOutputParser

In [None]:
from langchain_core.output_parsers import PydanticOutputParser

parser = PydanticOutputParser(pydantic_object = ItemSchema)
# JSON ----Parser----> Pydantic Model Object

In [None]:
# same as JsonOutputParser
print(parser.get_format_instructions())

The output should be formatted as a JSON instance that conforms to the JSON schema below.

As an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}
the object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.

Here is the output schema:
```
{"properties": {"name": {"description": "제품의 이름", "title": "Name", "type": "string"}, "info": {"description": "제품에 대한 정보", "title": "Info", "type": "string"}, "release_date": {"description": "제품이 출시된 일시. yyyy-mm-dd 형시", "title": "Release Date", "type": "string"}, "price": {"description": "제품의 한국 발매 가격", "title": "Price", "type": "integer"}}, "required": ["name", "info", "release_date", "price"]}
```


In [None]:
prompt_template = ChatPromptTemplate.from_template(
    dedent("""
    # Instruction
    {name}에 대해 설명해주세요.
    # Output Indicator
    {format_instructions}
    """)
    , partial_variables = {'format_instructions':parser.get_format_instructions()}
)
prompt = prompt_template.invoke({'name':'Mac Book'})
print(prompt)
model = ChatOpenAI(model = 'gpt-4o-mini')
response = model.invoke(prompt)
parsed_response = parser.invoke(response)

messages=[HumanMessage(content='\n# Instruction\nMac Book에 대해 설명해주세요.\n# Output Indicator\nThe output should be formatted as a JSON instance that conforms to the JSON schema below.\n\nAs an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}\nthe object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.\n\nHere is the output schema:\n```\n{"properties": {"name": {"description": "제품의 이름", "title": "Name", "type": "string"}, "info": {"description": "제품에 대한 정보", "title": "Info", "type": "string"}, "release_date": {"description": "제품이 출시된 일시. yyyy-mm-dd 형시", "title": "Release Date", "type": "string"}, "price": {"description": "제품의 한국 발매 가격", "title": "Price", "type": "integer"}}, "required": ["name", "info", "release_date", "price"]}\n```\n', additional_kwargs={}, response_metadata={})

In [None]:
print(type(parsed_response)) # not a dictionary
print(parsed_response)

<class '__main__.ItemSchema'>
name='MacBook Air' info='MacBook Air는 Apple에서 제작한 슬림한 디자인의 노트북으로, 인텔 및 Apple M 시리즈의 프로세서를 탑재하여 높은 성능과 효율성을 자랑합니다. Retina 디스플레이와 긴 배터리 수명이 특징입니다.' release_date='2022-06-01' price=1799000


In [None]:
print(parsed_response.name, parsed_response.info, parsed_response.release_date, parsed_response.price, sep = '\n')

MacBook Air
MacBook Air는 Apple에서 제작한 슬림한 디자인의 노트북으로, 인텔 및 Apple M 시리즈의 프로세서를 탑재하여 높은 성능과 효율성을 자랑합니다. Retina 디스플레이와 긴 배터리 수명이 특징입니다.
2022-06-01
1799000


In [None]:
chain = prompt_template | model | parser
chained_response = chain.invoke(prompt)

In [None]:
print(chained_response.name, chained_response.info, chained_response.release_date, chained_response.price, sep = '\n')

MacBook Air
Apple의 MacBook Air는 얇고 가벼운 노트북으로, 뛰어난 휴대성과 긴 배터리 수명을 자랑합니다. M1 칩을 사용하여 높은 성능과 효율성을 제공합니다. 또한, Retina 디스플레이와 쾌적한 키보드를 갖춰 사용자가 다양한 작업을 쉽게 수행할 수 있습니다.
2020-11-10
1249000


#### cf. Typehint

```python
import typing
```

* `variable_name: type [= value]`
* `def function(parameter: type) -> return_type:`

**Datatype Class**

* Collections

    * `List[T]`

    * `Dict[K, V]`

    * `Tuple[T1, T2]`

    * `Set[T]`

* Special

    * `Optional[T]`

    * `Union[T1, T2]`

    * `Final[T]`

    * `Callable[[ArgType], ReturnType]`

    * `Iterable[T]`

**After Python 3.9+**

We can finally use python built-in type classes as typehints.
```python
numbers: list[int] = [1, 2, 3]
settings: dict[str, str]: {'name':'value'}
```

**After Python 3.10+**

* Union -> `|`
```python
# Before
num: Union[int, float] = 1
# After
num: int | float = 1
```

* TypeAlias Available
```python
from typing import TypeAlias
vector: TypeAlias = list[float]

num_list: vector
```

**Pydantic**

* to help to define data-type class

* Type Validity Authentication

* Automated Type Conversion

* Default Value Preset

* Complex Data Structure

* Data Serialization & Deserialization

**HOW??**

* Subclass succeeding `BaseModel`

* `Field` for validation constraints.

In [None]:
# Common case
class Person:

    def __init__(self, name, age, address):  # attributes
        self.name = name
        if isinstance(age, int):
            self.age = age
        else:
            raise Exception("나이 타입이 아닙니다.")
        self.address = address

p = Person("홍길동", 20, "서울")
# p = Person("홍길동", "서른", "서울")
print(p.name, p.age, p.address)
# we want to prevent users from putting other data-types into self.age

홍길동 20 서울


In [None]:
from pydantic import BaseModel

class Member(BaseModel):
    # Set attributes by defining CLASS VARIABLES
    name: str
    age: int | float
    nickname: str | None = None
    hobby: list[str]

In [None]:
m = Member(name = '이순신', age = 30, nickname = '거북선', hobby = ['게임', '영화'])
m

Member(name='이순신', age=30, nickname='거북선', hobby=['게임', '영화'])

In [None]:
m.age = 30.5
m

Member(name='이순신', age=30.5, nickname='거북선', hobby=['게임', '영화'])

In [None]:
m = Member(name = '이순신', age = '서른살', nickname = '거북선', hobby = ['게임', '영화'])
m

ValidationError: 2 validation errors for Member
age.int
  Input should be a valid integer, unable to parse string as an integer [type=int_parsing, input_value='서른살', input_type=str]
    For further information visit https://errors.pydantic.dev/2.11/v/int_parsing
age.float
  Input should be a valid number, unable to parse string as a number [type=float_parsing, input_value='서른살', input_type=str]
    For further information visit https://errors.pydantic.dev/2.11/v/float_parsing

**Field**

further constraints.

In [None]:
# Filed
from pydantic import BaseModel, Field

class Member(BaseModel):
    name: str = Field(title = '회원이름', decription = '회원의 이름을 저장')
    age: int | float = Field(title = '회원나이', description = '회원의 나이를 저장.', gt = 0)
    nickname: str | None = Field(default = None, title = '별칭', description = '회원의 별명')
    hobby: list[str] = Field(title = '취미', description = '회원의 취미', max_length = 2, min_length = 1)
    # If no default setting: it's a necessary attribute.

In [None]:
m = Member(name = '홍길동', age = 20, nickname = '의적', hobby = ['독서', '게임'])
m

Member(name='홍길동', age=20, nickname='의적', hobby=['독서', '게임'])

In [None]:
m = Member(age = 20, hobby = ['독서', '게임'])
m

Member(name='홍길동', age=20, nickname=None, hobby=['독서', '게임'])