# Model IO
- Language Model
- Prompt
- OutputParser
![](https://d.pr/i/Wy5B5B+)

In [1]:
!pip install langchain langchain-openai langchain-community langchain-huggingface



In [2]:
# colab secret 모두 등록할 것
from google.colab import userdata
import os

os.environ['LANGSMITH_TRACING'] = userdata.get('LANGSMITH_TRACING')
os.environ['LANGSMITH_ENDPOINT'] = userdata.get('LANGSMITH_ENDPOINT')
os.environ['LANGSMITH_API_KEY'] = userdata.get('LANGSMITH_API_KEY')
os.environ['LANGSMITH_PROJECT'] = userdata.get('LANGSMITH_PROJECT')
os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')

## Language Models

https://python.langchain.com/api_reference/reference.html#integrations

LangChain의 Integrations 섹션에서는 다양한 다운스트림 LLM 모델과의 연동을 지원하다.

이 섹션에서는 OpenAI, Hugging Face, GPT-4 등의 다양한 LLM 모델과 LangChain을 연결하는 방법을 다룬다.

### openai

In [3]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model='gpt-4o')

llm.invoke('태국의 수도는 어디인가요?')

AIMessage(content='태국의 수도는 방콕입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 16, 'total_tokens': 26, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_a288987b44', 'id': 'chatcmpl-BmvrLk8RbPS7Gn7yy8n1SZqiEw1CL', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--4305ce74-c4c4-4b52-9030-006d90fcaceb-0', usage_metadata={'input_tokens': 16, 'output_tokens': 10, 'total_tokens': 26, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### huggingface

In [4]:
from langchain_huggingface import HuggingFaceEndpoint, ChatHuggingFace

llm = HuggingFaceEndpoint(
    repo_id = 'microsoft/Phi-3-mini-4k-instruct',
    task = 'text-generation'
)

chat_model = ChatHuggingFace(llm = llm, verbose=True)

chat_model.invoke('프랑스의 수도는 어디인가요?')

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.
ERROR:root:Internal Python error in the inspect module.
Below is the traceback from this internal error.



Traceback (most recent call last):
  File "/usr/local/lib/python3.11/dist-packages/huggingface_hub/utils/_http.py", line 409, in hf_raise_for_status
    response.raise_for_status()
  File "/usr/local/lib/python3.11/dist-packages/requests/models.py", line 1024, in raise_for_status
    raise HTTPError(http_error_msg, response=self)
requests.exceptions.HTTPError: 401 Client Error: Unauthorized for url: https://router.huggingface.co/hf-inference/models/microsoft/Phi-3-mini-4k-instruct/v1/chat/completions

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "/usr/local/lib/python3.11/dist-packages/IPython/core/interactiveshell.py", line 3553, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "/tmp/ipython-input-4-264836736.py", line 10, in <cell line: 0>
    chat_model.invoke('프랑스의 수도는 어디인가요?')
  File "/usr/local/lib/python3.11/dist-packages/langchain_core/language_models/chat_models.py", line 372, in invoke


TypeError: object of type 'NoneType' has no len()

In [None]:
from langchain_huggingface import HuggingFacePipeline

pipe = HuggingFacePipeline.from_model_id(
    model_id = 'microsoft/Phi-3-mini-4k-instruct',
    task = 'text-generation',
)

pipe.invoke('What is LLM')

### Model Laboratory

In [5]:
from langchain.model_laboratory import ModelLaboratory

llms = [
        ChatOpenAI(model_name= 'gpt-3.5-turbo'),
        ChatOpenAI(model_name= 'gpt-4.1')]

lab = ModelLaboratory.from_llms(llms)
lab.compare('파이썬의 장점이 무엇인가요?')

[1mInput:[0m
파이썬의 장점이 무엇인가요?

client=<openai.resources.chat.completions.completions.Completions object at 0x78662c4eda10> async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x78662c4ede10> root_client=<openai.OpenAI object at 0x78662d80e310> root_async_client=<openai.AsyncOpenAI object at 0x78662c4edb90> model_kwargs={} openai_api_key=SecretStr('**********')
[36;1m[1;3m1. 쉬운 학습 곡선: 파이썬은 간결하고 읽기 쉬운 문법을 가지고 있어 쉽게 학습할 수 있습니다. 이는 프로그래밍 초보자들에게 특히 도움이 됩니다.

2. 다양한 응용 분야: 파이썬은 웹 개발, 데이터 분석, 인공지능, 머신러닝, 자연어 처리 등 다양한 분야에서 널리 사용되고 있습니다. 이로 인해 파이썬 개발자는 다양한 분야에서 일을 할 수 있습니다.

3. 강력한 라이브러리: 파이썬은 다양한 라이브러리와 프레임워크를 제공하고 있어 개발 속도를 높일 수 있습니다. 예를 들어, NumPy, Pandas, Matplotlib 등 데이터 분석 및 시각화를 위한 라이브러리가 내장되어 있습니다.

4. 커뮤니티 지원: 파이썬은 활발한 온라인 커뮤니티를 가지고 있어 개발자들이 서로 정보를 공유하고 도움을 주고 받을 수 있습니다. 또한 다양한 오픈소스 프로젝트로 인해 뛰어난 지원을 받을 수 있습니다.

5. 크로스 플랫폼: 파이썬은 윈도우, 맥, 리눅스 등 다양한 운영 체제에서 동작하며, 코드를 한 번 작성하면 어디서든 실행할 수 있습니다. 이는 개발자에게 유연성을 제공합니다.[0m

client=<openai.resources.chat.compl

## Prompts
https://python.langchain.com/api_reference/core/prompts.html#langchain-core-prompts

`LangChain`의 API 문서에서 제공하는 **Prompts**에 대한 내용은 LangChain 프레임워크의 **핵심 구성 요소 중 하나**로, LLM(Large Language Model)과의 인터페이스를 설정하는 데 중요한 역할을 한다. Prompts는 LLM에 전달될 입력을 정의하고, 구조화하며, 이를 기반으로 원하는 응답을 얻기 위해 사용된다.

**주요 사용처**

1. **자동화된 입력 구성**
   - PromptTemplate을 사용하여 사용자 입력을 자동으로 구성.
   - 동일한 형식의 질문이나 대화를 대량으로 생성 가능.

2. **대화형 응답**
   - ChatPromptTemplate을 통해 대화형 AI의 문맥 유지를 지원.

3. **샘플 기반 학습**
   - Few-shot Prompt는 LLM에 구체적인 예제를 제공해 정확한 응답을 유도.

4. **결과 파싱**
   - Output Parsers를 통해 LLM의 출력을 특정 포맷으로 처리하여 후속 작업을 자동화.


**클래스 계층구조**
```
BasePromptTemplate
├─ PipelinePromptTemplate
├─ StringPromptTemplate
│  ├─ PromptTemplate
│  ├─ FewShotPromptTemplate
│  └─ FewShotPromptWithTemplates
└─ BaseChatPromptTemplate
   ├─ AutoGPTPrompt
   └─ ChatPromptTemplate
      └─ AgentScratchPadChatPromptTemplate

BaseMessagePromptTemplate
├─ MessagesPlaceholder
└─ BaseStringMessagePromptTemplate
   ├─ ChatMessagePromptTemplate
   ├─ HumanMessagePromptTemplate
   ├─ AIMessagePromptTemplate
   └─ SystemMessagePromptTemplate

```

In [8]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name = 'gpt-4o-mini')

llm.invoke('LLM이 뭔가요?')

AIMessage(content='LLM은 "Large Language Model"의 약자로, 대량의 텍스트 데이터를 학습하여 자연어 처리(NLP) 작업을 수행할 수 있는 인공지능 모델을 의미합니다. 이러한 모델은 텍스트 생성, 질문 응답, 번역, 요약 등 다양한 언어 관련 작업을 처리하는 데 사용됩니다. 예를 들어, OpenAI의 GPT(Generative Pre-trained Transformer) 시리즈와 같은 모델들이 이에 해당합니다.\n\nLLM은 많은 양의 데이터와 강력한 계산 능력을 활용하여 언어의 패턴과 구조를 학습하므로, 높은 수준의 언어 이해와 생성을 가능하게 합니다. 이를 통해 사용자와의 대화, 글쓰기 지원, 정보 검색 등 다양한 용도로 활용됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 160, 'prompt_tokens': 15, 'total_tokens': 175, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BmvyAokZzIZv0FE11kDkt47Hk9UxL', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--e82e2187-9ce8-4e00-8657-bd1452bcd212-0', usage_metadata={'input_to

In [9]:
messages = [
    ('system', '당신은 친절한 초딩전용 챗봇입니다. 초딩의 눈높이에 맞게 설명해주세요.'),
    ('human', '랭체인이 뭔가요?'),
]
llm.invoke(messages)

AIMessage(content='랭체인(RankChain)은 사람들이 정보를 정리하고, 연결하는 방법을 돕는 도구나 시스템이에요. 이걸로 여러 가지 정보를 한 곳에 모아서 더 쉽게 이해하고 사용할 수 있도록 도와줘요. 예를 들어, 책이나 논문 같은 내용을 보다 체계적으로 정리해서 필요한 부분을 쉽게 찾을 수 있게 해 준답니다.\n\n구체적으로는, 사람들이 어떤 것들을 중요하게 생각하는지 평가하고, 그에 따라 정보를 순서대로 정리하는 방식이에요. 그래서 만든 정보의 흐름이 더 명확해지고, 찾기도 쉬워진답니다. 예를 들어 친구들과의 대화 내용을 정리할 때, 중요한 내용을 먼저 적어놓거나 카테고리별로 나눌 수 있겠죠. \n\n이해가 좀 더 잘 됐나요? 궁금한 점이 있으면 언제든지 물어봐요!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 194, 'prompt_tokens': 47, 'total_tokens': 241, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-Bmvzt8wEYSJB6yTlsqIsyy6AmrESh', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--629d2e44-e5f4-4fdf-a77f-8f4669261652-0', usage_metadata=

### Prompt Template

In [13]:
from langchain import PromptTemplate

# 어떤 상품에 대한 광고문구를 생성.

prompt_template = PromptTemplate(
    template='{product}를 홍보하기 위한 신박한 광고문구를 작성해줘',
    input_variables=["product"]
)

prompt = prompt_template.format(product='초소형 카메라')

ai_message = llm.invoke(prompt)
print(ai_message.content)

"작은 것의 힘, 소소한 순간을 담다! 초소형 카메라와 함께라면 당신의 기억이 언제 어디서나 살아납니다. 주머니 속의 거대한 이야기, 지금 바로 만져보세요!"


### ChatPromptTemplate

In [None]:
from langchain.propmts.chat import ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate

system_msg_template = SystemMessagePromptTemplate.from_template("당신은 {domain}분야의 최고의 챗봇입니다.")
human_msg_template = HumanMessagePromptTemplate.from_template("{question}")
chat_template = ChatPromptTemplate.fom(messages([system_msg_template, human_msg_template]))

prompt = chat_template.format_messages(domain='IT',question='SLM이 뭐야?')

llm.invoke(prompt).content

In [None]:
domain = '육아'
human_msg_template = HumanMessagePromptTemplate.from_template("{question}")
chat_template = ChatPromptTemplate.fom(messages([system_msg_template, human_msg_template]))

prompt = chat_template.format_messages(domain='육아',question='')

llm.invoke(prompt).content

### FewShotPromptTemplate

In [15]:
from langchain.prompts import FewShotPromptTemplate

examples = [
    {'q' : '2 + 2', 'a' : '4'},
    {"q" : '3 + 5', 'a' : '8'},
]

prompt_template = PromptTemplate(
    template='Q: {q}\nA: {a}',
    input_variables = ['q','a']
)

fewshot_template = FewShotPromptTemplate(
    examples = examples,
    example_prompt = prompt_template,
    prefix = '다음 수학문제를 풀어주세요',
    suffix = 'Q: {question} \nA:', # 사용자입력값
    input_variables = ['question']
)

prompt = fewshot_template.format(question = '123 + 345 = ?')
print(prompt)

다음 수학문제를 풀어주세요

Q: 2 + 2
A: 4

Q: 3 + 5
A: 8

Q: 123 + 345 = ? 
A:


In [16]:
print(llm.invoke(prompt).content)

A: 468


## Output Parsers

https://python.langchain.com/api_reference/langchain/output_parsers.html#module-langchain.output_parsers

LangChain의 Output Parsers는 LLM이 생성한 텍스트 출력을 특정 형식으로 변환하거나 처리하는 데 사용된다. 이는 모델의 응답을 해석하고, 이를 구조화된 데이터로 바꿔 후속 작업에 활용하기 위해 설계되었다. Output Parsers는 LangChain의 응답 처리 워크플로우에서 중요한 역할을 한다.

예를 들어, LLM 응답이 "Name: John, Age: 30"와 같은 텍스트라면, 이를 {"name": "John", "age": 30}과 같은 Python 딕셔너리로 변환 가능.

**사용 목적**
- 모델의 출력을 특정 애플리케이션에 맞게 처리해야 하는 경우가 많음.
- 응답을 해석하는 일관성과 정확성을 높이기 위해 필요.
- 텍스트 기반 응답을 JSON, 리스트 또는 숫자와 같은 특정 포맷으로 변환하여 후속 작업에 활용.

**종류**
1. **BaseOutputParser**: Output Parsers의 기본 클래스, 커스텀 파서 구현 시 사용.  
2. **CommaSeparatedListOutputParser**: 콤마로 구분된 문자열을 리스트로 변환.  
3. **RegexParser**: 정규식을 사용해 특정 패턴을 추출하고 키-값 형태로 반환.  
4. **StructuredOutputParser**: 출력의 JSON 또는 구조화된 형식을 강제.  
5. **PydanticOutputParser**: Pydantic 모델을 기반으로 출력 검증 및 변환.  
6. **MarkdownOutputParser**: 마크다운 형식의 텍스트에서 데이터를 추출.  

### CommaSeparatedListOutputParser

In [17]:
from langchain.output_parsers import CommaSeparatedListOutputParser

model_output = "사과, 바나나, 오렌지, 포도"

output_parser = CommaSeparatedListOutputParser()

output = output_parser.parse(model_output)
output

['사과', '바나나', '오렌지', '포도']

In [22]:
# {야구}팀 {4}개 질문
# {축구}팀 {10}개 질문

prompt_template = PromptTemplate(
    template="{subject} {n}개의 팀을 보여주세요.\n{format_instruction}",
    input_variables = ['subject', 'n'], # 사용자 프롬프트로 채워질 변수
    partial_variables={
        'format_instruction' : output_parser.get_format_instructions() # template 생성시에 채워짐
    }


)

prompt = prompt_template.format(subject='대한민국 프로야구', n =5)

In [23]:
ai_message = llm.invoke(prompt)
output = ai_message.content

# 출력파서가 가공한 최종출력
output = output_parser.parse(output)
output

['두산 베어스', 'LG 트윈스', '삼성 라이온즈', '키움 히어로즈', 'SSG 랜더스']

In [25]:
chain = prompt_template | llm | output_parser
chain.invoke(input={'subject':'프로농구', 'n':3})

['서울 SK', '전주 KCC', '안양 KGC']

### JSONOutputParser

In [28]:
from langchain_core.output_parsers import JsonOutputParser

model_output = '{"title": "GPT-5를 소개합니다.", "author" : "OpenAI", "pages" : 250}'

json_parser = JsonOutputParser()
print(json_parser.get_format_instructions())

output = json_parser.parse(model_output) # json_str -> python object(list, dict)
print(output)
print(type(output))

Return a JSON object.
{'title': 'GPT-5를 소개합니다.', 'author': 'OpenAI', 'pages': 250}
<class 'dict'>


In [34]:
# AI 관련 책 3권을 보여주세요. (json)
# 요리 관련 책 5권을 보여주세요. (json)
# PromptTemplate - LLm - output_parser

prompt_template = PromptTemplate(
    template="{subject} 관련 책 {n}권을 추천해주세요.\n{format_instruction}",
    input_variables = ['subject', 'n'], # 사용자 프롬프트로 채워질 변수
    partial_variables={
        'format_instruction' : json_parser.get_format_instructions() # template 생성시에 채워짐
    }
)

chain = prompt_template | llm | json_parser
print(chain.invoke(input={'subject':'인공지능', 'n':3}))
print(chain.invoke(input={'subject':'요리', 'n':5}))
# chain.invoke(input={'subject':'AI', 'n':3})

{'recommended_books': [{'title': 'Artificial Intelligence: A Guide to Intelligent Systems', 'author': 'Michael Negnevitsky', 'description': 'This book provides a comprehensive introduction to the concepts and techniques of artificial intelligence, covering topics such as machine learning, neural networks, and natural language processing.'}, {'title': 'Deep Learning', 'author': 'Ian Goodfellow, Yoshua Bengio, and Aaron Courville', 'description': 'A thorough exploration of deep learning, this book covers fundamental concepts, theoretical foundations, and practical applications, making it suitable for both beginners and experienced practitioners.'}, {'title': 'Artificial Intelligence: Foundations of Computational Agents', 'author': 'David L. Poole and Alan K. Mackworth', 'description': 'This book provides a comprehensive introduction to the principles and practices of AI, focusing on the foundations of computational agents, reasoning, and learning.'}]}
{'cookbooks': [{'title': 'The Joy of